9.3  Schatten van gemiddelden >
Voorbeeld:

We staren gemiddeld 42 minuten per dag naar het beeldscherm van onze telefoon.
Stel dat deze uitspraak gebaseerd is op een steekproef van 100 mensen, dat het steekproefgemiddelde gelijk is aan 42 minuten en dat de standaardafwijking in de steekproef gelijk is aan 8 minuten.
Hoe kun je op basis van deze steekproefresultaten een uitspraak doen over het populatiegemiddelde en de betrouwbaarheid ervan?

Het meest aannemelijk is dat het populatiegemiddelde gelijk is aan 42 minuten, maar dat hoeft natuurlijk niet precies te kloppen. Het populatiegemiddelde zal waarschijnlijk in de buurt liggen van die 42 minuten. Het is waarschijnlijker dat het populatiegemiddelde gelijk is aan 40 minuten dan 36 minuten, omdat 40 dichter bij het steekproefgemiddelde ligt.

Als van een steekproef de omvang, het gemiddelde en de standaardafwijking bekend zijn, dan kun je het 95 % -betrouwbaarheidsinterval voor het populatiegemiddelde berekenen als:
steekproefgemiddelde ± 2 steekproefstandaardafwijking steekproefomvang .
Of korter:
het 95 % -betrouwbaarheidsinterval voor het populatiegemiddelde is X ¯ ± 2 S n , met X ¯ het steekproefgemiddelde, n de steekproefomvang en S de steekproefstandaardafwijking.

Voorbeeld:

In het bovenstaande onderzoek naar telefoongebruik is het steekproefgemiddelde 42 minuten, de standaardafwijking 8 minuten en de steekproefomvang 100 . Invullen van deze gegevens levert een ondergrens van 42 2 8 100 en een bovengrens van 42 + 2 8 100 .
Met 95 procent betrouwbaarheid ligt het populatiegemiddelde dus tussen 40,4 en 43,6 . Met 95 procent zekerheid kunnen we dus zeggen dat mensen tussen de 40,4 en 43,6 minuten per dag naar het beeldscherm van hun smartphone staren.

1

Uit een aselecte steekproef van ruim 50.000 leerlingen uit leerjaar 1 en 2 van het voortgezet onderwijs zijn onderstaande kentallen bekend van het aantal uren dat de leerlingen per week naar sport kijken.

a

Bereken het 95 % -betrouwbaarheidsinterval van het aantal uren dat de leerlingen naar sport kijken.

Ook zijn onderstaande kentallen berekend van het zakgeld dat de leerlingen per week krijgen.

b

Bereken het 95 % -betrouwbaarheidsinterval van het zakgeld dat de leerlingen per week krijgen.

2

In een aselecte steekproef onder Nederlanders blijkt dat 70 procent bezuinigt op kleding, vrije tijd en boodschappen. Deze groep bespaart daarmee gemiddeld genomen 200 euro per maand.
Veronderstel dat de overige 30 procent niet bezuinigt op kleding, vrije tijd en boodschappen.

a

Bereken de gemiddelde besparing per maand op kleding, vrije tijd en boodschappen in de steekproef.

Stel dat de steekproefomvang 800 is en de standaardafwijking in de steekproef gelijk is aan 120 .

b

Bereken het 95 % -betrouwbaarheidsinterval voor de gemiddelde besparing op kleding, vrije tijd en boodschappen.

3

Uit de registratie van medische gegevens is bekend dat de duur in dagen van de menselijke zwangerschap vrijwel normaal verdeeld is met gemiddeld 266 dagen en standaardafwijking 16 .
Een gynaecoloog vraagt zich af wat de gemiddelde duur van de zwangerschap is van vrouwen die bij hem op medische indicatie in het ziekenhuis bevallen. Om hiervoor een betrouwbaarheidsinterval te berekenen, baseert hij zich op een aselecte steekproef van 64 vrouwen die bij hem op medische indicatie in het ziekenhuis zijn bevallen. De gemiddelde zwangerschapsduur van deze vrouwen is 250 dagen en de standaardafwijking is 15 .

Laat met geschikte berekeningen zien dat de waarde van 266 dagen niet ligt in het 95 % -betrouwbaarheidsinterval.

Het Statistics Learning Centre heeft meer dan 50 video’s over statistiek gemaakt. Bekijk eens de video die ze hebben gemaakt over betrouwbaarheidsintervallen.

4

Kinderen in een klas met meer dan 30 leerlingen, omdat de school moet bezuinigen? Niet alleen basisscholen zijn er ongelukkig mee. Ouders vrezen dat hun kroost te weinig aandacht krijgt. “We draaien de klok terug naar begin jaren negentig”, stelt pedagoog Bas Levering.
Tussen 1997 en 2002 daalde het gemiddeld aantal kinderen in een onderbouwklas van 23,7 naar 20,9 en kwamen er onderwijsassistenten. Uit een evaluatierapport blijkt dat kleinere groepen en meer handen in de klas de kwaliteit van het onderwijs in de onderbouw van het basisonderwijs hebben verbeterd.

a

Wat is hier de populatie?

Veronderstel dat de gegevens over 1997 gebaseerd zijn op een aselecte steekproef van 80 klassen en dat de standaardafwijking gelijk is aan 3 .

b

Bereken het 95 % -betrouwbaarheidsinterval voor de gemiddelde omvang van een onderbouwklas in 1997.

Veronderstel dat de gegevens over 2002 gebaseerd zijn op een aselecte steekproef van 120 klassen en dat de standaardafwijking gelijk is aan 4 .

c

Bereken het 95 % -betrouwbaarheidsinterval voor de gemiddelde omvang van een onderbouwklas in 2002. Overlapt dit 95 % -betrouwbaarheidsinterval met dat van 1997?

Veronderstel dat een onderzoeker met 95 procent zekerheid de gemiddelde omvang van een onderbouwklas op 1 decimaal nauwkeurig wil vaststellen.
Veronderstel verder dat de standaardafwijking gelijk is aan 4 .

d

Bereken hoe groot de steekproef minimaal moet zijn om aan de gegeven eis te kunnen voldoen.

Het is niet noodzakelijk dat een onderzoek naar de omvang van klassen in het basisonderwijs zich baseert op steekproefgegevens.

e

Welke organisatie zou voor zo’n onderzoek kunnen beschikken over populatiegegevens?

5

Van lampen van soort A is de levensduur van 500 aselect gekozen exemplaren gemeten. Van soort B zijn er aselect 1200 lampen gekozen. Het aantal branduren blijkt in beide gevallen vrijwel normaal verdeeld te zijn.

Hieronder zie je een schets van de steekproefverdelingen. Enkele percentages zijn gegeven om onder andere de standaardafwijkingen te kunnen bepalen.

Stel op basis van deze gegevens de 95 % -betrouwbaarheidsintervallen op voor de levensduur van soort A en soort B.

Opmerking:

Het onderstaande komt niet aan bod op het examen.

In het hoofdstuk Statistiek 3 heb je geleerd dat de verdeling van het steekproefgemiddelde voor voldoende grote steekproeven benaderd kan worden door een normale verdeling.
De vuistregel X ¯ ± 2 S n is hierop gebaseerd.

Bij een normale verdeling geldt de vuistregel dat 95 procent van alle waarnemingen zich zal bevinden tussen het gemiddelde plus of min twee keer de standaardafwijking. Dit is precies de opbouw van de formule.

Het gemiddelde is X ¯ en de standaardafwijking is S n .

De 2 in de formule is een afgeronde waarde van de zogenaamde z -waarde die hoort bij 95 procent ( 1,96 ).

Net als bij het betrouwbaarheidsinterval voor de populatieproportie, kun je hier weer voor een andere betrouwbaarheid kiezen als je de waarde van 2 vervangt door de z -waarde die hoort bij de gekozen betrouwbaarheid.