Schatten van proporties

Door middel van een aselecte steekproef kun je schatten hoeveel procent van een populatie een zekere eigenschap heeft. Je kunt ook met een bepaalde, vooraf gekozen betrouwbaarheid zeggen tussen welke waarden/grenzen deze populatieproportie ligt. Je gebruikt daarvoor de onderstaande vuistregel.

Deze vuistregel zegt: het 95%-betrouwbaarheidsinterval voor de populatieproportie is
p ± 2 p ( 1 p ) n ,
met p de steekproefproportie en n de steekproefomvang.

Schatten van gemiddelden

Als van een steekproef de omvang, het gemiddelde en de standaardafwijking bekend zijn, dan kun je het 95%-betrouwbaarheidsinterval voor het populatiegemiddelde berekenen als:
X ¯ ± 2 S n ,
met X ¯ het steekproefgemiddelde, n de steekproefomvang en S de steekproefstandaardafwijking.

Ordinale variabelen vergelijken

Om te bepalen of er sprake is van een (groot) verschil tussen twee groepen op een ordinale variabele, bereken je het maximale cumulatieve percentageverschil. Met behulp van vuistregels geef je een oordeel over de omvang van het verschil tussen de twee groepen.

Maximale verschil in cumulatief percentage (max Vcp) (met steekproefomvang n > 100 )

  • als max  V c p > 40 , dan zeggen we “het verschil is groot”,

  • als 20 < max    V c p 40 , dan zeggen we “het verschil is middelmatig”,

  • als max    V c p 20 , dan zeggen we “het verschil is gering”.

Nominale variabelen vergelijken

Om te bepalen of er sprake is van een (groot) verschil tussen twee groepen op een nominale variabele bereken je phi. Met behulp van vuistregels geef je een oordeel over de omvang van het verschil tussen de twee groepen.

2 × 2 -kruistabel ( a    b c    d ) , met p h i = a d b c ( a + b ) ( a + c ) ( b + d ) ( c + d )

  • Als p h i < 0,4 of p h i > 0,4 , dan zeggen we “het verschil is groot”,

  • als 0,4 p h i < 0,2 of 0,2 < p h i 0,4 , dan zeggen we “het verschil is middelmatig”,

  • als 0,2 p h i 0,2 , dan zeggen we “het verschil is gering”.

Effectgrootte

Om na te gaan of er sprake is van een (groot, middelmatig of gering) verschil tussen twee groepen op een kwantitatieve variabele, kun je de effectgrootte gebruiken.

Effectgrootte E = X ¯ 1 X ¯ 2 1 2 ( S 1 + S 2 ) ,
met X ¯ 1 en X ¯ 2 de steekproefgemiddelden ( X ¯ 1 X ¯ 2 ),
S 1 en S 2 de steekproefstandaardafwijkingen.

Met behulp van vuistregels geef je een oordeel over de omvang van het verschil tussen de twee groepen.

  • E > 0,8 , dan zeggen we ”het verschil is groot”,

  • 0,4 < E 0,8 , dan zeggen we ”het verschil is middelmatig”,

  • E 0,4 , dan zeggen we ”het verschil is gering”.

Twee boxplots vergelijken

Om na te gaan of er sprake is van een (groot, middelmatig of gering) verschil tussen twee groepen op een kwantitatieve variabele kun je twee boxplots vergelijken. Met behulp van de onderstaande vuistregels geef je een oordeel over de omvang van het verschil tussen de twee groepen.

  • Als de boxen elkaar niet overlappen, dan zeggen we “het verschil is groot”,

  • als de boxen elkaar wel overlappen en een mediaan van een boxplot buiten de box van de andere boxplot ligt, dan zeggen we “het verschil is middelmatig”,

  • in alle andere gevallen zeggen we “het verschil is gering”.

Samenhang

Om het statistisch verband tussen twee kwantitatieve variabelen te onderzoeken, wordt meestal gebruik gemaakt van een spreidingsdiagram. Afhankelijk van de vorm van de puntenwolk kun je vaststellen of er een statistisch verband tussen de variabelen is en zo ja, of dat verband sterk is.
Er is sprake van een causaal verband (oorzakelijk verband) als er sprake is van oorzaak en gevolg.

In het spreidingsdiagram is ook een trendlijn getekend. Dit is de lijn die het beste past bij de puntenwolk. Met behulp van de formule van de trendlijn kun je uitrekenen welke waarde een variabele naar verwachting heeft als je de waarde van de andere variabele kent.