Is er verschil?
Heeft het gebruik van kunstmest bij appelbomen zin? Om daar achter te komen worden twee groepen appelbomen bekeken: in groep A wordt kunstmest gebruikt en in groep B niet. Het blijkt dat de appels in groep A gemiddeld een diameter van cm hebben met een standaardafwijking van cm. De appels in groep B hebben een diameter van cm met een standaardafwijking van cm.
Kan op grond van dit resultaat beslist worden dat het gebruik van kunstmest zinvol is, of is het verschil daarvoor te gering? (Kleine verschillen kunnen altijd wel optreden door toevallige verschillen in omstandigheden.)
Dit is een vraag waar de statistiek antwoord op wil geven. We willen het effect van het gebruik van kunstmest in een getal uitdrukken. Als dat getal groot is, zullen we concluderen dat kunstmest grotere appels geeft, als het getal klein is, zullen we dat niet zeggen (en natuurlijk blijven er twijfelgevallen).
Stel dat groep A als gemiddelde cm met standaardafwijking zou geven, was dan het effect van het gebruik van kunstmest groter of kleiner dan bij het bovenbeschreven resultaat?
Stel dat groep A als gemiddelde cm met standaardafwijking zou geven, was dan het effect van het gebruik van kunstmest groter of kleiner dan bij bovenbeschreven resultaat?
Bij een onderwijskundig onderzoek wordt in twee vergelijkbare klassen een wiskundig begrip op twee verschillende manieren uitgelegd: een traditionele manier en een nieuwe manier. In de twee klassen werd de uitleg afgesloten met dezelfde toets.
Het dubbele histogram laat de (denkbeeldige) toetsresultaten van de twee klassen zien.
De klas waarvan links het histogram staat had de nieuwe manier van uitleg gekregen.
De cijfers in het rechter histogram zijn precies punt lager dan in het linker. Het gemiddelde van de rechter klas is dus precies punt lager dan dat van de linker klas. De standaarddeviaties zijn gelijk (Kun je
uitleggen waarom?); in dit geval is . De nieuwe manier van uitleg lijkt een duidelijk effect te hebben. Hoe groot het
effect is, gaan we uitdrukken in een getal.
Daartoe leggen we de twee histogrammen over elkaar en letten op de overlap.
Er zitten van de leerlingen in de overlap, dat is ; dus zit niet in de overlap.
Bij overlap zou het effect van de nieuwe uitleg nihil zijn. Bij overlap zou het effect van de nieuwe uitleg zeer groot zijn. Het percentage dat niet in de overlap zit wordt genoteerd met de Griekse letter . In dit geval is ().
Het experiment wordt herhaald in twee vergelijkbare klassen op een andere school. Hier zie je het (weer denkbeeldige) resultaat.
Hoeveel verschillen de gemiddeldes tussen de twee klassen? En de standaardafwijkingen?
Waaraan zie je dat op de tweede school de standaardafwijking van de toetsresultaten groter is dan op de eerste school?
De standaardafwijking is nu .
Leg op het werkblad de histogrammen over elkaar.
Hoeveel procent van de leerlingen zit in het gemeenschappelijke deel?
Hoe groot is ?
Op welke school heeft de nieuwe uitleg het meeste effect gehad?
Het percentage dat niet in de overlap zit is een maat voor het effect dat een nieuwe uitleg heeft. Als , is er geen effect. Hoe groter , des te groter het effect. De groepen die je vergelijkt moeten even groot zijn.
Het effect van de nieuwe uitleg kan ook op een andere manier worden gemeten. Daarbij is niet alleen het verschil van de gemiddelde toetscijfers van belang, maar ook de standaardafwijkingen in beide groepen.
J. Cohen stelde in 1962 voor de effectgrootte bij een vergelijking van twee groepen als volgt te berekenen: neem het verschil tussen de gemiddeldes en deel dat door de standaardafwijking (als tenminste de standaardafwijkingen in beide groepen gelijk zijn; neem anders het gemiddelde van de standaardafwijkingen). Hij gebruikte de letter voor deze effectgrootte.
Hierbij is er altijd sprake van een groep waarop iets nieuws wordt uitgeprobeerd en een groep waarop dat niet gebeurt (de controlegroep).
Waardoor in deze formule gedeeld moet worden is onderwerp van discussie tussen statistici. Volgens sommigen kan beter gedeeld worden door de standaardafwijking van de controlegroep. Wij zullen bovenstaande definitie hanteren.
Ga met een berekening na dat de effectgrootte in de eerste school (in de tekst voor opgave 31) ongeveer is.
Bereken de effectgrootte in de tweede school (opgave 31).
In welke school had de nieuwe uitleg het meeste effect?
De
effectgrootte
is een maat voor het verschil tussen twee groepen aan de hand van de gemiddeldes
en de standaarddeviaties van de twee groepen.
,
met en de steekproefgemiddelden ,
en de steekproefstandaardafwijkingen.
Als waardering van is vrij gangbaar:
, dan zeggen we ”het verschil is groot”,
, dan zeggen we ”het verschil is middelmatig”,
, dan zeggen we ”het verschil is gering”.
Bereken de effectgrootte van kunstmest in de situatie van het begin van deze paragraaf.
Is het effect van kunstmest groot?
Waarom wordt er in de formule voor de effectgrootte überhaupt gedeeld (door het gemiddelde van de standaardafwijkingen)? Waarom is het verschil tussen de gemiddeldes niet goed? In deze opgave wordt dat uitgelegd.
Stel dat de cijfers niet op een schaal van t/m zouden zijn gegeven, maar op een schaal van t/m . We kijken naar de eerste school.
Wat zou dan het verschil tussen de gemiddeldes zijn?
Wat zou de standaardafwijking dan zijn?
Wat is dan dus de effectgrootte?
Dankzij het feit dat gedeeld wordt door de standaardafwijking, doet de “schaal” waarop de cijfers worden gegeven er niet toe. Als niet gedeeld zou worden door de standaardafwijking zou je niet kunnen zeggen of een effectgrootte van bijvoorbeeld groot is of niet.
Op het Amalia College telt in havo4 de A-groep leerlingen en de B-groep leerlingen. In de volgende tabel zijn van vijf variabelen voor beide groepen het gemiddelde en de standaardafwijking gegeven.
Bereken voor elke variabele de effectgrootte van de groep en benoem telkens de grootte van het effect.
Op welke variabele verschillen de twee groepen het meest?
Op welke variabele(n) verschillen de twee groepen maar weinig, vind jij?
In de volgende figuur zie je een dubbel steelbladdiagram van de scores op cijfgem in de wiskunde-A- en de wiskunde-B-groep van het Amalia College.
Bereken de effectgrootte van de groep op de variabele cijfgem.
In de volgende figuur zijn hokken om de bladeren van het steelbladdiagram getekend. Dan gaat het op twee histogrammen lijken.
Wat zijn de klassengrenzen bij deze histogrammen?
Waarom kun je in dit geval niet de verschilmaat met de gegevens van deze histogrammen berekenen?
We illustreren de effectgrootte aan de hand van de lengte van jongens en meisjes. Zet je een groep van -jarige meisjes naast een groep -jarige jongens, dan zie je het lengteverschil onmiddellijk. Op -jarige leeftijd is het verschil nog nauwelijks waarneembaar. Tot de leeftijd van jaar zijn jongens en meisjes in Nederland vrijwel even lang, maar daarna ontwikkelt zich een verschil. Meisjes van jaar zijn gemiddeld cm lang en jongens van deze leeftijd cm. De standaardafwijking zowel bij de meisjes als bij de jongens is op die leeftijd cm.
Bereken de effectgrootte van de sekse op de lengte bij -jarigen.
Is hier sprake van een gering, middelmatig of groot verschil?
Op -jarige leeftijd zijn de gemiddeldes cm en cm, terwijl de standaardafwijkingen bij beide groepen cm blijft.
Wat is nu de effectgrootte en hoe zou je de grootte van dat verschil nu kwalificeren?
Voor de jongens en meisjes in 4 havo van het Amalia College zijn de gemiddelde lengtes: en cm. De bijbehorende standaardafwijkingen zijn en cm.
Is hier sprake van een gering, middelmatig of groot verschil?
Bij een bloedonderzoek worden het hemoglobinegehalte en de hoeveelheid rode bloedcellen
gemeten. In de uitslag van het onderzoek
staan van beide de gemeten waarden. Om deze uitslag te kunnen beoordelen, worden
de gemeten waarden vergeleken met de
bijbehorende referentiewaarden. Dit zijn de waarden zoals ze gevonden worden bij van de gezonde mensen. In deze opgave bekijken we de
referentiewaarden van volwassenen.
Het hemoglobinegehalte wordt uitgedrukt in millimol per liter (mmol/L) (een mol is
een eenheid voor het aantal deeltjes) en de hoeveelheid rode
bloedcellen in biljoenen per liter ( biljoen ). We gaan ervan uit dat het hemoglobinegehalte en de hoeveelheid rode bloedcellen
van gezonde
mannen normaal verdeeld zijn. Dit geldt ook voor het hemoglobinegehalte en de hoeveelheid
rode bloedcellen van gezonde vrouwen.
In de tabel staan de referentiewaarden van het hemoglobinegehalte en van de hoeveelheid
rode bloedcellen. Deze referentiewaarden liggen
symmetrisch om het gemiddelde. Zo kun je in de tabel bijvoorbeeld aflezen dat van de gezonde mannen een hemoglobinegehalte heeft
tussen mmol/L en mmol/L.
Bereken de standaardafwijking van de hoeveelheid rode bloedcellen van gezonde vrouwen. Geef je antwoord in biljoenen per liter en rond af op één decimaal.
De standaardafwijking van het hemoglobinegehalte van zowel gezonde mannen als gezonde vrouwen is mmol/L.
Bereken of het verschil tussen het hemoglobinegehalte van gezonde mannen en gezonde vrouwen gering, middelmatig of groot is.
In paragraaf 13 vind je een onderzoek dat je nu kunt doen.