Temperatuur meet je met een thermometer. Of de een het nu wat aan de kille kant vindt en de ander juist een lekker temperatuurtje, de thermometer is onverbiddelijk. De thermometer geeft een getalswaarde aan de temperatuur die los staat van je persoonlijke mening.
Iets soortgelijks doet zich voor in de statistiek (en in veel meer gebieden van de wetenschap). In het voorgaande hebben we naar verschillen gekeken tussen twee groepen. Over de grootte van die verschillen kun je twisten. De een vindt dat ze aanzienlijk zijn, een ander vindt dat dat wel meevalt. We gaan nu proberen de verschillen te meten, dat wil zeggen uit te drukken in een getal. Welke manier van meten je kiest, hangt af van de situatie en soms van je persoonlijke voorkeur. Net zoals bij de thermometer: de Amerikanen doen het met Fahrenheit en in Europa houden we het op Celsius.
Je zou kunnen verwachten dat leerlingen die voor wiskunde A/C gekozen hebben, meer belangstelling hebben voor kunst dan wiskunde B-leerlingen. De variabele kunstbel van de leerlingenquête geeft hier informatie over. De volgende kruistabellen geven de resultaten van het denkbeeldige Amalia College.
In de eerste tabel staan de frequenties, in de tweede tabel de cumulatieve aantallen.
Vervolgens kijken we naar de cumulatieve percentages en hun verschillen Vcp. Die staan in onderstaande tabel. In het reepdiagram daarnaast zijn die percentages in beeld gebracht.
Je zoekt nu de maximale waarde van Vcp op. Dat is een geschikte maat voor het verschil tussen beide groepen op de variabele
kunstbel. Hij heet het maximale cumulatieve percentageverschil, of kortweg max. Vcp.
In dit geval is max. Vcp = 10%. Deze waarde zie je bij de reepdiagrammen terug als de meest steile verbindingslijn
tussen de beide staven.
In stappen bepaal je het max. Vcp-verschil dus als volgt:
Bepaal de cumulatieve frequenties van beide groepen.
Zet die om in de cumulatieve percentages.
Bepaal per waarde het (absolute) verschil van de cumulatieve percentages tussen de groepen.
Neem van die verschillen de grootste waarde; dat is max. Vcp.
In de praktijk hanteert men de regel:
als max. Vcp kleiner dan 15% is, dan is het verschil gering,
als max. Vcp tussen 15% en 30% is, dan is het verschil middelmatig,
als max. Vcp groter dan 30% is, dan is het verschil groot.
Hier zie je de kruistabel van aantal vreemde talen en wiskundegroep (A/C of B).
Bereken op het werkblad voor dit geval max. Vcp.
Is het verschil tussen beide groepen groot?
Bij de hoogste waarde van de variabele is Vcp altijd 0.
Leg dat uit.
Iemand overweegt bij de variabele profiel ook max. Vcp te bereken om de jongens en de meisjes te vergelijken.
Waarom is dat niet zinvol?
Je zou als verschilmaat ook het gemiddelde van alle verschillen Vcp kunnen kiezen.
Bedenk een voor- en een nadeel van deze keuze ten opzichte van max. Vcp.
In de volgende kruistabel, weer van het Amalia College, is het geslacht tegen de wiskundekeuze uitgezet.
Neem de tabel over en percenteer die verticaal.
Waarom is het in dit geval niet zinvol om max. Vcp uit te rekenen?
Nu max. Vcp als maat is afgevallen om het verschil in wiskundekeuze bij jongens en meisjes uit te drukken, moet je een andere maat bedenken.
Welke maat bedenk jij?
In opgave 35 is het niet zinvol om max. Vcp te bepalen, omdat er geen natuurlijke volgorde is tussen de twee geslachten man en vrouw. We zeggen dat geslacht een nominale variabele is (dat komt van het Latijnse woord nomen, wat naam betekent). Om max. Vcp zinvol te laten zijn moeten de waarden van de variabele een (natuurlijke) volgorde hebben. We spreken dan van een ordinale variabele (dat komt van het Latijnse woord ordo, wat volgorde betekent).
In het geval van de laatste opgave moeten we een andere maat verzinnen om grip te krijgen op de verschil man/vrouw in de A/C-groep en de B-groep. Daarvoor vergelijken we de verhouding aantal man : aantal vrouw in beide groepen. Zo'n verhouding noemt men een odd. Voor de B-groep is die gelijk aan .
Odds is een Engelse term die vooral bij weddenschappen wordt gebruikt. In een gokkantoor kan men wedden op de uitslag van een wedstrijd bijvoorbeeld van A tegen B. De odds van A is de wedverhouding “kans dat A wint” : “kans dat A verliest”. De odds bepalen de uitbetaling die het kantoor doet als A wint en als A verliest.
Hoe groot is die verhouding bij de A/C-groep?
Vind jij dat die verhoudingen in de A/C-groep en in de B-groep veel verschillen?
Het quotiënt van deze twee man : vrouw-verhoudingen heet de ongelijkheidsverhouding of de odds-ratio van de man : vrouw-verhouding tussen de A/C- en de B-groep.
Laat zien dat de odds-ratio hier 2,37 is.
Bereken de odds-ratio vanuit de tabel in opgave 35, maar nu voor de verhouding B : A/C tussen de vrouwen en de mannen.
Verschilt deze waarde van de odds-ratio in opgave 36? Leg uit dat dat geen toeval is.
Wat is de odds-ratio als er geen verschil is in de wiskundekeuze tussen mannen en vrouwen?
Wat kun je over de odds-ratio zeggen als de wiskundekeuzes tussen mannen en vrouwen erg veel verschillen?
Let op de volgorde. Als je de waarde hebt gevonden voor de man : vrouw-verhouding tussen twee groepen, is de odds-ratio voor de omgekeerde verhouding vrouw : man ook de omgekeerde waarde: .
Meestal wordt de volgorde zo gekozen dat de odds-ratio groter dan of gelijk aan is. In de rest van het hoofdstuk zullen we ons aan deze afspraak houden.
Als waardering van de odds-ratio is gangbaar:
als de odds-ratio kleiner dan of gelijk aan 2 is, dan is het verschil gering,
als de odds-ratio tussen 2 en 3 ligt, dan is het verschil middelmatig,
als de odds-ratio groter dan 3 is, dan is het verschil groot.
De volgende kruistabel geeft nog eens de verdeling van het aantal vreemde talen tegenover wiskunde B of wiskunde A/C.
Hoe groot is de odds-ratio voor een-of-twee talen : drie-of-vier talen tussen de twee groepen?
Je ziet hier weer de kruistabel waarin de kunstbelangstelling en de wiskundekeuze (A/C of B) wordt vergeleken. De scores 1, 2 en 3 noemen we laag en de scores 4, 5 en 6 hoog.
Maak hiermee een kruistabel voor de kunstzinnige belangstelling (laag of hoog) tegenover de wiskundegroep (A/C of B) (zie ook werkblad):
Bereken de odds-ratio voor laag : hoog tussen de twee wiskundegroepen.
In de volgende kruistabel zijn de eindcijfers voor wiskunde in klas 3 (variabele
Vul op het werkblad zelf de tabel in voor de B-groep.
Bepaal de waarde van max. Vcp.
Waarom kun je hier de odds-ratio niet gebruiken?
Je kunt nu net zo'n truc uithalen als in opgave 39: neem de eindcijfers voor wiskunde samen in twee groepen: laag (5,6,7) en hoog (8,9,10).
Maak een bijbehorende kruistabel.
Bereken de odds-ratio voor de verhouding laag : hoog tussen beide wiskundegroepen.
Waarop verschillen de A/C- en B-leerlingen van het Amalia College het meest: op geslacht, op aantal vreemde talen, op kunstzinnige belangstelling of op eindcijfer voor wiskunde in klas 3?