De wiskunde A-docent Jan Stoer zag het examen met vertrouwen tegemoet. Zijn klas had goed gewerkt, dus verwachtte hij dat het vwo wiskunde A-examen wel goed zou gaan. En dat bleek ook het geval te zijn: de leerlingen scoorden de volgende cijfers:
Jan maakte bij de cijfers een frequentiehistogram, met klassebreedte . De cijfers tot en met komen in de klasse “”, enzovoort.
Wat was de mediaan van de cijfers?
Voor alle leerlingen in Nederland die het wiskunde A-examen in 2010 hebben gemaakt, was de mediaan .
Hoeveel procent van de klas van Jan Stoer scoorden boven de landelijke mediaan?
Geen wonder dat Jan Stoer trots was op zijn klas (en op zichzelf). Henk Modaal, zijn collega Frans, is niet zo onder de indruk van de prestaties van Jans klas. Hij redeneert: als je een munt keer opgooit, kan die best of meer keer op kop vallen.
Bereken die kans.
Wat denk jij, is de trots van Jan Stoer terecht?
Twee meningen, die van Jan en van zijn collega staan tegenover elkaar:
Jan: “De klas heeft buitengewoon goed gepresteerd”,
Henk: “Dit kan best toeval zijn”.
Als Henk gelijk heeft, is de kans dat een leerling bovenmodaal scoort . Dat noemen we de
nulhypothese: H0.
Als Jan gelijk heeft, is die kans groter dan ;
dat is de alternatieve hypothese H1.
H1 zegt niet hoe groot de kans precies is; alleen maar dat hij groter is dan .
Wie gelijk heeft is niet met zekerheid vast te stellen. Maar wel hoe zeldzaam de prestatie
van Jans klas is,
onder de aanname dat Henk gelijk heeft.
Stel dat in Jan Stoers klas alle leerlingen boven de landelijke mediaan zouden hebben gescoord. Dan zou het wel heel toevallig zijn dat dat resultaat door toeval tot stand is gekomen. In dat geval zal elk weldenkend mens Henks hypothese verwerpen.
Stel dat in Jans Stoers klas maar leerlingen boven de landelijke mediaan zouden hebben gescoord. Dat is een heel gewoon resultaat. Dan zal een weldenkend mens Henks hypothese niet verwerpen.
Vraag: Bij welk aantallen leerlingen die boven de mediaan scoren verwerp je Henks hypothese, en bij welke aantallen niet? Met andere woorden: Waar trek je de grens?
Hierboven staan de mogelijke aantallen leerlingen die boven de landelijke mediaan scoren; de aantallen lager dan zijn weggelaten. Stel dat we de grens tussen en trekken:
De kans dat door louter toeval (zoals Henk beweerde) het aantal in het linker stuk
terecht komt is ,
de kans dat hij in het rechter stuk terecht komt is dus .
Het aantal leerlingen boven de mediaan in Jan Stoers klas was . Dat zit in het rechter stuk.
Omdat de kans om daarin terecht te komen slechts is, is de prestatie van Jans klas waarschijnlijk
geen toeval.
We hadden de grens ook tussen en kunnen trekken:
De kans op het rechter stuk is nu zelfs maar . Omdat het aantal in Jans klas in dat gebied valt, is de
conclusie gerechtvaardigd dat Jan een goede klas had.
Er zit iets willekeurigs in de aanpak. Wat vind je een kleine kans? Dat bepaalt waar
je de grens gaat
trekken. En dat bepaalt weer of je Henk gelijk geeft of niet.
We letten op het aantal leerlingen dat boven de landelijke mediaan scoort: dat is de toetsingsgrootheid .
De mogelijke waarden worden opgesplitst in twee stukken, zo dat - als H0 waar is - de kans dat een waarde binnen het ene (in dit geval rechter) stuk aanneemt kleiner is dan α.
Als dan toch een waarde in dat stuk aan blijkt te nemen, zal men H0 verwerpen.
Dat stuk heet het kritieke gebied. “Kritiek”, omdat dan wel eens een verkeerde beslissing genomen kan
worden. Het kritieke gebied hangt af van de waarde van α.
α heet wel het significantieniveau. Vaak wordt genomen.
Om het kritieke gebied in bovenstaand voorbeeld bij te bepalen, kun je met de GR een tabel maken.
Met de tabel zie je: ligt niet in het kritieke gebied,
wel. Dus het kritieke gebied bij
bestaat uit de getallen
.
NB. De kans bij in de tabel bereken je met de GR als volgt:
.
Ga na hoe je de tabel in het voorgaande voorbeeld op de GR kunt maken.
Wat is het kritieke gebied in bovenstaand voorbeeld bij
.
Iemand zegt helderziende te zijn. Hij kan zeggen of een speelkaart een klaveren, ruiten, harten of schoppen is – zonder de kaart te zien natuurlijk. Hem worden twintig kaarten voorgelegd, waarvan hij de kleur gaat voorspellen. is het aantal goede voorspellingen dat hij gaat doen.
Wat is het waardengebied van ?
Stel H0 : De “helderziende” is een bedrieger en heeft geen talent om kaarten te voorspellen.
Wat is dan de kans per kaart dat hij hem goed voorspelt?
Wat is dan de verwachtingswaarde van ?
Wat is het kritieke gebied als ? En als ? En als ?
Een atleet zegt tegen een journalist dat hij de meter gemiddeld loopt in
seconden en dat hij
% van zijn
sprints loopt binnen de seconden.
Neem aan dat zijn -metertijd normaal verdeeld is.
Welke standaardafwijking volgt uit de beweringen van de atleet? Geef je antwoord in twee decimalen.
De atleet gaat de meter lopen. De tijd in seconden die hij gaat realiseren noemen we . Veronderstel dat de atleet gelijk heeft. We splitsen de verzameling mogelijke waarden van in twee stukken:
waarden boven of gelijk aan een zekere grenswaarde ; dat is het kritieke gebied,
waarden onder die grenswaarde .
Dat doen we zo, dat - als de atleet gelijk heeft - een resultaat in het kritieke gebied kleiner dan α is.
Wat is het kritieke gebied als .
Bepaal ook het kritieke gebied als .
De journalist gelooft de atleet niet als een waarde boven of gelijk aan aanneemt; anders wel. De atleet realiseert een tijd van seconde.
Wat is bij elk van de waarden van α de conclusie van de journalist?
Iemand doet een bewering, een ander twijfelt aan de juistheid daarvan. Een hypothesetoets is een procedure om te beslissen wie gelijk krijgt. Daarbij heb je:
twee hypothesen: de nulhypothese H0 en de alternatieve hypothese H1,
een toetsingsgrootheid; dat is het aantal dat geteld wordt (of een gewicht dat gemeten wordt, of ...),
een criterium dat zegt bij welke waarden van de nulhypothese wordt verworpen. Deze waarden vormen het zogenaamde kritieke gebied.
Het kritieke gebied wordt zo bepaald dat - als H0 waar is - de kans dat een waarde aanneemt in het
kritieke gebied kleiner is dan een vooraf afgesproken α. Deze α heet het
significantieniveau.
Voor α neemt men vaak ,
of zelfs , afhankelijk van hoe zwaarwegend de beslissing is.
Schematisch:
H0: en H1:
Kritiek gebied:
Voorbeeld (opgave 9)
H0: Henk heeft gelijk en H1: Jan heeft gelijk
het aantal leerlingen dat hoger dan de landelijke mediaan scoort;
is binomiaal verdeeld met en succeskans ,
H0: en H1: ,
Kritiek gebied:
Definieer en formuleer H0 en H1 in de opgaven 20 en 21.
Na het opstellen van de hypothesetoets volgt een experiment (Let op de juiste volgorde.
Je moet eerst de toets opstellen en daarna pas het experiment uitvoeren.) Daarin neemt
een waarde aan.
Als in het kritieke gebied zit, wordt H0 verworpen
(en dus H1 geaccepteerd).
Waarschijnlijk gebeurt dat terecht, maar helemaal zeker is dat niet. Het is dus mogelijk
dat een verkeerde
beslissing wordt genomen. Vandaar de term kritiek gebied.
Als H0 ten onrechte wordt verworpen, spreekt men van de
fout van de eerste soort. De kans op de fout
van de eerste soort is kleiner dan α.
Als niet in het kritieke gebied zit, wordt
H0 niet verworpen.
Er is een redelijke kans dat dit onterecht gebeurt. Men spreekt dan van de fout van de tweede soort.
Dit wordt meestal minder erg gevonden.
Als H0 niet verworpen wordt, omdat het resultaat niet significant is, kan er toch (veel) twijfel bestaan of H0 wel juist is. Vergelijk dit met de rechtspraak: als een verdachte bij gebrek aan bewijs niet wordt veroordeeld, betekent dat nog niet dat hij onschuldig is.
In het begin van een voetbalwedstrijd moet de speelrichting van de teams worden bepaald
en wie mag
aftrappen. De scheidsrechter doet dit door “tossen”: hij gooit een muntstuk op; als
het op kop valt kiest
het team dat kop koos de speelrichting en de andere partij doet de aftrap. (Voor de
tweede helft is het
omgekeerd.)
Men gaat er bij de toss vanuit dat het muntstuk met evenveel kans op kop als op munt
valt. Als in plaats
van een muntstuk een kroonkurk wordt gekozen, is dat niet zo zeker.
De kans dat een kroonkurk met de holle kant naar boven valt, noemen we .
We zetten twee meningen tegenover elkaar:
H0: en H1: .
Omdat volgens de alternatieve hypothese zowel groter als kleiner dan 0,5 kan
zijn, hebben we hier te maken met een tweezijdige toets.
is het aantal keer dat de holle kant boven komt,
in een serie van vijftig worpen.
H0 zal worden verworpen als de waarde van sterk afwijkt van het verwachte
aantal , naar beneden of naar boven. Het kritieke gebied bestaat dus uit twee
stukken, namelijk de erg lage aantallen en de erg hoge aantallen. Beide stukken
moeten een kans hebben van hoogstens .
Bepaal het kritieke gebied bij .
blijkt de waarde aan te nemen.
Is de kroonkurk bruikbaar om te tossen?
Sanne en Harm toepen regelmatig samen. Toepen is een kaartspel waarbij de spelers elk vier kaarten krijgen uit een spel van kaarten: B, V, H, A, 7, 8, 9, 10 van elke kleur. De 10 is de hoogste, de boer de laagste kaart. Het is dus gunstig om 10’en te krijgen. De kans dat een speler minstens één 10 krijgt is .
Reken dat na.
Die kans is , tenminste als er eerlijk gedeeld wordt. Harm is argwanend en denkt dat Sanne de kaarten “steekt” als ze de kaarten deelt. Hij denkt dat Sanne - als ze zelf deelt - veel vaker ten minste één 10 heeft dan in % van de keren. We gaan dit vermoeden toetsen, in twintig keer dat Sanne deelt.
Leg uit dat je hier niet met een tweezijdige toets te maken hebt.
We spreken hier van een eenzijdige toets.
Definieer een toetsingsgrootheid en formuleer H0 en H1.
Bepaal het kritieke gebied bij .
Harm telt dat Sanne dertien keer een of meer 10’en had als ze deelde.
Wat gaat Harm concluderen bij ?
Over eenzijdig en tweezijdig
Vaak constateren mensen iets, bijvoorbeeld dat een munt vaak op kop valt en denken
daarom dat ze
eenzijdig moeten toetsen. H0: kans op kop tegen H1: kans op kop
.
Dit is onjuist. Zo’n
constatering mag je wel op het idee brengen een hypothese te toetsen, maar je moet
onbevoordeeld aan de
toets beginnen: eerst de toets formuleren en dan pas het experiment uitvoeren. In
dit geval moet dus
tweezijdig getoetst worden.
In het voorbeeld van het toepen deelt Sanne eerlijk of niet. Als ze oneerlijk deelt,
is het verwachte aantal
10’en per keer groter dan en beslist niet kleiner. Nu moet dus eenzijdig getoetst worden.
Sanne beweert dat een punaise met kans met de punt naar boven valt en met kans
met de punt naar
beneden. Harm zou niet weten waarom dat zo is.
Om Sannes bewering te toetsen, keert hij een bakje met honderd punaises ondersteboven
en telt het aantal
punaises dat met de punt omhoog komt te liggen. Als significantieniveau neemt hij .
Het kritieke gebied bestaat uit twee stukken. De kans dat de waarde van in één van die stukken ligt,
moet dus kleiner dan zijn.
Bereken en .
Wat zal Harms conclusie zijn als de waarde blijkt te hebben?
Wat zal Harms conclusie zijn als de waarde blijkt te hebben?
Als de waarde blijkt te hebben, hoeven we het kritieke gebied niet te bepalen. We kunnen volstaan
met de kans . Omdat die kleiner is dan
, kan Harm Sannes bewering verwerpen.
We noemen de overschrijdingskans van , dat is de kans op een aantal van of meer.
Bekijk nog eens het vermeende steken van de kaarten door Sanne (opgave 24). Neem aan H0 is waar: Sanne deelt eerlijk. is het aantal keer dat Sanne een of meer 10’en krijgt in een serie van twintig keer dat ze zelf deelt. Neem als significantieniveau %.
Wat is dan ?
Omdat deze kans kleiner is dan , zullen we H0 bij verwerpen, als Sanne keer ten minste één 10 krijgt in de serie van twintig. Ook nu hoeven we dus niet het kritieke gebied te bepalen. De kans is de overschrijdingskans van , dat is de kans op een aantal van of groter.
Gregor Mendel deed biologische experimenten, waarbij hij erwtenplantjes met elkaar kruiste. Volgens de theorie moesten % van de nakomelingen geel zijn en % groen. Hij testte de theorie met erwtenplantjes van de tweede generatie.
Wat was Mendels toetsingsgrootheid? En welke waren H0- en H1-hypothese, denk je?
Wat is het kritieke gebied bij ?
Soms moet je eenzijdig en soms tweezijdig toetsen.
In het geval van tweezijdig toetsen, bestaat het kritieke gebied uit twee stukken.
Die worden zó bepaald
dat de kans dat de toetsingsgrootheid een waarde in een van die stukken aanneemt – als H0 waar is –
kleiner is dan α. Dus zó dat de kans dat een waarde in één van die stukken aanneemt kleiner is dan .
Stel dat de waarde aanneemt.
H0 wordt verworpen als de overschrijdingskans kleiner is dan en ook als de overschrijdingskans
kleiner is dan .
In het geval van eenzijdig toetsen, bestaat het kritieke gebied uit één stuk. Dat
wordt zó bepaald dat de
kans dat de toetsingsgrootheid een waarde in dat stuk aanneemt – als H0 waar is – kleiner is dan α. Stel dat de waarde aanneemt.
Bij een rechtszijdige toets wordt H0 verworpen als de overschrijdingskans kleiner is dan α en bij
een linkszijdige toets als de overschrijdingskans kleiner is dan α.