Snelle conclusies
1

Enkele leerlingen, die een onvoldoende voor wiskunde op het rapport hebben, krijgen bijles. Iedere donderdagmiddag krijgen ze 1 1 2 uur bijles. Het eerste proefwerk, enige weken later, blijkt voor hen een succes. De gemiddelde score van het groepje is 6,5 . Dus de bijles helpt prima, is de voor de hand liggende conclusie.

Bedenk argumenten om deze snelle conclusie onderuit te halen.

2

Geef kritiek bij de volgende situaties. Kritiek kun je geven op de opzet van het onderzoek of op de conclusies die getrokken worden.
Geef waar mogelijk aanwijzingen om het onderzoek te verbeteren.

a

Ontevreden vrouwen
Bij een onderzoek naar seksuele gewoontes werden 50.000 vrouwen aangeschreven met het verzoek een enquête in te vullen. Slechts 3750 vrouwen voldeden aan dat verzoek. De resultaten van het onderzoek werden vastgelegd in een rapport. Daarin wordt gesproken over het feit dat drie van de vier vrouwen ontevreden is over de man.

b

Vaccinatie levensgevaarlijk
In oktober 1976 werd in de Verenigde Staten gestart met griepvaccinatie. Allereerst werden de ouderen en zwakken ingeënt. In de eerste week werden 24.000 mensen van 65 jaar en ouder ingeënt. Drie ervan overleden kort hierna. Daarop stopten acht staten met de vaccinatie. Hier trok men blijkbaar de conclusie dat vaccineren gevaarlijk is.

c

Vitamines verlengen je leven
De laatste jaren is er een enorme stijging in het gebruik van vitaminen. Speciale 'gezondheidswinkels' rijzen als paddestoelen uit de grond. Een van die winkels wil voor reclamedoeleinden aantonen dat het gebruik van extra vitaminepillen de gezondheid bevordert. Er worden enquêteformulieren neergelegd in alle filialen van deze winkel. De enquête wordt ingevuld door 3214 mensen. Van deze groep zegt 91 % baat te hebben bij extra vitaminegebruik.
Vervolgens adverteert de winkel. In de advertentie zet hij: 'Onderzoek toont aan dat 91 % van de mensen baat heeft bij extra vitaminegebruik'.

d

Naar het buitenland?
Een onderzoeker wil graag weten hoeveel Nederlanders er dit jaar de zomervakantie in eigen land willen doorbrengen.
Om mensen voor zijn steekproef te selecteren bezoekt hij 27 reisbureaus in de randstad (daar wonen veel mensen) en interviewt daar iedere zevende bezoeker. Het resultaat van het onderzoek was dat een record aantal Nederlanders zijn vakantie in het buitenland wil doorbrengen.

3

De inktvis Paul leefde in een aquarium in Oberhausen (Duitsland). Had hij voorspellende gaven voor voetbalwedstrijden?
De dag voorafgaand aan een voetbalwedstrijd tussen twee landen werden Paul twee kistjes aangeboden, elk met een mossel als voedsel. Op de kistjes waren de vlaggen van de twee landen aangebracht. Het kistje dat Paul als eerste koos om de mossel te consumeren, was het land dat hij voorspelde als winnaar.

wedstrijd

winnaar
volgens Paul

uitslag

Duitsland - Polen

Duitsland

goed

Kroatië - Duitsland

Duitsland

fout

Oostenrijk - Duitsland

Duitsland

goed

Portugal – Duitsland

Duitsland

goed

Duitsland – Turkije

Duitsland

goed

Duitsland – Spanje

Duitsland

fout

Duitsland - Australië

Duitsland

goed

Duitsland - Servië

Servië

goed

Ghana - Duitsland

Duitsland

goed

Duitsland - Engeland

Duitsland

goed

Argentinië – Duitsland

Duitsland

goed

Duitsland - Spanje

Spanje

goed

Uruguay - Duitsland

Duitsland

goed

Spanje - Nederland

Spanje

goed

Hierboven staan Pauls voorspellingen tijdens het Europees kampioenschap van 2008 en het wereldkampioenschap van 2010.
Veronderstel dat Paul geen verstand van voetbal heeft.

a

Wat is dan de kans dat hij twaalf of meer van de veertien wedstrijden goed voorspelt?

b

Heeft Paul voorspellende gaven?

Paul is op op 12 juli 2010 als orakel met pensioen gegaan. Kort daarna, op 26 oktober is hij op 2 1 2 -jarige leeftijd overleden.

Soms lijkt het dat twee variabelen (de uitslag van een voetbalwedstrijd en de eerste keuze van een mossel) samenhangen. Zonder dat het duidelijk is wat die samenhang is. Veroorzaakt de ene variabel de andere, of omgekeerd, of hebben ze helemaal niets met elkaar te maken en berust de overeenkomst op louter toeval.
We bekijken nog wat voorbeelden.

4

Tussen 1960 en 1980 nam het aantal geboorten in Duitsland af. In dezelfde periode nam ook het aantal ooievaars in Duitsland af, terwijl de teelt van rode kool gelijk bleef. De theorie luidt: de ooievaarsstand neemt af, daardoor kunnen ze minder kinderen brengen.

a

Haal de theorie onderuit.

Lees het krantenartikel hiernaast. (De laatste zin had moeten zijn: Vooral bij personen van 68 jaar of ouder bleek dat het geheugen achteruit ging.)
Tofu is een vleesvervanger op basis van sojabonen.

b

Vind je dit bericht verrassend?

c

Kun je een mogelijke verklaring verzinnen?

Tussen 1995 en 2005 is de bierprijs flink gestegen en ook de bedragen die studenten lenen als aanvulling op de basisbeurs. Allicht: als de bierprijs stijgt, hebben de studenten hogere uitgaven, dus moeten ze wel meer lenen.

d

Geef commentaar.

Koeien met een naam geven meer melk, dan koeien zonder naam. Dit is de conclusie van een onderzoek dat de Ig-Nobelprijs voor diergeneeskunde in 2009 in de wacht sleepte.
(De Ig Nobelprijs is een parodie op de Nobelprijs en wordt ieder jaar uitgereikt voor tien onderzoeken waar men eerst om moet lachen, maar die ook aan het denken zetten.)

e

Geef een mogelijke verklaring.

Sinds de Tour de France is begonnen lijkt het wel of ik meer mensen op racefietsen zie. Het gaat vooral om mannen van middelbare leeftijd.

f

Geef een mogelijke verklaring.

Tijdens de kwartfinale Nederland-Frankrijk van het Europees kampioenschap voetbal van 1996 miste Clarence Seedorf de beslissende strafschop. Het bleek dat op die dag meer mannen een infarct kregen.

g

Vind je dat logisch?

Logisch, want zo’n wedstrijd brengt natuurlijk de nodige spanning met zich mee. En zo haalde een nieuw statistisch significant verband de krant: voetbal is dodelijk. Echter, de desbetreffende wedstrijd werd gespeeld op een zaterdag. Het blijkt dat de zaterdag altijd meer infarcten heeft, soms nog meer dan de ‘piek’ op de zaterdag van de gemiste penalty. (Naar Hans van Maanen, studium generale Utrecht, 17 februari 2010)

Hoe langer de naam van een eredivisie voetbalclub, des te slechter de prestaties.
Dit is de conclusie uit de eindstand van de vaderlandse voetbalcompetitie 2008/2009.
We onderscheiden de clubs in de bovenste helft (de eerste negen) en de onderste helft. En we kijken naar de lengte van de naam: bestaat die uit ten hoogste negen letters, of uit meer dan negen?

1

AZ

10

VITESSE

2

FC TWENTE

11

NEC

3

AJAX

12

WILLEM II

4

PSV

13

SPARTA ROTTERDAM

5

SC HEERENVEEN

14

ADO DEN HAAG

6

FC GRONINGEN

15

HERACLES ALMELO

7

FEYENOORD

16

RODA JC

8

NAC BREDA

17

DE GRAAFSCHAP

9

FC UTRECHT

18

FC VOLENDAM

h

Vul de volgende tabel in.

bovenste helft

onderste helft

totaal

korte naam

lange naam

totaal

i

Bereken de odds-ratio bij de tabel.

j

Geef commentaar op het geconstateerde verband tussen de lengte van de naam en de voetbalprestatie.

5

In opgave 8 hebben we gesproken over wiegendood/SIDS (sudden infant death syndrome).
De Britse expert Sir Roy Meadow schreef eind jaren ’70 dat het vrijwel uitgesloten was dat wiegendood meer dan één maal in een gezin voorkwam. "Eén keer wiegendood in een gezin is een drama, twee keer wiegendood is verdacht, drie keer wiegendood is moord", luidde de Wet van Meadow. Alleen al tussen 1993 en 2003 zijn enkel op basis van deze wet 258 ouders voor moord op hun kind veroordeeld. Eind 2003 werden de eerste vonnissen teruggedraaid, waarna er een brede discussie ontstond over de betrouwbaarheid van de wet van Meadow.
Ga uit van een wiegendood bij 1 op 4000 baby’s.

a

Wat is de kans dat in een willekeurig gezin met twee geboortes beide baby’s aan wiegendood overlijden?

b

Wat is de kans dat in een willekeurig gezin met drie geboortes alle drie de baby’s aan wiegendood overlijden?

Er is nog een andere factor in het spel. In Groot-Brittanië worden elk jaar 540.000 kinderen geboren. Je mag verwachten dat er jaarlijks 135 keer wiegendood optreedt. Bij een deel van die gezinnen zal nog een tweede kind geboren worden; stel dat er dat jaarlijks 100 zijn.

c

Hoe vaak verwacht je dat in honderd jaar tijd dat tweede kind ook aan wiegendood zal overlijden?

Omdat er zoveel kinderen geboren worden is het helemaal niet zo onwaarschijnlijk dat er twee keer ergens een wiegendood voorkomt in één gezin. Dat is wel erg toevallig, maar ook erg toevallige dingen komen voor, zeker als het “experiment” heel vaak herhaald wordt.
Vergelijk dit met de veroordeling van Lucia de Berk (opgave 9).

d

Kun je beredeneren dat de kans op twee of zelfs drie keer wiegendood in één gezin niet zo klein is als de uitkomsten van a, b en c doen geloven?

6

Een ander voorbeeld geeft de Bulgaarse lottotrekking van 10 september 2009: 4, 15, 23, 24, 35 en 42. De vorige trekking, op 6 september, waren precies dezelfde balletjes uit de draaiende trommel gevallen. De Bulgaarse Lotto werkt met de nummers 1 t/m 42. De kans dat in een week precies dezelfde getallen worden dan de week daarvoor is 0,00000019 .

a

Reken deze kans na.

b

Waarom betekent dit niet dat de Bulgaarse Lotto corrupt is?

Schijncausaliteit
Er lijkt een verband te zijn tussen wiegen dood en buikligging. Is dat een reden om baby’s niet meer op de buik te leggen?
Dat veel wiegendood-baby’s op de buik lagen, zou als volgt verklaard kunnen worden. Een kind voelt zich niet goed en is onrustig. Daarom legt een ouder het kind op de buik. Als het kind dan overlijdt, lijkt de buikligging de oorzaak te zijn.
Sinds 1996 overlijden 7 van de wiegendoodkinderen in een box. Is dit een reden om baby’s niet meer in een box te leggen?
Een verklaring zou kunnen zijn dat, als een baby in een box gelegd is, de ouders niet meer zo intensief op het kind (hoeven te) letten.
En buikligging in de box is helemaal uit den boze. Maar pas op. Onderzoeken wijzen uit dat buikligging in een box goed is voor de motorische ontwikkeling van het kind.
Tien van alle wiegendoodgevallen in Nederland vindt plaats op een kinderdagverblijf. Op een kinderdagverblijf is de kans op wiegendood maar liefst 4 maal zo groot als thuis.
Is dit een reden een kind niet meer naar een kinderdagverblijf te doen?
Een mogelijke verklaring is dat een kind meer gestrest is op een kinderdagverblijf.
De moraal
Wees voorzichting met het leggen van een oorzakelijk verband tussen twee verschijnselen.
De kans op een wiegendood is zo klein dat de ouders, de box of het kinderdagverblijf snel verdacht zijn. Maar er kunnen andere factoren in het spel zijn die heel plausibele verklaringen geven.

Placebo
Voordat een geneesmiddel op de markt komt, wordt eerst onderzocht of het effectief is. Maar hoe weet je of een gemeten effect is veroorzaakt door het geneesmiddel, of door andere factoren?
Die andere factoren kunnen van alles zijn. Patiënten kunnen bijvoorbeeld na verloop van tijd gewoon weer beter worden door het natuurlijke verloop van de ziekte: de ziekte is self-limiting, of het immuunsysteem maakt de patiënt beter. Ook door meetfouten of externe factoren kunnen gemeten effecten vertroebeld raken. Om toch het effect van het geneesmiddel correct te meten, worden geneesmiddelen vergeleken met een placebo. De patiënten die meedoen aan het onderzoek worden willekeurig verdeeld in twee groepen en krijgen precies dezelfde behandeling, met één belangrijk verschil: de ene groep krijgt het geneesmiddel en de andere groep een placebopil (die geen werkzame bestanddelen bevat).
Er kleven ethische aspecten aan het gebruik van placebo’s. Mag je patiënten willens en wetens een niet werkzaam middel voorschrijven? Volgens de Medisch Ethische Commissie wel als je ze bij aanvang van de studie duidelijk maakt dat ze misschien een placebo toegediend krijgen. Uiteindelijk is het wel ten bate van de wetenschap en de kennis over het geneesmiddel.

7

Gek genoeg blijken die placebo’s ook vaak genoeg een gunstig effect op de gezondheid te hebben: het placebo-effect.

Heb je hier een verklaring voor?

De rol van de menselijke psyche wordt prachtig gedemonstreerd door het volgende voorbeeld.
Bij een onderzoek kregen studenten een rood of een blauw pilletje, beide placebo’s, in de veronderstelling dat ze of een rustgevend of een oppeppend middel kregen toegediend. Niet alleen bleken de ‘pillen’ daadwerkelijk effect te hebben; de studenten wisten ook zeker dat de rode pillen de oppeppers waren en de blauwe pillen de rustgevende middelen.

8

Simpsonparadox
Burgerrechten zijn rechten die door de overheid gegarandeerd behoren te worden, en die de burgers beschermen tegen oneerlijke behandeling gebaseerd op huidskleur, geloof of geslacht. Vooral in de Verenigde Staten zijn burgerrechten in de 20e eeuw veel in opspraak geraakt doordat ze vaker voor blanken dan voor zwarten (Afro-Amerikanen) golden; vooral in de zuidelijke staten van de VS was dat het geval. In 1964 werd de Civil Rights Act aangenomen die de staten verplichtte hun burgerrechten voor al hun inwoners te laten gelden.
In de eerstvolgende tabel staat hoe het Amerikaanse Congres was samengesteld uit Democraten en Republikeinen opgesplitst naar de zuidelijke en noordelijke staten. In de tweede tabel staat hoe de Democraten en Republieken stemden, ook opgesplitst naar de zuidelijke en noordelijke staten.

aantal congresleden

democraten

republikeinen

totaal

noordelijk

154

162

316

zuidelijk

94

10

104

totaal

248

172

420

aantal vóórstemmers

democraten

republikeinen

totaal

noordelijk

145

138

283

zuidelijk

7

0

7

totaal

152

138

290

a

Bereken het percentage voorstemmers onder de democraten in de noordelijke staten (dus 145 van 154).

b

Ga na dat de percentages voorstemmers onder de democraten zowel in de noordelijke als van de zuidelijke staten groter waren dan de percentages voorstemmers onder de republikeinen.

Ga na dat over alle staten bekeken het percentage voorstemmers bij de republikeinen hoger was dan onder de democraten.

Terwijl de democraten positiever tegenover de Civil Rights Act stonden dan de republikeinen als je Noord en Zuid afzonderlijk bekijkt, is dat niet zo over het geheel bezien. Dit komt bijzonder vreemd, zelfs tegennatuurlijk, over. Vandaar dat men hier spreekt van een paradox.

9

Een nieuw medicijn werd getest.
100 mannen kregen het medicijn, waarvan er 60 genazen; 50 mannen kregen een placebo waarvan er 25 genazen.
80 vrouwen kregen het medicijn, waarvan er 70 genazen; 200 vrouwen kregen een placebo, waarvan er 160 genazen.

a

Ga na dat het medicijn beter dan de placebo presteert bij de mannen en ook bij de vrouwen.

b

Wat presteert het beste over alle mensen tezamen, het medicijn of de placebo?

De moraal
Intuïtie kan bedrieglijk zijn.

10

Terugval naar het midden

  1. De kinderen van hoogbegaafde ouders zijn vaak niet hoogbegaafd.

  2. Extreem lange mensen zijn vaak niet extreem zwaar.

  3. Een sportman, -vrouw of -ploeg die dit jaar een topprestatie heeft geleverd, zal volgend jaar waarschijnlijk wat minder goed presteren.

  4. Als je voor je laatste toets een laag cijfer hebt gehaald, zal de volgende toets waarschijnlijk iets beter gaan.

Ben jij het met de volgende beweringen eens?

Het idee achter al deze voorbeelden is: bij een extreem resultaat zal een volgende keer het resultaat wel weer extreem zijn, maar minder extreem, dus dichter bij het gemiddelde liggen.
Dit verschijnsel noemt men terugval naar het midden.

Francis Galton

Sir Francis Galton (1822 – 1911), een Brits statisticus (en neef van Charles Darwin), is grondlegger was van de psychometrie (het meten van persoonskenmerken). Rond 1888 stelde Galton vast dat verschillende menselijke eigenschappen, zoals lengte en intelligentie, de neiging hebben om dichter bij het gemiddelde te liggen in een volgende generatie. Lange ouders hebben bijvoorbeeld gemiddeld kinderen die minder lang zijn dan zijzelf, terwijl korte ouders juist kinderen hebben die gemiddeld langer zijn dan zijzelf. Hij noemde dit verschijnsel terugval naar het midden.

De bevindingen van Galton werden bevestigd door de Amerikaanse psycholoog Lewis Terman (1877 – 1956). Rond 1920 startte hij een onderzoek waarin meer dan 1000 hoogbegaafde kinderen (met een gemiddeld IQ van 152 ) levenslang gevolgd werden. In 1950 testte Terman 384 nakomelingen; die bleken een gemiddeld IQ te hebben van “maar” 128 . Meer dan de helft van deze kinderen van hoogbegaafde ouders waren niet hoogbegaafd.

11

Op grond van het bovenstaande zou je kunnen denken dat er in volgende generaties steeds minder hoogbegaafden zullen zijn.

Bedenk een reden waarom dat niet het geval zal zijn.

12

Waarom is terugval naar het midden relevant in deze paragraaf met titel “Gevaar”?

Veronderstel dat een prestatie afhangt van kundigheid en van toeval. Dan zal een zeer hoge prestatie meestal gevolgd worden door een minder hoge prestatie. Dat is zo omdat die hoge prestatie door geluk (meewerkende toevalligheden) tot stand kwam en bij gelijke kundigheid een volgende keer het geluk minder zal zijn of er zelfs sprake van pech kan zijn.
Dit is bijvoorbeeld het geval bij lichaamslengte; die wordt gedeeltelijk door aanleg bepaald, maar ook door toeval. En bij de dagtemperatuur van twee opvolgende dagen; de temperatuur op een dag hangt samen met die op de dag daarvoor, maar wordt gedeeltelijk door toeval bepaald. Vaak wordt echter niet aan die toevallige factoren gedacht en wordt de volgende keer een even hoge prestatie verwacht.

13

Geef commentaar op de volgende conclusies.

  1. Een bedrijf kan dit jaar erg goede jaarcijfers overleggen. Volgende jaar verwachten de aandeelhouders weer zulke goede cijfers.

  2. De jackpot viel in een jaar vier van de tien keer in Gelderland. Mensen overwegen nu om naar deze provincie te verhuizen.

  3. Vorige week waren er wel tien diefstallen in de Winkel van Sinkel. De directie stelde een opziener in uniform aan. Deze week waren er maar vier winkeldiefstallen. Zo’n opziener in uniform helpt dus.

  4. Een patiënt voelt zich erg beroerd en krijgt een medicijn. De volgende dag voelt hij zich een stuk beter. De verklaring ligt voor de hand: dat komt door het medicijn.

De moraal
Na een extreem slecht resultaat worden maatregelen genomen. Als er daarna verbetering optreedt, hoeft dat niet door die maatregelen te komen. Immers, meestal komt er een terugval naar het midden voor.

In de volgende opgave bekijken we een aardig model om terugval naar het midden te simuleren op de GR.

14

We willen met de grafische rekenmachine lengtes van mannen uit opeenvolgende generaties produceren.
Daarvoor gebruiken we de optie randomgenerator die willekeurige getallen uit een normale verdeling met een gemiddelde van 60 en een standaardafwijking van 8 geeft.
We maken de rij lengtes als volgt.

  1. Start met bijvoorbeeld 174 cm,

  2. neem 2 3 van de lengte,

  3. tel daarbij een random getal uit de normale verdeling met een gemiddelde van 60 en een standaardafwijking van 8 op,

  4. dit wordt de lengte van de volgende generatie.

a

Produceer op deze manier een rij van lengtes uit twintig opeenvolgende generaties.

b

Ga na of er bij de geproduceerde rij lengtes sprake is van terugval naar het midden.

c

Wat is (volgens dit model) de kans dat de zoon van een man van 195 cm langer is dan zijn vader?

d

Wat is (volgens dit model) de kans dat de zoon van een man van 160 cm kleiner is dan zijn vader?