Echt onderzoek is een reis door terra incognota, een grillig pad zonder
bewijsbaar doel, waar een vooraf aangewezen bestemming bijna nooit
blijkt te bestaan. Als je produceert wat je hebt aangekondigd, is het
product platvloers of bedrog.
Vincent Icke, 22 maart 2010
Dagelijks staan er in de krant statistische uitspraken. De precieze betekenis is vaak
niet duidelijk en of ze
waar zijn is ook maar de vraag. Op welke feiten is zo’n uitspraak trouwens gebaseerd?
We bekijken enkele uitspraken.
“Vandaag is het tot °C en dat is koel voor de tijd van het jaar.”
“De kans dat er in uw woning brand uitbreekt is op ” Advertentie van brandmelders. In Spits december 2010.
“De inkomensverdeling in Nederland is iets ongelijker dan in de Scandinavische landen, maar het verschil is niet significant.” Centraal planbureau, ISBN 978-90-5833-426-8
“Twee keer per week witte rijst eten verhoogt het risico op ouderdomssuikerziekte met procent.” NRC 15-06-2010
“De kinderen van gescheiden ouders hebben drie keer zoveel kans om met justitie in aanraking te komen.” NRC 15-01-2011
“De kans op regen is %.”
“Vroeg kalende mannen hebben een twee keer zo groot risico later in hun leven prostaatkanker te krijgen als mannen die op hun twintigste nog een volle haardos hebben.” NRC 17-02-2011
Is jou duidelijk wat de bovenstaande uitspraken zeggen?
Denk je dat de uitspraken juist zijn?
Waarom zijn dit statistische uitspraken?
Het aantal echtscheidingen is tussen 2004 en 2005 gestegen van naar .
Vind je dit een grote stijging?
Of dit een forse stijging is, kun je niet zo maar zeggen. Informatief is hoe de aantallen
echtscheidingen in
de voorgaande jaren waren. Is er iets in de wetgeving veranderd?
Warmt de aarde op? Daarover is men het niet eens. De gemiddelde jaartemperaturen van 2004, 2005, 2006 en 2007 waren in België achtereenvolgens: , , en °C.
Vind je dat je hieruit mag concluderen dat het in België warmer wordt?
Ook hier moet je voorzichtig zijn met conclusies. Is de trend in de temperaturen
duidelijk genoeg? Er
wordt veel gepraat en geschreven over de opwarming van de aarde. En deze trend past
daar prima bij.
Het bleek dat de gemiddelde jaartemperatuur in 2008 °C was, in 2009 °C en in 2010
°C.
Discussie
De krant en internet staan vol van uitspraken als in opgave 1 en 2. Het is goed je
af te vragen wat zo’n
uitspraak nou eigenlijk precies betekent. En op welke gegevens is zij gebaseerd? Soms
is de conclusie
voorbarig of erg onzeker. Als illustratie nog enkele voorbeelden.
In 2010 was er veel ophef over een groot aantal zelfmoorden bij France Telecom. Lees onderstaand krantenartikel uit NRC van 7 oktober.
Was het aantal zelfmoorden bij France Telekom onrustbarend?
In het vakblad Automotive van de automobielindustrie stond in januari 2011 het volgende.
Vind jij de stijging onrustbarend?
Hoe denk je nu over de stijging van het aantal autodiefstallen tussen 2009 en 2010?
Polio of kinderverlamming wordt veroorzaakt door het poliovirus. Polio kwam vroeger
voor bij 1 op de
kinderen. In % van de besmettingen merkt men niks van het poliovirus,
in à % treden
verlammingsverschijnselen op. Totdat de poliovaccinatie in 1957 werd opgenomen in
het
Rijksvaccinatieprogramma (DKTP-prik) werden jaarlijks enkele honderden gevallen van
polio gemeld.
Tijdens epidemieën liep het aantal op tot à ,
zoals in de oorlogsjaren 1943/1944, in 1952 en
1956. Na 1957 kwamen epidemieën alleen nog voor binnen groeperingen die om religieuze
redenen
vaccinatie afwijzen. Vaccinatie tegen polio beschermt vermoedelijk levenslang.
In 1954 ontwikkelde Jonas Salk in de VS het poliovaccin. Het vaccin werd uitgebreid
getest. Hieronder
staan de testresultaten van het tweede onderzoek, onder ongeveer kinderen. In de tabel staan de
aantallen poliogevallen per kinderen.
aantal polio per 100.000 |
totaal aantal kinderen |
|
Salk |
||
placebo |
||
niet ingeënt |
46 |
Opmerking:
Het valt op dat in de placebogroep vaker polio voorkwam dan bij de kinderen die niet
ingeënt
werden. Dat komt doordat de rijkere mensen vaker hun kinderen lieten inenten en in
hun kringen de
hygiëne beter was, waardoor de kinderen minder weerstand hadden.
Vind je dat uit de tabellen blijkt dat het vaccin van Salk werkt?
Na deze testresultaten werd een vaccinatieprogramma gestart in grote delen van de
wereld.
Om te weten hoe iets zich ontwikkelt - bijvoorbeeld het klimaat, de criminaliteit, de export, het rekenniveau van de leerlingen - wordt de huidige toestand vergeleken met die van de laatste jaren. Aan de hand van cijfers wordt een wetenschappelijke, maatschappelijke of politieke discussie gevoerd en uiteindelijk worden beslissingen genomen. Maar met cijfers moet je voorzichtig omgaan, want ze vertellen vaak maar een deel van het verhaal.
Het aantal branden in een stad is dit jaar gestegen met %. Is dat reden tot ongerustheid? Hierbij moet je allerlei dingen in acht nemen.
Vaak wordt de manier van tellen gewijzigd. Bijvoorbeeld werden voorheen de brandmeldingen geteld en later alleen de echte branden of het aantal keer dat de brandweer moest uitrukken. Worden ook schoorsteenbrandjes meegeteld?
Interessant is ook te weten hoe groot de branden waren. Ofwel, tel het aantal uren dat de brandweerlieden in de weer waren.
Hoe was de ontwikkeling in de jaren daarvoor?
Is er een reden voor het verschil? Bijvoorbeeld een extreem hete, droge zomer, of een pyromaan?
Hoeveel branden waren er eigenlijk in absolute aantallen. Het maakt nogal een verschil of het aantal branden steeg van naar of van naar .
In het laatste punt was sprake van twee toenames:
- van naar branden,
- van naar branden.
Welk van de twee toenames komt het gemakkelijkst door toeval tot stand?