11.2  Mate van samenhang >
1

In hoofdstuk 1 – Verschillen hebben we gezien hoe op het Amalia College gekozen werd voor wiskunde A/C of wiskunde B, apart voor jongens en meisjes. Hieronder staan de gegevens in een tabel.

Geslacht

A/C

B

totaal

man

13

56

69

vrouw

30

55

85

totaal

43

111

154

a

Vind jij dat op het Amalia College een duidelijke samenhang bestaat tussen de sekse en de wiskundekeuze?
Waarom?

Op een andere school geldt de volgende tabel.

Geslacht

A/C

B

totaal

man

13

37

50

vrouw

30

74

104

totaal

43

111

154

b

Vind jij dat op deze school een duidelijke samenhang bestaat tussen de sekse en de wiskunde-keuze?
Waarom?

2

Men spreekt van wiegendood (SIDS = sudden infant death syndrome) als een baby onverwacht overlijdt zonder dat daar – ook na een grondig onderzoek – een verklaring voor wordt gevonden.
In Nederland overleden 11 baby's (tussen een week en een jaar oud) in 2006 onder de diagnose wiegendood/SIDS; 14 in 2007, 18 in 2008 en 19 in 2009.
In oktober 1987 maakte prof. G.A. de Jonge bekend dat er sterke aanwijzingen zijn voor een verband tussen buikligging bij baby’s en wiegendood. De gegevens van de Jonge waren:

  1. er zijn 150 gevallen van wiegendood onderzocht,

  2. in 127 van de gevallen was er sprake van buikligging,

  3. in een controlesteekproef van 326 baby’s werd bij 199 buikligging geconstateerd.

a

Vul de tabel in.

dood

niet dood

buikligging

geen buikligging

totaal

b

Vind jij de gegevens zodanig dat je van een duidelijk verband tussen wiegendood en buikligging zou kunnen spreken?

Iemand interpreteert de gegevens als volgt: bij buikligging is het risico op wiegendood … .

c

Maak deze zin af.

3

Als verpleegster Lucia dienst heeft in een ziekenhuis, vinden er relatief veel “incidenten” plaats.
Men spreekt van een incident als een patiënt overlijdt of gereanimeerd moet worden.
De gegevens staan in de tabel hieronder.

L. heeft dienst

L. heeft geen dienst

totaal aantal diensten

incidenten

14

13

27

geen incidenten

187

1490

1677

totaal

201

1503

1704

Op grond hiervan wordt Lucia verdacht van (poging tot) moord.

a

Vind je de aantallen zodanig dat je Lucia zou willen veroordelen?

In een vaas zitten 27 zwarte en 1677 witte ballen. Iemand pakt 201 ballen uit de vaas.

b

Hoeveel zwarte ballen zal hij naar verwachting trekken?

c

Blijf je bij je mening in onderdeel a?

Mede op grond van een dergelijke berekening werd de Haagse verpleegster Lucia de Berk in 2004 tot levenslang veroordeeld. Deskundigen hebben de berekeningsmethoden aangevochten en ten slotte is de hechtenis in 2008 onderbroken en is Lucia in 2010 vrijgesproken.
De gegevens in de tabel spreken inderdaad zeer in het nadeel van Lucia. Maar men moet bedenken dat er zeer veel diensten zijn in ziekenhuizen in Nederland en dat dus uiterst onwaarschijnlijke toevalligheden ook wel eens voorkomen. Zo is in het casino van Monaco wel eens dertig keer achter elkaar rood voorgekomen, zonder dat er fraude in het spel was. Een uitvoerige bespreking vind je in een artikel van Ronald Meester op internet.

Odds-ratio
4

Er worden in Nederland meer jongetjes geboren dan meisjes. Het verschil kun je op twee manieren uitdrukken:

  1. 51,26 % van de geboortes is een jongen.

  2. De sekseodds is 1,0517 ( = aantal jongetjes : aantal meisjes).

a

Ga na dat deze twee uitspraken met elkaar in overeenstemming zijn.

Ook in België worden meer jongetjes dan meisjes geboren, maar iets minder meer dan in Nederland. De verhouding van de sekseodds in Nederland en Belgie is 1,0024 , de zogenaamde odds-ratio.

b

Hoeveel procent van de baby’s is in België een jongetje?

Chinezen willen graag een stamhouder en daarom zijn jongens populairder dan meisjes. De regering in Peking heeft bepaald dat echtparen maar één kind mogen krijgen om de bevolkingsgroei in te dammen. In China worden dan ook veel meer jongens dan meisjes geboren. De British Medical Journal meldt dat per 100 pasgeboren meisjes 125 jongetjes geboren worden.

c

Bereken de odds-ratio jongen/meisje tussen China en Nederland.

De odds-ratio is de verhouding (= ratio) van twee odds , in de voorgaande opgave de sekseodds in China en de sekseodds in Nederland.

Welke van de twee we in de teller zetten en welke in de noemer, is een kwestie van keuze.
Wij kiezen ervoor de grootste van de twee odds in de teller te zetten. De oddsratio is dus een getal, groter dan of gelijk aan 1 . De odds-ratio drukt uit hoe sterk het verband is tussen twee variabelen, die allebei twee waarden kunnen aannemen; in opgave 10: de waarden jongen en meisje. Als waardering van de odds-ratio is gangbaar:

  1. odds-ratio < 2 : gering verschil,

  2. 2 < odds-ratio < 3 : middelmatig verschil,

  3. odds-ratio > 3 : groot verschil.

5

Ajax speelt tegen RKC in de halve finale van de KNVB-beker in 2011. De odds voor Ajax zijn 7 .

a

Hoeveel procent kans had Ajax om te winnen. (Er is altijd een winnaar; gelijkspel komt dus niet voor.)

In de eredivisie voetbal worden in Nederland ongeveer 600 doelpunten gemaakt door de thuisspelende ploeg en 400 door de uitspelende ploeg. In de eerste divisie zijn die aantallen 500 en 400 .

b

Bereken de odds-ratio van het aantal thuis/uit-doelpunten tussen de ere- en eerste divisie?

Voor de komende paardenrace schat men de winstkansen van Hinkepink en Rolator op 0,4 en 0,3 .

c

Bereken de odds-ratio tussen Hinkepink en Rolator.

6

In een onderzoek is aan 120 leerlingen gevraagd of zij rookten. De resultaten staan in de tabel hieronder, opgesplitst naar geslacht.

geslacht

roken

niet roken

totaal

man

23

13

36

vrouw

44

40

84

totaal

67

53

120

a

Vind je dat je op grond van deze cijfers mag zeggen dat onder de jongens meer gerookt wordt dan onder de meisjes?

Noem de aantallen in de 2×2-tabel hieronder a , b , c en d .

geslacht

roken

niet roken

totaal

man

a

b

vrouw

c

d

totaal

b

Wat weet je van a , b , c en d als er verhoudingsgewijs onder de jongens en onder de meisjes evenveel gerookt wordt?

Een manier om het verschil in rookgedrag tussen jongens en meisjes op grond van zo’n tabel tot uitdrukking te brengen is de odds-ratio.

c

Welke breuk is de verhouding rokers : niet-rokers onder de jongens? En onder de meisjes?

De odds-ratio is de verhouding van deze twee verhoudingen, dus a b c d .

d

Ga na dat deze verhouding gelijk is aan a d b c .

Als we jongens en meisjes in dit verhaal verwisselen (of als we roken en niet-roken verwisselen), vinden we a d b c of b c a d . Welk van de twee we kiezen, a d b c of b c a d , is niet belangrijk.
De afspraak is om dát quotiënt te kiezen dat groter dan of gelijk aan 1 is.

e

Wat is de odds-ratio als er verhoudingsgewijs evenveel jongens als meisjes roken?

7
a

Bereken de odds-ratio B-keuze : A/C-keuze tussen jongens en meisjes op het Amalia College (zie opgave 7a).

b

Bereken de odds-ratio wel Lucia : niet Lucia tussen de twee soorten diensten met incidenten en zonder incidenten (zie opgave 9).

8

Bereken de odds-ratio dood: niet-dood bij buikligging en niet-buikligging (zie opgave 8).

9

Meer kanker bij vroeg kale man
NRC 17 02 2011

Vroeg kalende mannen hebben een twee keer zo groot risico later in hun leven prostaatkanker te krijgen als mannen die op hun twintigste nog een volle haardos hebben.
Dit is de conclusie van een Frans wetenschappelijk onderzoek, dat op 15 februari 2011 gepubliceerd werd in de Annals of Oncology.

In dat onderzoek werd aan 388 kankerpatiënten en 281 gezonde mensen gevraagd hoeveel haar zij nog hadden op 20 -, 30 - en 40 -jarige leeftijd.
Bekijk de tabel voor de situatie op 20 -jarige leeftijd. Daarin zijn de kaalheidsfasen II, III en IV op een hoop gegooid.

20 -jarige leeftijd

wel kanker

geen kanker

vol haar

351

267

(enige) kaalheid

37

14

totaal

388

281

a

Ga na dat de odds-ratio 2,01 is.

b

Hoeveel procent van de prostaatkankerpatiënten had (enige) kaalheid op 20 -jarige leeftijd?
Hoeveel procent van de gezonde mannen had op 20 -jarige leeftijd nog een volle haardos?

c

Vind je de conclusie in het krantenartikel terecht?

Beter is de conclusie: bij kalende 20 -jarige mannen is de verhouding prostaatkanker / geen prostaatkanker 2 keer zo groot als bij 20 -jarige mannen met een volle haardos.

Bekijk de tabel voor de situatie op 30 -jarige leeftijd.

30 -jarige leeftijd

wel kanker

geen kanker

vol haar

266

200

(enige) kaalheid

122

81

totaal

388

281

d

Bepaal de odds-ratio.

Deze ligt dicht bij 1 . Dus maakt wel of geen kaalheid bij 30 -jarige leeftijd weinig verschil voor het risico op prostaatkanker.

Effectgrootte

In hoofdstuk 1 – Verschillen heb je naast de odds-ratio nóg een maat ontmoet om het verband tussen twee statistische variabelen te meten: de effectgrootte. We werken hieronder een voorbeeld uit.

Biologische groenten zijn duurder dan conventioneel gekweekte groenten. Dit komt, omdat de organische teelt geen gebruik maakt van zaken als kunstmest en pesticiden. Hierdoor daalt de opbrengst per hectare land, wat de investering per kilo gewas laat toenemen. De precieze daling in opbrengst is sterk afhankelijk van de eigenschappen van het gewas. Ziekte- en insectgevoelige gewassen als aardappels en suikerbieten lenen zich relatief slecht voor de organische teelt, met opbrengsten die tot wel 50 % lager liggen. Voor sterkere gewassen kan het opbrengstverlies echter gering zijn. Gemiddeld genomen produceren organische boerderijen 8 % minder gewas per hectare dan conventionele boerderijen.
Bron: website http://www.ikleefgroen.nl/lifestyle/ (website opgeheven).

10

De opbrengst van een boomgaard is normaal verdeeld. De boer is vorig jaar overgeschakeld op biologische fruitteelt. Voorheen was de opbrengst 40 ton appels per hectare, met standaardafwijking 4 ton. Dit jaar is die 35 ton. Veronderstel dat de standaardafwijking bij de nieuwe aanpak ook 4 ton is.
We definiëren de effectgrootte D als:
D = verschil van de nieuwe en oude opbrengst gemiddelde van de standaardafwijkingen .

a

Bereken de effectgrootte D van de biologische aanpak op de opbrengst.

Stel dat de biologische aanpak in principe een even grote opbrengst geeft.

b

Tussen welke grenzen – symmetrisch om 40 ton - zal de opbrengst met 90 % zekerheid liggen?

c

Vind jij de 35 ton voldoende argument om te zeggen dat biologische fruitteelt minder opbrengt dan klassieke fruitteelt?

Als waardering van de effectgrootte ( D ) is gangbaar:

D 0,4

gering verschil

0,4 < D 0,8

middelmatig verschil

0,8 < D 1,5

groot verschil

D > 1,5

zeer groot verschil

11

Een coopertest is een oefening waarbij de conditie wordt gemeten. Men moet in 12 minuten een zo groot mogelijke afstand afleggen.
Hieronder staat de tabel van afstanden (in meters) voor de coopertest voor jongelui van 15 of 16 jaar.

jongens

meisjes

zeer slecht

2200

1600

slecht

2200 2300

1600 1700

redelijk

2300 2500

1700 2000

goed

2500 2800

2000 2100

zeer goed

2800

2100

Een gezonde Nederlandse jongen van 16 jaar legt in een coopertest gemiddeld 2400 meter af en een meisje 1850 meter, beide met een standaardafwijking van 150 meter.

a

Bereken de effectgrootte D van het geslacht voor de af te leggen afstand bij de coopertest.

b

Neem over en vul in: de jongens lopen gemiddeld … meter meer dan de meisjes en dat is … keer de standaarafwijking.

c

Vind je dat het geslacht van grote invloed is op de prestaties bij de coopertest?

12

In een vwo5 wiskunde A-klas van 10 jongens en 15 meisjes worden bij een toets de volgende cijfers gehaald.
Jongens: 7,4 ; 4,6 ; 3,5 ; 6,9 ; 4,1 ; 5,8 ; 8,1 ; 8,4 ; 7,4 ; 7,8 .
Meisjes: 7,9 ; 7,5 ; 5,4 ; 6,3 ; 5,3 ; 4,9 ; 8,3 ; 5,6 ; 8,5 ; 7,8 ; 6,5 ; 7,5 ; 7,8 ; 5,1 ; 9,0 .

Bereken de effectgrootte van het geslacht voor de toetsscore.

13

Een onderzoeker vraagt zich af of het wat uitmaakt hoe mensen in reclamefolders aangesproken worden.
Maakt het wat uit voor het toekomstig koopgedrag van lezers of ze aangesproken worden met U of met Je? Hij maakt twee versies van dezelfde folder en verspreidt deze huis aan huis waarbij in elke brievenbus aselect of de U-folder of de Je-folder gedaan wordt. Na twee dagen gaat hij de huizen nogmaals af en vraagt de potentiële klanten een oordeel over de folder door cijfers tussen 1 en 10 te geven.
De U-folder krijgt daarbij de volgende scores: 8 5 6 6 5 4 4 7 7 6 .
De Je-folder krijgt de scores: 9 6 5 8 8 6 4 8 9 7 .


Bereken de effectgrootte van het soort folder voor het klantoordeel.