9.5  Over continue verdelingen (2) >
Binomiaal ≈ normaal
1

X is het aantal keer kop bij negen worpen met een muntstuk. Hieronder staat een kanshistogram van X , met daar overheen de normale kromme die daar het best bij past. Dat is de normale verdeling met hetzelfde gemiddelde en dezelfde standaardafwijking als X . De bijbehorende grootheid noemen we U .

a

Wat zijn μ en σ van X en U ?

b

Bereken P ( X = 3 ) .

c

Bereken P ( 2,5 U 3,5 ) .

d

Neem over en vul in:

P ( X = 5 ) P ( U )

P ( 4 X 7 ) P ( U )

e

Ga naar VuStat/Kansverdelingen en kies linksboven voor 'Binomiale verdeling'.
Teken het kanshistogram voor het aantal keer kop bij oplopende aantallen worpen n met een muntstuk. Je ziet dat het kanshistogram steeds meer op een normale kromme gaat lijken.
Teken de normale kromme erbij (aanvinken rechtsboven).

2

Y is het aantal keer zes bij 18 worpen met een dobbelsteen. V is de normale grootheid die daar het best bij past, dat wil zeggen die hetzelfde gemiddelde en dezelfde standaardafwijking heeft.

a

Wat zijn dat gemiddelde en die standaardafwijking?

b

Vergelijk P ( Y = 2 ) en P ( 1,5 < V < 2,5 ) .

c

Dezelfde vragen voor 180 in plaats van 18 worpen en 20 in plaats van 2 zessen.

d

Ga naar VuStat/Kansverdelingen en kies linksboven voor 'Binomiale verdeling'. Teken het kanshistogram voor het aantal keer zes bij 18 en bij 180 worpen met een dobbelsteen. Teken er de normale kromme bij.

Een binomiale verdeling kan goed benaderd worden met een normale verdeling. Vooral als de succeskans p niet te ver van 0,5 afwijkt. Als p bijvoorbeeld 0,1 of 0,9 is, moet het aantal herhalingen n van de binomiale verdeling groter gekozen worden (ten minste tien).

Abraham de Moivre 1667 - 1754

Dat de binomiale verdeling voor grote waarden van n steeds meer op een normale verdeling gaat lijken werd omstreeks 1720 ontdekt door Abraham de Moivre. Later is de volgende algemene stelling bewezen.
Als onafhankelijke grootheden met dezelfde kansverdeling bij elkaar opgeteld worden, gaat de som steeds meer lijken op een normale verdeling.
Dit staat bekend als de centrale limietstelling.

De som van normale verdelingen

In opgave 63 bekeken we de lengte van 18 -jarige jongens en 18 -jarige meisjes. De lengte van 18 -jarige jongens is normaal verdeeld met gemiddelde 180 cm en standaardafwijking 7 cm; de lengte van 18-jarige meisjes is normaal verdeeld met gemiddelde 170 cm en standaardafwijking 6 cm.
Kies nu een willekeurige 18 -jarige jongen en een willekeurig 18 -jarig meisje. Wat is dan de kans dat het meisje langer is dan de jongen? Of wat is de kans dat de jongen ten minste 17 cm langer is dan het meisje? Over dit soort vragen gaat het volgende gedeelte.
Om deze vragen te beantwoorden, willen we weten of het lengteverschil L ( = lengte jongen – lengte meisje) normaal verdeeld is, en zo ja, wat het gemiddelde en de standaardafwijking van L is. We gaan eerst een en ander over de standaardafwijking herhalen.

Herhaling
In hoofdstuk 6 Discrete Verdelingen heb je gezien hoe je de verwachtingwaarde en standaardafwijking van een stochast berekent.

E ( X ) = p 1 x 1 + p 2 x 2 + ... p n x n is de verwachtingswaarde van X . Als je de tabel van de kansverdeling kent:

kun je de verwachtingswaarde dus eenvoudig uitrekenen: vermenigvuldig elk van de mogelijke uitkomsten met de kans op die uitkomst en tel vervolgens de producten op.


We korten de verwachtingswaarde af met μ .
sd ( X ) is de standaardafwijking van X , in formulevorm:
sd ( X ) = p 1 ( x 1 μ ) 2 + p 2 ( x 2 μ ) 2 + ... + p n ( x n μ ) 2 .
De variantie van X is het kwadraat van de standaardafwijking: Var ( X ) = p 1 ( x 1 μ ) 2 + p 2 ( x 2 μ ) 2 + ... + p n ( x n μ ) 2 .
Verder hebben we gezien:

  1. E ( X + Y ) = E ( X ) + E ( Y )

  2. E ( a + X ) = a + E ( X )

  3. E ( a X ) = a E ( X )

en

  1. Var ( X + Y ) = Var ( X ) + Var ( Y ) , mits X en Y onafhankelijk

  2. Var ( a + X ) = Var ( X )

  3. Var ( a X ) = a 2 Var ( X )

De formule voor Var ( X + Y ) = Var ( X ) + Var ( Y ) is lastig te bewijzen. In hoofdstuk 6 is die aan de hand van een voorbeeld aangetoond.
Bij de formules voor a + X en a X tekenen we de volgende plaatjes.

3
a

Ga na dat de formules E ( a + X ) = a + E ( X ) en Var ( a + X ) = Var ( X ) in overeenstemming zijn met de bijbehorende krommen in de figuur.

b

Var ( 2 X ) = 4 Var ( X ) . Wat is dus het verband tussen sd ( 2 X ) en sd ( X ) ?

4

Xander en Yono spelen allebei een avond in een casino. Xander begint met 100 euro, Yono met 200 euro. Allebei zetten ze (onafhankelijk van de ander) twintig keer in, Xander zet steeds 5 euro in, Yono 10 euro. Veronderstel dat de kans 1 2 is op verlies (dan ben je je inzet kwijt) en de kans ook 1 2 is op winst (dan wordt de dubbele inzet uitbetaald). X is Xanders bedrag na de twintig keer spelen, Y is Yono’s bedrag na afloop. X en Y zijn binomiaal verdeeld.
X + Y is het bedrag dat Xander en Yono samen na afloop hebben.

a

Wat zijn E ( X ) , E ( Y ) en E ( X + Y ) ?

b

Wat zijn Var ( X ) , Var ( Y ) en Var ( X + Y ) ?

Op grond van de centrale limietstelling zijn X en Y bij benadering normaal verdeeld, en om dezelfde reden is X + Y bij benadering normaal verdeeld. En de verdeling van X + Y zou nog beter op een normale verdeling hebben geleken als Xander en Yono (veel) vaker dan twintig keer hadden ingezet.

Als X en Y onafhankelijk zijn en beide normaal verdeeld zijn, dan is ook X + Y normaal verdeeld.

5

Stel dat X de nevenstaande verdelingskromme heeft. Zoals je ziet neemt X de waarden van 1 tot 2 aan. Stel dat E ( X ) = 0,2 en sd ( X ) = 0,6 .
Bij X maken we T = X (het tegengestelde van X ; bijvoorbeeld als X de winst is bij een zeker spel, is T het verlies bij dat spel.)

a

Teken op het werkblad de verdelingskromme van T .

b

Hoe groot zijn E ( T ) en sd ( T ) ?

6

We vragen ons af: Hoe zit het met het lengteverschil L van een willekeurige 18 -jarige jongen en een willekeurig 18 -jarig meisje? De lengte van de jongen noemen we X , die van het meisje Y . Dus L = X Y .
Omdat Y normaal verdeeld is, is Y dat ook.

a

Leg uit dat L normaal verdeeld is.

18 -jarige jongens zijn gemiddeld 180 cm lang met een standaardafwijking van 7 cm; 18 -jarige meisjes zijn gemiddeld 170 cm lang met een standaardafwijking van 6 cm.

b

Bereken E ( L ) , Var ( L ) en sd ( L ) .

Als X en Y onafhankelijk zijn en beide normaal verdeeld zijn, dan is ook X Y normaal verdeeld.

7

We kiezen twee willekeurige Nederlandse mannen en bepalen hun lengte. De lengte van de eerste die wordt gekozen noemen we X , die van de tweede Y . Het gemiddelde van zowel X als Y is 180 cm en de standaardafwijking is 7 cm.
We moeten zorgvuldig kiezen, anders zijn X en Y niet onafhankelijk.

a

Noem omstandigheden waarbij X en Y zeker niet onafhankelijk zijn.

We zijn geïnteresseerd in de som S van X en Y .
Anneke stelt voor in plaats van een tweede man te kiezen gewoon de lengte van de eerste man twee keer te nemen. Dus met D = X + X te werken in plaats van S = X + Y .

b

Zijn D en S gelijk?

c

Wat zijn de gemiddelden en standaardafwijkingen van D en S ?

Ten slotte bekijken we ook nog de gemiddelde lengte van de twee gekozen mannen: G = 1 2 ( X + Y ) .

d

Wat zijn het gemiddelde en de standaardafwijking van G ?

e

Wat zijn het gemiddelde en de standaardafwijking van de gemiddelde lengte van negen onafhankelijk van elkaar gekozen mannen?

De wortel- n -wet
We bekijken n onafhankelijke herhalingen van een toevalsexperiment met verwachtingswaarde E ( X ) en standaardafwijking sd ( X ) .
Zeg dat de resultaten zijn: X 1 , X 2 , X 3 , , X n .
De som van de resultaten is S = X 1 + X 2 + X 3 + + X n , het gemiddelde is G = 1 n S .
Er geldt:
E ( S ) = n E ( X ) , sd ( S ) = n sd ( X ) ,
E ( G ) = E ( X ) en sd ( G ) = sd ( X ) n .
Als X 1 , X 2 , X 3 , , X n normaal verdeeld zijn, zijn S en G zijn dat ook.

8

In een diepvriespak lekkerbekjes zitten volgens de verpakking 4 tot 6 wijtingfilets in beslag die samen een gewicht van 500 gram hebben. Neem aan dat het gewicht van zo’n pak normaal verdeeld is met gemiddelde 500 gram en standaardafwijking 15 gram.

a

Waarom zal de standaardafwijking van het gewicht van een pak lekkerbekjes waarschijnlijk groter zijn dan de standaardafwijking van het gewicht van bijvoorbeeld een pondspak suiker?

Iemand koopt zo’n pak lekkerbekjes.

b

Hoe groot is de kans dat het gewicht daarvan meer dan 10 % afwijkt van wat de verpakking belooft?

Iemand koopt drie van deze pakken.

c

Hoe groot is de kans dat het totale gewicht van de drie pakken meer dan 10 % afwijkt van het te verwachten totale gewicht?

De kans bij c is beduidend kleiner dan bij b.

d

Kun je dat verklaren?

9

In veel winkels wordt bij het afrekenen afgerond op veelvouden van 5 eurocent. Door het afronden betaalt de klant meestal iets te veel of te weinig. Het aantal eurocent dat hij te veel betaalt noemen we X ; in het geval dat de klant te weinig betaalt is X negatief.

a

Bereken E ( X ) en Var ( X ) .

b

Wat was je veronderstelling bij vraag a?

Op een dag heeft een supermarkt – waar op bovenstaande manier wordt afgerond – 200 klanten gehad. T is het aantal eurocent dat de supermarkt die dag door het afronden teveel ontvangt.

c

Op grond van welke stelling is T bij benadering normaal verdeeld?

d

Bereken de kans dat T groter dan 0,50 euro is.

e

Tussen welke grenzen ligt T met 95 % zekerheid?

10

Twee koplampen
De levensduur van een halogeenkoplamp van een auto is normaal verdeeld met een gemiddelde van 2500 branduren en een standaardafwijking van 450 uur. Neem aan dat de levensduur van de linker koplamp van een auto en de levensduur van de rechter koplamp onafhankelijk van elkaar zijn.

a

Bereken de kans dat zowel de linker als de rechter koplamp binnen 2100 branduren kapot gaat.

De levensduur van de rechter koplamp noemen we R en die van de linker koplamp L . Om R en L met elkaar te vergelijken, bekijken we het verschil V , gedefinieerd door V = R L .
Als bijvoorbeeld V = 100 , dan brandt de linker koplamp 100 uur langer dan de rechter koplamp.

b

Wat zijn het gemiddelde en de standaardafwijking van V ?

c

Bereken de kans dat het verschil in levensduur van de beide koplampen kleiner is dan 20 uur.

11

Heupoperaties
Patiënten lopen na een operatie in het ene ziekenhuis veel meer gevaar een infectie te krijgen dan in het andere. In het jaar 2003 werden in een bepaald ziekenhuis 120 heupoperaties uitgevoerd, waarna 6 patiënten een infectie kregen. De directie vond het percentage van 5 % infectiegevallen te hoog en nam extra preventieve maatregelen. In 2004 werden 154 heupoperaties uitgevoerd, met nu 2 infectiegevallen. Men vroeg zich af of dit betere resultaat toeval was of dat het door de extra preventieve maatregelen kwam.

a

Bereken de kans op hoogstens 2 infectiegevallen bij 154 operaties voor het geval dat de kans op infectie per operatie 0,05 is.

Omdat de zojuist berekende kans klein is, neemt men aan dat na de extra preventieve maatregelen de kans op infectie na een operatie is afgenomen. De kans op infectie na een operatie na de extra preventieve maatregelen noemen we p .

b

Zoek de waarde van p waarvoor geldt: de kans op hoogstens 2 infectiegevallen bij 154 patiënten is 0,1 .

De afgelopen vijf jaar was de verpleegduur in Nederlandse ziekenhuizen voor heupoperaties ongeveer normaal verdeeld met een gemiddelde van 4,5 dagen en een standaardafwijking van 1,8 dagen.
Van 100 patiënten wordt de gemiddelde verpleegduur bepaald.

c

Bereken de kans dat de gemiddelde verpleegduur groter is dan 5,0 dagen. (Dat zou voor de directie aanleiding zijn om maatregelen te nemen.)

12

De diameter van de bout DIN931 is normaal verdeeld met gemiddelde 6,0 mm en standaardafwijking 0,2 mm. De diameter van de bijbehorende moer is normaal verdeeld met gemiddelde 6,5 mm en standaardafwijking 0,2 mm.
Iemand pakt willekeurig een bout en een moer van dit type. We willen weten wat de kans is dat de moer te klein is voor de bout.
Noem de diameter van de bout B en die van de moer M (in mm).

a

Hoe is M B verdeeld?

b

Wat betekent het voor M B dat de moer te klein is voor de bout?

c

Wat is de kans dat de moer te klein is voor de bout?

13

Anne moet elke ochtend op halte Terminus overstappen van lijn 5 op lijn 9. De aankomsttijd van lijn 5 is normaal verdeeld met gemiddelde 7.30 uur en standaardafwijking 3 minuten. De vertrektijd van lijn 9 is normaal verdeeld met gemiddelde 7.35 en standaardafwijking 4 minuten.

Wat is de kans dat Anne de aansluiting mist?

14

Easy is startloopster in een estafetteploeg 4 maal 100 meter. Haar tijd over de 100 meter is normaal verdeeld: gemiddeld 12,4 seconden, met een standaardafwijking van 0,6 seconden.
De andere drie loopsters in Easy’s ploeg doen korter over de 100 meter, want zij hebben een vliegende start. Hun tijd is normaal verdeeld met gemiddelde 10,8 seconde en standaardafwijking 0,4 seconden.

Wat is de kans dat hun totaaltijd voor de 4 keer 100 meter onder de 44 seconden ligt?