9.2  De Poissonverdeling >

Stel dat er in een winkel gemiddeld 10 klanten per uur komen.
Wat is dan de kans dat er in het komende kwartier precies 3 klanten komen.

Dit is het centrale thema van deze paragraaf. Wij gaan die kans precies berekenen.

1
a

Waarom is het belangrijk voor de winkelier (bedrijfsleiding) om te weten wat de kans is op 3 klanten in een kwartier?

b

Hoe groot schat jij de kans op 3 klanten in een kwartier als er gemiddeld 10 per uur komen? Het gaat erom of je een idee hebt; je kunt natuurlijk onmogelijk zomaar die kans berekenen.

2

Stel dat je weet dat er komend uur precies 10 klanten komen. (Hoe je dat te weten bent gekomen doet er nu even niet toe.) Maar je hebt geen idee wanneer ze in die periode van een uur zullen komen: elk moment is voor elk van de klanten even waarschijnlijk. Ze komen onafhankelijk van elkaar.

a

Wat betekent het dat ze onafhankelijk van elkaar komen?

b

Wat is de kans dat er 8 in het eerste halfuur komen en de andere 2 in het tweede halfuur?

Stel dat de winkelier geen personeel heeft en stel dat elke klant precies 5 minuten nodig heeft om geholpen te worden.

c

Hoe groot schat jij de kans dat geen enkele klant hoeft te wachten? Licht je antwoord toe.

Sommige winkels proberen de wachttijden bewust klein te houden. Door deze service willen ze klanten winnen en vasthouden. Het is duidelijk dat het kunnen inschatten van wachttijden voor deze winkels erg belangrijk is. In dit hoofdstuk willen we zicht krijgen op deze problematiek.

We bekijken een periode van 1 uur als geheel en opgesplitst in twee periodes van 1 2 uur.
P 1 ( n ) is de kans op precies n klanten in dat uur,
P 1 2 ( n ) is de kans op n klanten in een halfuur.

3

Er geldt P 1 ( 0 ) = ( P 1 2 ( 0 ) ) 2 .
Immers, de kans op 0 klanten in een uur = de kans op 0 klanten in het eerste half uur én 0 klanten in het tweede half uur =
de kans op 0 klanten in het eerste half uur × de kans op 0 klanten in het tweede half uur.

a

Druk zo ook P 1 ( 1 ) uit in P 1 2 ( 0 ) en P 1 2 ( 1 ) .

b

Druk P 1 ( 3 ) uit in P 1 2 ( 0 ) , P 1 2 ( 1 ) , P 1 2 ( 2 ) en P 1 2 ( 3 ) .

Als er 7 klanten in het eerste halfuur komen én 0 in het tweede halfuur, dan komen er 7 klanten in het hele uur én die 0 komen allemaal in de eerste helft van dat uur. Dit vertalen we in kansen:
P 1 2 ( 7 ) P 1 2 ( 0 ) = P 1 ( 7 ) ( 1 2 ) 7 .

4

Gebruik in de volgende vraag een soortgelijke redenering.

a

Neem over en vul het passende in: P 1 2 ( 6 ) P 1 2 ( 1 ) = P 1 ( 7 ) .

Uit P 1 2 ( 7 ) P 1 2 ( 0 ) = P 1 ( 7 ) ( 1 2 ) 7 en P 1 2 ( 6 ) P 1 2 ( 1 ) = P 1 ( 7 ) 7 ( 1 2 ) 7 volgt:
P 1 2 ( 7 ) = 1 7 P 1 2 ( 1 ) P 1 2 ( 0 ) P 1 2 ( 6 ) .

b

Laat dat zien.

(hint)
Elimineer P 1 ( 7 ) .
c

Druk zo ook P 1 2 ( n ) uit in P 1 2 ( n 1 ) .

d

Controleer of de formule uit onderdeel c klopt voor het geval n = 1 .

Als we P 1 2 ( 0 ) en P 1 2 ( 1 ) zouden kennen, zouden we alle kansen P½(n) kennen.
Het gaat niet zo zeer om de kansen P 1 2 ( 0 ) en P 1 2 ( 1 ) zelf, maar om hun verhouding P 1 2 ( 1 ) P 1 2 ( 0 ) . Die verhouding noemen we λ.
Uit opgave 13c volgt dan: P 1 2 ( n ) = λ n P 1 2 ( n 1 ) .

We noteren P 1 2 ( 1 ) P 1 2 ( 0 ) = λ .
Dan P 1 2 ( n ) = λ n P 1 2 ( n 1 ) , n = 1, 2, 3, .
Dus: P 1 2 ( n ) = λ n n ! P 1 2 ( 0 ) .

Dit laatste bewijzen we in de volgende opgave.

5
a

Druk achtereenvolgens P 1 2 ( 1 ) , P 1 2 ( 2 ) , P 1 2 ( 3 ) , P 1 2 ( 4 ) en P 1 2 ( 5 ) uit in P 1 2 ( 0 ) en λ .

b

Geef een formule voor P 1 2 ( n ) , uitgedrukt in λ en P 1 2 ( 0 ) .

Als je P 1 2 ( 0 ) zou kennen, zou je λ kunnen uitrekenen (en omgekeerd, want de som van alle kansen P 1 2 ( n ) , n = 0, 1, 2, 3, is 1 .
Daarvoor moet je wel oneindig veel kansen optellen en dat is geen sinecure.
Dus: P 1 2 ( 0 ) + P 1 2 ( 1 ) + P 1 2 ( 2 ) + = 1 , in de notatie:
n = 0 P 1 2 ( n ) = 1 .

In Appendix A wordt uitgelegd dat n = 0 λ n n ! = e λ .

n = 0 λ n n ! = e λ , dus: e λ P 1 2 ( 0 ) = 1

6

Neem P 1 2 ( 0 ) = 0,1 ; dan is er dus 10 % kans dat er in een half uur geen klanten komen in de winkel.

a

Bereken λ exact en geef een benadering in vie decimalen.

b

Druk algemeen λ uit in P 1 2 ( 0 ) .

Een voorval, bijvoorbeeld een klant komt binnen, kan optreden of niet. We nemen aan dat de voorvallen onafhankelijk van elkaar optreden. We tellen het aantal keer dat een voorval optreedt in een zekere tijdsperiode. Dat aantal noemen we X .
De verhouding kans op 1 voorval kans op 0 voorvallen noemen we λ .
Dan is de kans op k voorvallen in die tijdsperiode P ( X = k ) = λ k k ! e λ voor k = 0, 1, 2, .
We zeggen dat X Poissonverdeeld is met parameter λ.

7

We gaan de verwachtingswaarde van een Poissonverdeelde stochast X met parameter λ uitrekenen.
Die verwachtingswaarde is per definitie:
P ( X = 0 ) 0 + P ( X = 1 ) 1 + P ( X = 2 ) 2 + = k = 0 P ( X = k ) k

Toon aan: E ( X ) = λ e λ ( 1 + λ + λ 2 2 ! + λ 3 3 ! + λ 4 4 ! + ) = λ .

X is het aantal keer dat een voorval optreedt in een zekere tijdsperiode. De voorvallen treden onafhankelijk van elkaar op.
Zeg dat het voorval gemiddeld λ keer in de tijdsperiode optreedt (dat is dus de verwachtingswaarde). Dan is X Poissonverdeeld met parameter λ en P ( X = k ) = λ k k ! e λ voor k = 0, 1, 2, .

8

Neem aan: het aantal klanten per uur is X en heeft parameter λ . Noem het aantal klanten per half uur Y . Dan heeft Y parameter 1 2 λ .
In opgave 12a hebben we gezien: P ( X = 0 ) = P ( Y = 0 ) 2 , zonder de kansen van de Poissonverdeling te gebruiken.

a

Controleer dat de gelijkheid geldt met de Poissonkansen P ( X = 0 ) en P ( Y = 0 ) .

In opgave 12b heb je gezien dat P ( X = 1 ) = 2 P ( Y = 0 ) P ( Y = 1 ) , zonder de kansen van de Poissonverdeling te gebruiken.

b

Controleer dat de gelijkheid geldt met de Poissonkansen P ( X = 0 ) , P ( Y = 0 ) , en P ( Y = 1 ) .

Terugblik
We zijn geïnteresseerd in de kansverdeling van het aantal voorvallen in een uur als er gemiddeld λ voorvallen per uur plaatsvinden. We nemen aan dat de voorvallen onafhankelijk van elkaar plaatsvinden. We hebben gezien:

  1. Het aantal voorvallen per uur hangt samen met het aantal voorvallen per half uur.

  2. De kans op 7 voorvallen in een uur gelijk is aan 1 7 λ de kans op 6 voorvallen in een uur, enzovoort.

  3. De kans op 7 voorvallen in een uur is 1 7 ! λ de kans op 0 voorvallen in een uur.

  4. Omdat alle kansen samen 1 zijn, kon de kans op 0 voorvallen in een uur worden uitgerekend: die is e λ .

Als er per uur gemiddeld 24 klanten (onafhankelijk van elkaar) in een winkel komen, komen er natuurlijk gemiddeld 12 klanten per half uur.
Daar zal niemand aan twijfelen. Dat kun je ook formeel bewijzen. Als volgt.
Het aantal klanten X dat in een uur komt is Poissonverdeeld met parameter λ = 24 .
Het aantal klanten Y in een halfuur is ook Poissonverdeeld. We gaan bewijzen: de parameter van Y is 12 is.
Splits een uur op in twee halve uren. Het aantal klanten in het eerste halfuur noemen we Y 1 en in het tweede halfuur Y 2 . Dan X = Y 1 + Y 2 ; dus E ( X ) = E ( Y 1 ) + E ( Y 2 ) . Omdat E ( Y 1 ) = E ( Y 2 ) , volgt hieruit dat E ( Y ) = E ( Y 1 ) = E ( Y 2 ) = 1 2 24 = 12 en dat is de parameter.

Neem aan dat het aantal klanten in 1 uur Poissonverdeeld is met gemiddelde λ .
Dan is het aantal klanten in t uur Poissonverdeeld met gemiddelde t λ .

9

In een jaar komen er gemiddeld 123 brandmeldingen voor in een zekere stad.

a

Bereken de kans dat er morgen precies twee brandmeldingen zijn.

Er vallen in Nederland jaarlijks gemiddeld 810 fietsdoden in het verkeer.

b

Bereken de kans dat er morgen drie fietsdoden vallen.

Je kunt de kansen uit de voorgaande onderdelen ook rechtstreeks op de GR berekenen.

c

Zoek uit hoe dat op jouw machine gaat.

Op de GR kun je niet alleen de kans op drie fietsdoden morgen rechtstreeks berekenen maar ook de kans op hoogstens drie fietsdoden.
De eerste kans noteren we met P Poisson ( X = 3, λ = 2,2191 ) en de tweede met P Poisson ( X 3, λ = 2,2191 ) .
Zie opgave 18b

10

Gemiddeld worden er elke dag in Nederland 496 baby's geboren.

a

Bereken de kans dat er morgen niet meer dan 450 baby's geboren worden in Nederland.

Er vallen in Nederland jaarlijks gemiddeld 810 fietsdoden in het verkeer.

b

Bereken de kans dat er in een jaar minder dan 800 fietsdoden vallen in het verkeer.

Gegeven zijn twee Poissonverdeelde stochasten X en Y met parameters λ en μ , onafhankelijk van elkaar.
Dan is X + Y Poissonverdeeld met parameter λ + μ .

We bewijzen bovenstaande in de volgende opgave.

11

Gegeven zijn twee Poissonverdeelde stochasten X en Y met parameters λ en μ , onafhankelijk van elkaar.
Er geldt: P ( X + Y = 10 ) = k = 0 10 P ( X = k ) P ( Y = 10 k ) =
P ( X = 0 ) P ( Y = 10 ) + P ( X = 1 ) P ( Y = 9 ) +
+ P ( X = 10 ) P ( Y = 0 ) .

a

Ga dat na en druk P ( X + Y = 10 ) uit in λ en μ .

b

Ga na dat in het vorige onderdeel bewezen is dat P ( X + Y = 10 ) de kans op de uitkomst 10 is op een Poissonverdeelde stochast met parameter λ + μ .

12

Twee winkels A en B zijn elkaars concurrenten. De aantallen klanten X en Y die deze per uur krijgen zijn Poissonverdeeld met gemiddelden respectievelijk 1 en 2 .

Een klant gaat naar een van de twee winkels.

a

Wat is, denk je, de kans dat hij naar de eerste winkel gaat?

Waarschijnlijk heb je bij onderdeel a intuïtief de juiste kans gegeven. We gaan die kans berekenen. Bedenk dat:
P ( de winkelskrijgen  samen  1  klant ) P ( die klant gaat naar  A ) = P ( A  krijgt  1  klant en  B  krijgt geen klant ) =
P ( A  krijgt  1  klant  ) P ( B  krijgt geen klant ) .

b

Schrijf de drie Poissonkansen op:
P ( de winkels krijgen  samen  1  klant in een uur ) ,
P ( A  krijgt  1  klant in een uur ) ,
P ( B  krijgt  0  klanten in een uur )

c

Bereken hieruit P ( de ene klant gaat naar winkel  A ) .
Had je in onderdeel a dit antwoord?

Stel je weet dat er in totaal 7 klanten naar de winkels gaan, maar je weet van geen van de klanten in welk van de twee winkels ze binnen zullen gaan.

d

Bereken de kans dat er 3 naar de eerste winkel gaan (en dus 4 naar de tweede).

Twee winkels zijn elkaars concurrenten. De aantallen klanten X en Y die deze per uur krijgen zijn Poissonverdeeld met gemiddelden respectievelijk λ en μ .
Stel je weet dat er in totaal Y klanten naar de winkels gaan, maar je weet van geen van de klanten naar welke van de twee winkels ze gaan.
Dan is het aantal klanten dat naar de eerste winkel gaat binomiaal verdeeld met n herhalingen en succeskans λ λ + μ .

Opmerking:

Speciaal bij zeldzame gebeurtenissen speelt de Poissonverdeling een belangrijke rol.

In de volgende opgave hebben we nog een andere eigenschap van de exponentiële functie met grondtal e nodig. Deze wordt bewezen in appendix C.

e x ( 1 + x n ) n en dit klopt beter naarmate n groter wordt:
lim n ( 1 + x n ) n = e x .

13

Een zekere ziekte is zeer zeldzaam: één op de honderdduizend mensen heeft haar. De kans dat iemand de ziekte heeft is dus 0,00001 . De ziekte is niet overdraagbaar en ook niet erfelijk bepaald. We mogen het hebben-van-de-ziekte voor een individu dus onafhankelijk beschouwen van het al dan niet hebben-van-de-ziekte van andere personen.

Er zijn 800 duizend Amsterdammers. Het aantal Amsterdammers dat de ziekte heeft noemen we X .

a

Wat is de verwachtingswaarde van X ?

Elke Amsterdammer heeft kans 0,00001 om de ziekte te hebben, onafhankelijk van zijn stadsgenoten. Dus X is binomiaal verdeeld met parameters n = 800 000 en p = 0,00001 .

b

Bereken P ( X = 6 ) .

We bekijken nu de Poissonverdeelde stochast Y met parameter λ = 8 .

c

Bereken P ( Y = 6 ) .

Als het goed is, heb je in b en c (nagenoeg) hetzelfde antwoord gekregen. In het vervolg gaan we na waarom dat zo is.
P ( X = 6 ) = ( 800 000 6 ) 0,00001 6 0,99999 799 994 .

d

Ga na: ( 800 000 6 ) 0,00001 6 8 6 6 ! .

e

Ga na: 0,99999 799 994 0,99999 800 000 e 8 .

(hint)

Gebruik het theorieblok hierboven.

f

Toon aan dat uit het voorgaande volgt dat P ( X = 6 ) en P ( Y = 6 ) nagenoeg gelijk zijn.

X is binomiaal verdeeld met parameters n en p , waarbij p klein en n groot is,
Y is Poissonverdeeld met parameter λ = p n . Dan zijn P ( X = k ) = ( n k ) p k ( 1 p ) n k en P ( Y = k ) = λ k k ! e λ nagenoeg gelijk.
Dus hebben X en Y nagenoeg dezelfde kansverdeling.

Opmerking:

Rekenmachines hebben een beperkt rekendomein. Op sommige machines moet de parameter n bij de binomiale verdeling kleiner dan 1 miljoen zijn. Als n groter dan 1 miljoen is (en p klein) brengt de Poissonverdeling uitkomst.

In de figuur hieronder kun je de binomiale verdeling met
p = 0,02 en n = 100 vergelijken met de Poissonverdeling met λ = 100 0,02 = 2 .

Simeon-Denis Poisson,
1781-1840

In 1837 introduceerde de Franse wiskundige Poisson een benadering van de binomiale kansverdeling. Hij bekeek de al geruime tijd bekende binomiale verdeling voor gevallen waarbij het aantal herhalingen n heel groot is en de succeskans p heel klein. Hij liet zien dat de binomiale kans op k successen P ( X = k ) = ( n k ) p k ( 1 p ) n k nagenoeg gelijk is aan λ k k ! e λ waarin λ = n p de verwachtingswaarde van X is.
Dat is precies wat we in opgave 22 hebben laten zien.
Voor deze verdeling hoef je de kans op succes per kansexperiment niet te weten. Als verwachtingswaarde λ gebruik je het gemiddelde aantal "successen" bij een aantal series van n kansexperimenten.
Poisson besteedde niet meer dan één bladzijde aan zijn ontdekking.

Ladislaus von Bortkiewicz,
1868-1931

De Duitse wiskunde L. von Bortkiewicz was de eerste die het belang van de Poissonverdeling onderkende. Van hem is het volgende voorbeeld afkomstig.
Hij bekeek het aantal doden per jaar onder de Pruisische cavaleristen door een trap van een paard. Er zijn inderdaad veel herhalingen met een zeer kleine "succes"- kans (een dodelijke trap van een paard).

Het veelvuldig optreden van Poissonkansen in het dagelijks leven is niet zo vreemd als je dit voorbeeld bekijkt. In veel praktische situaties is er sprake van een zeer groot aantal uitvoeringen en een zeer kleine (onbekende) succeskans.

14

De zeldzame ziekte van de vorige opgave komt voor bij 1 op de 100000 mensen. Nederland telt 17 miljoen mensen.

Bereken de kans dat er in Nederland ten hoogste 185 mensen met de ziekte zijn.

15

Von Bortkiewicz telde in 14 regimenten over 20 jaren (1875 t/m 1894) in totaal 196 doden door een trap van een paard. Hij concludeerde dat per regiment per jaar het aantal door een trap van een paard gedode cavaleristen Poissonverdeeld was met verwachtingswaarde 0,7 .

Bereken de kansen dat in een regiment in een jaar 0 , 1 en 2 doden vielen door een trap van een paard.

16

De lotto is een kansspel. De speler kruist zes nummers aan uit 1 t/m 45 en kiest een van de zes mogelijke kleuren. De notaris trekt ook zes nummers en een kleur; als die nummers precies hetzelfde zijn aan de zes die de speler koos, en bovendien de kleur hetzelfde is, wint hij de jackpot.

a

Ga na dat de kans daarop 1 ( 45 6 ) 6 2,05 10 8 is.

Stel dat er in een week 1 miljoen lottoformulieren worden ingevuld. De jackpot valt als iemand de juiste zes nummers én de juiste kleur heeft gekozen.

b

Bereken de kans dat de jackpot in een zekere week niet valt.

Als meer dan een speler alles goed heeft, moeten de gelukkigen de jackpot delen.

c

Bereken de kans dat de jackpot moet worden gedeeld.