Klokvormig
1

Vanaf 1848 worden in Nederland systematisch allerlei gegevens over het weer bijgehouden. Gemiddeld valt er jaarlijks 780 mm neerslag in de Bilt. Grotere afwijkingen dan 380 mm van dit gemiddelde zijn nooit voorgekomen. Op grond van die jarenlange ervaring maakt men een plaatje van de kansverdeling van de neerslag voor het komend jaar.

a

Hoe ziet dat plaatje eruit, denk je? Vermeld de relevante gegevens.

Stel dat er in een jaar 500 mm neerslag viel

b

Vind je dat extreem weinig of valt het wel mee? Waarom?

Hieronder staan twee mogelijke antwoorden op vraag a.

c

Wat is je bezwaar tegen elk van deze antwoorden?

Over een klokvormige kromme
In de simulaties in de vorige paragraaf kwam je hetzelfde soort plaatje tegen: de zogenaamde klokvorm. De klokvorm heeft de volgende kenmerken.

  • Symmetrie om het gemiddelde: afwijkingen naar boven zijn even waarschijnlijk als even grote afwijkingen naar beneden.

  • Hoe groter de afwijking, des te kleiner is de kans dat die optreedt.

  • Erg grote afwijkingen komen praktisch niet voor.

Adolphe Quételet
1796 - 1874

In veel voorbeelden in de natuur en bij het menselijk handelen komt de klokvorm voor (vaak bij benadering). Dat deze verdeling vaak voorkomt, is ontdekt in de negentiende eeuw. De belangrijkste onderzoeker was de Belg Quételet. In 1835 publiceerde hij een boek met statistisch materiaal over allerlei grootheden betreffende een mens (bijvoorbeeld de lengte van 18-jarige jongens). Hij merkte op dat de grootheden klokvormig verdeeld waren rond een gemiddelde. Een individuele afwijking van dat gemiddelde kwam door toevallige oorzaken. Hij voerde het idee van de “volmaakte” mens in: dat is de mens die alle grootheden gemiddeld heeft. Heel iets anders dan wat als ideaal gezien wordt!

2

Teken voor elk van de volgende voorbeelden een plaatje zoals hiernaast. Op de horizontale as wordt de genoemde grootheid uitgezet.
Schrijf bij de horizontale as de eenheid waarin je meet. (Bij het eerste voorbeeld is de grootheid lengte en is de eenheid cm.) Schrijf bij de drie streepjes op de horizontale as getallen die redelijk kloppen met de werkelijkheid.

  • Lengte van een Nederlandse jongen van 18 jaar.

  • Leeftijd van een vrouw als ze moeder wordt (haar eerste kind krijgt).

  • Tijdsduur van een autorit Arnhem-Nijmegen ( 18 km) in de ochtendspits.

  • Het precieze gewicht in een zogenaamd kilopak suiker.

  • Het aantal keer kop bij 100 worpen met een muntstuk.

Zoals gezegd, zijn veel verdelingen klokvormig, of ze lijken daar sterk op. We spreken wel van een normale verdeling. De term normale verdeling is ingevoerd door de Engelse statisticus Karl Pearson (1857-1936). Het plaatje bij opgave 12 staat model voor de normale verdeling.

Maar niet alle verdelingen zijn normaal.

3
a

Geef zelf nog een paar praktijkvoorbeelden van (ongeveer) normale verdelingen.

b

Geef zelf ook een paar voorbeelden waarbij de verdeling duidelijk niet normaal is.

4

Geen van de volgende verdelingen is normaal.

Zeg van elke verdeling, waarom hij niet normaal is.

Zoals je gezien hebt, kun je uit een zogenaamde verdelingskromme kansen of percentages aflezen. Daarvoor is de oppervlakte onder de kromme bepalend.

5

Op 6 mei 1998 vonden er verkiezingen voor de Tweede Kamer plaats. De laatste dagen voor de verkiezingen werd de uitslag voorspeld. Er zijn twee grote bureaus die zich daarmee bezighouden: Inter/View en Nipo. Zij houden peilingen onder de Nederlandse bevolking. Op grond van die peilingen voorspellen de bureaus voor elke politieke partij een percentage van de stemmen. Maar dat voorspelde percentage klopt natuurlijk zelden precies: er is een onzekerheid. Welke percentages voorspeld werden voor de drie grote partijen, drie dagen voor de verkiezingen, kun je aflezen uit onderstaand plaatje. Bovendien kun je de erin zien in hoeverre de voorspellingen betrouwbaar zijn.

We bekijken het percentage voor de PvdA.

a

Welk percentage is voorspeld voor de PvdA?

b

Tussen welke twee grenzen ligt het percentage (met grote waarschijnlijkheid)?

c

Bij welke partij is de onzekerheid van de voorspelling het grootst? Bij welke partij is de onzekerheid het kleinst? Waar zie je dat aan?

De oppervlakte onder elk van de drie krommen is hetzelfde.

d

Waarom moet dat zo zijn?

e

Hoe groot ongeveer is volgens het plaatje de kans dat de PvdA meer dan 31 % van de stemmen haalt?

6

Verkeersdoden
Het aantal verkeersdoden in een jaar in Nederland schommelt de laatste jaren rond de 800 . Op grond van het verleden wordt het aantal verkeersdoden voor komend jaar voorspeld. De voorspelling en de onzekerheid van de voorspelling kun je aflezen uit het volgende plaatje.

a

Schat hoe groot de kans is dat het aantal verkeersdoden onder de 750 ligt.

b

Schat hoe groot de kans is dat het aantal verkeersdoden ligt tussen 800 en 830 .

7

De lengte van 18 -jarige jongens in Nederland is klokvormig verdeeld. Het percentage van de jongens die langer zijn dan 190 cm wordt gegeven door de gekleurde oppervlakte.

a

Hoe groot schat jij dat dat percentage ongeveer is?

b

Schat hoeveel procent van de jongens een lengte heeft tussen 170 en 180 cm.

Een grootheid X is verdeeld volgens de kromme hiernaast. Op de horizontale as zijn twee mogelijke waarden van X aangegeven: a en b .
De kans dat de waarde van X ligt tussen a en b wordt gegeven door de oppervlakte onder de kromme tussen a en b .
Preciezer: de volgende drie uitspraken komen op hetzelfde neer.

  • De grijze oppervlakte is p % van de totale oppervlakte onder de kromme.

  • Bij een groot aantal herhalingen zal X in ongeveer p % van de gevallen een waarde tussen a en b hebben.

  • De kans dat a X b is p 100 .

8

In 2009 werden in Nederland in totaal 184.915 kinderen levend geboren. Hieronder staan een frequentietabel en een frequentiehistogram van de leeftijd van de moeders. De gegevens zijn ontleend aan het CBS StatLine. De verdeling is klokvormig.

Voer op de GR de leeftijden in.

a

Controleer het histogram door het op de GR te tekenen.

b

Bereken op de GR het gemiddelde en de standaardafwijking van de leeftijd van de moeders.

Als je als leeftijden 15 , 16 , ... invoert, krijg je als gemiddelde ongeveer 31,0 jaar.
In werkelijkheid is het gemiddelde echter 31,5 jaar.

c

Kun je dat halve jaar verschil verklaren?

d

Ga na dat in het frequentiehistogram x ¯ , x ¯ + σ en x ¯ σ goed zijn aangegeven.

e

Hoeveel procent van de moeders is ouder dan x ¯ , hoeveel procent is ouder dan x ¯ + σ en hoeveel procent is ouder dan x ¯ + 2 σ ?

Klokvormige verdelingen

Veel data zijn zo ongeveer klokvormig verdeeld zoals hiernaast schetsmatig is aangegeven. Er is één top en de verdeling is symmetrisch en loopt geleidelijk af tot 0 . Jr kunt hierbij denken aan juli-temperaturen, lengte van rekruten, de eindexamencijfers voor het vak wiskunde A of het aantal jongens bij 1000 geboortes in een zekere gemeente. In opgave 18 zie nog zo'n voorbeeld. Bij die verdelingen zijn grote afwijkingen van het gemiddelde zeldzaam.

Bij klokvormige verdelingen gelden de volgende vuistregels voor de afwijkingen van het gemiddelde:

  • afwijkingen van meer dan σ zijn heel gewoon: dit gebeurt in ongeveer 32 % van de gevallen,

  • afwijkingen van meer dan 2 σ zijn tamelijk zeldzaam: dit gebeurt in ongeveer 5 % van de gevallen,

  • afwijkingen van meer dan 3 σ zijn uiterst zeldzaam: dit gebeurt in ongeveer 0,2 % van de gevallen.

Zie de vier plaatjes hiernaast.

9

Kijk nog eens naar de plaatjes die je hebt getekend bij opgave 12.

Schat bij elk van de voorbeelden de standaardafwijking met behulp van het plaatje en de derde vuistregel.

  • Lengte van een Nederlandse jongen van 18 jaar.

  • Leeftijd van een vrouw als ze moeder wordt (haar eerste kind krijgt).

  • Tijdsduur van een autorit Arnhem-Nijmegen ( 18 km) in de ochtendspits.

  • Het precieze gewicht in een zogenaamd kilopak suiker.

  • Het aantal keer kop bij 100 worpen met een muntstuk.

Kansen bij de normale verdeling

Bij de volgende opgaven mag je er telkens van uitgaan dat er sprake is van een normale verdeling.

10

Op een weg binnen de bebouwde kom (waar 50 km/u de maximumsnelheid is) wordt vaak te hard gereden. Controles wijzen uit dat de gemiddelde snelheid 60 km/uur is en de bijbehorende standaardafwijking 5 km/uur.

a

Hoeveel procent van de passerende voertuigen rijdt te hard?

b

Hoeveel procent van de passerende voertuigen rijdt tussen 55 en 70 km/uur?

11

Een melkkoe geeft in een lactatieperiode (dat is de periode waarin ze melk geeft) gemiddeld 25 liter melk per dag. Een koe wordt gemiddeld 315 dagen per jaar gemolken. Dit komt neer op een gemiddelde productie van 7875 liter melk per koe per jaar. Sommige koeien produceren tijdens hun leven wel 100.000 liter melk. Nederland telt ongeveer 4 miljoen melkkoeien.
De standaardafwijking van de dagelijkse hoeveelheid melk van melkkoe Bertha is 3 liter.

a

Hoeveel dagen per jaar zal Bertha naar verwachting minder dan 19 liter melk geven?

De standaardafwijking van de jaarlijkse hoeveelheid melk van Nederlandse melkkoeien is 125 liter.

b

Hoeveel melkkoeien in Nederland zullen naar verwachting meer dan 8000 liter melk per jaar geven?

12

Klas 4V2 (met 28 leerlingen) heeft bij Engels een schriftelijke overhoring gehad over een groot aantal woordjes. Gemiddeld had een leerling 17,5 fout. De standaardafwijking van het aantal fouten was 2,5 . De toegepaste normering is één punt eraf per vijf fouten.

a

Schat het laagste en het hoogste cijfer in deze klas.

b

Schat het aantal onvoldoendes ( 5,5 ) in deze klas.

13

Neem aan dat de leeftijd van leerlingen in vwo 5 aan het begin van een schooljaar (1 september) normaal verdeeld is met een gemiddelde van 16,3 jaar en een standaardafwijking van 0,8 jaar. (Hierbij rekenen we de leeftijd als voortdurend oplopende tijd sinds de geboorte, zodat iemand bijvoorbeeld 15,7 jaar kan zijn.)

a

Is de leeftijd van deze leerlingen aan het eind van het schooljaar (op 1 juli) ook normaal verdeeld? Wat is dan het gemiddelde en wat is de standaardafwijking?

b

Is de leeftijd van deze leerlingen gerekend in maanden (op 1 september) ook normaal verdeeld? Wat is dan het gemiddelde en wat is de standaardafwijking (beide in maanden)?

14

De lengte van 21 -jarige Engelse jongemannen is normaal verdeeld met een gemiddelde van 178 cm en een standaardafwijking van 7 cm. Hun gewicht is ook normaal verdeeld en wel met een gemiddelde van 78 kg en een standaardafwijking van 11 kg.

a

Wat wordt het gemiddelde en wat de standaardafwijking als de lengtes in “feet” en “inches” worden weergegeven? ( 1 foot = 30,48 cm en 1 inch = 2,54 cm)

b

Wat wordt het gemiddelde en wat de standaardafwijking als de gewichten in “stones” worden weergegeven?
( 1 stone = 6,35 kg)

15

Temperaturen kunnen zowel in graden Celsius als in graden Fahrenheit worden uitgedrukt.
De temperatuur in graden Celsius noemen we C en de temperatuur in graden Fahrenheit F . Er geldt: F = 1,8 C + 32 .

Wat wordt de gemiddelde julitemperatuur van 17,4 °C en een bijbehorende standaardafwijking van 1,5 °C als de temperaturen naar Fahrenheit worden overgezet?

Een normale verdeling wordt volledig bepaald door twee parameters:

  • het gemiddelde,

  • de standaardafwijking.

Het gemiddelde en de standaardafwijking worden in de statistiek met Griekse letters aangegeven:

  • μ (spreek uit mu) voor het gemiddelde,

  • σ (spreek uit sigma) voor de standaardafwijking.

Opmerking:

Stel dat een grootheid X normaal verdeeld is met gemiddelde μ en standaard-afwijking σ .
De kans dat de grootheid een waarde tussen a en b aanneemt ligt dan vast. Deze kans noteren we met: P ( a < X < b | μ , σ ) .
(Zie de figuur hierboven links.)
Op de GR kun je deze kans berekenen, in de figuur links met een vraagteken aangegeven.
Ook kun je met de GR het getal a vinden (in de figuur rechts aangegeven met een vraagteken) als je de kans p kent met P ( X < a | μ ; σ ) = p .
Zoek uit hoe dat op jouw GR gaat.
Ga met je GR bijvoorbeeld na dat voor P ( 1 X 5 | μ = 3 ; σ = 2 ) ongeveer 0,6827 vindt.
Ook dat je voor het getal a met P ( X < a | μ = 5 ; σ = 8 ) = 0,85 vindt:
a 13,27 .

In de volgende opgaven moet je beide opties veel gebruiken.
We gaan ervan uit dat je ook P ( X < a | μ ; σ ) en P ( X > a | μ ; σ ) op de GR kunt berekenen.

16

Een tomatenkweker heeft geoogst. De vruchten variëren in grootte en gewicht. Het gewicht is normaal verdeeld met μ = 90 gram en σ = 15 gram. In totaal zijn 60.000 tomaten geoogst. De oogst wordt op gewicht gesorteerd.
De drie gewichtsklassen zijn:

  • klasse A: tot 70 gram,

  • klasse B: van 70 tot 100 gram,

  • klasse C: meer dan 100 gram.

a

Hoeveel procent van de oogst komt in elk van de klassen terecht?

De opbrengst van een tomaat hangt af van zijn gewichtsklasse:

  • klasse A: 20 cent,

  • klasse B: 25 cent,

  • klasse C: 30 cent.

b

Welke opbrengst mag de kweker voor zijn hele oogst verwachten?

17

In 1986 werd van 103.370 dienstplichtige 18 -jarigen de lengte opgemeten. Hun gemiddelde lengte bleek 181,8 cm te zijn en de standaardafwijking 7 cm.
We willen weten hoeveel jongens 190 cm of langer zijn.

a

Schets een normale kromme en geef daarbij de gegevens en het gevraagde aan.

b

Bereken met de GR hoeveel van de jongens naar verwachting 190 cm of langer waren.

Jongens die langer waren dan 200 cm of korter dan 160 cm werden op grond van hun lengte afgekeurd.

c

Teken weer een bijpassend plaatje. Bereken hoeveel jongens er in 1986 op grond van hun lengte werden afgekeurd.

d

Bereken vanaf welke lengte een jongen tot de 1 % langste behoorde.

e

Bereken tot welke lengte een jongen tot de 5 % kleinste behoorde.

18

Een ei weegt gemiddeld 63 gram met een standaardafwijking van 4 gram. Men verdeelt eieren in verschillende gewichtsklassen: S staat voor Small, dat is met een gewicht onder de 53 gram, M betekent Medium, dat is met een gewicht van 53 tot 61 gram, de L staat voor Large, dat is met een gewicht van 61 tot 73 gram en XL is Extra Large; dat zijn eieren die zwaarder zijn dan 73 gram.

a

Bereken hoeveel procent van de eieren in de verschillende gewichtsklassen terechtkomt.

Stel dat de eieren worden ingedeeld in vier opeenvolgende gewichtsklassen die elk 25 % van het totaal bevatten.

b

Bereken dan de bijbehorende gewichtsgrenzen.

19

Twee fabrikanten brengen voor dezelfde prijs eenzelfde type lamp op de markt. Merk A heeft een gemiddelde van 1200 branduren en een standaardafwijking van 200 uur. Merk B heeft een gemiddelde van 1250 uur en een standaardafwijking van 250 uur. Je wilt een lamp kopen die minstens 1100 uur moet branden.

Welk merk heeft jouw voorkeur?

20

Nederlandse euromunten worden in Utrecht geslagen bij de Koninklijke Nederlandse Munt. De afmetingen en gewichten zijn aan zeer strikte regels gebonden.

munstsoort

metaal

middellijn
in mm

gewicht
in mg

twee euro

koper/nikkel/messing

25,75

8500

een euro

koper/nikkel/messing

23,25

7500

vijftig cent

Nordic gold

24,25

7800

twintig cent

Nordic gold

22,25

5740

tien cent

Nordic gold

19,75

4100

vijf cent

staal/koper

21,25

3920

twee cent

staal/koper

18,75

3060

een cent

staal/koper

16,25

2300

Het gewicht van een nieuw geslagen euromunt is normaal verdeeld met μ = 7500 mg en σ = 6 mg. Munten die meer dan 15 mg afwijken van het vereiste gewicht mogen niet in omloop worden gebracht.

a

Waarom gelden er zulke strikte eisen voor het toegestane gewicht?

b

Bereken welk percentage van de nieuw geslagen één-euromunten niet in omloop zal worden gebracht.

Per jaar zijn er 25 miljoen nieuwe één-euromunten nodig.

c

Hoeveel moeten er geslagen worden om aan die vraag te kunnen voldoen?

21

In een fabriek worden blikken gevuld met (gemiddeld) 1 liter verf. De vulmachine levert niet blikken van precies 1 liter. De inhoud van de blikken is normaal verdeeld met een standaardafwijking van 15 milliliter.
We willen weten hoeveel procent van de blikken meer dan 30 ml verf te weinig bevat.

a

Schets een normale kromme en kleur de oppervlakte die hoort bij deze vraag.

b

Bereken hoeveel procent van de blikken meer dan 30 ml verf te weinig bevat.

Een liter verf weegt 2 kg.

c

Bereken hoeveel procent van de blikken minder dan 1980 gram verf bevat.