7.5  Rekenen met de normale verdeling >
1

In de onderstaande figuur zie je de (fictieve) lengteverdeling van Nederlandse, Franse en Zweedse 18 -jarige mannen. De buigpunten zijn aangegeven met een rondje.

a

In welk land zijn de jongens het langst?

b

Lees de standaardafwijking voor elk van de drie verdelingen af.

c

Verklaar: hoe smaller de ‘klok’, hoe hoger de ‘top’.

2

Vanaf 1848 worden systematisch allerlei gegevens over het weer bijgehouden. Gemiddeld valt er jaarlijks 780  mm neerslag in de Bilt. Grotere afwijkingen dan 380  mm van dit gemiddelde zijn nooit voorgekomen. Op grond van die jarenlange ervaring maakt men een plaatje van de voorspelling voor het komend jaar.

a

Hoe ziet dat plaatje eruit, denk je? Vermeld de relevante gegevens.

Stel dat er in een jaar 500  mm neerslag viel.

b

Vind je dat extreem weinig of valt het wel mee? Waarom?

Hieronder staan twee mogelijke antwoorden op vraag a.

c

Wat is je bezwaar tegen elk van deze antwoorden?

3

Teken voor elk van de volgende voorbeelden een klokvorm zoals hiernaast. Schrijf bij de horizontale as de grootheid en de eenheid waarin je meet. (Bij het eerste voorbeeld is dat de grootheid lengte en de eenheid is cm.) Schrijf bij de drie streepjes op de horizontale as redelijke getallen.

a

Lengte van Nederlandse jongens van 18  jaar.

b

Leeftijd van de vrouw als ze moeder wordt (haar eerste kind krijgt).

c

Tijdsduur van een autorit Arnhem-Nijmegen ( 18  km) in de ochtendspits.

d

Het precieze gewicht in een zogenaamd kilopak suiker.

e

Het aantal keer kop bij 100  worpen met een muntstuk.

In de opgaven hiervoor kwam je steeds hetzelfde soort plaatje tegen: de normale kromme. Kenmerkend voor deze klokvorm zijn:

  • Symmetrie om het gemiddelde: afwijkingen naar boven zijn even waarschijnlijk als even grote afwijkingen naar beneden.

  • Hoe groter de afwijking, des te kleiner is de kans dat die optreedt.

  • Erg grote afwijkingen komen praktisch niet voor.

Opmerking:

Veel verdelingen zijn klokvormig, of ze lijken daar sterk op. We spreken van een normale verdeling. De term normale verdeling is ingevoerd door de Engelse statisticus Karl Pearson (1857-1936). Maar let op, niet alle verdelingen zijn normaal.

4

Geen van de volgende verdelingen is klokvormig.

Zeg van elke verdeling, waarom hij niet klokvormig is.

5

In januari 2008 verscheen er in NRC Handelsblad een artikel over de becijfering van het tentamen Recht bij een universiteit. In de figuur hieronder zie je de verdeling van de cijfers voor dat tentamen.

Het is duidelijk dat deze cijfers niet passen in een normale verdeling. Dit in tegenstelling tot andere tentamenresultaten. Hieronder staan enkele mogelijke verklaringen.

Verklaring 1:
Er waren twee groepen studenten, namelijk een groep die zijn huiswerk iedere week inleverde en een groep die dat niet deed.

Verklaring 2:
Veel studenten zijn tevreden met een zesje. Meer hoeft voor hen niet. Dus daar richten ze zich op.

Verklaring 3:
Docenten geven niet graag een 5 . Ze scheppen liever duidelijkheid over het al dan niet halen van een tentamen.

Wat vind je van elk van deze drie verklaringen?

Zoals je gezien hebt, kun je uit een verdelingskromme percentages aflezen. Daarvoor is de oppervlakte onder de grafiek bepalend.

6

De lengte van 18 -jarige jongens in Nederland is klokvormig verdeeld. Het percentage van de jongens dat langer is dan 190  cm wordt gegeven door de gekleurde oppervlakte.

a

Hoe groot schat jij dat dat percentage ongeveer is?

b

Schat hoeveel procent van de jongens een lengte heeft tussen 170 en 180  cm.

Het percentage waarnemingen dat ligt tussen de grenzen  a en b wordt gegeven door de oppervlakte onder de normale kromme tussen a en b .

Bij klokvormige verdelingen hoort een wiskundig model: de normale verdeling. Belangrijke kenmerken van de normale verdeling zijn:

  • de grafiek is symmetrisch, de verticale lijn door het gemiddelde ( μ ; spreek uit: mu) is symmetrieas;

  • de totale oppervlakte onder de kromme is gelijk aan 1 (of 100 % );

  • de afstand van symmetrieas tot de buigpunten is gelijk aan de standaarddeviatie ( σ ; spreek uit: sigma).


Voor de normale verdeling geldt dat waarnemingen die veel afwijken van het gemiddelde zeldzaam zijn. Bijna altijd zal een waarneming tussen de grenzen “ gemiddelde 2 SD ” en “ gemiddelde + 2 SD ” liggen. Bij klokvormige verdelingen gelden de volgende vuistregels voor de afwijkingen van het gemiddelde:

  • 68 % van de waarnemingen ligt tussen de waarden μ σ en μ + σ ;

  • 95 % van de waarnemingen ligt tussen de waarden μ 2 σ en μ + 2 σ ;

  • nagenoeg 100 % van de waarnemingen ligt tussen de waarden μ 3 σ en μ + 3 σ .

Voorbeeld:

De lengte van 18 -jarige jongens is normaal verdeeld. Het gemiddelde is 182,4  cm en de standaardafwijking is 10,2  cm. Op grond van deze kerngegevens mag je het volgende verwachten: 95 % van deze groep zal een lengte hebben tussen 162,0  cm en 202,8  cm. Niet onbelangrijk als je denkt aan kleding, bedden, enzovoorts!

7
a

Leg uit hoe we aan 162,0  cm en 202,8  cm komen.

b

Hoeveel procent van de 18 -jarige jongens is, naar verwachting, langer dan 202,8 ?

c

Schets de normale kromme en schrijf bij de horizontale as de getallen 162,0 en 202,8 op de juiste plaats.

d

Tussen welke grenzen zal de lengte van vrijwel 100 % van de jongens liggen?

8

De cijfers op een eindexamen zijn vaak ongeveer normaal verdeeld. Stel dat het gemiddelde van een bepaald vak  6,6 is en de standaardafwijking is 1,2 .

a

Tussen welke grenzen zal dan het cijfer van 95 % van de leerlingen liggen, naar je mag verwachten?

b

Hoeveel procent van de leerlingen zal dan een cijfer boven de 7,8 hebben?

9

Van een partij van 10.000  tomaten is het gewicht normaal verdeeld. Er zijn 250  tomaten zwaarder dan 490  gram en 250  tomaten lichter dan 420  gram.

a

Schets de normale kromme en schrijf de getallen 490 en 420 bij de horizontale as.

b

Wat is het gemiddelde gewicht van de tomaten?

c

Wat is de SD van het gewicht van de tomaten?

d

Wat is het gewicht van de 16 % zwaarste tomaten?

Opmerking:

Let op: als de verdeling niet normaal verdeeld is, gaan de 68 % -, 95 % - en 100 % -regel niet op.

10

In het databestand Voetlengtes vind je de voetlengtes in centimeter van honderd mannen en honderd vrouwen.

a

Bepaal van beide groepen zowel de gemiddelde voetlengte als de standaarddeviatie van de voetlengtes, beide in 1 decimaal nauwkeurig.

b

Maak bij beide groepen een histogram en ga aan de hand daarvan na of de voetlengtes bij benadering normaal verdeeld zijn.

Werk nu verder met normale verdelingen als model voor de voetlengtes.

c

Hoeveel procent van de mannen heeft grotere voeten dan de helft van de vrouwen?

d

Wat is de kleinste voetlengte die voorkomt in de groep van de 2,5 %  vrouwen met de grootste voeten?

e

Wat is de grootste voetlengte die voorkomt in de groep van de 2,5 %  mannen met de kleinste voeten?

11

Hieronder staat de scoreverdeling van de Vlaamse Wiskunde Olympiade. De scoreverdeling is bij benadering normaal verdeeld.

a

Leg uit hoe je de gegeven standaardafwijking ( 20,50 ) uit het staafdiagram kunt halen.

b

Controleer de vuistregels van de normale verdeling.

Met behulp van de normale verdeling kun je een schatting maken van het aantal scholieren dat een score had van 100 of meer.

c

Maak deze schatting. Licht je antwoord toe.