1

Stel dat bij een examen de laagste score 40 was, het 25 -percentiel 58 , het 50 -percentiel 65 , het 75 -percentiel 75 en de hoogste score 95 .

Maak bij deze gegevens een mogelijk somfrequentiepolygoon.

Met de bovenstaande gegevens (de laagste en hoogste score en het 25 -, 50 - en 75 -percentiel) kunnen we een boxplot tekenen.

In elk van de vier vakken zit 25 % van de leerlingen.

Voorbeeld:

Laten we voor een kleinere groep van bijvoorbeeld 12  leerlingen kijken hoe we een boxplot maken.
De scores zijn: 40 , 68 , 51 , 92 , 82 , 77 , 81 , 39 , 76 , 85 , 67 , 61 .

  • We ordenen de scores eerst van klein naar groot:
    39 , 40 , 51 , 61 , 67 , 68 , 76 , 77 , 81 , 82 , 85 , 92 .

  • We geven de twaalf scores aan op de getallenlijn:

  • We zoeken de middelste score. Hier is die er niet, dus nemen we het gemiddelde van de middelste twee: ( 68 + 76 ) : 2 = 72 .

  • Het getal 72 noemen we de mediaan. Zo ontstaat een onderste helft en een bovenste helft:

  • We zoeken nu de middelste score van de onderste helft. Ook hier is die er niet, dus nemen we opnieuw het gemiddelde van de middelste twee: ( 51 + 61 ) : 2 = 56 .
    We noemen 56 het eerste kwartiel Q1.

  • We zoeken ten slotte het midden van de bovenste helft: ( 81 + 82 ) : 2 = 81,5 .
    We noemen 81,5 het derde kwartiel Q3.

  • Teken een getallenlijn en teken de boxplot er zwevend boven.


De boxplot ziet er dan als volgt uit:

Wat valt er nu af te lezen uit deze boxplot?

  • De hele groep van 12  scores is in 'vieren' gedeeld.

  • Het eerste kwartiel Q1 (een kwart van de waarnemingen ligt hieronder) is bij benadering het 25 -percentiel.

  • De mediaan (helaas wordt hij niet het tweede kwartiel genoemd) is bij benadering het 50 -percentiel.

  • En het derde kwartiel Q3 (driekwart van de waarnemingen ligt hieronder) is bij benadering het 75 -percentiel

Opmerking:

Bij een oneven aantal scores is er wel een middelste score: die score is de mediaan. We spreken af dat we die mediaan dan - om de kwartielen te bepalen - zowel bij de onderste als bij de bovenste helft NIET meerekenen. Overigens is dit in de praktijk niet van belang omdat dan zeer grote databestanden worden gebruikt.

2

In de jaren 1984 t/m 1987 is in de Verenigde Staten onderzoek gedaan naar de salarissen van jonge wiskundigen. Deze groep werd in tweeën verdeeld: een groep die werkzaam was op de universiteit en een groep die in het bedrijfsleven werkzaam was. De salarissen zijn in dollar per week. De gegevens zijn opgesplitst voor mannen en vrouwen; M = male, F = female.

Uit de tabellen kun je bijvoorbeeld aflezen dat in 1985 van de mannen op de universiteit 75 % 300  dollar of minder verdiende en dat 25 % tussen 235 en 240  dollar verdiende.

a

Teken de boxplots voor universiteit en bedrijfsleven in 1987 voor mannen en vrouwen in één figuur.

b

Bespreek welke informatie uit deze boxplots is af te lezen. De volgende vragen kunnen je daarbij helpen.

  • Verdienen mannen altijd meer dan vrouwen?

  • Betaalt het bedrijfsleven beter dan de universiteit?

3

In opgave 27 heb je somfrequentiepolygonen gemaakt bij de lengteverdeling van een groep jongeren, volwassenen en ouderen.

a

Maak op het werkblad met behulp van deze polygonen een boxplot voor iedere groep.

b

Zie je de verschillen in lengten tussen de verschillende groepen terug in de boxplots?

4

De consumentenbond heeft voor 55  autotypen de maandelijkse kosten onderzocht. Er werd gekeken naar brandstofkosten, onderhoudskosten en vaste kosten (o.a. afschrijving). Deze drie opgeteld geven de totale kosten van een auto in euro’s per maand.

Hieronder zie je de boxplots van deze vier kosten.

Als je de minimale waarden in de vier boxplots neemt, geldt niet 473 = 21 + 58 + 312 . Evenzo, als je de maximale waarden neemt, geldt 1331 < 52 + 208 + 1090

a

Leg uit hoe dat kan.

Bij het zoeken naar een nieuwe auto spelen kosten een belangrijke rol. De onderhoudskosten spelen bij de keuze van de auto nauwelijks een rol.

b

Geef argument(en) hiervoor gezien de boxplots.

c

Welke kosten bepalen voornamelijk de totale kosten?

d

Maak een mogelijk somfrequentiepolygoon van de totale kosten.

5

Soms kan een boxplot er enigszins 'gehavend' uitzien.

Leg uit hoe dit mogelijk is.

6

Uit een histogram kun je vaak met enig schatten eenvoudig een boxplot maken, zij het niet precies.

a

Schat op grond van het histogram wat de mediaan is. Het is niet de bedoeling om te gaan rekenen. Waar let je op om de mediaan te vinden?

b

Vind zo ook – schattend – de kwartielen.

c

Teken op grond van je schattingen een boxplot.

Omgekeerd is het ook mogelijk, zo ongeveer, bij een boxplot een grof histogram te maken.

d

Doe dat bij de onderstaande twee boxplots.

Er liggen evenveel waarnemingen in de vier stukken:
min-Q1, Q1-mediaan, mediaan-Q3, Q3-max.
Dus moeten de bijbehorende vier oppervlaktes in het histogram gelijk zijn.

From chart to ART!
Xan de Vries combineert zijn liefde voor de aandelenbeurs met zijn talenten en passie voor grafisch ontwerp en schilderkunst. Deze mix resulteert in prachtige kunstwerken waarin statistische diagrammen een hoofdrol spelen.