7.3  Verdeling typeren en groepen vergelijken >

Het gemiddelde en de standaardafwijking worden vaak gebruikt om een verdeling te typeren en om groepen met elkaar te vergelijken.

1

In figuur 1 is een histogram afgebeeld.

a

Waar ligt het gemiddelde van de waarnemingen?

b

Dezelfde vraag voor figuur 2.

Inkomensverdelingen hebben vaak een verdeling als het histogram in figuur 3 laat zien.

c

Waar ligt het gemiddelde ten opzichte van de modus?

Bij vraag c van de vorige opgave is het niet eenvoudig om het gemiddelde nauwkeurig aan de hand van het histogram aan te geven.
De figuur lijkt enigszins op het onderstaande histogram van de inkomensverdeling van de Amerikaanse artsen in de jaren veertig (opgave 7).

Het gemiddelde inkomen was destijds $ 11.500 . Misschien verwacht je dat de helft van de artsen minder dan $ 11.500 verdiende, maar dat is niet zo. We zoeken uit hoe het komt dat die verdeling niet “fiftyfifty” is.

2

In een huisartsenpraktijk werken vier artsen. Drie artsen verdienen respectievelijk 3000 , 3500 en 3500  euro per maand.
Bereken het gemiddelde inkomen van de vier artsen in de volgende gevallen:

  • de vierde arts verdient 4000  euro;

  • de vierde arts verdient 5000  euro;

  • de vierde arts verdient 6000  euro;

  • de vierde arts verdient 7000  euro.

Uit het voorbeeld van de vier huisartsen blijkt duidelijk dat een uitschieter het gemiddelde ‘meetrekt’, waardoor het gemiddelde niet altijd te gebruiken is als karakterisering van de dataset. Zo verdienen in drie van de vier gevallen 75 % van de huisartsen minder dan het gemiddelde!
Iets dergelijks heb je als een histogram een ‘staart naar rechts’ heeft, zoals in de figuur hiernaast. In zo’n geval geeft de mediaan een beter beeld van het centrum van de verdeling. De oppervlakte van een histogram wordt door de mediaan in twee even grote delen verdeeld. De mediaan laat zich dus niet van de wijs brengen door de staart van de verdeling.

3

Bij een histogram met een staart naar rechts is het gemiddelde groter dan de mediaan.

a

Verklaar dit.

Histogrammen van een inkomensverdeling hebben vaak een staart naar rechts. Bij inkomens wordt daarom regelmatig naar de mediaan gekeken en niet naar het gemiddelde.

b

Verklaar dit.

4
a

Geef voor elk van de onderstaande verdelingen aan of de mediaan groter of kleiner is dan het gemiddelde.

b

Teken een histogram waarbij de modus (de meest voorkomende waarneming) het beste beeld geeft van het centrum van de verdeling.

5

In de figuur hieronder staan de schoolexamencijfers van de leerlingen A t/m D aan het eind van HAVO 5.

Het eindcijfer is het gemiddelde van deze cijfers. Neem aan dat elk cijfer even zwaar meetelt voor het eindcijfer.

a

Welke eindcijfers krijgen deze leerlingen?

De leerlingen A en B hebben (afgerond op 1 decimaal) hetzelfde gemiddelde. Toch is hun cijferbeeld nogal verschillend.

b

In welk opzicht?

De spreiding van de cijfers van A en C is vrijwel hetzelfde.

c

Waarin verschilt hun cijferbeeld vooral?

De leerlingen B en D hebben vrijwel dezelfde spreidingsbreedte.

d

Zou je de spreiding van hun cijfers ook hetzelfde willen noemen?

e

Sorteer, zonder berekening, de leerlingen op basis van de standaardafwijking (van klein naar groot).

In de figuur hieronder staan de gegevens van een vijfde leerling E.

De verdeling van de cijfers van leerling E kent een echte uitschieter. Daarom is de standaardafwijking ongeschikt om de spreiding van de verdeling te beschrijven.

f

Licht dit toe.

Stel dat leerling E de 2,3 mag herkansen en hij een 7,9 haalt.

g

Beredeneer, zonder berekening, dat hierdoor de standaardafwijking kleiner wordt.

6

Bekijk de dataset Gegevens154Leerlingen. Je vindt daar de lengtes van 154  leerlingen.

a

Maak een histogram van de relatieve frequenties van de lengtes van de jongens. Doe hetzelfde voor de meisjes. Zijn beide histogrammen symmetrisch?

b

Laat de computer van zowel de jongens als de meisjes de gemiddelde lengte berekenen. Geef die in de histogrammen aan.

c

Laat de computer van zowel de jongens als de meisjes de standaardafwijking van de lengtes berekenen. Geef ook die links en rechts van het gemiddelde in je histogrammen aan.

d

Alle lengtes zijn in cm. Welke eenheid heeft de variantie? En de standaardafwijking? Waarom is de standaardafwijking een passender spreidingsmaat dan de variantie?

7

Het eindcijfer voor een vak wordt berekend door het gemiddelde te nemen van het schoolexamencijfer (SE-cijfer) en het cijfer voor het centraal examen (CE-cijfer).
Hieronder staat de verdeling van de eindcijfers voor het vak wiskunde van het Amalia College, uitgesplitst naar geslacht.

Beredeneer, dus zonder te rekenen, voor welk geslacht de standaardafwijking van het eindcijfer het kleinst is.

8

Hieronder vind je gegevens over de lengte van 209  mannen en 195  vrouwen.

Beredeneer, dus zonder te rekenen, voor welk geslacht de standaardafwijking van de lengte het kleinst is.

9

In de onderstaande frequentiepolygonen vind je gegevens over het gewicht van de leerlingen van het Amalia College.

Beredeneer, dus zonder te rekenen, voor welk geslacht de standaardafwijking van het gewicht het kleinst is.

10

In de onderstaande boxplots vind je gegevens over het aantal dagen per jaar dat het mist, onweert, sneeuwt en hagelt.

Orden, zonder te rekenen, de weersverschijnselen op basis van de standaardafwijking.

De standaardafwijking zegt iets over de spreiding rond het gemiddelde. Het is een spreidingsmaat die alle waarnemingen meeweegt. Een kleine standaardafwijking betekent ‘er is weinig spreiding: de waarnemingen liggen dicht bij elkaar’. Een grote standaardafwijking betekent ‘er is veel spreiding: de waarnemingen liggen ver uit elkaar’. De standaardafwijking gebruiken we om groepen te typeren en met elkaar te vergelijken.

Vaak kun je aan de vorm van een verdeling al iets zeggen over de standaardafwijking. Bijvoorbeeld:

  • de standaardafwijking is groot als in een histogram veel waarnemingen in de ‘staarten’ zitten;

  • in een boxplot duidt een grote box op een grote standaardafwijking;

  • als de standaardafwijking groot is, loopt een cumulatief frequentiepolygoon geleidelijk omhoog; terwijl bij een kleine standaardafwijking een cumulatief frequentiepolygoon eerst weinig stijgt, daarna hard en op eind weer weinig.