Het gemiddelde en de standaardafwijking worden vaak gebruikt om een verdeling te typeren en om groepen met elkaar te vergelijken.
In figuur 1 is een histogram afgebeeld.
Waar ligt het gemiddelde van de waarnemingen?
Dezelfde vraag voor figuur 2.
Inkomensverdelingen hebben vaak een verdeling als het histogram in figuur 3 laat zien.
Waar ligt het gemiddelde ten opzichte van de modus?
Bij vraag c van de vorige opgave is het niet eenvoudig om het gemiddelde nauwkeurig aan de hand
van het histogram aan te geven.
De figuur lijkt enigszins op het onderstaande histogram van de inkomensverdeling
van de Amerikaanse artsen in de jaren veertig (opgave 7).
Het gemiddelde inkomen was destijds . Misschien verwacht je dat de helft van de artsen minder dan verdiende, maar dat is niet zo. We zoeken uit hoe het komt dat die verdeling niet “fiftyfifty” is.
In een huisartsenpraktijk werken vier artsen. Drie artsen verdienen respectievelijk
, en euro per maand.
Bereken het gemiddelde inkomen van de vier artsen in de volgende gevallen:
de vierde arts verdient euro;
de vierde arts verdient euro;
de vierde arts verdient euro;
de vierde arts verdient euro.
Uit het voorbeeld van de vier huisartsen blijkt duidelijk dat een uitschieter het
gemiddelde ‘meetrekt’, waardoor het gemiddelde niet altijd te gebruiken is als karakterisering
van de dataset. Zo verdienen in drie van de vier gevallen van de huisartsen minder dan het gemiddelde!
Iets dergelijks heb je als een histogram een ‘staart naar rechts’ heeft, zoals in
de figuur hiernaast. In zo’n geval geeft de mediaan een beter beeld van het centrum
van de verdeling. De oppervlakte van een histogram wordt door de mediaan in twee even
grote delen verdeeld. De mediaan laat zich dus niet van de wijs brengen door de staart
van de verdeling.
Bij een histogram met een staart naar rechts is het gemiddelde groter dan de mediaan.
Verklaar dit.
Histogrammen van een inkomensverdeling hebben vaak een staart naar rechts. Bij inkomens wordt daarom regelmatig naar de mediaan gekeken en niet naar het gemiddelde.
Verklaar dit.
Geef voor elk van de onderstaande verdelingen aan of de mediaan groter of kleiner is dan het gemiddelde.
Teken een histogram waarbij de modus (de meest voorkomende waarneming) het beste beeld geeft van het centrum van de verdeling.
In de figuur hieronder staan de schoolexamencijfers van de leerlingen A t/m D aan het eind van HAVO 5.
Het eindcijfer is het gemiddelde van deze cijfers. Neem aan dat elk cijfer even zwaar meetelt voor het eindcijfer.
Welke eindcijfers krijgen deze leerlingen?
De leerlingen A en B hebben (afgerond op 1 decimaal) hetzelfde gemiddelde. Toch is hun cijferbeeld nogal verschillend.
In welk opzicht?
De spreiding van de cijfers van A en C is vrijwel hetzelfde.
Waarin verschilt hun cijferbeeld vooral?
De leerlingen B en D hebben vrijwel dezelfde spreidingsbreedte.
Zou je de spreiding van hun cijfers ook hetzelfde willen noemen?
Sorteer, zonder berekening, de leerlingen op basis van de standaardafwijking (van klein naar groot).
In de figuur hieronder staan de gegevens van een vijfde leerling E.
De verdeling van de cijfers van leerling E kent een echte uitschieter. Daarom is de standaardafwijking ongeschikt om de spreiding van de verdeling te beschrijven.
Licht dit toe.
Stel dat leerling E de mag herkansen en hij een haalt.
Beredeneer, zonder berekening, dat hierdoor de standaardafwijking kleiner wordt.
Bekijk de dataset Gegevens154Leerlingen. Je vindt daar de lengtes van leerlingen.
Maak een histogram van de relatieve frequenties van de lengtes van de jongens. Doe hetzelfde voor de meisjes. Zijn beide histogrammen symmetrisch?
Laat de computer van zowel de jongens als de meisjes de gemiddelde lengte berekenen. Geef die in de histogrammen aan.
Laat de computer van zowel de jongens als de meisjes de standaardafwijking van de lengtes berekenen. Geef ook die links en rechts van het gemiddelde in je histogrammen aan.
Alle lengtes zijn in cm. Welke eenheid heeft de variantie? En de standaardafwijking? Waarom is de standaardafwijking een passender spreidingsmaat dan de variantie?
Het eindcijfer voor een vak wordt berekend door het gemiddelde te nemen van het schoolexamencijfer
(SE-cijfer) en het cijfer voor het centraal examen (CE-cijfer).
Hieronder staat de verdeling van de eindcijfers voor het vak wiskunde van het Amalia
College, uitgesplitst naar geslacht.
Beredeneer, dus zonder te rekenen, voor welk geslacht de standaardafwijking van het
eindcijfer het kleinst is.
(Controleer je antwoord door beide standaardafwijkingen met de GR te berekenen.)
Hieronder vind je gegevens over de lengte van mannen en vrouwen.
Beredeneer, dus zonder te rekenen, voor welk geslacht de standaardafwijking van de lengte het kleinst is.
In de onderstaande frequentiepolygonen vind je gegevens over het gewicht van de leerlingen van het Amalia College.
Beredeneer, dus zonder te rekenen, voor welk geslacht de standaardafwijking van het gewicht het kleinst is.
In de onderstaande boxplots vind je gegevens over het aantal dagen per jaar dat het mist, onweert, sneeuwt en hagelt.
Orden, zonder te rekenen, de weersverschijnselen op basis van de standaardafwijking.
De standaardafwijking zegt iets over de spreiding rond het gemiddelde. Het is een
spreidingsmaat die alle waarnemingen meeweegt. Een kleine standaardafwijking betekent
‘er is weinig spreiding: de waarnemingen liggen dicht bij elkaar’. Een grote standaardafwijking
betekent ‘er is veel spreiding: de waarnemingen liggen ver uit elkaar’. De standaardafwijking
gebruiken we om groepen te typeren en met elkaar te vergelijken.
Vaak kun je aan de vorm van een verdeling al iets zeggen over de standaardafwijking.
Bijvoorbeeld:
de standaardafwijking is groot als in een histogram veel waarnemingen in de ‘staarten’ zitten;
in een boxplot duidt een grote box op een grote standaardafwijking;
als de standaardafwijking groot is, loopt een cumulatief frequentiepolygoon geleidelijk omhoog; terwijl bij een kleine standaardafwijking een cumulatief frequentiepolygoon eerst weinig stijgt, daarna hard en op eind weer weinig.