3.2  Wat is statistiek? >
1

Nils vraagt zich af hoe het aantal Nederlanders in de loop van de jaren is veranderd. Om inzicht in de bevolkinggroei te krijgen, heeft hij gegevens nodig. Het Centraal Bureau voor de Statistiek (CBS) is een instantie die dergelijke gegevens bijhoudt. Hieronder zie je een klein deel van de tabel “Bevolking; kerncijfers”.

a

Hoe komt het CBS aan dergelijke gegevens?

b

Laat met een berekening zien hoe je de waarde 4,9 voor de totale bevolkingsgroei, relatief kunt bepalen met de gegevens uit de tabel.

c

Welke uitspraak zou je op grond van deze tabel kunnen doen over de totale bevolkingsgroei, relatief?

In de tabel vind je ook de bevolkingsdichtheid: het gemiddeld aantal inwoners per km2.

d

Hoe berekent het CBS de bevolkingsdichtheid? En wat betekent de toename van de bevolkingsdichtheid?

Tussen 1950 en 2000 is de oppervlakte van Nederland behoorlijk groter geworden.

e

Reken na met hoeveel km2. Weet jij hoe dit komt?

(hint)

Maak gebruik van de gegevens totale bevolking en bevolkingsdichtheid uit de tabel.

In 1812 trok het Franse leger onder aanvoering van de Franse keizer Napoléon ten strijde tegen Rusland. Deze campagne begon aan de rivier de Niemen en leidde naar Moskou. Het leger van Napoléon stuitte op flinke weerstand en werd bij Moskou verslagen. De terugtocht was vreselijk, mede door de extreme kou. De Franse ingenieur Charles Joseph Minard (1781 – 1870) tekende onderstaande figuur om het verloop van deze Russische veldtocht weer te geven.

Bij de weergave van de data heeft een onderzoeker meestal een bepaald doel. Minard wilde de verschrikkingen van de veldtocht van Napoléon in beeld brengen. Eén van de onderwerpen van Minards onderzoek betrof het aantal soldaten tijdens deze barre tocht. Dit aantal noemen we een statistische variabele. Minard heeft de vorm van zijn diagram zo gekozen dat de enorme verliezen duidelijk zichtbaar worden.

Voor een duidelijkere weergave in kleur van deze grafiek zie de link Minard: Napoleon's mars.
Een bewerkte versie waarin de getallen duidelijker zijn gemaakt vind je hier: Napoleons March Redux.

2

Bekijk Minards diagram over de veldtocht van 1812. Je ziet dat het Franse leger met 422.000  soldaten vertrok waarvan er uiteindelijk 10.000 terugkwamen.

a

Hoeveel procent van het Franse leger is tijdens de Russische veldtocht overleden?

b

Op welke twee manieren geeft het diagram de grootte van het leger weer?

c

Welke variabelen zijn nog meer in het diagram terug te vinden?

Op de terugweg zijn af en toe de dagtemperaturen gemeten. De temperatuur is gegeven in graden Réamur ( ° Re ); 0 ° C is hetzelfde als 0 ° Re en 100 ° C hetzelfde als 80 ° Re .

d

Hoeveel graden was de laagste dagtemperatuur in ° C ?
En op welke datum is deze temperatuur gemeten?

Met zijn diagram heeft Minard waarschijnlijk duidelijk willen maken dat de grootste vijand voor het Franse leger de temperatuur was. Je ziet dit onder andere terug in de lijndiagram die hij bij de terugtocht heeft gemaakt.

e

Wat is vreemd aan dit lijndiagram?

3

We bekijken drie beweringen.

Onze zomers worden steeds natter.

Anneke beweert dat de zomers in Nederland steeds natter worden, want vorig jaar nog was haar vakantie in eigen land helemaal verregend.

a

Wat vind je van Annekes argument?

Meisjes moeten zich niet laten vaccineren tegen baarmoederhalskanker.

Anneke laat zich niet inenten tegen baarmoederhalskanker. Haar vriendinnen doen dat ook niet, want zij hebben gelezen dat in de VS meisjes ernstig ziek zijn geworden van de inenting.

b

Wat vind je van Annekes argument?

Het fileprobleem is veel erger geworden.

Anneke beweert dat het fileprobleem de laatste jaren veel erger is geworden, want gisteren en eergisteren heeft ze twee uur in de file gestaan tussen Amsterdam en ’s-Hertogenbosch.

c

Wat vind je van Annekes argument?

Wat is statistiek?

Om verantwoorde uitspraken te kunnen doen in onzekere situaties, is statistiek nodig.

  • Je begint met een vraag of een bewering.

  • Dan moet je keuzes maken. Bijvoorbeeld wat het fileprobleem betreft.

    • Hoever ga je terug in de tijd? Onderscheid je verschillende seizoenen?

    • Kijk je alleen naar Nederland of betrek je ook andere landen in je onderzoek? Onderscheid je verschillende delen van Nederland?

    • Let je op het aantal files per dag, of op de lengte, of …

    • Let je op oorzaken van files? Wegwerkzaamheden, weer, vakanties, …

    • Als je gemiddeldes neemt, doe je dat dan per dag, per week, per maand?

  • Vervolgens ga je gegevens verzamelen.

  • Dat levert een gigantische verzameling getallen op waar je in het begin geen grip op hebt. Daartoe ga je ze ordenen en in beeld brengen.

  • Dan moet je de gegevens analyseren: je berekent bijvoorbeeld gemiddeldes en de spreiding.

  • Tot slot worden er conclusies getrokken; je beantwoordt de vraag.

Opmerking:

Persoonlijke gegevens zijn goud waard! Zo verdient Facebook enorme bedragen met de bergen persoonlijke informatie die het over zijn gebruikers heeft. Het socialemediabedrijf verkoopt deze gegevens door aan adverteerders die er reclame op maat mee maken; je weet wel, banners over schoenen die je achtervolgen nadat je een onlineschoenenwinkel hebt bezocht.

4

Ad voert een onderzoekje uit onder zijn klasgenoten.
Hij vraagt naar:

  • het geslacht;

  • de lichaamslengte;

  • het lichaamsgewicht;

  • de omvang van het gezin;

  • de afstand tot de school;

  • de kleur van de ogen;

  • het zakgeld per maand in euro’s;

  • de muziekvoorkeur.

Sommige van deze statistische variabelen geven een hoeveelheid (een grootte) aan, andere een kenmerk.

a

Welke van de statistische variabelen geven een kenmerk aan?

b

Welke van deze variabelen kun je in een getal uitdrukken?

c

Bij welke van deze variabelen is het zinvol om ze op volgorde te zetten?

5

Hieronder staan de gegevens over de gezinsomvang van leerlingen uit twee havo 4 klassen.
H4A: 3,   5,   2,   6,   5,   5,   2,   3,   4,   6,   4,   3,   5,   2,   5,   4,   4,   3,   4,   4,   5,   3,   7,   4,   4,   5,   2,   4
H4B: 4,   2,   5,   3,   4,   2,   4,   3,   5,   2,   3,   4,   6,   3,   3,   4,   3,   5,   4,   2,   4,   2,   5,   3,   3

a

Ga na dat de frequentietabel hiernaast bij de data past en leg uit waarom deze frequentietabel handiger is.

b

Hoeveel leerlingen zitten er in H4A?

c

Hoeveel personen wonen er in totaal in alle gezinnen van de leerlingen uit H4A?

d

Hoeveel bedraagt de gemiddelde gezinsomvang in H4A?

e

Vul de tabel verder in voor H4B.

In de frequentietabel staan de absolute frequenties. Door deze absolute frequenties te delen door het totale aantal leerlingen krijg je relatieve frequenties, die je ook kunt geven als percentages. Je kunt dan gemakkelijker beide klassen vergelijken.

f

Maak een nieuwe tabel met relatieve frequenties.

g

Beschrijf de verschillen tussen H4A en H4B.

Statistische variabelen kun je onderverdelen in kwalitatieve en kwantitatieve variabelen.

  • Statistische variabelen als het geslacht, de kleur ogen, de godsdienst, de bloedgroep, de naam, enzovoorts, geven een kenmerk van de populatie weer maar hoeven niet noodzakelijkerwijs in een getal te zijn uitgedrukt. We noemen dit kwalitatieve variabelen.

  • Statistische variabelen als de lengte, de hoogte van het inkomen, de omvang van het gezin, enzovoorts, worden wel in een getal uitgedrukt; dit zijn kwantitatieve variabelen. Het is een eigenschap die meetbaar of telbaar is.


Het is vaak handig om je gegevens te ordenen in frequentietabellen. Daarin hebben niet alleen de data een logische volgorde, maar is ook meteen te zien hoe vaak een bepaalde waarde van de statistische variabele voorkomt, zijn absolute frequentie.


Bij de gegevens over de gezinsomvang van leerlingen uit twee havo 4 klassen heb je twee datasets bij eenzelfde kwantitatieve variabele. Om beide datasets goed te kunnen vergelijken, is het handiger om met relatieve frequenties te werken, dat wil zeggen absolute frequenties gedeeld door het totaal, eventueel uitgedrukt in procenten.

6

De onderstaande tabel laat het aantal geslaagden zien op havo en vwo gedurende een drietal schooljaren. De gegevens zijn afkomstig van het CBS.

a

Om welke populatie gaat het bij deze data? Of anders gezegd: over welke doelgroep gaat het onderzoek.

b

Welke variabelen worden er onderzocht? Welke soort variabele betreft het?

Op het havo is in 2007/2008 het geslaagdenpercentage 89 .

c

Toon dit aan door een berekening.

d

Hoeveel procent van de examenkandidaten havo heeft in 2007/2008 een N-profiel gekozen? En hoeveel M-profielers zijn er dat jaar op havo?

e

Kun je het geslaagdenpercentage havo in 2007/2008 berekenen vanuit de percentages geslaagden van de M-profielen en de N-profielen afzonderlijk?

Het aantal examenkandidaten met een N-profiel op havo neemt absoluut gezien toe.

f

Is dat relatief bekeken ook zo?

7

In een onderzoek onder de 62  examenkandidaten havo van het Stedelijk Lyceum, worden onder andere de cijfers voor wiskunde A op het schoolexamen (SE) en het centraal examen (CE) vergeleken. Dit leidt tot de onderstaande puntenwolk.

a

Hoeveel leerlingen hebben een onvoldoende voor het CE?

b

Beschrijf - in woorden - het verband tussen de variabelen SE-cijfer en CE-cijfer.

c

Onderzoek of de leerlingen het SE beter hebben gemaakt dan het CE of dat het omgekeerde juist vaker voorkomt. Licht je antwoord toe.

(hint)

Teken een rechte lijn van de hoek linksonder naar de hoek rechtsboven.

d

Bij hoeveel leerlingen is het verschil tussen het SE-cijfer en het CE-cijfer meer dan 1  punt?

8

In Nederland wordt het aantal personen van 100  jaar of ouder nauwkeurig bijgehouden. Deze personen worden ook wel eeuwelingen genoemd. Het Centraal Bureau voor de Statistiek heeft het aantal eeuwelingen in 2005 vergeleken met het aantal eeuwelingen in 1985. Gegevens daarover vind je in de figuren 1 en 2.

a

Bereken met de gegevens van de figuren 1 en 2 hoeveel vrouwelijke eeuwelingen er op 1 januari 2005 in Nederland waren.

(hint)

In figuur 1 kun je bijvoorbeeld aflezen dat er op 1 januari 1985 ongeveer 45  personen waren van 103  jaar oud. In figuur 2 kun je aflezen dat er op dat moment op elke 100  vrouwelijke eeuwelingen ongeveer 38  mannen waren.

b

Is het aantal mannelijke eeuwelingen toe- of afgenomen in de periode 1985-2005? Licht je antwoord toe met een berekening.

9

Onderstaand diagram is afkomstig van de website Gapminder.

a

Welke twee variabelen zijn tegen elkaar uitgezet?

b

Beschrijf - in woorden - het verband tussen deze variabelen.

Ga naar de website Gapminder World.

c

In welk land is de levensverwachting het laagst?
Is dit ook het armste land ter wereld?

d

Welke twee landen stellen de grootste cirkels voor?
Welke betekenis heeft de grootte van elke punt?

Speel de animatie af.

e

Beschrijf wat je ziet gebeuren. Kun je dit verklaren?

Bekijk de ontwikkeling van Frankrijk in de periode van 1900 tot 1950.

f

Kun je het verloop van het gemiddelde inkomen en/of de levensverwachting verklaren?

Vergelijk nu eens de buurlanden Haïti en de Dominicaanse Republiek.

g

Wat valt je op? Kun je dit verklaren?

10

Het vermogen van een huishouden is grofweg gezegd de waarde van de bezittingen (bijvoorbeeld huizen, spaartegoeden, enzovoort) minus de schulden (zoals hypotheekschulden, persoonlijke leningen, enzovoort).
In een artikel in de Volkskrant is het vermogen van huishoudens in 2012 vergeleken met dat in 2008.

Het vermogen van de huishoudens is tussen 2008 en 2012 gedaald.

a

Hoe kun je dit in figuur 1 zien?

b

En hoe kun je dit in figuur 2 zien?

Het gemiddeld vermogen per huishouden is in Utrecht procentueel sterker gedaald dan in Noord-Brabant.

c

Hoe kun je dat zonder te rekenen zien?

d

Hoeveel nam het totale vermogen van de Limburgse huishoudens af in de periode 2008-2012? Geef je antwoord in miljarden euro’s nauwkeurig.

Adriaan Kluit (1735-1807)

Statistiek is ontstaan in Duitsland in de achttiende eeuw. In Nederland werden voor het eerst in 1802 te Leiden statistiekcolleges gegeven, door de hoogleraar Adriaan Kluit. Het vak heette toen nog statenkunde en bestond uit kennis die nodig was voor een goed bestuur van een land, zoals over de bevolking, het leger, het klimaat, de handel, enzovoort.

Statistiek kan ook misleidend zijn. De waarheid spreken kan namelijk op vele manieren. Bekijk maar eens de volgende opdrachten.

11

De onderstaande tabel zie je de ontwikkeling van het aantal verkochte woningen en de gemiddelde verkoopprijs sinds 2000. De gegevens zijn afkomstig van het CBS.

a

Wat valt je op?

Om klanten te overtuigen een huis te (ver)kopen, wil makelaar Van de Kastelen laten zien dat het momenteel erg goed gaat op de huizenmarkt. Hij heeft daarvoor verschillende diagrammen gemaakt.

b

Welk diagram kan makelaar Van de Kastelen volgens jou het best gebruiken? Licht je antwoord toe.

In een persbericht constateert De Nederlandsche Bank (DNB) dat de huizenmarkt langzaam opklimt.

c

Welk van de bovenstaande diagrammen is te vinden in het persbericht? Licht je antwoord toe.

12

In een overzicht op de website www.bijbanen.nl stonden de onderstaande cirkeldiagrammen.

a

Bereken hoeveel graden de cirkelsector is van Utrecht in de linker figuur.

b

Waarom zijn de twee cirkeldiagrammen misleidend? En hoe zou je ze kunnen verbeteren?

(hint)

In het linker cirkeldiagram lijkt het dat bijna een kwart van de deelnemers in de regio Amsterdam woont. Klopt dat ook?

13

In de onderstaande figuur zie je dat de overheidsuitgaven aan defensie in de periode 2003-2008.

Een vredesactivist zegt: “Het uitgavenpeil voor defensie is de laatste jaren steeds gestegen.”
De militaire vakbond stelt: “De defensie-uitgaven vertonen de laatste jaren een dalende trend.”

Wie spreekt de waarheid?

14

Dolf vraagt elke leerling van zijn school hoe groot het gezin is waartoe zij behoren. Hij bepaalt vervolgens de gemiddelde gezinsgrootte door alle antwoorden op te tellen en te delen door het aantal ondervraagden.

Wat is je commentaar.