In de eredivisie voetbal worden per seizoen wedstrijden gespeeld. De tabel is van het seizoen 2006/2007.
Hieronder staat het bijbehorende histogram.
In hoeveel procent van de wedstrijden werd niet gescoord?
Deze verdeling is niet symmetrisch, maar “scheef”.
Wat betekent dat, denk je?
Bereken het gemiddelde van het aantal doelpunten per wedstrijd in het seizoen 2006/2007.
Het gemiddelde is de "evenwichtswaarde". Daarbij hoort het volgende idee. Denk je het histogram in alsof het is uitgezaagd uit een houten plaat; plaats onder het histogram een wig op de plaats van het gemiddelde; dan balanceert het histogram netjes op deze wig.
Welk van de drie posities van de wig hierboven is de juiste? Denk aan het evenwicht.
De verdeling kan van jaar tot jaar verschillen. Zouden de verschillen groot
zijn?
In het seizoen 1996/1997 was de verdeling als volgt:
We gaan de verdelingen in de twee jaren vergelijken.
Teken op het werkblad in dezelfde figuur als de verdeling van 2006/2007 het histogram van de verdeling in het seizoen 1996/1997.
Voor het grootste deel vallen de histogrammen over elkaar heen.
Hoeveel procent zit niet in de overlap?
Vind je dat de verdelingen in de twee seizoenen veel verschillen?
Elk uur wordt in De Bilt de temperatuur gemeten. De resultaten van uur ’s ochtends in de jaren 1981 t/m 2000 geven de volgende verdeling.
Reken na dat er in die periode metingen zijn gedaan.
Hoe groot is de gemiddelde temperatuur ongeveer?
Er is iets verrassends (iets onlogisch) aan de verdeling.
Wat?
Hoe groot schat jij het percentage van de dagen dat de temperatuur om uur ’s ochtends of hoger is.
De meisjes en de jongens van het Amalia College zijn als volgt verdeeld over de vier profielen: leerlingen in CM, in EM, in NG en in NT.
Maak een staafdiagram van de verdeling van alle leerlingen van het Amalia College over de vier profielen.
Landelijk waren in 2007 de keuzes op het vwo als volgt over de profielen verdeeld.
% CM,
% EM,
% NG en
% NT.
Teken ook een staafdiagram bij deze landelijke verdeling.
De meest extreme verdelingen zijn die waarbij % van de leerlingen voor één profiel kiest (en de andere profielen dus geen klanten hebben). De meest vlakke verdeling is die waarbij alle vier de profielen evenveel leerlingen hebben. Stel dat op een school het profiel EM twee keer zo veel leerlingen heeft als CM en dat het profiel NG ook twee keer zo groot is als NT. Stel dat de M-profielen (CM en EM) anderhalf keer zoveel leerlingen hebben als de N-profielen.
Hoe is dan de frequentieverdeling?
Algemeen
In een groep letten we op een zekere eigenschap (variabele).
Die eigenschap kan bijvoorbeeld vier waarden hebben. De groep is verdeeld over de vier waarden:
elke waarde komt een zeker aantal keren voor. We spreken dan van een
frequentieverdeling.
Als de verdeling in procenten van de totale groep is, spreken we van een
relatieve frequentieverdeling.
De som van de relatieve frequenties is %.
Als je in een Engelse tekst van elk woord telt hoe vaak het voorkomt, dan blijkt het
volgende.
Het woordje "the" komt het vaakste voor, het woordje "of" komt op de tweede plaats,
enzovoort.
Hieronder staat de top tien:
Dit is zo voor elke (niet te korte) Engelse tekst. Georg Kingley Zipf, docent Duits
aan de Harvard
University heeft dit verschijnsel ontdekt en verder onderzocht. Dat was het begin
van de kwantitatieve
linguïstiek.
Maar er is meer aan de hand. Zipf constateerde ook dat "the" ongeveer keer zo vaak voorkwam
als “of” en keer zo vaak als “and”, keer zo vaak als “to”, enzovoort.
Dat is als volgt kort samen te vatten: in een natuurlijke taal is de frequentie waarmee
een woord voorkomt ongeveer
omgekeerd evenredig met de rang van het woord in de frequentietabel.
Deze wet geldt zowel voor mensen met een grote woordenschat als voor mensen met een
kleinere
woordenschat.
Het woordje "the" kwam in een zekere tekst keer voor.
Teken een staafdiagram bij deze frequentieverdeling voor de tien meest voorkomende woordjes.
Alle kinderen die op de echopoli van kindercardiologie komen, krijgen een compleet
echo-onderzoek
waarbij diverse dimensies en bloedstroomsnelheden van het hart worden gemeten.
Als blijkt dat het kind geen grote afwijkingen heeft aan het hart, worden deze kinderen
"normaal"
genoemd. Van deze normaal gescoorde kinderen wordt ook de lengte en het gewicht gemeten.
De gegevens zijn afkomstig van het Radboud Ziekenhuis te Nijmegen.
De gewichten zijn ingedeeld in klassen. Hieronder staat een histogram van de frequentieverdeling.
Kun je uit bovenstaand histogram aflezen om hoeveel kinderen het ongeveer gaat?
Kies uit ,
,
,
.
Het frequentiehistogram is verre van symmetrisch.
Hoe komt dat?
Het frequentiehistogram is niet zo regelmatig; het is nogal "springerig".
Wat gebeurt er met die springerigheid als je de klassenbreedte twee keer zo groot neemt?
In de volgende "applet" kun je met de klassenbreedte experimenteren.
Hoe oud is een vrouw als ze haar eerste kind krijgt?
De gegevens voor Vlaanderen (2006) staan
in de tabel hieronder.
Het betreft in totaal vrouwen.
Hoeveel procent van de vrouwen is jonger dan jaar als ze hun eerste kind krijgen?
Als je wilt weten hoeveel procent van de vrouwen ,
of
jaar oud is als ze hun eerste kind
krijgen, heb je te maken met van de levensjaren in de klasse
“”. Een redelijke schatting
van dat aantal vrouwen is
van .
Dat klopt waarschijnlijk niet precies, maar het is het beste wat je op grond van de
gegeven tabel kunt doen (zonder nadere informatie).
Bepaal op grond van de tabel hoeveel procent ouder dan maar jonger dan jaar is.
Bij de vorige opgave kun je een procentueel histogram maken. Zie figuur 1.
In het histogram zijn de middens van de bovenkanten van de opvolgende balken verbonden.
Zodoende ontstaat er een zogenaamde
frequentiepolygoon.
Om de polygoon links en rechts op %
te laten beginnen, is er aan weerszijden een lege klasse toegevoegd. Zie figuur
1.
In een histogram geeft de hoogte van een staaf het aantal of het percentage in de bijbehorende klasse.
In plaats van op de hoogte kun je ook op de oppervlakte letten.
De totale oppervlakte van de balken is %.
Zie figuur 2 bij opgave 8.
De oppervlakte van het histogram links van jaar, inclusief
jaar zelf, geeft het percentage van de vrouwen van jaar of jonger.
In dit geval kun je uit het histogram aflezen dat dit (ongeveer)
is.
Het besteedbaar inkomen in Nederland is verdeeld in klassen van breedte euro.
Er zijn gezinnen met een inkomen tussen
en
euro.
Er zijn ook gezinnen met een besteedbaar inkomen boven de
euro,
maar die zijn niet meer in de verdeling opgenomen.
De gegevens zijn afkomstig van het CBS (2008).
Hoeveel procent van de gezinnen had een besteedbaar inkomen van minder dan euro?
Merk op dat het totale percentage (van alle balken tezamen) % is.
Door de middens van de bovenkanten van de balken te verbinden, ontstaat de frequentiepolygoon.
Hoe kun je hieruit – in principe – aflezen hoeveel procent van de gezinnen een besteedbaar inkomen onder de euro heeft?
Het plaatje in opgave 3 is ook een frequentiepolygoon. Gevraagd werd het percentage te schatten
van de dagen dat de temperatuur ’s ochtends om uur
°C of hoger is.
Daarvoor moest je
schatten welk deel van de oppervlakte rechts van °C ligt.
Hoeveel uur slaapt een mens? Tijdens een onderzoek is met een EEG (elektro-encefalogram)
de
slaapduur vastgesteld bij volwassenen ( jaar) gedurende
nachten.
De gegevens zijn van werkdagen (op vrije dagen slaapt men gemiddeld uur langer). Bron: Waken en Slapen,
Paul A. M. van Dongen, isbn 90-74078-02-8.
Bekijk de onderstaande frequentiepolygoon.
Wat betekent de hoogste stip precies?
Bepaal op grond van de polygoon zo goed mogelijk hoeveel procent van de mensen meer dan uur en minder dan uur slaapt als hij/zij de volgende dag moet werken.
Hieronder zie je de relatieve (procentuele) verdelingen van de slaapduur van ouderen
( jaar)
en jongeren ( jaar) (gebaseerd op onderzoek uit 1969).
Het betreft de subjectieve slaapduur (zoals de mensen die zelf ervaren).
Noem twee verschillen tussen deze verdelingen.
De mediaan (middelste) van de slaapduren is díe waarde waarboven en waaronder % zit van alle slaapduren.
Bepaal zo goed mogelijk de mediaan van de slaapduur bij de jongeren en bij de ouderen.
De modale slaapduur is de slaapduur die het meest voorkomt.
Hoeveel procent ongeveer van de jongeren slaapt bovenmodaal? En hoeveel procent van de ouderen?
De twee krommen snijden elkaar bij .
Anne zegt dat er evenveel ouderen als jongeren zijn die
gemiddeld uur slapen.
Is dat juist?
Spaanse exportsinaasappelen zijn gewogen. Hieronder staat de frequentiepolygoon van de gewichten.
Hoeveel procent weegt minder dan gram? Schrijf ook op hoe je te werk bent gegaan.
Hoeveel wegen de zwaarste procent (ongeveer)?
Hoe groot is de mediaan?
We bekijken het aantal uren dat een baan per dag telt in Luilekkerland.
Dat varieert tussen en
uur per dag.
Hieronder zie je hoe de banen over de verschillende groottes verdeeld zijn.
Hoeveel procent van de banen wordt gerepresenteerd door één hokje?
Hoeveel procent van de banen heeft een omvang tussen en uur per dag?
Ga door een berekening na of een baan van uur groter of kleiner dan de mediaan is.
Bekijk de bevolkingspiramide van
Nederland op 1 januari 2007.
Een bevolkingspiramide is een
grafische weergave van een
frequentieverdeling, apart voor
mannen en vrouwen.
Op welk kenmerk zijn de mannen en de vrouwen verdeeld?
Verklaar de "uitschieters" van -jarigen.
Schat de mediaan van de leeftijden van de Nederlanders.
Schat hoeveel procent ouder dan jaar was (op 1 januari 2007).
Van een zekere leeftijd is van de Nederlanders vrouw.
Welke leeftijd is dat (ongeveer)?
Langs de verticale as van de verdelingen in opgaven 10, 11, 13 en 14 staat niets. Dat kan ook niet.
Je gebruikt de oppervlakte onder de grafiek, waarbij de totale oppervlakte op % is gesteld.
Bij opgave 13 vertegenwoordigt één hokje %,
bij opgave 14 is één hokje %.
Hieronder staat de grafiek van de verdeling van de bevolking van Luilekkerland
over de verschillende lengtes.
Op de horizontale as staat de lengte in cm.
Noem enkele kenmerken van de verdeling van de lengtes die je uit de grafiek kunt aflezen.
Wat is de gemiddelde lengte? En wat is de mediaan van de lengte?
Hoe kun je bepalen hoeveel procent van de bevolking een lengte heeft tussen 70 en 90 cm? Hoe groot is dat percentage?