5.7  Extra opgaven
1

Ga van de volgende statistische variabelen na van welke soort (kwalitatief of kwantitatief; discreet of continu) ze zijn en welke waarden ze ongeveer kunnen aannemen.

a

Geboortejaar (van nog levende personen).

b

Temperatuur op de noordpool in graden Celsius.

c

Een enquête met een driepuntsschaal.

d

Gewicht van muizen in grammen.

e

Toetscijfer.

f

Profiel in bovenbouw HAVO.

g

Kwaliteit van een hotel: aantal sterren.

2

Voor een practicum biologie zijn op twee velden regenwormen gevangen. Vervolgens werden de lengtes van die wormen gemeten. In de frequentietabel zie je de resultaten.

a

Om wat voor soort statistische variabele gaat het hier?

b

Hoe lang was de grootste regenworm hoogstens?

c

Wanneer is het verstandig om beide frequentietabellen om te werken naar relatieve frequenties?

d

Maak van beide velden relatieve frequentietabellen van de lengtes en teken er histogrammen bij.

e

Vergelijk de histogrammen. Wat valt je op?

3

Bekijk de dataset Gegevens154Leerlingen.

a

Maak een frequentietabel en een steelbladdiagram van de variabele huiswerk.

b

Bedenk tenminste 2 redenen waarom een frequentietabel soms handiger is dan een steelbladdiagram. Is het in deze situaties erg dat je de gegevens van een individuele waarneming mist?

c

Maak een histogram van de variabele huiswerk, neem klassenbreedte  2 .
Hoeveel klassen heb je nu nodig?

d

In welk soort situaties zou jij gebruik maken van een frequentietabel? En wanneer van een histogram?
Bedenk voor beide een voordeel en een nadeel.

4

Bekijk het staafdiagram voor de gewichten van de jongens.

a

Bereken de mediaan en het gemiddelde van de gewichten van de jongens.

b

Waarom is nu de modus niet vast te stellen?

c

Bepaal de spreidingsbreedte en de kwartielafstand.

Er is bij de jongens één uitschieter.

d

Welke centrummaat en/of spreidingsmaat verandert het sterkst als je deze uitschieter weg laat?

e

Veranderen de centrum- en/of de spreidingsmaten als je alle absolute frequenties omrekent naar relatieve frequenties?

f

Hoeveel wegen de 25 % lichtste jongens maximaal?

g

Hoeveel procent van de jongens weegt meer dan 78  kg?

5

Bekijk het databestand Sportprestaties.

a

Vergelijk de verdelingen voor de prestaties van de jongens en de meisjes bij het ver gooien. Gebruik daarbij de verschillen in vorm en de verschillen tussen de centrummaten en de spreidingsmaten van de verdelingen. Gebruik hiervoor staafdiagrammen, boxplots en de kentallen.

b

Maak relatieve somfrequentieverdelingen. Probeer ook daaruit conclusies te trekken.

6
a

Splits de data in dataset Gegevens154Leerlingen in jongens en meisjes en maak nu boxplots bij de variabelen:

  • lengte;

  • uren huiswerk;

  • cijfergemiddelde.

b

Beschrijf het verschil tussen jongens en meisjes op basis van deze drie boxplots.

7

Je ziet hier de frequentieverdelingen van de gewichten van de jongens en de meisjes. Ze zijn elk gegroepeerd in klassen.

De vraag is of je de centrummaten dan nog kunt berekenen.

a

Waarom kun je met deze frequentieverdelingen de mediaan niet meer vaststellen? In welke klasse zit de mediaan bij de meisjes? En bij de jongens?

b

Maak bij deze klassenindeling frequentietabellen voor de gewichten van de jongens en de meisjes en voeg daaraan de klassenmiddens toe.

c

Waarom kun je met deze klassen het gemiddelde alleen nog maar schatten?

d

Geef een schatting van het gemiddelde met behulp van de klassenmiddens zowel voor de jongens als voor de meisjes.

e

Vergelijk jouw schatting van het gemiddelde gewicht van de jongens met het ‘echte’ gemiddelde (dit heb je in extra opgave 4 berekend). Hoeveel wijkt jouw schatting af?

8

Bij een onderzoek over kleurenblindheid is 1000  mensen gevraagd of ze een vorm van kleurenblindheid hebben.
In totaal werden 600  mannen bevraagd, waarvan er 65 aangaven kleurenblind te zijn.
Van de vrouwen bleken er maar 7  kleurenblind te zijn.

a

Maak met deze gegevens een kruistabel van de variabelen kleurenblindheid en geslacht.

b

Welke deel van de kleurenblinden in deze groep is van het mannelijk geslacht?

c

Welk deel van de mannen in deze groep is kleurenblind?

d

Zou er een relatie bestaan tussen beide variabelen? Zo ja, beschrijf dan die relatie.

9

De onderstaande histogrammen komen uit de dataset Gegevens154Leerlingen. Je kunt je afvragen of bij het kiezen voor een bepaald profiel het cijfer voor wiskunde een rol heeft gespeeld. We kijken eens per profiel naar de verdeling van de cijfers voor wiskunde in 3 havo.

a

Beschrijf de vorm van ieder van deze frequentieverdelingen.

b

Vergelijk de frequentieverdelingen met elkaar. Probeer conclusies te trekken.

c

Bepaal van de vier verdelingen de mediaan en het gemiddelde.

d

Bij welke van deze vier verdelingen liggen mediaan en gemiddelde het dichtst bij elkaar? Kun je dit ook aan het staafdiagram zien?

10

Er is onderzoek gedaan naar het favoriete avondje uit onder jongeren, zie de tabel hieronder.

Maak een kruistabel met relatieve gegevens die de verschillen in voorkeur tussen jongens en meisjes laat zien.

11

Een groep Amerikaanse golfers heeft bij het putten (het slaan van de golfbal met als doel dat hij in de hole terechtkomt en niet dat hij alleen maar in de buurt van de hole komt) hun percentage successen berekend afhankelijk van de afstand tot de hole (in meters). Hieronder zie je de resultaten.

a

Schat het succespercentage bij een afstand van 15  meter tot de hole.

b

Hoe groot is het succespercentage bij 0  meter?

Er lijkt een statistisch verband te bestaan tussen de variabelen succes en afstand.

c

Wat kun je zeggen van het succespercentage bij een afstand van 30  meter?

d

En wat gebeurt er met het succespercentage als de afstand tot de hole steeds groter wordt?

12

Hieronder zie je een spreidingsdiagram van de diameter en het volume van verschillende bomen.

a

Formuleer het causale verband dat uit de bovenstaande grafiek duidelijk wordt.

b

Welk volume (in feet2) verwacht je bij een boom van 30  inch?

c

Welk volume (in cm2) verwacht je bij een boom met een diameter van 40  centimeter?
( 1  inch = 2,54  cm , 1  ft = 30,48  cm )