5.4  Twee groepen vergelijken >

We gaan het gemiddelde rapportcijfer van de A- en de B-leerlingen vergelijken, bij de overgang van klas 3 naar klas 4. Dit gemiddelde is op één decimaal afgerond.
In deze paragraaf bekijken we welke representaties je kunt gebruiken om de verschillen tussen de twee groepen inzichtelijk te maken.

1

De onderstaande dotplot geeft alle data weer van beide groepen. Van alle leerlingen is het gemiddelde rapportcijfer aangegeven door een stip. Verticaal staan de cijfers, horizontaal de (genummerde) leerlingen, links A en rechts B.

Welk verschil tussen beide groepen valt onmiddellijk op als je de dotplot van de A-groep vergelijkt met die van de B-groep?

De gegevens uit de dotplot verwerken we in staafdiagrammen.

figuur 1
figuur 2

De staafdiagrammen maken je niet veel wijzer over de verschillen tussen beide groepen. Er ontstaat een overzichtelijker beeld als de gemiddelde eindcijfers worden ingedeeld in klassen, zie figuur 3 en 4. De balk boven score 6,0 in figuur 3 in het histogram voor de A-groep geeft weer dat 3 leerlingen een cijfer hadden tussen 5,5 en 6,5 .

figuur 3
figuur 4
2

Welk verschil tussen beide wiskundegroepen valt nu het meeste op?

3

Welke informatie ben je kwijtgeraakt als je de histogrammen met de staafdiagrammen vergelijkt?

4

Aangezien de aantallen A- en B-leerlingen ongelijk zijn, is het nuttig om frequenties om te zetten naar relatieve frequenties. Een goede mogelijkheid om het verschil tussen de A-groep en de B-groep in beeld te brengen, is de relatieve somfrequentiepolygoon.

a

Bij welke waarde van cijfergemiddelde is het verschil tussen de cumulatieve percentages van de twee groepen het grootst?

b

Hoe groot is dat verschil?

c

Geef je mening over de verschillen tussen beide groepen wat het gemiddelde cijfer betreft.

Opmerking:

Het zojuist berekende grootste verschil in cumulatieve percentages tussen twee groepen, heet het Maximale cumulatieve percentage verschil, en wordt meestal afgekort met MaxVcp . Dit is een verschilmaat waarop we in een latere hoofdstuk nog terugkomen (en die je moet kennen voor het Centrale Examen).

5

Je kunt ook een cumulatieve relatieve frequentiepolygoon maken door uit te gaan van de histogrammen (in plaats van van de waarden zelf). Hieronder zie je de cumulatieve frequentiepolygonen voor de A- en B-groep in één figuur.

a

Lees uit de cumulatieve frequentiepolygonen af hoeveel procent van de A-leerlingen meer dan 6,5 en hoogstens 7,4 als gemiddelde hadden.

b

Hoe zie je in de figuur dat de gemiddelde rapportcijfers van de B-leerlingen hoger waren dan die van de A-leerlingen?

c

Hoe groot is volgens deze grafiek MaxVcp ?

6

Kijk naar de 25 % -, 50 % - en 75 % -waarden op de verticale as van de A-polygoon van opgave 38 en zoek de bijbehorende cijfers op de horizontale as.

Welke cijfers zijn dat?

7
a

Teken een boxplot voor zowel de A-groep als de B-groep.

b

Wat kun je zeggen over het verschil van de gemiddelde eindcijfers in klas 3 op grond van de boxplots?

c

Heeft het eindcijfer voor wiskunde in klas 3 een rol gespeeld bij de keuze voor wiskunde A of wiskunde B? Geef argumenten.

Zoals je in de voorgaande opgaven hebt gezien, kun je van veel verschillende representaties gebruik maken om verschillen tussen groepen inzichtelijk te maken. Iedere representatie voegt iets toe: dotplots en staafdiagrammen geven een goede eerste indruk waarna boxplots, somfrequentiepolygonen en kentallen gebruikt kunnen worden om verschillen inzichtelijker te maken. Het is dus nooit voldoende om slechts naar één representatie te kijken.

8

We vragen ons af of leerlingen met een CM-profiel beter in Engels zijn dan leerlingen met een NT-profiel. We kijken daarvoor naar de gegevens van 84  leerlingen aan het eind van 5 Atheneum. Wat kunnen we op basis van deze dataset - 5Atheneum - zeggen over het verschil in eindcijfer?

a

Maak histogrammen bij de eindcijfers voor Engels en beschrijf de verschillen tussen de histogrammen. Wat zegt dit over het verschil tussen de CM-groep en de NT-groep?

b

Bepaal van beide verdelingen de mediaan en het gemiddelde en trek op basis van de gevonden waarden een conclusie.

c

Teken de boxplots bij de eindcijfers en vergelijk deze. Wat zegt dit over het verschil tussen de CM-groep en de NT-groep?

d

Teken de relatieve somfrequentiepolygonen en vergelijk ze. Welke conclusie(s) trek je op basis van deze grafieken?

e

Combineer je bevindingen uit onderdelen a tot en met d en beschrijf de verschillen in het eindcijfer tussen de leerlingen met een CM-profiel en de leerlingen met een NT-profiel.

9

In de tabel zie je de leeftijdsopbouw van leraren in het primair onderwijs (po) en het voortgezet onderwijs (vo) in de jaren 1995 en 2005.

a

Teken histogrammen van de verdeling van de leeftijdsopbouw voor 1995 en 2005 in het po.

Een krant uit 2005 kopt: “PABO’s leveren veel leraren af”.

b

Leg uit waar je de nieuwe instroom van leraren in het po aan herkent.

c

Bepaal de klassenmiddens en geef daarmee een schatting van de gemiddelde leeftijden in het po in 1995 en in 2005.

d

Teken histogrammen van de verdeling van de leeftijdsopbouw voor 1995 en 2005 in het vo.

e

Beschrijf de verschillen tussen beide verdelingen. Leg met name uit waaraan je de uitstroom van leraren in het vo kunt zien.

f

Teken de cumulatieve relatieve frequentiepolygonen voor het vo in één figuur. Teken er boxplots bij.

Vergelijk beide verdelingen nog eens.

g

Welke conclusie trek je voor het vo?

10

Hieronder staan boxplots die het aantal branduren van vier type lampen beschrijven.
Je ziet onmiddellijk dat lampen van het type A een langere brandtijd hebben dan die van alle andere types.

a

Leg uit hoe je onmiddellijk kunt zien dat lampen van type A een langere brandtijd hebben dan die van type B, C of D.

b

Waarom weet je nog steeds niet 100% zeker dat elke lamp van type A langer brandt dan een lamp van de andere types?

c

Hoeveel procent van de lampen van type C gaat langer mee dan de lamp van type B met de kortste brandtijd?

d

Zijn lampen van type C en van type D nog zinvol te vergelijken met behulp van hun boxplots? Zo ja: doe een uitspraak die je nog veilig kunt doen (als de steekproeven groot genoeg zijn). Zo nee: leg uit waarom je geen enkele zinvolle uitspraak kunt doen over het verschil in branduren van type C en type D.

figuur 1
figuur 2

Bij het vergelijken van twee groepen met boxplots worden de volgende vuistregels gehanteerd:

  • als de boxen elkaar niet overlappen (figuur 1), dan zeggen we “het verschil is groot”, anders

  • als de boxen elkaar wel overlappen en de mediaan van een boxplot buiten de box van de andere boxplot ligt (figuur 2), dan zeggen we “het verschil is middelmatig”, en

  • in alle andere gevallen zeggen we “het verschil is gering”.

11

Bekijk de dataset Lichaamsmaat met daarin enkele lichaamsmaten van 404  mannen en vrouwen. Je gaat de mannen en vrouwen vergelijken.

a

Vergelijk de boxplots van de handspanne van mannen en vrouwen. Kun je zeggen dat mannen een grotere handspanne hebben dan vrouwen?

b

En hoe zit dat met de lengtes van mannen en vrouwen?

c

En hoe zit het met de verschillen tussen mannen en vrouwen bij de variabelen gewicht en schoenmaat?

12

Bekijk opnieuw het bestand 5Atheneum.
We willen weten of er verschil is in de cijfers voor geschiedenis als we de jongens en de meisjes vergelijken.

a

Maak twee histogrammen van de relatieve frequenties voor het geschiedeniscijfer voor jongens en voor meisjes. Wat valt je op?

b

Wordt dit beeld bevestigd door de boxplots?

c

Maak twee relatieve cumulatieve frequentiepolygonen en schrijf een stukje tekst over de verschillen tussen jongens en meisjes voor het geschiedeniscijfer. Welke kanttekening kun je bij deze tekst maken?

13

Verzin een manier om iemands reactiesnelheid te meten. Voer dit experiment meerdere malen uit bij een proefpersoon en zet de gegevens in de computer. Herhaal het experiment met andere proefpersonen.

a

Maak voor elke proefpersoon een histogram van de reactiesnelheden.

b

Beschrijf de vorm van deze histogrammen.

c

Bereken de centrummaten en spreidingsmaten die zinvol zijn en leg uit waarom ze dat zijn.

d

Vergelijk de prestaties van de proefpersonen en gebruik daarbij het voorgaande.

e

Bedenk nu zelf andere klassenindelingen en andere representaties waarmee je de reactiesnelheden nog weer extra met elkaar kunt vergelijken. Benoem welke informatie je nu nog extra hebt verkregen.