5.4  Twee groepen vergelijken >
1

Er zijn veel meer leerlingen met wiskunde B dan met wiskunde A.
Er zijn bij wiskunde B hogere cijfers dan bij wiskunde A.

2

De B-groep scoort ook negens, de A-groep niet.

3

De onafgeronde cijfers. Onbekend is nu hoe de cijfers binnen een klasse verdeeld zijn.

4
a

Bij 7,0 is cp = 70 % voor de A-groep en cp = 33 % voor de B-groep.

b

Het verschil is 37 % .

c

B scoort beter, want de meeste B-leerlingen scoren boven 7,0 en de meeste A-leerlingen onder de 7,0 .

5
a

91 % 21 % = 70 %

b

De B-grafiek ligt onder de A-grafiek.

c

Aflezen grootste verticale verschil: MaxVcp = 20

6

de 25 % -waarde is 6,6
de 50 % -waarde is 7,0
de 75 % -waarde is 7,2

7
a
b

De cijfers in de A-groep liggen lager dan in de B-groep, want de boxplot van de A-groep ligt links van de boxplot van de B-groep.

c

Het gemiddelde eindcijfer voor alle vakken heeft een grote rol gespeeld in de keuze voor A of B. Zou het kunnen zijn dat de betere leerlingen relatief vaker voor een NG- of NT-profiel kiezen met wiskunde B, terwijl minder goede leerlingen relatief vaker kiezen voor een EM- of CM-profiel met wiskunde A?

8
a

De frequentieverdeling van het NT-profiel is vrij symmetrisch. Het CM-profiel is uniformer dan het NT-profiel.
De modus van het NT-profiel ligt meer naar rechts dan de modus van het CM-profiel: deze ligt erg links.
De verdeling van het CM-profiel loopt langer door naar rechts dan in het NT-profiel.
In het NT-profiel worden de meeste cijfers rondom de modus gescoord: weinig echt lage cijfers en weinig echt hoge cijfers.
In het CM-profiel komen alle cijfers ongeveer even vaak voor; er zijn echter extra veel lage cijfers (de modus) en de allerhoogste cijfers (het meest rechts) van beide groepen samen worden in het CM-profiel gescoord.

b

NT-profiel: gemiddelde is 6,6 en mediaan is 6,6 .
CM-profiel: gemiddelde is 6,5 en mediaan is 6,7 .
De mediaan en het gemiddelde van beide groepen verschillen weinig.

c

De box van de boxplot van het CM-profiel is veel langer dan de box van het NT-profiel, vooral aan de linkerkant; aan de linkerkant beginnen de boxplots tegelijk, de boxplot van het CM-profiel loopt langer door naar rechts; de medianen liggen ongeveer gelijk.
Zowel de spreidingsbreedte als de kwartielafstand van het NT-profiel zijn kleiner dan die van het CM-profiel. De laagste 50 % begint en eindigt bij beiden (ongeveer) bij dezelfde cijfers maar in het CM-profiel is de kleinste 25 % veel minder verspreid dan de 25 % daarboven, terwijl dat bij het NT-profiel net andersom is: in het CM-profiel worden meer echt lage cijfers gescoord. Al eerder is opgemerkt dat de echt hoge cijfers ook in het CM-profiel worden gescoord.

d

Het CM-profiel is gelijkmatiger (uniformer) dan het NT-profiel, op een sprong tussen de 5 en de 5,5 na. Het NT-profiel heeft opeens een sprong tussen de 6,5 en 7 . En is eerder bij de 100 % , al bij de 8,5 (CM-profiel bij de 9 ).
Je kunt ook in één oogopslag zien dat:

  • ongeveer 10 % van de leerlingen met een NT-profiel heeft een onvoldoende ( < 5,5 ) tegenover ongeveer 30 % van de CM-leerlingen;

  • ongeveer 75 % van de leerlingen met een NT-profiel een 7 of lager scoort tegenover ruim 60 % van de CM-leerlingen.

e

Een voorbeeld van een mogelijke beschrijving:
Het percentage onvoldoendes voor Engels is bij de leerlingen in het CM-profiel hoger dan bij de leerlingen in het NT-profiel. De verdeling over de cijfers is bij de leerlingen in het CM-profiel gelijkmatiger dan bij de leerlingen in het NT-profiel. Bij de laatste groep heeft een groot deel van de leerlingen een cijfer tussen de 6,5 en 7 . Bij de leerlingen in het CM-profiel zijn de verschillen in frequentie tussen de cijfers veel kleiner. Dit zie je terug in de boxplots: de kwartielafstand bij de leerlingen in het CM-profiel is groter dan de kwartielafstand bij leerlingen in het NT-profiel. Echt hoge cijfers - boven de 8,5 - komen alleen voor bij leerlingen in het CM-profiel.
Kanttekening bij deze conclusies. We hebben hier alleen naar de variabele “cijfer voor Engels” gekeken. Eigenlijk zou je ook moeten kijken naar het algemene beeld van de leerlingen. Doen ze het op alle vakken ongeveer even goed, zijn er leerlingen die duidelijk uitvallen? Naar dat soort dingen kijken we in de volgende paragraaf.

9
a
b

De verdeling van 1995 heeft één top en die van 2005 heeft twee toppen. De linker top betreft de nieuwe instromers in het onderwijs

c

klassenmiddens: 22,5   ;   27,5   ;   ...   ;   62,5
po 1995: gemiddelde is ongeveer 40,5 ; po 2005: gemiddelde is ongeveer 42,3

d
e

De verdeling in 1995 is redelijk symmetrisch terwijl die van 2005 gelijkmatiger/uniformer wordt.
De staven tussen 25 en 45 zijn ongeveer even hoog: er komt in die leeftijdsklassen niemand bij.
De staven tussen 45 en 60 zijn lager: er zijn minder mensen werkzaam in die leeftijdsklassen dan in 1995.
In totaliteit komt is er dus sprake van uitstroom.

f

Zie figuur. Teken de boxplots er zelf bij.

g

Het uniformer worden van de verdeling zie je terug in de rechtere polygoon van 2005. Aan de medianen (bij 50 % ) zie je dat er minder jongeren zijn in 2005 ( 50 % jonger dan 47/48  jaar) dan in 1995 ( 50 % jonger dan 45  jaar). De kwartielafstand is in 2005 groter geworden dan in 1995: de jongste 25 % is in 2005 wat jonger is dan in 1995 en de oudste 25 % is wat ouder dan in 1995.

10
a

De boxplot van type A ligt in zijn geheel rechts van de drie andere boxplots (de kleinste waarde van type A is groter dan de grootste waarden van type B, C en D).

b

Het zullen steekproeven zijn waarop deze boxplots zijn gebaseerd en natuurlijk nooit de voltallige populatie van lampen ooit gemaakt of nog te maken! En een steekproef kan door toeval afwijken van de totale populatie.

c

Het aantal branduren van de lamp van type B met de kortste brandtijd is even groot als het derde kwartiel van type C: 25 % van type C brandt langer dan de lamp van type B met de kortste brandtijd.

d

Wat je veilig kunt zeggen:

  • Het kortste aantal branduren is bij beiden gelijk: of je nu een lamp van type C of van type D hebt, ze branden minimaal 2000  uur.

  • De mediaan van type C is gelijk aan het derde kwartiel van type D: de kortste 75 % van type D gaat even kort mee als de 50 % kortste van type C.

  • Het eerste kwartiel van type C valt samen met de mediaan van type D: de kortste 50 % van type D gaat even kort mee als de kortste 25 % van type C.

Al met al lijk je met type C iets meer kans te hebben op meer branduren dan met type D.
In het algemeen - zeker als de steekproeven niet zo heel groot zijn - kun je bij dit soort geheel overlappende boxplots nauwelijks met zekerheid uitspraken doen.

11
a

-

b

-

c

-

12
a

Er vallen drie dingen op:

  • Bij de jongens is de spreidingsbreedte groter.

  • De jongens hebben een hoge modus en de meisjes geen modus.

  • Bij de meisjes scoort niemand lager dan een 5 (maar ook niet hoger dan 7,5 ).

b

Ook hier zie je het verschil in spreidingsbreedte terug en de ligging van de cijfers.

Verder valt op:

  • De mediaan van de jongens is lager dan de mediaan van de meisjes.

  • Maar liefst 25 % van de jongens heeft lager gescoord dan alle meisjes.

c

Eigen antwoord; vergeet niet dat het hier alleen om de jongens en meisjes in deze ene klas gaat: het betreft zeker geen representatieve steekproef van alle jongens en meisjes!

13
a

-

b

-

c

-

d

-

e

-