5.5  Relatie tussen twee variabelen >

De verkoop van ijs stijgt als de temperatuur stijgt, terwijl de verkoop van handschoenen stijgt als de temperatuur daalt. In beide gevallen is sprake van een statistisch verband tussen temperatuur en verkoop. In deze paragraaf onderzoeken we het verband tussen twee variabelen zoals:

  • Is er een relatie tussen het geslacht en de keuze tussen wiskunde A en wiskunde B?

  • Is er een verband tussen lengte en gewicht?

Je leert welke datarepresentaties je kunt gebruiken om te kijken of er een verband bestaat en welk soort conclusies je kunt trekken wanneer je een verband ziet tussen twee variabelen.

Kruistabel

We willen weten in hoeverre het geslacht een rol speelt bij de keuze tussen wiskunde A en wiskunde B voor de leerlingen uit het databestand Gegevens154Leerlingen. Met de onderstaande kruistabel - waarin je de variabele geslacht combineert (“kruist”) met de variabele wiskundegroep - krijg je een goed overzicht hoe de verdeling jongens-meisjes samenhangt met de keuze A-B.

1
a

Hoeveel meisjes kiezen wiskunde B?

b

Vul in beide boomdiagrammen de aantallen in.

c

Welk percentage van de meisjes kiest wiskunde B? Rond af op 1  decimaal nauwkeurig.

d

Hoeveel jongens kiezen wiskunde B? Welke percentage van de jongens is dat?

e

Bereken het percentage wiskunde B-leerlingen dat een jongen is. Welk diagram kun je daarvoor het beste gebruiken?

2

Aangezien het aantal jongens en meisjes ongelijk is, kun je voor een goede vergelijking aantallen beter herleiden tot percentages.
In het boomdiagram hiernaast zijn de meisjes en de jongens elk op 100  procent gesteld.

a

Vul het boomdiagram verder in.

b

Maak een nieuwe kruistabel met de bij onderdeel a berekende percentages.

c

Wat is je conclusie?

Als je het goed gedaan hebt, is het verschil in percentage wiskunde A onder meisjes en onder jongens 16 % . Dit verschil in percentage geeft een goede indicatie hoe sterk de verdeling wiskunde A-wiskunde B verschilt tussen de meisjes en de jongens.

3

Stel dat de percentages wiskunde A onder de meisjes en onder de jongens 0% verschillen.

a

Wat is dan je conclusie?

Stel dat de percentages wiskunde A onder de meisjes en onder de jongens 100% verschillen.

b

Wat is dan je conclusie?

Opmerking:

Als je verschillen constateert, moet je die interpreteren. Je krijgt dan met de vraag te maken of het geconstateerde verschil gering, redelijk, groot of extreem is. En dat is subjectief. In een situatie zoals in opgave 49 vinden statistici dat er vanaf bijvoorbeeld 30 % sprake is van een (redelijk) groot verschil.
In een volgend statistiek hoofdstuk leer je een maat om de verschillen tussen variabelen in een kruistabel in een getalswaarde uit te drukken.

4

Het verschil in percentage wiskunde A onder meisjes en onder jongens is 16 % . Dat verschil in percentages wiskunde A is precies gelijk aan het verschil in percentages wiskunde B. En dat is niet toevallig.

Leg uit dat die verschillen in percentages altijd beslist gelijk zijn.

In opgave 49b heb je horizontaal gepercenteerd. De rijtotalen zijn op 100 % gezet en die 100 % is verdeeld over de cellen ernaast. Je hebt de tabel horizontaal gepercenteerd omdat je wilde weten hoe de verdeling wiskunde A-wiskunde B is onder de meisjes en onder de jongens. De twee percentages vergelijk je vervolgens verticaal: je neemt het verschil van de onder elkaar geplaatste percentages.

Je kunt ook verticaal percenteren. Dan wil je weten wat het verschil is in de verdeling jongen-meisje in de A-groep en in de B-groep. Dit komt aan bod in de volgende opgave.

5

Je kunt in de kruistabel voor opgave 48 ook kijken naar het percentage wiskunde B-leerlingen dat meisje dan wel jongen is.

a

Hoeveel procent van de leerlingen bij wiskunde B is een meisje?

b

Waarom ziet het bijpassende boomdiagram er nu zo uit als dit hiernaast?

c

Maak weer de bijpassende kruistabel met percentages.

d

Wat is het percentageverschil? Is dit gelijk aan het percentageverschil in de kruistabel van opgave 49?

Je hebt nu kruistabellen gebruikt om iets te zeggen over de relatie tussen de soort wiskunde (A of B) en het geslacht. Zo'n kruistabel werkt zowel voor kwalitatieve als kwantitatieve variabelen. Om eerlijk te kunnen vergelijken, gebruik je percentages. Bij een kruistabel kun je de percentages op twee manieren uitrekenen en met elkaar vergelijken.

  • Je kunt per rij de percentages berekenen. Rechts aan het eind van de rijen krijg je 100%. Deze percentages vergelijk je dan verticaal met elkaar. Dit heet: horizontaal percenteren.

  • Je kunt ook per kolom de percentages uitrekenen. Onderaan in de kolommen kom je dan op 100% uit. Deze percentages vergelijk je dan horizontaal met elkaar. Dit heet verticaal percenteren.

Spreidingsdiagram

De volgende grafiek laat zien dat er een heel sterk verband is tussen de levensverwachting van mannen en vrouwen. Iedere stip is een land ergens in de wereld.
Een dergelijke grafiek heet spreidingsdiagram, de verzameling punten in het spreidingsdiagram noemen we puntenwolk.

6
a

Hoe kun je zien dat er een duidelijk verband bestaat tussen de levensverwachting van mannen en van vrouwen?

Stel dat er een land is dat niet in deze grafiek is opgenomen.
De levensverwachting van mannen in dit land is 73 .

b

Wat verwacht je dat de levensverwachting voor vrouwen in dat land is?

Om het statistisch verband tussen twee kwantitatieve variabelen te onderzoeken, wordt meestal gebruik gemaakt van een spreidingsdiagram. Afhankelijk van de vorm van de puntenwolk kun je vaststellen of er een statistisch verband tussen de variabelen is en zo ja, of dat verband sterk is.

Opmerking:

In een volgend statistiek hoofdstuk gaan we rekenen aan de puntenwolk zodat we een getalswaarde kunnen koppelen aan de mate van samenhang tussen twee kwantitatieve variabelen.

7

We willen weten in hoeverre er een verband is tussen de lengte en het gewicht van de leerlingen uit het databestand Gegevens154Leerlingen. Omdat beide variabelen kwantitatief zijn, kun je - in plaats van een kruistabel te maken - ook naar de onderlinge samenhang kijken door een spreidingsdiagram te maken.

a

Teken een puntenwolk met horizontaal het gewicht en verticaal de lengte. Vind je dat er een verband bestaat tussen lengte en gewicht?

Jan hoort eigenlijk ook bij deze groep leerlingen, maar hij heeft niet meegedaan aan het onderzoek. Hij is 198  centimeter lang.

b

Kun je voorspellen tussen welke waarden zijn gewicht ligt?

Opmerking:

In de vorige opdracht heb je met behulp van een spreidingsdiagram onderzocht of er een verband is tussen de lengte en het gewicht van de leerlingen uit het databestand Gegevens154Leerlingen. Er bleek een verband tussen lengte en gewicht, al is het zeker niet zo dat een grotere lengte automatisch zorgt voor een groter gewicht. Een statistisch verband is een kenmerk van een hele dataset en niet een kenmerk van een enkele persoon. Je kunt wel met een zekere waarschijnlijkheid een voorspelling doen over het gewicht van een leerling die niet in deze dataset is opgenomen als je de lengte weet.

8

Ebbe beweert: “Als er meer ijsjes worden verkocht dan stijgt het aantal verdrinkingen”.

Wat vind je van zijn bewering?

De verkoop van ijs stijgt als de temperatuur stijgt. Een toename van de temperatuur heeft dus tot gevolg dat de ijsverkoop stijgt. Dit is een causaal verband: er is sprake van oorzaak en gevolg.
Het aantal verkochte ijsjes op een mooie zomerdag neemt toe en het aantal verdrinkingen ook. Hier is wel sprake van een verband, maar het is geen causaal verband: er zijn niet meer verdrinkingen omdat er meer ijsjes worden verkocht.

Voorbeeld:

De onderstaande grafiek laat duidelijk zien dat de sterke wereldwijde afname van het aantal piraten over de laatste 180  jaar leidt tot een stijging van de gemiddelde temperatuur op de aarde. Dus als je de opwarming van de aarde tot stilstand wilt brengen, dan is het beste wat je kan doen een piraat worden.

Hoe onwaarschijnlijk het bovenstaande voorbeeld ook mag lijken, het is een extreem voorbeeld van de incorrecte logica waar je dagelijks mee geconfronteerd wordt.

9

Is er een statistisch verband tussen ijsverkoop en verkoop van zonnebrillen in de zomer?
Is er sprake van een causaal verband?

Oefenen
10

Hier zie je een kruistabel waarin de variabele geslacht is uitgezet tegen plezier (met plezier naar school gaan).
De variabele plezier is een vijfpuntsschaal: 1=nee, 2=weinig, 3=neutraal, 4=behoorlijk, 5=veel.

a

Heb je hier met kwalitatieve of kwantitatieve variabelen te maken?

b

Is bij de variabele geslacht de volgorde van belang? En hoe zit dat bij de variabele plezier?

Wanneer je een volgorde kunt vaststellen in een kwalitatieve variabele, dan noem je deze ordinaal.
Wanneer je geen volgorde kunt vaststellen is er sprake van een nominale variabele.

11

Hieronder zie je de kruistabel van de variabelen wiskundecijfer (eind havo 3) en profiel.

a

Welke van beide variabelen is kwalitatief? Is die variabele ordinaal of nominaal?

Je wilt nu de frequentieverdeling van de variabele wiskundecijfer over de profielen bestuderen.

b

Hoe ga je dan percenteren: horizontaal of verticaal? Licht je antwoord toe.

c

Maak nu de bij b passende kruistabel met percentages.

d

Kun je door de percentages te vergelijken een conclusie trekken over de verdeling van het wiskundecijfer over de profielen?

12

Bekijk de kruistabel van de voorgaande opgave nog eens. Je wilt de verdeling van de variabele profiel over de wiskundecijfers (eind havo 3) bekijken.

Maak een bijpassende kruistabel met percentages en probeer ook nu conclusies te trekken.

13

Bekijk de dataset Gegevens154Leerlingen nog een keer.

a

Splits de data op de variabele geslacht. Teken nu twee aparte puntenwolken met horizontaal het gewicht en verticaal de lengte. Je ziet dat de puntenwolk van de jongens in zijn geheel iets boven de puntenwolk van de meisjes ligt.

Er komt een leerling met een lengte van 180  centimeter.

b

Welk gewicht vind je aannemelijk wanneer dit een jongen is? En wanneer dit een meisje is?

14

In de onderstaande kruistabel vind je gegevens van brugklassers bij het verspringen.

a

Als je het verspringen tussen jongens en meisjes wilt vergelijken, moet je dan horizontaal of verticaal percentages nemen?

b

Maak de tabel die je bij a bedacht hebt en kijk of je een conclusie kunt trekken over het verschil in verspringen tussen jongens en meisjes.

Bekijk het databestand Sportprestaties.

c

Maak een puntenwolk bij de variabelen sprint en verspringen. Onderzoek of je een statistisch verband aantreft tussen beide variabelen en zo ja, beschrijf dan dit verband. Is dit verband duidelijker wanneer je de data splitst op geslacht en twee puntenwolken maakt?

15

De regels omtrent het in bezit mogen hebben van vuurwapens zijn per land verschillend. Deze regels staan natuurlijk ook wel eens ter discussie.
Tegenstanders van vuurwapenbezit beweren dat hoe makkelijker mensen aan vuurwapens kunnen komen, hoe meer die gebruikt worden.
Voorstanders van vuurwapenbezit zeggen altijd dat het niet de wapens zijn die doden, maar de mensen. Zij vinden dat mensen vrij moeten zijn om een vuurwapen aan te schaffen, omdat meer vuurwapens niet betekent dat er dan ook meer gebruik van wordt gemaakt.
Het vuurwapenbezit en het aantal dodelijke slachtoffers door vuurwapens is in een aantal landen onderzocht. De onderzoeksresultaten zie je hieronder.

a

Geef met behulp van de figuur een argument dat voorstanders van vuurwapens kunnen gebruiken.

b

Geef met behulp van de figuur een argument dat tegenstanders van vuurwapens kunnen gebruiken.

c

Is hier naar jouw mening sprake van een statistisch verband? Van een causaal verband?