Kruistabellen
1
Enquête

Hieronder staan elf enquêtevragen. Beantwoord die voor jezelf.

  1. Naam

  2. Geslacht

  3. Leeftijd

  4. Heb je een baantje? (Bedoeld is een betaald regelmatig baantje.)

  5. Hoeveel zakgeld krijg je per week?

  6. Doe je aan sport? (Bedoeld wordt lichamelijke sport.)

  7. Doe je aan een denksport? (Ben je lid van een denksportclub?)

  8. Wat vind je het interessantste vakgebied? Je moet kiezen uit exact, taal en kunst.

  9. Heb je een eigen computer op je kamer?

  10. Heb je een eigen tv op je kamer?

  11. Ben je gelovig?

De enquête is aan een groep van 36 leerlingen voorgelegd. In de vorige tabel staan hun antwoorden.
De namen van de leerlingen zijn vervangen door nummers. De tabel bevat een schat aan informatie.
De meeste zaken zijn gecodeerd.

Geslacht: 0 = meisje , 1 = jongen
Baantje: 0 = nee , 1 = ja
Sport: 0 = nee , 1 = ja
Denksport: 0 = nee , 1 = ja
Interesse: 1 = exact , 2 = taal , 3 = kunst
Computer: 0 = nee , 1 = ja
TV: 0 = nee , 1 = ja
Religie: 0 = niet gelovig , 1 = wel gelovig

2
a

Maak op grond van de grote tabel een kleinere tabel, waarin je het geslacht uitzet tegen het al of niet hebben van een baantje. De tabel is al voor je getekend. In het vak "Wel baantje", "Jongen" schrijf je het aantal jongens dat wel een baantje heeft, enzovoort.

Zo'n tabel noemt men een kruistabel.


b

Kun je op grond van deze tabel zeggen dat de meisjes in verhouding vaker een baantje hebben dan de jongens? Licht dit toe.

3

We gaan verder met de grote tabel en vragen ons af of in deze groep de gelovige leerlingen meer aan lichamelijke sport doen dan de leerlingen die niet gelovig zijn.

a

Maak een kruistabel om dit uit te zoeken.

b

Wat is je conclusie?

4
a

Wat is het gemiddelde zakgeld van een gelovige leerling? En van een leerling die niet gelovig is?

b

Vind je het verschil opvallend genoeg om een uitspraak te doen over het zakgeld van gelovige leerlingen in vergelijking met het zakgeld van leerlingen die niet gelovig zijn?

5
7

Iemand die "exact" het interessantste vakgebied vindt, zal wel aan denksport doen.
Onderzoek met een kruistabel of dit zo is. De tabel ziet er uit zoals hiernaast.

6

Kijk nog eens naar de totalen, onderaan de grote tabel: de getallen uit de kolommen zijn opgeteld. Aan een van die sommen heb je eigenlijks niets.

a

Aan welke som heb je niets?

b

Wat kun je gemakkelijk met het totaal van de kolom "zakgeld" berekenen?

5s
7s

De grote tabel staat ook in een Excel-bestand op de website van de Wageningse Methode.

Anneke wil weten hoeveel leerlingen aan denksport doen en bovendien een computer op de kamer hebben. Daarom vermenigvuldigt Anneke voor elke leerling het getal in de kolom denksport met het getal in de kolom computer, en telt de uitkomsten op. Dat kan in Excel gemakkelijk gedaan worden. Vraag je leraar om een handleiding voor Excel.

a

Leg uit waarom Annekes manier goed is.

b

Hoeveel leerlingen vindt Anneke?

c

Wat zou Anneke doen om uit te vinden hoeveel meisjes een baantje hebben?

In een kruistabel worden twee kenmerken vergeleken, bijvoorbeeld "een baantje" en "een tv op de kamer". Iemand kan wel of niet een baantje hebben. Hij kan wel of niet een tv op de kamer hebben. Interessant is hoe vaak "een baantje" en "een tv op de kamer" tegelijk voorkomen. Dat aantal staat op de kruising van de rij "Met baantje" en de kolom "Met tv".

Met tv

Zonder tv

Totaal

Met baantje

aantal met baantje en met tv

aantal met baantje en zonder tv

aantal met baantje

Zonder baantje

aantal zonder baantje en met tv

aantal zonder baantje en zonder tv

aantal zonder baantje

Totaal

aantal met tv

aantal zonder tv

totaal aantal

Opmerking:

In de praktijk worden de resultaten van zo'n enquête niet met de hand verwerkt, maar met behulp van een computerprogramma, zeker bij grote databestanden. In het bedrijfsleven is dat vaak Excel, onderzoekers aan hbo's en universiteiten gebruiken meestal SPSS. Maar het kost wel enige oefening om met deze software-pakketten goed te kunnen werken, omdat ze zoveel mogelijkheden hebben.
Speciaal voor het (voortgezet) onderwijs is een relatief eenvoudig alternatief ontwikkeld, zodat je veel voorkomende bewerkingen eenvoudig kunt uitvoeren: VUstat. Je kunt met VUstat erg eenvoudig grafieken of tabellen maken, zodat je je niet teveel in de werking van een programma hoeft te verdiepen.
Klik maar op deze link naar de database met de enquête-gegevens van de 36 leerlingen en probeer of je de kruistabellen uit de bovenstaande opgaven ook met VUstat kunt maken.
Gegevens_enquête_36leerlingen

Groeperen
8
9

De administratie van een bedrijf heeft het ziekteverzuim van zijn 50 werknemers bijgehouden over het vorige jaar. In de volgende tabel staat de administratie die is opgesteld.

Het bijbehorende VUstat-bestand vind je hier: Ziekteverzuim.

We maken vijf leeftijdsgroepen: 20 - 29; 30 - 39; 40 - 49; 50 - 59; 60 - 69.
We groeperen ook de aantallen uren ziekteverzuim: 0 - 4; 5 - 9; 10 - 14; 15 - 19; 20 - 24. In de klasse "0 - 4" komen de medewerkers die 0, 1, 2, 3 of 4 dagen verzuimd hebben. Enzovoort.

a

Maak een kruistabel waarbij je de leeftijdsgroepen uitzet tegen de ziekteverzuimgroepen.

b

Welke conclusie trek je?

c

Tussen welke twee kolommen van de tabel zou je ook het verband willen onderzoeken? Doe dat.
Wat is je conclusie?

8s
9s

De administratie van een bedrijf heeft het ziekteverzuim van zijn 50 werknemers bijgehouden over het vorige jaar. Zie de bijbehorende tabel. Hij staat ook in een Excel-bestand op de website van de Wageningse Methode.

Om een kruistabel te maken waar de leeftijden worden uitgezet tegen een ander kenmerk, is het makkelijker als de werknemers op volgorde van hun leeftijd staan.

a

Sorteer in het Excel-bestand op leeftijd.

b

Selecteer in Excel met behulp van de ALS( )opdracht de werknemers die minder dan 10 uur ziekteverzuim hadden.

We maken vijf leeftijdsgroepen: 20 - 29 ; 30 - 39 ; 40 - 49 ; 50 - 59 ; 60 - 69. We groeperen ook de aantallen uren ziekteverzuim: 0 - 4 ; 5 - 9 ; 10 - 14 ; 15 - 19 ; 20 - 24.

c

Maak een kruistabel waarbij je de leeftijdsgroepen uitzet tegen de ziekteverzuimgroepen.

10

In de tabel staat de eindstand van de eredivisie voetbal in Nederland, van het seizoen 2007-2008. De kolommen zijn genummerd A t/m H.

A = het rangnummer in de eindstand
B = de club
C = het aantal gespeelde wedstrijden
D = het aantal wedstrijden dat werd gewonnen
E = het aantal wedstrijden dat gelijk gespeeld werd
F = het aantal wedstrijden dat werd verloren
G = het aantal behaalde punten (winst levert 3 punten op, gelijkspel 1 punt en verlies 0 punten)
H = aantal gemaakte doelpunten aantal tegendoelpunten

Het bijbehorende VUstat-bestand vind je hier: voetbal_2007-2008.

a

Hoe kun je, als je de kolommen C, D en E kent, kolom F berekenen?

b

Hoe kun je, als je de kolommen D, E en F kent, kolom G berekenen?

Het "doelsaldo" van een club is het aantal doelpunten dat de club gemaakt heeft minus het aantal doelpunten dat de club heeft tegengekregen. Van PSV is dat 65 24 = 41 .

c

Wat is het gemiddelde van de achttien doelsaldo's?

d

Hoeveel doelpunten werden er gemiddeld per wedstrijd gemaakt?

e

Hoeveel procent van de wedstrijden eindigde in een gelijkspel?

We verdelen de aantallen doelpunten in drie groepen:

weinig: minder dan 50
midden: van 50 t/m 70
veel: meer dan 70
Dat doen we zowel voor de eigen doelpunten als voor de tegendoelpunten.

f

Maak een kruistabel. De tabel is al voor je getekend.

g

Trek conclusies uit de tabel:
als een ploeg zelf veel scoort, ...
als een ploeg zelf weinig scoort, ...

11

Elk uur wordt in De Bilt de temperatuur gemeten. In de grote tabel staan de resultaten van de jaren 1981 t/m 2000. Er staat bijvoorbeeld dat zes keer in uurvak 1 (dat is tussen 0:00 en 0:59 uur) een temperatuur tussen -12,0 en -11,1 werd aangetroffen (inclusief grenzen). De gegevens zijn afkomstig van het KNMI.

De tiende regel luidt : -11 -10,1 7 8 11 13 enz.

a

Zeg precies wat het getal 8 in deze regel betekent.

Als je de aantallen in het eerste uurvak optelt, krijg je 7305. Die uitkomst kun je ook gemakkelijk vinden (zonder alle getallen in kolom 1 op te tellen).

b

Hoe kun je dat aantal gemakkelijk vinden?

c

Wat is de som van de getallen van de andere kolommen?

d

Hoe vaak is er in totaal gemeten?

In de tabel wordt gewerkt met hele graden. Dat wil zeggen dat er niet op gelet wordt of een gemeten temperatuur 12,0 , 11,9 , 11,8 enz. t/m   11,1 ° C is; al die temperaturen worden samen genomen. Ze vormen samen één klasse.

e

Wat is de modale temperatuurklasse? Dat is de klasse waarin de meeste meetwaarden liggen.

f

Hoeveel temperatuurklassen zijn er, de lege klassen niet meegerekend?

12
13

De grote tabel in de vorige opgave is niet zo goed te lezen: er staat namelijk te veel informatie in. Door temperatuurklassen en uurvakken samen te nemen, wordt de tabel kleiner en dus overzichtelijker. We nemen de uurvakken in viertallen samen en we nemen ook de temperatuurklassen in viertallen samen. Bekijk de kleinere tabel.

Het laatste getal in de tweede rij is 23.

a

Wat zou jij in de twee lege hokjes voor de tweede rij willen schrijven?
En in het lege hokje boven de laatste kolom?

b

Controleer het getal 23 met de complete tabel van opgave 11.

c

Bereken met deze tabel in hoeveel procent van de tijd het 28  ° C of warmer was.
En kouder dan 12   ° C ?

12s
13s

De tabel in de vorige opgave is niet zo goed te lezen: er staat namelijk te veel informatie in. Door temperatuurklassen en uurvakken samen te nemen, wordt de tabel kleiner en dus overzichtelijker.
We nemen de uurvakken in viertallen samen en we nemen ook de temperatuurklassen in viertallen samen. Bekijk de kleinere tabel. Die staat ook in het programma Excel op de website van de Wageningse Methode.

a

Verzin een manier om in Excel de gemiddelde temperatuur over de periode 1981-2000 in De Bilt te berekenen.

b

Dat kan ook met de complete tabel van de vorige bladzijde. Vind je hetzelfde gemiddelde?

Als je weet dat een temperatuur tussen 20,0   ° C en 16,1   ° C valt, kan hij dicht bij 20,0   ° C liggen, maar dicht bij 16,1   ° C kan even goed, of hij valt in het midden. Om met klassen te rekenen wordt vaak aangenomen dat zo'n temperatuur 18,0  ° C is. Gemiddeld zit je dan wel goed, is het idee. We zeggen dat 18,0   ° C het klassenmidden is van de temperatuurklasse van 20,0   ° C t/m 16,1   ° C .