weergeven in plaatjes

Een databestand kan o.a. worden gevisualiseerd met

  • een histogram

  • een cirkeldiagram

  • een staafdiagram

kruistabel

In een kruistabel worden het wel/niet hebben van twee eigenschappen tegen elkaar uitgezet. Uit een kruistabel kan worden afgelezen hoe vaak de twee eigenschappen tegelijk voorkomen. En dus of de twee eigenschappen (sterk of zwak) samenhangen.

tijdgrafieken

Als een aantal bijvoorbeeld elk jaar gemeten wordt, kunnen die waarden in een grafiek worden uitgezet, met de tijd op de horizontale as. Door de stippen (de waarden) met rechte lijntjes te verbinden, krijg je een polygoon.
Je kunt de gemiddelde waarde aangeven door een horizontale lijn. De oppervlakte van het gebied onder die lijn en boven de polygoon is gelijk aan de oppervlakte van het gebied boven de lijn en onder de polygoon.

gemiddelde

Het gemiddelde van een stel waarden ligt "midden" tussen die waarden in. De waarden die kleiner zijn dan het gemiddelde wijken tezamen evenveel van dat gemiddelde af als de waarden die groter zijn dan het gemiddelde.
Het gemiddelde kan worden berekend door alle waarden op te tellen en de som te delen door het aantal waarden. Als een waarde met een zekere frequentie voorkomt, moet die waarde zo vaak geteld worden als de frequentie bedraagt.

Ook kan men een schatting maken voor het gemiddelde, alle afwijkingen ten opzichte van die schatting nemen (positief en negatief), de gemiddelde afwijking berekenen en die optellen bij de schatting.

klassenindeling

Gegeven is een verzameling data (waarden).

spreidingsbreedte =

grootste - kleinste van alle waarnemingen

frequentie van een waarde =

het aantal keer dat de waarde voorkomt

modus =

de meest voorkomende waarde

Vaak worden de data in klassen ingedeeld.

klassenbreedte =

grootst mogelijke verschil binnen een klasse

frequentie van een klasse =

het aantal keer dat een waarde in de klasse viel

modale klasse =

klasse met de hoogste frequentie

in gelijke delen

Je kunt de verzameling data splitsen in twee stukken van elk 50%. Het grensgetal tussen de kleinste helft en de grootste helft heet de mediaan. De mediaan is dus de middelste waarde (als je de waarden op volgorde zet van klein naar groot).


Je kunt de verzameling data splitsen in drie stukken van elk 33%.


Je kunt de verzameling data ook splitsen in vier delen van elk 25%. De drie grensgetallen heten eerste kwartiel, tweede kwartiel en derde kwartiel. Het tweede kwartiel is de mediaan.


Je kunt de verzameling data splitsen in tien stukken van elk 10%, enzovoort.