Een databestand kan o.a. worden gevisualiseerd met
een histogram
een cirkeldiagram
een staafdiagram
In een kruistabel worden het wel/niet hebben van twee eigenschappen tegen elkaar uitgezet. Uit een kruistabel kan worden afgelezen hoe vaak de twee eigenschappen tegelijk voorkomen. En dus of de twee eigenschappen (sterk of zwak) samenhangen.
Als een aantal bijvoorbeeld elk jaar gemeten wordt, kunnen die waarden in een grafiek
worden
uitgezet, met de tijd op de horizontale as. Door de stippen (de waarden) met rechte
lijntjes te
verbinden, krijg je een polygoon.
Je kunt de gemiddelde waarde aangeven door een horizontale lijn.
De oppervlakte van het gebied onder die lijn en boven de polygoon is gelijk aan
de
oppervlakte van het gebied boven de lijn en onder de polygoon.
Het gemiddelde van een stel waarden ligt
"midden"
tussen die waarden in. De waarden die kleiner zijn dan het gemiddelde wijken
tezamen evenveel van dat
gemiddelde af als de waarden die groter zijn dan het gemiddelde.
Het gemiddelde kan worden berekend door alle waarden op te tellen en de som te
delen door het
aantal waarden. Als een waarde met een zekere frequentie voorkomt, moet die waarde
zo vaak
geteld worden als de frequentie bedraagt.
Ook kan men een schatting maken voor het gemiddelde, alle afwijkingen ten opzichte van die schatting nemen (positief en negatief), de gemiddelde afwijking berekenen en die optellen bij de schatting.
Gegeven is een verzameling data (waarden).
spreidingsbreedte = |
grootste - kleinste van alle waarnemingen |
frequentie van een waarde = |
het aantal keer dat de waarde voorkomt |
modus = |
de meest voorkomende waarde |
Vaak worden de data in klassen ingedeeld.
klassenbreedte = |
grootst mogelijke verschil binnen een klasse |
frequentie van een klasse = |
het aantal keer dat een waarde in de klasse viel |
modale klasse = |
klasse met de hoogste frequentie |
Je kunt de verzameling data splitsen in twee stukken van elk 50%. Het grensgetal tussen de kleinste helft en de grootste helft heet de mediaan. De mediaan is dus de middelste waarde (als je de waarden op volgorde zet van klein naar groot).
Je kunt de verzameling data splitsen in drie stukken van elk 33%.
Je kunt de verzameling data ook splitsen in vier delen van elk 25%. De drie grensgetallen
heten eerste kwartiel, tweede kwartiel en
derde kwartiel. Het tweede kwartiel is de mediaan.
Je kunt de verzameling data splitsen in tien stukken van elk 10%, enzovoort.