Met het uitvoeren van je eerste kwantitatieve analyse heb je een nieuwe mijlpaal bereikt in jouw wiskundige leerweg. Nu is de tijd daar om je resultaten in een rapport of presentatie goed samen te vatten. Hierbij zijn grafieken een essentieel onderdeel: ze visualiseren jouw analyse en de belangrijkste resultaten ervan. In deze blog leggen we je het belang van grafieken uit, hoe een grafiek eruit moet zien en geven we je een paar voorbeelden van regelmatig gebruikte soorten grafieken. Hiervoor gebruiken we huisdieren om de theorie te visualiseren đđââŹ. Als afsluiter geven we je een paar tips voor het maken van een goede grafiek, evenals hoe je ze het beste kan uitleggen aan anderen.
1. Waarom een grafiek belangrijk is
Grafieken zijn erg visueel en visualisatie is essentieel voor vlotte en duidelijke communicatie. Het helpt zowel jezelf als jouw publiek om ingewikkelde data in Ă©Ă©n blik te kunnen begrijpen. Ook kan je met een goed gekozen grafiek de inzichten die je uit de analyse van de data hebt gehaald beter uitleggen en begrijpen. Grafieken zijn overal, niet alleen maar in rapporten of scripties, maar bijvoorbeeld ook in nieuwsberichten en brochures. Deze zogenoemde infographics of infografieken vatten op hele visuele manieren bepaalde onderwerpen samen en ze komen snel en duidelijk tot de kern van jouw argument. Bekijk maar de voorbeelden hieronder:
En vergelijk dit nu met dezelfde informatie in tabelvorm:
2. Hoe een grafiek eruitziet
In de basis bestaat een grafiek uit twee assen. De horizontale as is de x-as; de verticale as is de y-as. Allebei de assen worden voorzien van een label dat kort verklaart wat er op de as wordt weergegeven. Indien je software gebruikt zoals R, SPSS of Excel om grafieken te maken, zul je elke keer de x- en y-variabele moeten aantonen. Je doet bijvoorbeeld een analyse over het aantal uren training en de gehoorzaamheidsscore op een hondenexamen. Je zou kunnen onderzoeken of er een verband tussen de twee bestaat. In het voorbeeld hieronder staat het aantal uren op de x-as en de gehoorzaamheidsscore op de y-as. Stel je voor dat hond X 20 uur training heeft gehad en een 8 scoorde op het gehoorzaamheidsonderdeel.
Maar welke variabelen moeten nu op de x- of y-as? Meestal zal dit niet zoveel uitmaken en is het vooral een esthetische keuze. Echter zijn er wel twee uitzonderingen:
- Wanneer Ă©Ă©n van de variabelen een uitdrukking van tijd is (bijvoorbeeld: maanden, jaren, datums, etc.): tijd komt altijd op de x-as.
- Wanneer de ene variabele een afhankelijke variabele is, en de andere een onafhankelijke. Anders gezegd wordt er vermoed dat een variabele (de onafhankelijke, bijvoorbeeld het aantal uren training) van directe invloed is op de andere (de afhankelijke, bijvoorbeeld de gehoorzaamheidsscore op dat hondenexamen): afhankelijke variabelen komen op de y-as, onafhankelijke op de x-as.
Maar wat gebeurt er als je maar Ă©Ă©n variabele op een grafiek wilt laten zien? Dan geef je deze variabele aan op de x-as, terwijl je de frequentie op de y-as weergeeft. Dit komt bijvoorbeeld ter sprake bij een boxplot (deze en andere regelmatig voorkomende grafieken worden hieronder besproken). Echter, dit is geen vaste regel. Je zou er ook voor kunnen kiezen om de variabele op de y-as weer te geven als je dat duidelijker of visueel mooier vindt. Vooral bij staafdiagrammen komt dit bijvoorbeeld regelmatig voor.
3. Frequent voorkomende typen grafieken
Er bestaan verschillende soorten grafieken. Welke grafiek de goede is voor jouw analyse, hangt af van wat je precies wil laten zien. Hieronder bespreken we de meest voorkomende soorten en hun belangrijkste regels: lijngrafieken, staafdiagrammen, puntenwolken en boxplots.
3.1 Lijngrafieken
Wanneer je een bepaalde trend gedurende een bepaalde tijd wil laten zien, kun je het beste een lijngrafiek gebruiken. Op de x-as geef je de tijdsaanduiding weer en op de y-as de variabele die je door de tijd volgt. Het gewicht van een puppy tot aan een volwassen hond kan er dan bijvoorbeeld ongeveer uitzien als volgt:
3.2 Staafdiagrammen
Staafdiagrammen zijn goede keuzes als je categorieën met elkaar wilt vergelijken, of wanneer je de frequentie van verschillende categorieën wilt weergeven. Een goed voorbeeld is onderstaande grafiek over het aantal huisdieren in Europa, gecategoriseerd per soort dier.
Er bestaan ook histogrammen, dit zijn speciale vormen van het staafdiagram. Met een histogram kun je de spreiding van de verschillende waarden van variabelen weergeven. Je visualiseert (plot) een histogram door de specifieke variabele op de x-as te positioneren, terwijl je de aantallen per waarde op de y-as plaatst. Op deze manier kun je onder andere op een meer visuele manier bekijken of een variabele ongeveer normaal is verdeeld. Mocht je meer willen weten over de normaalverdeling, lees dan onze blog over de normaalverdeling en de z-score.
3.3 Puntenwolken (scatter plots)
Puntenwolken kun je het best gebruiken wanneer je twee numerieke variabelen met elkaar wilt vergelijken. In statistische software zoals R of SPSS wordt hiervoor ook wel de term âscatter plotâ gebruikt. Stel je voor dat je wil controleren of er een verband is tussen het aantal uren training en de gehoorzaamheidsscore van honden, dan kan je de onderstaande grafiek maken:
Op deze manier kun je dus snel zien dat er een positief lineair verband lijkt te bestaan tussen het aantal uren training en de gehoorzaamheidsscore van de honden!
3.4 Boxplots
Boxplots vatten variabelen en hun verdeling samen op basis van vijf statistieken: de mediaan, het minimum, het maximum, het 1e kwartiel en het 3e kwartiel. Hiermee kun je ook uitschieters vinden. Zoals je kan zien hieronder, is de centrale lijn van de box de mediaan. De uiteindes van de box worden door het 3e (Q3) en het 1e kwartiel (Q1) gevormd. Deze kwartielen worden op een soortgelijke manier berekend als de mediaan. De mediaan is het punt waarop 50% van de data een hogere waarde heeft en de andere 50% een lagere. Zo is ook bij het 1e kwartiel 25% van de data kleiner en zitten we aan 75% van de data bij het 3e kwartiel. Q3-Q1 wordt de interkwartielafstand genoemd. Deze gebruik je om te berekenen of er uitschieters (extreem hoge of lage waarden) aanwezig zijn in de data. Maak je niet ongerust over deze berekeningen: R, SPSS, Excel en andere software zullen deze boxplots voor jou maken. Voor jou is het het belangrijkste dat je de boxplot kan âlezenâ en dat je weet wat er staat en waar het staat.
In Ă©Ă©n oogopslag kan een boxplot je dus al veel informatie over specifieke variabelen geven. Ze worden ook regelmatig toegepast om verschillende groepen met elkaar te vergelijken, zoals bijvoorbeeld in de boxplot hieronder, die gaat over hoe vaak er op het internet wordt gezocht naar katten- vs hondenvideoâs:
4. Hoe je een goede grafiek maakt: tips
1. Kijk goed of je grafiek duidelijk en leesbaar is
Je bent al een behoorlijke stap verder wanneer je de correcte grafiek hebt geselecteerd. Echter, nu zijn er nog een paar belangrijke dingen waar je rekening mee moet houden om je grafiek zo goed mogelijk te maken. Ten eerste moet je goed op de opmaak van je grafiek letten. Is alles duidelijk en leesbaar? Hebben de x- en y-as de correcte labels? Om de leesbaarheid te vergroten, is het het beste om 3d-effecten en overmatig gebruik van kleur te vermijden. Gebruik liever ook geen dubbele assen. Mocht je die toch nodig hebben, maak dan liever twee verschillende grafieken. Er zijn een paar websites en programmaâs die je helpen om grafieken te maken, zoals bijvoorbeeld Canva of Excel, die je helpen met templates en ook suggesties maken voor de lay-out van je grafiek.
2. Richt de aandacht van je publiek op jouw kernboodschap
Focus de aandacht van jouw publiek op de kernboodschap van jouw grafiek. Doe dit bijvoorbeeld door jouw grafiek aan de belangrijkste inzichten uit je analyse te linken en door eventuele opvallende elementen er visueel te laten uitspringen. Je zou bijvoorbeeld uitschieters bij een scatter plot kunnen omcirkelen met een korte uitleg waarom dit uitschieters zijn (dit kun je zowel in de tekst als mondeling doen). Het is daarbij ook belangrijk om je grafiek helder uit te leggen en te voorzien van de nodige context. Om dit te doen bestaat er de handige McCandless-techniek:
5. Hoe je een grafiek uitlegt met de McCandless-techniek
De McCandless-techniek is een vijfdelig stappenplan om een grafiek uit te leggen. Het is vernoemd naar visualisatie-expert en data-journalist David McCandless, die deze manier gebruikt om al zijn grafieken aan zijn publiek te presenteren.
Stap 1: Introduceer grafieken bij naam
Stap Ă©Ă©n is om je grafiek te benoemen, dan weet iedereen waarover je het hebt. Bijvoorbeeld: âVerband tussen de gehoorzaamheidsscore en het aantal uren training op hondenexamensâ.
Stap 2: Anticipeer mogelijke vragen
Stap twee is om je grafiek van context te voorzien. Hierbij moet je op mogelijke vragen anticiperen, voornamelijk over hoe de grafiek tot stand gekomen is (bijvoorbeeld welke data je ervoor hebt gebruikt). Zoals bijvoorbeeld: âDit is Ă©Ă©n van de resultaten na het analyseren van een steekproef op puppyâs uit 10 hondenscholen verspreid over heel Nederlandâ.
Stap 3: Je centrale stelling
Stap drie is dat je de boodschap van je grafiek in Ă©Ă©n zin duidelijk samenvat. Denk aan: âZoals op de grafiek is te zien, blijkt uit de analyse dat er een duidelijk positief verband bestaat tussen het aantal uren training en de uiteindelijke gehoorzaamheidsscore op hondenexamensâ.
Stap 4: Bewijs voor je centrale stelling
Stap vier is dat je ondersteunende bewijselementen voor je centrale stelling uit stap 3 aangeeft, of eventuele extra informatie geeft die voor je publiek essentieel is om de stelling te kunnen begrijpen. Welke elementen dit precies zijn, is afhankelijk van de uitvoering van jouw specifieke analyse. Je zou bijvoorbeeld in het geval van de analyse over hondenexamens de correlatiecoëfficiënt kunnen meegeven, of je zou kunnen tonen hoe de gehoorzaamheidsscore is gecalculeerd.
Stap 5: Je conclusie
Stap vijf is jouw conclusie. Hier leg je beknopt uit waarom jouw onderzoeksresultaten belangrijk zijn en maak je indien nodig de overgang naar een volgende grafiek, hoofdstuk of alinea. Bijvoorbeeld: âDeze resultaten tonen aan dat het aantal uren training een belangrijke factor is voor het behalen van hoge gehoorzaamheidsscores. In wat volgt zal ik nog een paar andere factoren bespreken die ook van invloed kunnen zijnâ.
Blijf je grafieken lastig vinden? Of heb je moeite met andere vraagstukken van wiskunde of statistiek? Vraag dan bij BijlesHuis vrijblijvend een bijlesdocent statistiek of een bijlesdocent wiskunde aan (thuis of online) om je te helpen!
đ BijlesHuis - Vind de perfecte bijlesdocent
Laat hieronder je gegevens achter en blijf zo op de hoogte van onze nieuwste artikels! Je ontvangt verder geen reclame of andere e-mails.