Blog: Vijftien vragen die je met data kunt beantwoorden

Het belang van datavisualisaties valt of staat met het soort informatie dat ze laten zien. Het vinden van interessante waarden en verbanden begint met de kennis van het soort vragen dat je kunt stellen bij datasets. Hieronder staan vijftien relevante vragen die je met data kunt beantwoorden. Ze zijn gebaseerd op de indeling van Andy Kirk in zijn boek Data Visualization: a succesful design process. Verschillende voorbeelden komen uit de verzameling van Marije Rooze.

A Vergelijken

1 Waar (of bij wie) komt X in welke mate voor?
Dit is een vraag naar de verdeling van waarden over verschillende subjecten. Het gaat dan om vragen als: Waar zijn de gewonden gevallen? Welke werknemers zijn het vaakst ziek? Hoe verloopt het twittergedrag tijdens een tv uitzending?

Hier een voorbeeld van Jan Willem Tulp over het stemgedrag in verschillende gemeenten. En hier geeft Erik van Gameren aan hoe landbouw zich ontwikkelt op verschillende gebieden in Nederland. En deze visualisatie van Eugene Tjoa laat zien hoe hoog de lokale lasten zijn in de verschillende Nederlandse gemeenten.

2 Wie presteert het best?
Dit is de vraag naar ordening van groot naar klein, van hoog naar laag van goed naar slecht. Het is de basis voor allerlei vormen van lijstjes: beste ziekenhuizen, meeste medailles gewonnen, duurste huizen, etc. Hier is een voorbeeld van de beste sport coach volgens twee verschillende criteria (aantal titels; winstpercentage)

3 Wat is de betekenis van een schijnbaar hoge of lage waarde?
Dit is de vraag naar verhoudingen. Er kan bijvoorbeeld sprake zijn van het toename van het aantal inbraken, maar wat betekent die toename in het geheel van misdrijven? Hier is het beroemde voorbeeld van het aantal soldaten uit het leger van Napoleon dat terugkeert uit de oorlog met Rusland.

4 Wat zegt deze waarde over het functioneren van X?
Dit is een vraag naar de betekenis van een waarden in relatie tot gemiddelden, doelen en voorspellingen. Je kunt je bijvoorbeeld afvragen wat een bezuinigingsmaatregel nu werkelijk oplevert? Of of een beleidsvoornemen werkelijk is gehaald. Hier is een voorbeeld over de effecten van bezuiniging van de site Follow the Money waar veel van dit soort grafieken zijn te vinden

B Patronen ontdekken

5 In welke richting beweegt X?
Dit is een vraag over stijgen en dalen. Het kan gaan over zaken als toenemende werkeloosheid, dalende verkoopcijfers. Hier is een voorbeeld van de toe- en afname van de ijsberen populatie:  http://pbsg.npolar.no/en/dynamic/app/

De zogenoemde grafiek des doods’ over de ontwikkeling van het Griekse BNP is ook een mooi voorbeeld

6 Hoe snel verandert X?
Dit is een vraag naar snelheid van verandering. Is die lineair of exponentieel? Een pracht voorbeeld is de Ted talk van Hans Rosling over de komende stagnatie van de wereldbevolking.

7 Is er sprake van een periodieke schommeling van X?
Gaat hier om de vraag of de schommeling in waarden is gekoppeld aan vaste perioden. Het kan gaan om de seizoensafhankelijkheid van activiteiten, maar ook over dingen als filevorming gedurende de dag. Hier is een voorbeeld van seizoenschommeling op de aandelen markt.

8 Valt er betekenis te ontdekken aan een verandering?
Gaat hier om de vraag of verandering in waarden toevallig is of gekoppeld kan worden aan omstandigheden. Hier een voorbeeld van de veranderingen in New York gekoppeld aan het burgemeesterschap van Edward Koch.

9 Doen zich op bepaalde punten plotselinge betekenisvolle veranderingen voor?
Gaat hier om de vraag of bepaalde pieken en dalen in een ontwikkeling verklaard kunnen worden. Hier zie je hoe het zoekgedrag op sociale media toeneemt vlak nadat er iets ernstigs is gebeurd tijdens rellen in Londen.

C Relaties aangeven

10 Zijn er opvallende uitzonderingen?
Gaat hier om de vraag naar extreme waarden (‘outliers’). Is daar een verklaring voor? Hier een voorbeeld over de groei van megasteden in de wereld.

11 Is er bewijs voor een verband tussen X en Y
Dit is de vraag naar correlaties. Is er een relatie tussen de ene verandering en een andere? Dit onderzoek laat zien hoe deelname aan de markt een negatieve invloed heeft op de moraal

12 Valt er een verband te leggen tussen X en Y?
Gaat hier om de vraag of bepaalde variabelen op een of andere manier met elkaar in verband staan. Deze interactieve infographic maakt het mogelijk om te zoeken naar een verband tussen wapenbezit en moorden.

13 Hoe komt het dat er zich zoveel X bij Y voordoet?
Dit is de vraag naar de clustering van waarden. Waarom komt een waarde op een bepaalde plek zoveel voor? Hier is een onderzoek van de New York Times naar het effect van droogte op verschillende gewassen.

14 Hoe komt het dat er bij X helemaal geen Y voorkomt?
Dit is de vragen naar ‘gaten’. Deze graphic laat zien dat er nauwelijks minderheden staan ingeschreven bij de meeste prestigieuze Amerikaanse universiteiten.

15 Wordt een bepaalde categorie wel terecht gebruikt?
Hier wordt de vraag gesteld of de manier waarop data worden gecategoriseerd wel klopt. Hier wordt onderzocht wat de werkelijke kosten zijn van de Olympische Spelen in Londen. En dit is de alternatieve medaillespiegel van de Olympische Spelen.

Auteurs