‘I love spreadsheets’ – aandacht voor tools in data-onderzoek

In het datajournalistieke onderwijs combineer ik het leren van onderzoeksvaardigheden met ‘toolkritiek’ op de software die we gebruiken om data inzichtelijk te maken. Vanaf september zal ik ook de focus van het onderzoek dat ik uitvoer voor JLab richten op toolkritiek in de journalistieke praktijk.

Deze week, een van de laatste weken van het studiejaar 2017/8, kreeg ik een cadeau van twee van mijn tweedejaarsstudenten die bij mij het nieuwe vak dataresearch volgen: een mok met het opschrift ‘I love spreadsheets’ (zie afbeelding hierboven). In een van de lessen daarvoor vroeg een van de studenten aan mij of ik ‘nou daadwerkelijk zo enthousiast was over dataresearch en spreadsheets’ en ik kon dit oprecht beamen. Hij vroeg verder hoe dit kwam, waarop ik het antwoord gaf dat ik het proces spannend vind van abstracte informatie naar tastbaar resultaat. Een dergelijk resultaat kan bijvoorbeeld een datavisualisatie zijn die complexe samenhangen in, min of meer, één oogopslag communiceert. Verder zei ik dat het belangrijk is dat er, onder meer, in het journalistieke onderwijs aandacht is voor dit proces.

Spreadsheetsoftware in het onderwijs

In het tweedejaarsonderwijs leggen we hierbij de focus op het werken met spreadsheetprogramma Excel. Dit softwareprogramma biedt mogelijkheden om veel openbaar beschikbare datasets – bijvoorbeeld via websites van overheidsinstanties – te openen en bewerken. Naast de automatisering van handelingen en uiteenlopende berekeningen, maakt het programma het visualiseren van data mogelijk in de meest gebruikelijke grafiektypes zoals staafdiagrammen en lijngrafieken (vgl. Friendly’s paper “A Short History of Datavisualization” uit 2006).

Visualisatie kan in dit geval twee rollen spelen: a) als middel voor het exploreren van de data en het formuleren of aanscherpen van een onderzoeksvraag, bijvoorbeeld door opvallende pieken te traceren in een lijngrafiek – een grafiekvorm die een ontwikkeling door de tijd heen in beeld brengt, en b) om resultaten van de data-analyse te communiceren. Beide doeleinden van datavisualisatie gaan vaak gepaard: De arts John Snow plotte in 1854/5 bijvoorbeeld de uitbraak van cholera op een kaart van Londen om zijn hypothese te onderzoeken dat cholera zich verspreidde door besmetting via de watervoorziening in plaats van via de lucht. Vervolgens gebruikte hij de vervaardigde visualisatie om zijn resultaten te communiceren (zie Tufte’s beschrijving van dit voorbeeld in Visual Explanations).

Softwaretools in de journalistieke praktijk

Het spreadsheetsformat biedt een goede basis voor de meeste andere beschikbare tools voor de exploratie en presentatie van data. Veel van de tools die in datajournalism.tools terug te vinden zijn, de ‘toolbox’ die het lectoraat ontwikkeld heeft voor (beginnende) datajournalisten om de juiste tool bij een beoogde handeling te vinden en kiezen, bouwen voort op of zijn gerelateerd aan spreadsheetsoftware (zie ook een eerdere blogpost over datavisualisatie in het onderwijs).

Niet al deze softwaretools vereisen echter dat de gebruiker ze kritisch uiteenzet. Waarom kies je bijvoorbeeld voor een specifiek grafiektype en op welke verschillende manieren kun je het verhaal dat je wil vertellen in beeld brengen? Op welke manier stuurt de tool in dit proces de gemaakte keuzes? Wordt je als softwaregebruiker gestimuleerd om verantwoording af te leggen voor de keuzes die je hebt gemaakt bij het visualiseren van de data en op welke manier? In het onderwijs stuur ik aan op dit soort ‘toolkritiek’. Om in kaart te brengen hoe in de journalistieke praktijk gebruik gemaakt wordt van tools, en of deze de kritisch-analytische kant van journalistiek onderzoek stimuleren, of juist tegenwerken, ga ik me ook in het onderzoek dat ik in het komende studiejaar voor JLab zal uitvoeren op toolkritiek in journalistiek data-onderzoek richten.

Toolkritiek in de journalistieke praktijk

In mijn recent afgeronde masterthesis stel ik de vraag naar de ‘research affordances’ (vgl. Weltevrede, 2016) van een specifieke software tool, namelijk netwerkvisualisatiesoftware Gephi. In een eerdere blogpost heb ik de complexiteit van deze softwaretool aangestipt. ‘Research affordances’ begrijp ik als de actiemogelijkheden die de tool de (wetenschappelijke) onderzoeker biedt om het onderzoeksproces zowel uit te voeren als te evalueren. Het design van softwaretools zoals Gephi stellen ons als data-onderzoekers wel voor een dilemma: hun graphical user interface suggereert een vorm van gebruiksgemak en de mogelijkheid tot ‘directe manipulatie’ (Shneiderman, 1982) van de data. Een zinvol gebruik van de tools vereist echter dat we toegang krijgen tot de manier waarop ze werken en in staat zijn deze werking te begrijpen en hierop te reflecteren.

In het onderzoek waarmee ik in september van start ga, zal ik de nadruk leggen op de research affordances van datavisualisatietools die gebruikt worden in de journalistieke praktijk. Als eerste stap zal ik in kaart brengen in welke mate op Nederlandse redacties gebruik gemaakt wordt van datavisualisatietools. Blijf op de hoogte van dit onderzoek via dit blog en de sociale mediakanalen van JLab!