Cijfers net zo kritisch beoordelen als woorden

Sanne Blauw, correspondente bij De Correspondent, schreef een boek over cijfers. Over verkeerd en misleidend gebruik van cijfers. Een nuttig boek voor journalisten nu ruwe en bewerkte kwantitatieve data bij de standaard informatiebronnen zijn gaan horen.

Wat fijn is aan het boek van Blauw is dat het zonder veel cijfers, zonder formules en zonder wiskunde de meest voorkomende fouten met cijfers helder uitlegd. Veel journalisten zijn immers niet dol op cijfers; ze werden journalist omdat ze van woorden houden. Volgens Nguyen en Lugo-Ocando (2015, p. 2) hebben veel journalisten last van number phobia. Daarvoor komt overigens binnenkort een remedie. Elvira van Noort, Comenius Teaching Fellow van de School voor Journalistiek in Utrecht, ontwikkelt, in samenwerking met J-lab, een onderwijsprogramma om cijferangst van studenten journalistiek te lijf te gaan. Het boek van Sanne Blauw kan journalisten ook helpen gemakkelijker met cijfers om te gaan.

Cijfers zijn numerieke feiten

Een van de kerntaken van journalisten is om de betrouwbaarheid van informatie te beoordelen. Cijfers moeten net zo kritisch beoordeeld worden als woorden. Cijfers zijn numerieke feiten die niet voor zich spreken. Ook, juist, numerieke feiten moeten gecheckt moeten worden en hebben context nodig. Journalisten gaan soms vreemd aan de haal met cijfers, omdat ze bij informatie met cijfers kennelijk hun gebruikelijke journalistieke ‘gutfeeling’ voor onbetrouwbare onzin uitschakelen.

Een voorbeeld van hoe dat flink mis kan gaan noemt Blauw (p.109) de berichtgeving over de risico’s op darmkanker. Najaar 2015 meldde het NOS Journaal dat mensen die dagelijks bewerkt vlees eten 20 keer meer risico hadden op het krijgen van darmkanker. Ook andere media gebruikten toen vergelijkbare foute cijfers. Een soortgelijk voorbeeld zijn onjuiste berichten over de verdubbeling van de kans op een hersentumor door de straling van mobiele telefoons. Wat dan mis gaat is dat journalisten het verschil tussen relatieve en absolute getallen en percentages niet kennen. Zoals McConway (2016, p.57) het in een essay over journalistiek en statistiek fraai formuleert: twice not very much is still not very much. Dat kun je overigens ook bedenken als je niet nadacht over absoluut en relatief.

Verkeerd journalistiek cijfergebruik 

Scott Maier onderzocht welk soort fouten journalisten met cijfers maken en kwam tot elf soorten fouten. De lijst van meest voorkomende numerieke feitelijke onjuistheden ziet er zo uit (Maier, 2002, p.512):

Oliebollentest

In het boek van Sanne Blauw staat ook een voorbeeld van hoe media cijfers kunnen manipuleren om een verhaal aantrekkelijker te maken (p.59). Met de cijfers van de populaire jaarlijkse AD-oliebollen ranglijst werd gerommeld, zo gaf hoofdredacteur Hans Nijenhuis toe. Die ouderwetse oliebollentest bestaat niet meer, maar ranglijstjes worden online op grote schaal gebruikt om clickbait te generen. Een ranglijst is volgens Blauw een van de vijf veelgemaakte fouten bij de presentatie van cijfers. De andere vier fouten die Blauw (p. 173) noemt zijn:

  • Een gemiddelde
  • Een precies getal
  • Een risico
  • Een grafiek

Waarom moet je hierbij volgens haar goed opletten? Omdat gemiddeldes nietszeggend zijn als er uitschieters omhoog of naar beneden zijn. (Als Bill Gates in de bus stapt, wordt hele bus gemiddeld miljonair). Omdat getallen zijn om allerlei redenen zelden precies zijn. Ook risico percentages zijn vaak nietszeggend: de eerder genoemde kankerpercentages illustreren dat. Omdat er met de verticale as van grafieken gerommeld wordt (zie ook fout nummer 5 van Maier). Die as is soms uitgerekt of ingedeukt zonder dat dat duidelijk aangegeven wordt, dat kan de resultaten vertekenen.

Blauw illustreert in haar boek cijfer misbruik vaak met concrete voorbeelden uit de media, maar geeft de media niet (altijd) de schuld. Ze refereert ook aan onderzoek (Schat et al, 2018) waaruit blijkt dat 20 procent van de persberichten van persafdelingen van universiteiten overdreven conclusies en foute causale claims bevatten.

How to lie with statistics

Het boek van Sanne Blauw lijkt op dé klassieker over misbruik van cijfers:het boek van Darrell Huff How to lie with statistics. (Blauw schrijft ook dat ze door hem geïnspireerd is). Ook in Huff’s boek gaat het voornamelijk over statistische denkfouten en foute beweringen en weinig over formules. Een veel voorkomende denkfout die hij – en Blauw overigens ook- uitvoerig behandeld, is het essentiële verschil tussen een causaal verband en correlatie. Huff (1954;1974, p.84) noemt het voorbeeld van de correlatie tussen het aantal ooievaarsnesten en het aantal baby’s. Dat huizen met veel schoorstenen veel ooievaars aantrekken en zo zorgen voor veel baby’s is uiteraard een onzinnig verkeerd causaal verband. Blauw geeft een eveneens helder voorbeeld (p.108): dat je veel mensen met paraplu’s op straat ziet als het regent betekent nog niet dat paraplu’s die regen veroorzaken. Kulcausaliteit noemt Sanne Blauw dat.

Wie brengt het cijfer?

Blauw’s boek heeft tot slot een handige checklist met tips over wat je moet doen als je cijfers tegenkomt. Haar eerste tip is om na te gaan: ‘Wie brengt het cijfer’? Dat is een tip die naadloos aansluit bij de journalistieke mores bij de beoordeling van àlle informatie. In alle journalistieke handboeken staat dat je altijd moet checken of bedenken of informatie afkomstig is van een betrouwbare bron. Als een bron belang heeft bij het verstrekken van bepaalde informatie, moet je extra goed opletten. Professionele journalisten zouden moeten bedenken dat het met de beoordeling van cijfers en statistieken niet anders is. Als een bron betrouwbaar is, dan zijn ook de cijfers die bron verstrekt  cijfers dat (meestal) wel. En als een bron ergens belang bij heeft, zijn de verstrekte cijfers mogelijk te rooskleurig of te pessimistisch.

Natuurlijk is het ook verstandig en handig dat moderne journalisten enige elementaire statistiek aan hun vaardigheden toevoegen (zie ook: Diekerhof, 2013, p. 239). Daarvoor is het boek van Blauw ook een nuttig en leesbaar begin. Maar wat vooral helpt is om cijfers met hetzelfde professionele wantrouwen te benaderen als woorden. Als je denkt dat informatie niet klopt, niet kan kloppen, dan klopt er ook vaak iets niet.

Blauw, Sanne (2018). Het best verkochte boek ooit**met deze titel: Hoe cijfers ons leiden, verleiden en misleiden. De Correspondent.

Op Villamedia staat een voorpublicatie van het boek. Sanne Blauw geeft op maandagavond 29 april 2019 in Tivoli|Vredenburg een Correspondent College over De macht van cijfers (maar dat is al uitverkocht).

Bronnen:

Diekerhof, E. (2013).Teaching journalistic research skills in the digital age: Between traditional routines and advanced tools.Journal of Applied Journalism & Media Studies 2(2):231-244.
Huff, D. (1954;1974). How to lie with statistics.Harmondsworth: Penguin Books Ltd.
Koetsenruijter, W. en R.Berkenbosch (2011). Cijfers in het nieuws. Amsterdam:Boomlemma.
Maier S.R. (2002). Numbers in the news: A mathematics audit of a daily newspaper. Journalism Studies 3(4): 507-519.
McConway K. (2016). Statistics and the media: A statistician’s view. Journalism 17(1): 49-65.
Nguyen A. and Lugo-Ocando J. (2016). The state of data and statistics in journalism and journalism education: Issues and debates. Journalism 17(1): 3-17.
Schat, J., Bossema, F. G., Numans, M. E., Smeets, I., & Burger, J. P. (2018). Overdreven gezondheidsnieuws. Relatie tussen overdrijving in academische persberichten en in nieuwsmedia. Nederlands Tijdschrift voor Geneeskunde, 162, 5.

Illustratie: Cover van Huff door Mel Calman