Artificial intelligence (AI) maakt sluipenderwijs zijn opmars binnen de journalistiek. Er is al veel wetenschappelijk onderzoek gedaan naar het gebruik van deze technologie binnen de media, maar de inzet ervan voor journalistieke research bleef tot nu toe onderbelicht. Het Lectoraat Kwaliteitsjournalistiek in Digitale Transitie wil daar de komende twee jaar verandering in brengen.
Minneapolis maakt zich op voor een warme zomeravond als de 17-jarige Daniella Frazier met haar nichtje Judeah naar de buurtsuper wandelt. De kleine Judeah hoopt op snoepgoed. In plaats daarvan worden de twee meisjes getuigen van de laatste minuten van het leven van George Floyd, die langzaam stikt terwijl politieagent Derk Chauvin een knie in zijn nek drukt. Daniella zet de video diezelfde avond nog op Facebook. De rest van het verhaal is bekend. Miljoenen mensen gaan in duizenden steden wereldwijd de straat op om te protesteren tegen het onrecht dat Daniella zo overtuigend heeft vastgelegd. Media schrijven zoveel over George Floyd dat zijn naam op Google News inmiddels meer hits oplevert dan die van Nancy Pelosi of George Clooney.
Wat als Daniella’s video niet viral was gegaan? Zou ander beeldmateriaal van het incident alsnog zijn weg hebben gevonden naar de pers? Of zou de gewelddadige dood van George Floyd opgegaan zijn in de ruis van het dagelijks nieuwsaanbod? Wat als een Facebookmoderator het gewelddadige filmpje helemaal offline had gehaald?
Hoe AI meebeslist over ons nieuwsaanbod
Deze vragen zijn niet alleen bespiegelingen over de verspreidingskracht van sociale media. Ze laten ook zien hoe kunstmatige intelligentie, oftewel AI, sluipenderwijs de journalistiek binnentreedt en daar meebeslist over het nieuws dat we te zien krijgen. Zo wordt de News Feed van Facebook, waar journalisten voor het eerst van George Floyd’s overlijden leerden, samengesteld met hulp van AI. Ook bij het modereren van gewelddadige content leunt Facebook op zelflerende software. De computer beslist weliswaar niet wat er offline moet, hij bepaalt wel wat de menselijke moderatoren voorgeschoteld krijgen om een oordeel over te vellen. Dat is efficiënt. Zonder dit soort technologie zou moderatie voor meer dan een miljard gebruikers onmogelijk zijn, maar de zelflerende systemen brengen ook risico’s met zich mee. Zo weten de makers vaak niet op grond waarvan een AI-programma bepaalde beslissingen neemt. De software is niet transparant, maar een black box.
Het doet de vraag rijzen hoe ver AI binnen de Nederlandse journalistiek is opgerukt en wat voor invloed die groeiende aanwezigheid hier heeft op journalistieke beslissingen. Een vraag die het lectoraat momenteel probeert te beantwoorden. Het onderzoeksproject beslaat twee jaar en omvat diepte-interviews met zo’n 25 journalisten, enquêtes met meer dan honderd respondenten, online observaties en experimenten. Uiteindelijk zal het lectoraat ook een product ontwikkelen dat journalisten moet helpen bij het gebruik van AI in research. Het onderzoek als geheel moet een alomvattend beeld geven van de stand van zaken rondom AI in de Nederlandse journalistiek en de – soms subtiele – effecten ervan ontsluiten. Vandaar ook de naam: Van black box naar glass box, verborgen sturingsmechanismen in de geautomatiseerde journalistiek.
AI in de journalistiek: wat we weten
Een uitgebreid literatuuronderzoek, de eerste stap binnen het onderzoek, laat zien dat veel eerdere wetenschappelijke studies naar de toepassing van AI zich richtten zich op de distributie en productie van content, taken waarvoor de zelflerende software nu al breed wordt ingezet. Recommendations, de gepersonaliseerde leestips die je op veel nieuwssites onderaan artikelen vindt, zijn een voorbeeld van een terrein waar veel gebruik wordt gemaakt van AI, ook in Nederland. Het publieke debat hierover wordt gedomineerd door de angst voor filter bubbels, ideologische echoputjes waarin leden van specifieke politieke stromingen hun eigen gelijk blijven herhalen. Empirisch bewijs dat AI-gedreven recommendations hiertoe kunnen leiden is tot nu toe weinig overtuigend. Recent Nederlands onderzoek naar de recommendations van dagbladen laat bijvoorbeeld zien dat deze (vaak AI-gestuurde) systemen een voldoende divers nieuwsaanbod opleveren. Uit een grootschalige Amerikaanse studie naar het contentaanbod dat Google News gebruikers voorschotelt doemt echter een zorgelijker beeld op. Een groot deel van het nieuwsaanbod op deze zoekmachine wordt betrokken uit een relatief klein aantal nieuwsbronnen, wat een milde ideologische vertekening van het medialandschap geeft. (Via Google News lijkt dit linkser dan in werkelijkheid.)
Robots schrijven veel, maar mensen schrijven beter
AI wordt binnen de journalistiek ook al veel ingezet om verhalen te schrijven. Grote persbureaus, zoals AP, zetten de technologie al enkele jaren in om verslagen van beursgenoteerde bedrijven te scannen en automatisch hierover te publiceren. Ook van Amerikaanse sportwedstrijden wordt op deze wijze verslag gedaan. (In Nederland wordt ook geëxperimenteerd met de techniek, maar de beste taalinterpretatie- en generatiesoftware is exclusief Engelstalig, waardoor media die in deze taal publiceren een voorsprong hebben.)
Robotjournalistiek beperkt zich tot nu toe wel tot simpele verhalen, en in de regel wordt de technologie ingezet ter ondersteuning van journalisten, niet ter vervanging ervan. Het wetenschappelijk onderzoek naar de automatische gegenereerde content richt zich veelal op publieksperceptie: wat vinden mensen van door een computer geschreven stukjes? Een recente metastudie liet zien dat journalisten van vlees en bloed het voorlopig nog beter doen. Hun artikelen worden door het publiek als veel leesbaarder beoordeeld. Interessant detail: alleen al zeggen dat een stuk door mensenhanden is geschreven beïnvloedt het publieksoordeel positief.
AI wordt minder structureel ingezet voor research
Maar waar de de inzet van AI (althans binnen grote mediabedrijven) al gemeengoed is voor de productie en distributie van content, is dit bij journalistieke research nog maar mondjesmaat het geval. Dit betekent dat er ook minder wetenschappelijk onderzoek voorhanden is. Het gaat veelal om case studies of diepgaande analyses van een handvol toepassingen. Toch valt er een algemene schifting te maken. AI wordt binnen journalistieke research ingezet voor vier doeleinden: analyseren van datasets, verhaalideeën, factchecking en de selectie van informatie.
Analyse van datasets
Een recent onderzoek naar de toepassingen van AI binnen de Amerikaanse onderzoeksjournalistiek vormt een typisch voorbeeld van zowel het soort onderzoek, als de plaats die de technologie nu inneemt binnen journalistieke research. De besproken toepassingen spreken weliswaar tot de verbeelding: zo gebruikte de LA Times taalanalyse-software om de manipulatie van misdaadcijfers aan te tonen en zette Buzzfeed zelflerende software in om geheime observatievluchten door de Amerikaanse overheid te spotten, toch concludeert de auteur dat de drempel voor inzet van AI erg hoog is. Programmeurs zijn duur en de software moet vaak voor één specifiek verhaal ontwikkeld worden en kan daarna niet opnieuw ingezet worden.
Verhaalideeën
AI wordt in sommige gevallen ook al ingezet voor het bedenken van invalshoeken of zelfs complete verhalen. Dit gebeurt tot nu toe slechts met beperkt succes, alhoewel een door City University ontwikkeld softwareprototype (INJECT) in een experiment op Noorse nieuwsredacties erin slaagde om invalshoeken voor te stellen aan journalisten die daadwerkelijk gebruikt werden.
Fachtchecking
Het automatiseren van factchecken, een snelgroeiend veld, is iets waar meer onderzoek naar gedaan is. Meeste tools die op dit gebied zijn ontwikkeld geven een score die de vermoedelijke waarheidsgetrouwheid indexeert, bijvoorbeeld tweets of statements van politici. Onderzoek waarbij het oordeel van (student) journalisten wordt vergeleken met dat van deze facthchecking tools laat een sterke correlatie zien, maar ook structurele afwijkingen. Zo had de Truthmeter, door Britse wetenschappers ontwikkelde software die tweets checkte, moeite met de betrouwbaarheid beoordelen van weinig actieve twitteraars. Momenteel wordt dergelijk gereedschap dan ook vooral ingezet om menselijke factcheckers te ondersteunen, bijvoorbeeld bij de selectie van checkbare statements.
Informatieselectie
Alhoewel de inzet van AI-tools die specifiek voor journalistieke research zijn ontworpen dus beperkt is, vormen zoekmachines en sociale media een achterdeur waardoor de technologie toch al zijn weg naar redacties heeft gevonden. Er zijn redenen om aan te nemen dat die daar een sturend effect heeft. Zo liet onderzoek onder journalistiekstudenten zien dat ze bij het researchen van een stuk sterk leunen op Google en de eerste twee zoekresultaten hierbij even vaak aanklikken als alle andere resultaten bij elkaar. Of professionele journalisten hetzelfde doen, en zo ja, in hoeverre ze zich hiervan bewust zijn is een van de vragen waar ons onderzoek zich op richt. Algemeen onderzoek – dus niet gericht op journalisten – laat zien dat gebruikers weinig kennis hebben over de wijze waarop bijvoorbeeld sociale mediafeeds tot stand komen. In een onderzoek naar Amerikaanse Faceboookgebruikers wist minder dan de helft te benoemen dat een algoritme de postjes selecteerde die ze te zien krijgen.
AI in de journalistiek: wat we hopen te leren
Wat ontbreekt in het wetenschappelijk landschap is een alomvattend onderzoek dat al deze puzzelstukjes bij elkaar legt, het gebruik van AI binnen journalistieke research inventariseert en kijkt hoe goed journalisten de tools waar ze dagelijks mee werken begrijpen. Een hiaat dat het Lectoraat Kwaliteitsjournalistiek hoopt te vullen, onder meer aan de hand van de interviews die we momenteel houden met mensen uit het vak.
Een hypothetische journalist die een video van het overlijden van George Floyd opgestuurd krijgt zal zich altijd afvragen wie zoiets doet en waarom. Is de afzender een burgerrechtenactivist, dan zal de boodschap anders worden geïnterpreteerd dan wanneer de video van de politie afkomstig is. Een journalist die zo’n video in de News Feed tegenkomt, of als zoekresultaat, zou zichzelf vergelijkbare vragen moeten stellen: Wat voor technische en politieke beslissingen hebben ertoe geleid dat ik deze beelden te zien krijg? Wordt mijn research beïnvloed door AI? De resultaten van de studie Van black box naar glass box gaan helpen bij het beantwoorden hiervan.