De komende twee jaar gaat het Lectoraat Kwaliteitsjournalistiek in Transitie onderzoek doen naar de invloed van artificial intelligence (AI) op de Nederlandse journalistiek. Wat voor rol spelen algoritmes eigenlijk bij het tot stand komen van ons nieuws?
Tik iets in de zoekbalk en kijk wat Google over het onderwerp te bieden heeft. De handeling is zo alledaags geworden dat je zelden erbij stilstaat hoe Google aan de antwoorden komt. De zoekmachine is erg handig, dus we nemen deze vorm van horizonvernauwing graag voor lief. Input erin, output eruit: Google is voor ons een black box. Dat geldt voor steeds meer intelligente software die binnen de media gebruikt wordt. Zo halen veel journalisten dagelijks foto’s uit de zoekmachine van ANP voor gebruik in online en offline publicaties. De achterliggende software bepaalt daarmee letterlijk het beeld dat miljoenen Nederlanders hebben van de actualiteiten. De computer bepaalt steeds meer wat we te zien krijgen. Wat voor invloed hebben dit soort vormen van automatisering op de kwaliteit van onze nieuwsvoorziening? Het Lectoraat Kwaliteitsjournalistiek in Transitie is (met steun van het NWO) op zoek naar het antwoord op deze vraag. De nadruk ligt hierbij in het bijzonder op journalistieke research: de rol die intelligente software speelt bij het tot stand komen van een journalistiek product.
Een van de bescheiden eerste stappen in dit onderzoek vormde een verkenning van het huidige gebruik van AI binnen de Nederlandse journalistiek. Aan de hand van gesprekken met experts inventariseerden we actuele toepassingen van zelflerende software in het Nederlandse medialandschap. Het is een vraag waarbij definitiekwesties een grote rol spelen: wanneer is software intelligent genoeg om van AI te spreken? Ook wordt inzet van AI soms niet als dusdanig ervaren. Een journalist die naar een Facebookfeed kijkt maakt gebruik van zelflerende technologie, maar zal waarschijnlijk ‘nee’ antwoorden als je haar/hem vraagt of AI een rol speelde bij het schrijven van haar/zijn verhaal.
Toch zijn er duidelijke trends waarneembaar. De inzet van AI groeit, en intelligente software wordt al veel gebruik bij de distributie van nieuws. Uitgevers zoals DPG Media investeren in personalisatie van hun aanbod in de hoop abonnees te behouden. Her en der bemoeit de computer zich echter ook al met de inhoud van artikelen. NOS en RTL Nieuws genereren automatisch nieuwsberichten aan de hand van datasets: robojournalistiek. Bij journalistieke research wordt vooral gebruik gemaakt van tools die in het buitenland zijn ontwikkeld (denk bijvoorbeeld aan Dataminr, maar bovenal natuurlijk Google en Facebook.)
Pushberichten sturen: iets wat de computer effectiever doet
De meest indrukwekkende toepassingen zijn te vinden op het gebied van pushnotificaties: de kleine berichtjes die door het grendelscherm van een mobiele telefoon kunnen breken zijn een belangrijke manier voor kranten (en andere media) om hun lezers te bereiken. Lezers kunnen ze echter ook als irritant ervaren. Als een gebruiker notificaties daarom deactiveert of – erger – een krantenapp wist, is de uitgever terug bij af. De kunst is alleen berichten te sturen die een gebruiker echt interessant vindt. Een keuze die bij veel media nog steeds door mensen gemaakt wordt.
Bij DPG Media bestaat er naast deze ‘redactionele push’ echter ook een geautomatiseerd systeem dat gepersonaliseerde pushberichten uitstuurt. Elke gebruiker van de diverse krantenapps van de uitgever krijgt zo unieke berichten aangeboden. Om te bepalen wat gebruikers boeit gebruikt DPG zelflerende software die leunt op twee vormen van input: wat gebruikers zelf aangeven interessant te vinden, maar ook wat ze in het verleden gelezen hebben. Het Algemeen Dagblad en alle regiotitels van DPG hebben het systeem draaien, bij elkaar goed voor honderdduizenden lezers. Toch worden veel pushberichten slechts naar één persoon verzonden. “Bijvoorbeeld iemand die geïnteresseerd is in een klein dorp in Overijssel omdat hij daar woont”, zegt Anne Schuth, hoofd nieuwsdata bij DPG. Het is werk dat onmogelijk handmatig verricht zou kunnen worden en het resultaat is beter dan hetgeen met journalistiek handwerk behaald kan worden. “Het verschil in doorklikratio’s is te meten in orden van grootte”, aldus Schuth.
Computers spreken beter Engels dan Nederlands
Bij veel AI-producten die binnen de journalistiek gebruikt worden is tekstbegrip van belang. De computer moet kunnen interpreteren wat er staat: natural language processing of NLP in vakjargon. Binnen DPG is er zelfs een team dat zich hierin specialiseert, maar ook bij kleinere uitgevers zoals FDMG en RTL wordt er veel werk verricht op dit gebied. De beste technologie wordt gemaakt voor de Engelse taal waardoor Nederlandse uitgevers deels aangewezen zijn op IT-producten die in eigen huis gemaakt worden.
Een aantal partijen die binnen de Nederlandse media met AI werken bouwt daarom gezamenlijk aan elementen van de benodigde infrastructuur: ‘taal-agnostische’ software die helpt bij het lezen van Nederlandse teksten. De open source python library heet textipe en wordt onder meer bij FDMG ingezet voor persoonlijke ‘recommendations’, de aangeraden artikelen die je online vaak terugvindt onderaan een stuk.
AI financieel vooral interessant bij personalisatie
Recommendations en notificaties, beiden vormen van het personaliseren van het contentaanbod, zijn vooralsnog de enige voorbeelden waarbij de inzet van AI overtuigend financieel interessant is voor mediapartijen. Er moet weliswaar veel worden geïnvesteerd, het eindproduct is makkelijk schaalbaar en heeft een direct effect op de loyaliteit van gebruikers, wat zich vertaalt in hogere inkomsten uit abonnementenverkoop en online advertenties.
Daarbuiten is de inzet vooral experimenteel en niet per se winstgevend, zegt Daan Odijk, lead data scientist bij RTL Nieuws. “Data science en AI ontstaat veel vanuit een reclame-achtige context, daardoor blijft het daar ook vaak in hangen: segmentatie, personalisatie van ads”, aldus Odijk. Toch is juist bij RTL een van de meest sprekende voorbeelden te vinden van geautomatiseerde publicatie: ADAM, de ‘redactierobot’ van de datajournalisten van RTL Nieuws.
De meest productieve schrijver van de redactie
ADAM is momenteel met duizenden gepubliceerde artikelen verreweg de meest productieve schrijfrobot van Nederland. Het programma, dat deels met subsidie van Google ontwikkeld werd, neemt landelijke nieuwsverhalen met een kwantitatieve component, zoals verkeersveiligheid- of misdaadcijfers en werkt die automatisch uit naar artikelen op lokaal niveau: meer criminaliteit in Aarle-Rixtel bijvoorbeeld, of minder aso-automobilisten in Zuidwest Friesland. Dat levert veel verkeer naar de site van RTL Nieuws op. Volgens Odijk is de schrijfrobot zelfs goed voor zo’n 20% van alle bezoekers op dagen dat hij een verhaal publiceert. NOS experimenteerde ook al enkele malen met vergelijkbare technologie, bijvoorbeeld door automatisch artikelen te plaatsen over de uitslagen van de gemeenteraadsverkiezingen in 2018. Maar alhoewel de computer hier weliswaar beslist over de inhoud van een stuk, is de technische complexiteit van de software vaak relatief laag. Er wordt meestal gewerkt met een vast sjabloon waarbij de computer tekst invult op de stippellijntjes. In essentie is ADAM daarmee vooral een middel om grote datasets waar computers goed mee overweg kunnen te presenteren op een manier die ook voor mensen makkelijk te lezen is.
De echte black box: journalistieke research
Naast productie en distributie van content is er natuurlijk ook nog het researchproces. Hier sluipt AI vooral de journalistiek binnen in de vorm van zoekmachines en sociale media. Facebook en Google gebruiken al enkele jaren zelflerende technologie om news feeds en zoekresultaten te genereren. Omdat beide veel worden ingezet bij nieuwsgaring en verificatie heeft elke ingreep in deze technologie een indirect effect op wat er uiteindelijk geschreven wordt. Daarnaast worden op kleinere schaal specialistische tools ingezet om verhalen te vinden op sociale media, zoals Dataminr en Coosto. Nagenoeg iedere journalist maakt gebruik van Google en sociale media voor research. Toch is het bewustzijn van de rol die AI hierbinnen speelt beperkt, zo bleek al bij verkennende onderzoek van het lectoraat. Ondanks het gebrek aan begrip van de achterliggende werking wordt er vaak toch veel vertrouwen geplaatst in zoekresultaten.
Dit gebrek aan inzicht in de eigen omgang met technologie vormt ook een hindernis voor verder onderzoek. Journalisten vragen naar hun gebruik van AI-tools bij research levert vaak geen helder beeld op van hun daadwerkelijke gedrag. Toch vallen hier de grootste effecten te verwachten van AI. Research staat immers aan het begin van de journalistieke productieketen. De invloed van hier gebruikte technologie is dus overal voelbaar. In het ontsluiten van de rol van AI in dit proces ligt dus een belangrijke uitdaging besloten voor het onderzoek van de komende twee jaar. Twee jaar waarin we hopen de black box net een stukje transparanter te kunnen maken.