Automatisch transcriberen? Bepaald nog niet perfect

door Milou Vollebregt

Transcripties van gesprekken vormen de basis voor data-analyse bij veel kwalitatief onderzoek. Het uittypen van geluidsopnames is een onderschatte en tijdrovende klus. Nu er technisch steeds meer mogelijk is, zou het toch simpel moeten zijn een MP3-bestand om te zetten in een tekstbestand? Wij testten Amberscript, maar dat werkte bepaald nog niet perfect.   

Interviews voor je onderzoek bereid je uiteraard inhoudelijk goed voor, maar je moet ze ook technisch goed voorbereiden. Dat gaat, zeker in Coronatijd, wat verder dan de batterij van je voice-recorder checken. Veel interviews vinden nu niet face-to-face plaats, maar online via bijvoorbeeld Teams of Zoom. Je kunt, afhankelijk van de licenties, met die online meeting software interviews meteen opnemen of daar aanvullende apps voor gebruiken.

Er zijn verschillende apps op de markt die audiobestanden kunnen omzetten naar tekstbestanden. Veel van die apps, herkennen alleen Engels. Een app die ook Nederlands ‘verstaat’ is Amberscript. Ervaringen van onderzoekcollega’s met Amberscript waren zeer wisselend, met kwalificaties variërend van ‘onbruikbaar’ tot ‘het biedt een aardige basis, die je vervolgens zelf kunt redigeren’. Om zelf de proef op de som te nemen, kochten we zestig minuten Amberscript.

Vergeten woorden

Het transcript van een geluidsopname van anderhalf uur interview is binnen tien minuten klaar. Dat lijkt alvast een enorme tijdsbesparing. Overal staan keurig tijdscodes bij. De software van Amberscript maakt het mogelijk om de tekst gemakkelijk aan te passen.

En dat blijkt nodig te zijn. Amberscript maakt vreemde ‘vertalingen’, maar wat kwalijker is, is dat de software het audiobestand niet volledig transcribeert. Verbazingwekkend genoeg slaat de app hele stukken audio informatie over. Een voorbeeld hiervan is het volgende stuk:

Amberscript noteert: “Spreker 2; “Gebruiken binnen zijn gewoon door naar man die zij dan geschikt achtte. Ook van wat doen jullie dan is uit wat uitgelegd en toen zei ik van verantwoordelijkheid wie ze dan naar voren schuiven.” Wat de geïnterviewde zei was: “Kijk ik bel gewoon naar zo’n bedrijf en dan krijg ik de receptioniste, of ik bel naar de communicatieafdeling als ze die hebben. Dan zeg ik van ‘kan ik iemand spreken, ik ben van de pers. Kan ik iemand spreken die mij hier meer over kan vertellen?’ Dan verbinden zij door naar iemand die ze geschikt achten. Dus ik had iemand van de marketingafdeling, ik vroeg wat doen jullie dan. Zij heeft me uitleg gegeven hierover. Dan zeg ik prima, ik wil graag dat jullie dit ook in de uitzending vertellen. Toen schoof zij degene naar voren. Dat vind ik dan hun eigen verantwoordelijkheid, wie ze naar voren schuiven.” Amberscript gebruikte 34 woorden, wij gebruikten er 109.

Nog een voorbeeld van vergeten woorden is het volgende deel. Spreker 1; “Dit is voor het eerst dat ik hem online doen. Mijn interview dus ik heb ze tot nu toe altijd, en ik ga dus zo opnemen op zoom, en dat gaat Milou dan uittikken. Dan weet je dat.” Spreker 2; “Doen hoorde.” Wat er gezegd werd en wat we handmatig schreven was: Spreker 1; “Dit is voor het eerst dat ik het online doe, het interview. Ik heb ze tot nu toe altijd… Ik ga dus opnemen op Zoom. Milou gaat het dan uittikken. Dan weet je dat. Dat hoor je ook nu.” Spreker 2; “Ik hoor het ja.” Het meest opvallende is misschien wel de zin van spreker 2: Doen hoorde. Een aardig verschil met ‘ik hoorde het ja’. Ook bij simpele, korte zinnen gaat het nogal eens fout. Amberscript: “Gegeven van ons, wij noemen dat dus mensen die ons.” De correcte zin: “Ik heb van iemand een tip gekregen. Wij noemen dat tipgevers.”

Taalvoutjes

De spellingsregels kent Amberscript niet zo goed. Ook correcte grammatica lukt (nog) niet:  als ‘jij vind..’ en ‘je heb…’ komen voor. Daarnaast worden de samenstellingsregels af en toe ook vergeten. Onder meer de, in het Nederlands aan elkaar gespelde, woorden ‘Facebook reacties’ en ‘mail adressen’ staan in het transcript. Om dit alles af te toppen zijn sommige leestekens ook verdwenen. Bijvoorbeeld: ‘Enquete’ en ‘geinterviewd’. Het algoritme van Amberscript heeft kennelijk de grammaticaregels nog niet opgenomen.

Eenvoudig handwerk

Is het simpel om een MP3-bestand om te zetten in een tekstbestand met software? Nee. Het belangrijkste nadeel van het gebruik van Amberscript: Het is mogelijk dat de app stukjes audio overslaat. Belangrijke informatie kan verloren gaan. De betrouwbaarheid van de app is hierdoor niet optimaal. Amberscript lijkt in de war te raken wanneer er spreekpauzes zijn. Het plakt zinnen aan elkaar die niet aan elkaar horen. Controleren op spelfouten is noodzakelijk. Al met al kost het opschonen van een transcript gemaakt door Amberscript meer tijd dan het handmatig uittypen. Zelfs als je beschikt over de beste opnamemogelijkheden in online meeting software, betrouwbaar is Amberscript niet en handig is anders.

Auteurs

Leave a Reply

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *