Audiobestanden in een handomdraai van ondertiteling voorzien, het is tegenwoordig een ‘piece of cake’. Online lopen de toepassingen elkaar voor de voeten om een audiobestand snel te voorzien van een handig begeleidend tekstbestandje (meestal in .srt of .vtt). We vragen ons dan ook af waarom een platform als VRT MAX daar nog steeds geen gebruik van maakt.
Videotoepassingen en apps als YouTube, Instagram en TikTok maken intussen al langer gebruik van automatisch gegenereerde ondertiteling (of zelfs automatische vertaling). Die is zeker nog niet foutloos, maar de mogelijkheden evolueren snel en ook de kwaliteit wordt steeds beter. Ook voor audio ligt er op dat vlak een enorme markt open. Van veel Engelstalige podcasts vind je tegenwoordig al makkelijk een versie op tekst of kun je – o.m. via (betalende) Spotify-app – de ondertitels simultaan volgen.
Wij maakten ons de bedenking: waarom blijft VRT MAX zo hopeloos achter op dit gebied? Vooral Radio 1 plaatst een massa boeiende gesproken programmafragmenten enkel in audio online. Voor de gebruiker zou het, in functie van de verstaanbaarheid, als hulpmiddel voor slechthorenden of gewoon voor de aantrekkelijkheid, toch handig zijn om meer van die bestanden van ondertitels te voorzien.
Bij wijze van test namen we zelf een fragmentje (48 seconden) uit het Radio 1-ochtendprogramma – een sportberichtje met daarin een quote van Remco Evenepoel – om eens te testen of die AI-gestuurde ondertiteling in de praktijk een beetje lukt. We gebruikten in dit geval Happy Scribe, omdat die Vlaams verstaat, maar er zijn er nog veel meer (Kapwing lijkt ons ook een hele goeie, maar we deden geen vergelijkende studie). En dat zijn in dit geval dan nog enkel maar de gratis of de goedkope toepassingen voor de gewone doe-het-zelver. De VRT heeft uiteraard toegang tot veel professionelere software.
Het resultaat was verbluffend. We hebben de bliksemsnel gegenereerde ondertitels bewust nergens gecorrigeerd – die mogelijkheid bestaat wel – en je zal, in het fragment onderaan, slechts twee heel kleine foutjes opmerken. Vooral het al iets meer uitdagende fragment met Evenepoel – weliswaar een heel vlotte spreker, maar met hier en daar een kleine hapering of een ‘euh’ – oogt dankzij de ondertitels zelfs veel duidelijker. Enkel een typisch rennerswoordje als ‘klassementsmannen‘ detecteert de software als ‘klassementen mannen’. Zoals gezegd, AI-ondertiteling is zeker nog niet foutloos, maar de resultaten zijn vandaag al heel sterk en de evolutie naar bijna foutloos gaat razendsnel.
We begrijpen dan ook niet waarom de VRT enkel ondertitels genereert bij tv en video terwijl ze toch een schatkamer aan audio heeft die via VRT MAX (en/of VRT NWS) van quasi-automatische ondertiteling kan worden voorzien. Zeker bij podcasts lijkt ons dat vandaag minstens haast een morele plicht voor de openbare omroep.
Hieronder vind je ons testbestandje in twee vormen: eerst via een simpele standaard audioplayer, waarbij het VTT-bestandje apart, via een scriptje, simultaan wordt getoond en daarnaast als een mp4-bestandje waarin de VTT werd ‘ingebed’. In het tweede geval vraagt dat een (niet onoverkomelijke) extra handeling, maar heb je technisch wat meer mogelijkheden, zoals het uitgesproken woord een ander kleurtje geven.