Optimalisatie van tekst-to-speech door gebruik van metainformatie (documentstructuur)

TitleOptimalisatie van tekst-to-speech door gebruik van metainformatie (documentstructuur)
Publication TypePresentation
Year of Publication2010
Conference NameDag van de Fonetiek 2010
AuthorsVersteegh, Bouke
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationUtrecht, The Netherlands
Abstract

De huidige generatie algemeen beschikbare text-to-speech (TTS) systemen (links naar websites) leest tekstbestanden (bv Word-bestand, HTML, PDF) voor aan de gebruiker. Denk hierbij aan situaties waarin de gebruiker auditieve informatie beter tot zich kan nemen dan geschreven informatie, zoals bijvoorbeeld bij het beluisteren van vergaderstukken in de auto, of het beluisteren van collegestof in de sportschool. Echter, in geschreven documenten beperkt de boodschap zich niet slechts tot een rij woorden en zinnen, maar heeft de visuele opmaak een ondersteunende functie voor het begrijpen van de boodschap. Dik gedrukte woorden, lettergroottes, lijsten met bullets, genummerde opsommingen, inspringingen en dergelijke, maken het de lezer makkelijker de functie van elementen en hun onderlinge relaties te begrijpen. Als een TTS-systeem enkel de document-tekst uitspreekt, gaat al deze informatie verloren, en is de documentstructuur minder goed te begrijpen. Voor mijn bachelor-afstudeerstage Kunstmatige Intelligentie onderzoek ik hoe documentstructuur in combinatie met documentinhoud via audio gecommuniceerd kan worden met als doel de begrijpelijkheid te verbeteren. Het ultieme doel is dan vervolgens een applicatie te ontwikkelen waarin deze optimalisatie aan gebruikers kan worden aangeboden in een mobiele omgeving.\\