2010 Optimalisatie van tekst-to-speech door gebruik van metainformatie (documentstructuur)

Authors
Bouke Versteegh
Abstract
De huidige generatie algemeen beschikbare text-to-speech (TTS) systemen (links naar websites) leest tekstbestanden (bv Word-bestand, HTML, PDF) voor aan de gebruiker. Denk hierbij aan situaties waarin de gebruiker auditieve informatie beter tot zich kan nemen dan geschreven informatie, zoals bijvoorbeeld bij het beluisteren van vergaderstukken in de auto, of het beluisteren van collegestof in de sportschool. Echter, in geschreven documenten beperkt de boodschap zich niet slechts tot een rij woorden en zinnen, maar heeft de visuele opmaak een ondersteunende functie voor het begrijpen van de boodschap. Dik gedrukte woorden, lettergroottes, lijsten met bullets, genummerde opsommingen, inspringingen en dergelijke, maken het de lezer makkelijker de functie van elementen en hun onderlinge relaties te begrijpen. Als een TTS-systeem enkel de document-tekst uitspreekt, gaat al deze informatie verloren, en is de documentstructuur minder goed te begrijpen. Voor mijn bachelor-afstudeerstage Kunstmatige Intelligentie onderzoek ik hoe documentstructuur in combinatie met documentinhoud via audio gecommuniceerd kan worden met als doel de
begrijpelijkheid te verbeteren. Het ultieme doel is dan vervolgens een applicatie te ontwikkelen waarin deze optimalisatie aan gebruikers kan worden aangeboden in een mobiele omgeving.
Publication type
Presentation
Year of publication
2010
Conference location
Utrecht
Conference name
Dag van de Fonetiek 2010
Publisher
Nederlandse Vereniging voor Fonetische Wetenschappen