@article {381, title = {Intonatie modellering voor meerdere talen en verschillende tekst-types}, year = {2001}, publisher = {Nederlandse Vereniging voor Fonetische Wetenschappen}, address = {Amsterdam, The Netherlands}, abstract = {

Om een intonatiemodel voor meerdere talen te ontwikkelen werd eerder al met een datagedreven methode ge{\"e}xperimenteerd. Deze methode bestaat eruit vijf pitch waarden per syllabe te voorspellen aan de hand van een set features die afgeleid wordt uit de orthografie. Hiervoor wordt een recurrent neuraal netwerk (RNN) gebruikt.

De methode is met succes toegepast om intonatiecontouren van ge{\"\i}soleerde zinnen in zes verschillende talen te voorspellen. E{\'e}n van de doelen van dit project was te experimenteren met grote tekstdocumenten van verschillende teksttypes. De ontwikkelde methode is daarom in de eerste plaats aangepast om met grote tekstdocumenten om te gaan. Vervolgens is er voor drie talen (Engels, Nederlands en Frans) ge{\"e}xperimenteerd met modellen die enkel getraind zijn op {\'e}{\'e}n teksttype, en modellen die getraind zijn op data van meerdere teksttypes. Voor elke taal werden tests uitgevoerd voor vier verschillende teksttypes, namelijk instructies, nieuws, verhalen en technische teksten.

Een tweede uitbreiding ten opzichte van intonatiemodellering voor ge{\"\i}soleerde zinnen, is het gebruik van HTML-features. In tegenstelling tot ge{\"\i}soleerde zinnen, zijn de tekstdocumenten afkomstig van het internet. Onderzoek moest uitwijzen of het gebruik van HTML-features, die iets zeggen over de structuur van een tekst (vb. eerste woord in paragraaf), of die aangeven of een woord bijvoorbeeld "bold" of "italic" geschreven is, het eindresultaat positief be{\"\i}nvloedt.

In de presentatie zal uitleg gegeven worden over de opzet van de verschillende experimenten en de daaruit volgende resultaten.

}, author = {Jeska Buhmann} }