Het gebruik van cooccurrence values gebaseerd op het WWW voor het voorspellen van prosodische frasering.
Title | Het gebruik van cooccurrence values gebaseerd op het WWW voor het voorspellen van prosodische frasering. |
Publication Type | Presentation |
Year of Publication | 2001 |
Conference Name | Dag van de Fonetiek 2001 |
Authors | van Herwijnen, Olga |
Publisher | Nederlandse Vereniging voor Fonetische Wetenschappen |
Conference Location | Utrecht, The Netherlands |
Abstract | Cooccurrence values geven aan wat de waarschijnlijkheid is dat twee woorden naast elkaar voorkomen. Onze hypothese is dat een hoge cooccurrence value aangeeft dat twee woorden sterk met elkaar zijn verbonden en dat er daarom geen frasegrens op een juncture tussen de woorden mag worden geplaatst. Bekende methoden voor het bepalen van cooccurrence values zijn mutual information, chi-square en log likelihood. In recent onderzoek (Volk, 2000) is gebruik gemaakt van het WWW als corpus voor het berekenen van cooccurrence values voor het Duits. Het voordeel van het gebruik van het WWW als corpus is dat het het grootste beschikbare corpus is. In het hier besproken onderzoek hebben we deze methode toegepast voor het Nederlands. We bespreken verschillende methoden voor het berekenen van de cooccurrence relatie en de toepasbaarheid van deze methoden voor het voorspellen van prosodische frasegrenzen. |