Het gebruik van cooccurrence values gebaseerd op het WWW voor het voorspellen van prosodische frasering.

TitleHet gebruik van cooccurrence values gebaseerd op het WWW voor het voorspellen van prosodische frasering.
Publication TypePresentation
Year of Publication2001
Conference NameDag van de Fonetiek 2001
Authorsvan Herwijnen, Olga
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationUtrecht, The Netherlands
Abstract

Cooccurrence values geven aan wat de waarschijnlijkheid is dat twee woorden naast elkaar voorkomen. Onze hypothese is dat een hoge cooccurrence value aangeeft dat twee woorden sterk met elkaar zijn verbonden en dat er daarom geen frasegrens op een juncture tussen de woorden mag worden geplaatst. Bekende methoden voor het bepalen van cooccurrence values zijn mutual information, chi-square en log likelihood. In recent onderzoek (Volk, 2000) is gebruik gemaakt van het WWW als corpus voor het berekenen van cooccurrence values voor het Duits. Het voordeel van het gebruik van het WWW als corpus is dat het het grootste beschikbare corpus is. In het hier besproken onderzoek hebben we deze methode toegepast voor het Nederlands. We bespreken verschillende methoden voor het berekenen van de cooccurrence relatie en de toepasbaarheid van deze methoden voor het voorspellen van prosodische frasegrenzen.