Evaluatie van handmatig gecorrigeerde brede fonetische transcripties in het Corpus Gesproken Nederlands

TitleEvaluatie van handmatig gecorrigeerde brede fonetische transcripties in het Corpus Gesproken Nederlands
Publication TypePresentation
Year of Publication2002
Conference NameDag van de Fonetiek 2002
AuthorsBinnenpoorte, Diana, and Simo Goddijn
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationUtrecht, The Netherlands
Abstract

Voor de ontwikkeling van betere automatische transcripties zijn handmatig gecorrigeerde fonetische transcripties van grote waarde. Automatisch gegenereerde transcripties zijn weliswaar maximaal consistent, maar niet altijd maximaal accuraat, om verschillende redenen. Een manier om de transcripties accurater te maken, is ze handmatig te laten corrigeren. Uit de literatuur is echter bekend dat door mensen gemaakte fonetische transcripties een fors element van subjectiviteit en inconsistentie in zich hebben. In welke mate dit geldt voor de handmatig gecorrigeerde fonetische transcripties zoals die gemaakt worden in het CGN-project, wordt onderzocht aan de hand van twee experimenten.

Als eerste wordt de accuratesse van de handmatige transcripties bepaald door de transcripties van zestien fragmenten op te lijnen met een referentietranscriptie van diezelfde fragmenten. De referentietranscriptie benadert de werkelijkheid zo dicht mogelijk en is ontstaan door consensus tussen twee ervaren fonetici voor ieder symbool. De tweede vraag die beantwoord wordt, is in welke mate de verschillende transcribenten onderling overeenstemmen.

Door bestudering van de data hopen we een goed beeld te kunnen geven van de kwaliteit van de handmatig gecorrigeerde fonetische transcripties in het kerncorpus van het CGN.