@article {268, title = {Plaatsnaamherkenning en het trainen van akoestische modellen}, year = {2001}, publisher = {Nederlandse Vereniging voor Fonetische Wetenschappen}, address = {Utrecht, The Netherlands}, abstract = {

Bij het trainen van akoestische modellen ten behoeve van automatische spraakherkenning (ASR) geldt, dat hoe meer het trainingscorpus overeenkomst vertoont met de herkentaak, hoe beter de spraakherkenner zal presteren. KPN wilde binnen de dienst 118, de dienst inlichtingen telefoonnummers binnenland, het transcriberen van de plaatsnamen automatiseren met behulp van ASR. Het bovenstaande betekent dat hiervoor modellen getraind zouden moeten worden met een trainingscorpus bestaande uit plaatsnamen. Het probleem hierbij is echter, dat de hoeveelheid trainingsmateriaal te weinig van de minder frequente fonemen bevat. Het gebruikelijke alternatief is in dit geval het trainen van generieke modellen met een trainingscorpus bestaande uit fonetisch rijke zinnen. Dit zijn zinnen waarbij er opzettelijk voor gezorgd is, dat de minder frequente fonemen in voldoende mate vertegenwoordigd zijn. In dit onderzoek is onderzocht of applicatiewoorden, achternamen en straatnamen een zinvolle toevoeging aan het corpus met plaatsnamen vormen. Hierdoor zouden betere herkenresultaten bij de herkenning van spontaan (uitgesproken) plaatsnamen behaald moeten worden. Dit is het geval gebleken. Dit onderzoek is verricht in het kader van een stage bij KPN Research in het kader van een afstudeerproject bij de leerstoelgroep Fonetische Wetenschappen van de Universiteit van Amsterdam

}, author = {Daniel Salomons} }