Akoestische parameters versus fonetische kenmerken voor ASH

TitleAkoestische parameters versus fonetische kenmerken voor ASH
Publication TypePresentation
Year of Publication1999
Conference NameDag van de Fonetiek 1999
AuthorsStrik, Helmer, Jacques Koreman, and Bistra Andreeva
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationUtrecht, The Netherlands
Abstract

In automatische spraakherkenning (ASH) worden als akoestische parameters meestal cepstrale parameters gebruikt. Deze cepstrale parameters zijn door ons afgebeeld op 2 sets van fonetische kenmerken, resp. gebaseerd op de kenmerken van IPA (International Phonetic Association) en op die van SPE (Sound Pattern of English).

Door de akoestische parameters op fonetische kenmerken af te beelden is het mogelijk de linguistische informatie in het signaal explicieter te modelleren [1,2]. De resultaten van onze experimenten laten zien dat hierdoor ook de foneemidentificatie verbeterd van 15,6% correct voor cepstrale parameters, naar 42,3% respectievelijk 31,7% voor IPA- en SPE-gebaseerde kenmerken. Bovendien zijn de verwisselingen tussen fonemen fonetisch gezien in het algemeen minder ernstig wanneer fonetische kenmerken gebruikt worden.

  1. J. Koreman, B. Andreeva, W.J. Barry (1998) Do phonetic features help to improve consonant identification in ASR? Proc. ICSLP-98, Sydney.
  2. J. Koreman, B. Andreeva, H. Strik (1999) Acoustic parameters versus phonetic features in ASR. Proceedings of the 14th International Congress of Phonetic Sciences, San Francisco, USA, pp. 719-722.