Spengi spraaksynthese software (Demonstratie)

TitleSpengi spraaksynthese software (Demonstratie)
Publication TypePresentation
Year of Publication1999
Conference NameDag van de Fonetiek 1999
Authorsde Pijper, Jan-Roelof
PublisherNederlandse Vereniging voor Fonetische Wetenschappen
Conference LocationUtrecht, The Netherlands
Abstract

Spengi (SPeech ENGine) is de benaming voor het spraaksynthesesysteem dat op het IPO is ontwikkeld en nog steeds in ontwikkeling is. Spengi is een Phonetics-to-Speech engine, en verwacht dus een fonetische transcriptie als invoer. De synthese is gebaseerd op difonen en de kwaliteit van de spraak is state-of-the-art, mede door goede prosodische beregeling en geavanceerd gebruik van PSOLA technieken.

Er zijn momenteel drie difoondatabases beschikbaar: een vrouwenstem en een mannenstem voor het Nederlands en een vrouwenstem voor het Brits-Engels.

Spengi is beschikbaar als een API en kan daardoor makkelijk in bijvoorbeeld een C-programma geintegreerd worden. Verder zijn er twee front-end applicaties beschikbaar voor demonstratie- en onderzoeksdoeleinden: Ipologue is een conventioneel command-line programma (DOS en UNIX); Calipso is een Windows programma. Beide applicaties zullen op deze dag gedemonstreerd worden.

Beide applicaties kunnen gebruik maken van grafeem-foneemomzetters die ontwikkeld zijn aan de KUN en aan de KUB. Calipso is verder nauw geintegreerd met het signaalbewerkingsprogramma GIPOS.