@article {189, title = {"Landgenooten..." Verbeterde toegang tot historische toespraken}, year = {2006}, publisher = {Nederlandse Vereniging voor Fonetische Wetenschappen}, address = {Utrecht, The Netherlands}, abstract = {

Het CHoral project heeft tot doel om technologie te ontwikkelen ter verbetering van de toegang tot historische audiocollecties. Via spraakherkenning proberen we audio-archieven om te zetten in tekst, waardoor het mogelijk wordt om de audio te doorzoeken op woordniveau. Relevante fragmenten kunnen vervolgens direct worden beluisterd. Het automatisch verwerken van historische gesproken documenten is lastig, omdat de audiokwaliteit vaak slecht is, en de spreekstijl en het woordgebruik ouderwets zijn. Dit leidt tot een mismatch met bestaande akoestische modellen en taalmodellen, die zijn ontwikkeld op het nieuwsdomein.

In deze presentatie willen we ons onderzoek introduceren aan de hand van experimenten op een specifieke, historische audiocollectie: de toespraken van Koningin Wilhelmina uitgezonden op Radio Oranje tijdens de Tweede Wereldoorlog. Deze collectie bestaat niet alleen uit audio; alle toespraken zijn tevens volledig uitgeschreven. Daarom was het mogelijk om door oplijning van de audio met de teksten tot een index op woordniveau te komen. In een demo zullen we laten zien dat - met behulp van deze index - online gezocht kan worden in de audio en de tekst als ondertiteling bij de audio kan worden gepresenteerd.

}, author = {Willemijn Heeren and Laurens van der Werff} }