@article {35, title = {FAME! - The Frisian Audio Mining Enterprise}, year = {2015}, publisher = {Nederlandse Vereniging voor Fonetische Wetenschappen}, address = {Utrecht, The Netherlands}, abstract = {

We have recently presented a new speech database containing 18.5 hours of annotated radio broadcasts in the Frisian language. Frisian is mostly spoken in the province Fryslân and it is the second official language of the Netherlands. The native speakers of Frisian are mostly bilingual and often code-switch in daily conversations due to the extensive influence of the Dutch language.

Considering the longitudinal and code-switching nature of the data, an appropriate annotation protocol has been designed and the data is manually annotated with the orthographic transcription, speaker identities, dialect information, code-switching details and background noise/music information. This data has been collected in the scope of the FAME! (Frisian Audio Mining Enterprise) Project which aims to build a spoken document retrieval system for the disclosure of the archives of Omrop Fryslân (Frisian Broadcast) covering a large time span from 1950s to present and a wide variety of topics. Omrop Fryslân is the regional public broadcaster of the province Fryslân and the main data provider of this project with a radio broadcast archive containing more than 2600 hours of recordings.

In this presentation, we will address both the disclosure of this "big data", especially its phonetic aspects, and the rich potential of code switching research using this new database.

}, author = {Emre Y{\i}lmaz and Maaike Andringa and Sigrid Kingma and Frits van der Kuip and Hans Van de Velde and Frederik Kampstra and Jouke Algra and Henk van den Heuvel and David van Leeuwen} } @article {153, title = {The challenges of forensic application of automatic speaker recognition}, year = {2010}, publisher = {Nederlandse Vereniging voor Fonetische Wetenschappen}, address = {Nijmegen, The Netherlands}, abstract = {

Automatic speaker recognition is an area in speech technology that is enjoying increasing interest from the research community. In recent years, the application of this technology to the forensic domain is being investigated. Here the general idea is that a recording of an incriminating speech utterance can help to identify the perpetrator of a crime. The first application scenario is to use speaker recognition technology in the criminal investigation: to narrow down the search of suspects using the recording. In a second stage, the application scenario is to use the technology to produce evidence to support the hypothesis that a suspect is the source of the recording.

The speaker recognition community is in general very careful about the application of the technology to new domains, and in this presentation, some aspects of both application scenarios are put forward. The specific challenges and necessary research directions are reviewed, and where possible a comparison to current practice is made.

}, author = {David van Leeuwen} } @article {136, title = {Een audiovisuele spontane emotie-database van gamers}, year = {2008}, publisher = {Nederlandse Vereniging voor Fonetische Wetenschappen}, address = {Utrecht, The Netherlands}, abstract = {

TNO Defensie en Veiligheid, Soesterberg Een spontane audiovisuele emotie-database is opgenomen met het doel om automatische emotieherkenners te ontwikkelen. 28 proefpersonen hebben een videospel gespeeld (Unreal Tournament) waarin bepaalde spelelementen zijn gemanipuleerd om emoties uit te lokken. Er zijn spraak- en gezichtsopnamen gemaakt die na afloop door de gamers zelf zijn geannoteerd op emotie. Met deze opgenomen data is een aantal experimenten uitgevoerd. Ten eerste hebben we gekeken naar hoe het aanbieden van uni- of multimodale informatie (bijv. alleen audio, alleen video of beiden) de beoordeling van emotie beinvloedt. Ten tweede hebben we gekeken naar de betrouwbaarheid van de eigen emotiebeoordelingen van de gamers. Het uiteindelijke doel is om automatisch emotie in spraak te detecteren; we zullen voorlopige resultaten van een aantal emotieclassificatieexperimenten laten zien.

}, author = {Khiet Truong and Mark Neerincx and David van Leeuwen} } @article {134, title = {Een menselijke benchmark voor automatische taalherkenning}, year = {2008}, publisher = {Nederlandse Vereniging voor Fonetische Wetenschappen}, address = {Utrecht, The Netherlands}, abstract = {

Automatische taalherkenning heeft als doel het herkennen van de taal die gesproken wordt in een spraakfragment. Regelmatig worden wereldwijd systemen langs de lat gelegd in benchmark evaluaties, uitgevoerd door het Amerikaans NIST, en systemen worden steeds beter. Maar hoe goed kunnen mensen dat eigenlijk? En hoe meet je zoiets, en waar hangen de prestaties van af? We willen de resultaten presenteren van een onderzoek dat we bij het International Computer Science Institute in Berkeley en het University College Utrecht hebben uitgevoerd. En mensen doen het zo gek nog niet{\textendash}-als ze de taal in kwestie een beetje kennen.

}, author = {Rosemary Orr and David van Leeuwen} } @article {195, title = {Het wetenschappelijk werk van dr. Paula Smeele, 1961-2005}, year = {2005}, publisher = {Nederlandse Vereniging voor Fonetische Wetenschappen}, address = {Utrecht, The Netherlands}, abstract = {

Dit jaar is Paula Smeele overleden. Deze presentatie geeft een overzicht van haar wetenschappelijke carriere die zij als letterkundige en foneticus heeft opgebouwd. Dit zal gebeuren aan de hand van het werk dat ze verricht heeft in Nederland en daarbuiten: Leiden, Utrecht, Eindhoven, Delft, Santa Cruz, Seattle en Soesterberg. Het brede spectrum aan onderwerpen waar zij aan heeft bijgedragen laat zien dat we een waardevolle collega hebben verloren.

}, author = {David van Leeuwen} }