Der Weg zur Text-To-Speech Audiodeskription - TTS-AD in der Forschung

Die Text-To-Speech Audiodeskription ist eine seit einigen Jahren intensiver untersuchte Möglichkeit, Audiodeskriptionen effizienter und kostengünstiger zu produzieren. Frazier ermöglicht der Forschung einen einfachen Zugriff auf die aktuellsten Text-To-Speech Systeme.

Die klassische Produktion ist in der Regel teuer und langwierig. Neben der Texterstellung werden professionelle Sprecher und Tonstudio benötigt. Für kurzfristige Produktion oder geringe Budgets werden daher in der Regel keinen Audiodeskriptionen erstellt.

Seit 2011 wird daher zunehmend erforscht, in welchem Maße Audiodeskriptionen mit synthetischer Stimmen eine Alternative darstellen können. Dabei wird neben der Stimmenqualität auch die Akzeptanz für verschiedene Filmlängen und -genres analyisiert.

VIDEO TO VOICE stellt ab sofort der ZHAW Zürcher Hochschule für Angewandte Wissenschaften und der Universität Hildesheim Frazier für die Ausbildung & Forschung zur Verfügung.

Die Anbindung modernster Text-To-Speech Engines an Frazier erlaubt der Forschung damit einen realistischen Blick auf den Stand der Technik und direkte Testergebnisse. Zusätzlich gibt uns das Feedback aus dem praktischen Einsatz die Möglichkeit, Frazier weiter an die Bedürfnisse der Autor*innen anzupassen.