Phonetik
Forschungsprojekte der Phonetik
Aktuelle Forschungsprojekte
SPP 1234: Sprachlautliche Kompetenz: Zwischen Grammatik, Signalverarbeitung und neuronaler Aktivität
Project: The syllable as a processing unit in speech production: Evidence from frequency effects on coarticulation (2009-2012)
PI: Bernd Möbius and Petra Wagner (Univ. Bielefeld)
Researcher: Barbara Samlowski
Summary
The project investigates predictions of models of syllable production in speech that assume an interaction between frequency of occurrence and encoding of articulatory processes. Differences in frequencies of occurrence of syllable types are expected to result in different degrees of coarticulation. We predict a stronger degree of coarticulation in high-frequency syllables than in rare syllables. The project will test predictions derived from several proposed production models, such as the mental syllabary concept and the dual-pathway hypothesis. The investigation will be carried out in a series of production and subsequent perception experiments. Coarticulatory strength will be assessed based on the phonetic and statistical analysis of well-established acoustic correlates. Experimental results will also be interpreted from an exemplar-theoretic perspective. An important methodological objective is to develop a reliable procedure for estimating syllable frequencies in spoken language. The project aims to contribute experimental evidence towards a consistent view of the function and conceptual relevance of a phonetic syllabary in speech production.
Sprachsynthese
Unter dem Begriff Sprachsynthese versteht man die maschinelle Erzeugung von künstlicher Sprache aus geschriebenem Text. Beispiele für Anwendungen der Sprachsynthese sind das Vorlesen von SMS-Nachrichten per Telefon und die Ausgabe von Bildschirminhalten für sehbehinderte Menschen. Die Fähigkeit, beliebige Äußerungen erzeugen zu können und die damit verbundene, kompliziertere Vorverarbeitung unterscheidet die Sprachsynthese von einer einfachen Sprachausgabe mit beschränktem Wortschatz, wie sie in Ansagesystemen - beispielsweise bei digitalen Anrufbeantwortern - Verwendung findet. Die Phonetikgruppe des IfK verfolgt in erster Linie den Ansatz der konkatenativen Sprachsynthese, bei der das künstliche Sprachsignal aus Segmenten vorher aufgezeichneter natürlicher Sprache erzeugt wird.
Das IfK bietet zwei konkatenative Sprachsynthese-Systeme an. BOSS, das nach dem aktuellen Unit-Selection-Prinzip arbeitet und HADIFIX, eine klassische Diphonsynthese mit erweitertem Inventar. Eine ausführlichere Erklärung der Unterschiede und einen Überblick über unsere Sprachsyntheseforschung und -entwicklung finden Sie hier.
Mitarbeiter: Donata Moers
Abgeschlossene Projekte
APROPOS - Ein prosodisches Modell für lyrischen Sprechrhythmus
(DFG-Projekt, 12/03 - 12/05)
Im Projekt wurde ein prosodisches Modell für die unterschiedlichen rhythmischen Muster lyrischer und prosaischer Sprache erstellt und im Rahmen einer Sprachsyntheseanwendung evaluiert. Hierzu wurden in einem ersten Arbeitsschritt für die verschiedenen Versmaße des Deutschen prototypische Gedichte ausgewählt und für Sprachaufnahmen vorbereitet.
Mitarbeiter: Jörg Bröggelwirth, Petra WagnerAutomatisches Training von Unit-Selection basierten Sprachsynthesesystemen
(DFG-Projekt, 12/02- 12/04)
Ziel des Projektes war die Analyse von natürlichen Synthesebausteinen und die parametrische Beschreibung ihrer Eigenschaften im Hinblick auf ihre Eignung zur Erzeugung von synthetischer Sprache. Damit verbunden ist die Verbesserung der Qualität der auf Unit-Selection basierenden Syntheseverfahren. Es sollten Verfahren entwickelt werden, die zum einen bestehende Algorithmen optimieren, zum anderen alternative Auswahlstrategien bereitstellen.
Mitarbeiter: Christian WeissMiLCA (Medienintensive Lehrmodule in der Computerlinguistik-Ausbildung) (BMBF-Projekt, 09/01-03/04)
Ziel im Projekt MiLCA war es, Kernbereiche des Faches Computerlinguistik und zentrale Anwendungen der Sprachtechnologie mit virtuellen Lehrmodulen medial aufzubereiten. Am IKP wurde das E-Learning-Modul "Gesprochene Sprache" entwickelt, ein Web-Based-Training (WBT) aus dem Bereich der Sprachtechnologie.
Mitarbeiter: Felicitas Haas, Bernhard SchröderWahrgenommene Prominenz metrisch-phonologischer Muster (DFG-Projekt, 02/01-11/03)
Phonologische Theorien zur Wort- und Satzbetonung werden zumeist lediglich anhand introspektiv gewonnener Daten überprüft. Da gerade die metrischen Gitter aber den Anspruch erheben, perzeptive Relevanz zu besitzen, wurden in diesem Projekt die Vorhersagen metrischer Phonologie anhand perzeptiv ermittelter Daten überprüft.
Mitarbeiter: Volker Dellwo, Petra WagnerPersonalisierte interaktive Voice- und Audio-Portale (Pi-AVIda) (Auftrag der FHG innerhalb eines BMBF-Projekts, 10/01-07/03)
Auf der Basis des Bonner Sprachsynthesesystems BOSS (Bonn Open Synthesis Software) und des Verbmobil-Synthesekorpus wurde ein Sprachsynthesesystem hoher Qualität für das Deutsche erstellt und für das Projekt optimiert. Die Kenndaten dieses Systems sind: Synthese von beliebigen Zieläußerungen in hoher Verständlichkeit und Natürlichkeit mit zwei synthetischen Stimmen (eine weibliche, eine männliche), Flexibilität durch modularen Aufbau und damit spezielle Adaption auf die Erfordernisse des Projekts sowie eine Ansteuerungsmöglichkeit für Content-to-Speech-Anwendungen. Projektspezifische Anpassungen und Verbesserungen wurden dabei insbesondere im Bereich der Prosodiesteuerung und Mehrebenenbausteinauswahl vorgenommen.
Im Rahmen des vom BMBF geförderten Projekts PI-AVIda wird die Neu- und Weiterentwicklung von Verfahren zur Erschließung, Segmentierung und Klassifizierung von multimedialen Datenströmen ("information retrieval system") für ihren Einsatz in personalisierten Portalanwendungen vorangetrieben. Die Integration von PI-AVIda in bereits bestehende Produktionsumgebungen (Redaktionssysteme) ermöglicht die Realisierung einer Fülle von Anwendungsszenarien in den Bereichen Werbung, TV-Analyse, digitale Archivierung, Trendanalyse und Nachrichtenanalyse welche in erfolgversprechende Geschäftsmodelle überführt werden können.
Mitarbeiter: Jörg BröggelwirthProsodiebeurteilung und Reduktionsanalyse (DFG-Projekt, 99-05/03)
Untersuchungen zur Produktion gelesener und spontaner Sprache weisen auf sprecherspezifische Unterschiede hin. Es stellt sich somit die Frage, anhand welcher Merkmale Hörer gelesene von spontanen Äußerungen unterscheiden. Analysiert wurde die Beziehung zwischen Reduktion, Sprechstil und Sprechgeschwindigkeit sowie die prosodische Realisierung von Sprechstilen und ihre Perzeption. Zu diesem Zweck wurde eine Sprachdatenbank mit verschiedenen Sprechern, Sprechstilen (spontan vs. gelesen) und Sprechgeschwindigkeiten erstellt.
Mitarbeiter: Christina Widera, Gerit SonntagUnit-Selection-Sprachsynthese für die Telefonauskunft (Drittmittelprojekt, 08/00-02/03)
Am IKP wurde in Zusammenarbeit mit der klickTel GmbH ein auf der Synthesearchitektur BOSS basierendes System entwickelt, das auf die Ausgabe von Namen und Adressen spezialisiert ist. Die Anwendung, auf die das Projekt hinzielte, war eine automatische Telefonauskunft, bei der der Benutzer auf seine Anfrage hin eine synthetisierte akustische Ausgabe erhalten sollte. Dabei sollten nicht nur die angefragten Telefonnummern synthetisiert werden, sondern auch die Namen und Adressen der im Telefonbuch verzeichneten Teilnehmer.
Mitarbeiter: Stefan Breuer, Julia AbreschHADIFIX
ein konkatenatives Sprachsynthesesystem auf der Basis von Halbsilben, Diphonen und Suffixen. Mehr Informationen finden Sie auf den Sprachsyntheseseiten des IfK.
Mitarbeiter: Thomas PorteleISAEUS
Aussprachetrainer für Gehörlose und Hörgeschädigte (Gerit Sonntag, Julia Abresch, Christina Widera)
Parametrisierung von Grundfrequenzkonturen (Barbara Heuft, Thomas Portele)
Prosodiegenerierung für die Sprachsynthese (DFG-Projekt)
Statistische Untersuchungen an der Bonner Prosodischen Datenbank (Barbara Heuft)
Evaluation von (synthetischer) Prosodie mit der PURR-Methode (Gerit Sonntag)
[siehe auch: Sonntag, Gerit P. (1999), Evaluation von Prosodie]
Weitere Untersuchungen zu diesem Thema wurden innerhalb des Projekts "Prosodiebeurteilung und Reduktionsanalyse" durchgeführt.
Reduktionsanalyse (Christina Widera)
Dieser Teil des Projekts wurde innerhalb des Projekts "Prosodiebeurteilung und Reduktionsanalyse" weitergeführt
Prosodiegetriebene Erkennung spontaner Sprache mit unbegrenztem Wortschatz (DFG-Projekt) (Volker Strom)
Verbmobil
BMBF-Projekt zur Entwicklung eines Systems, das Hilfestellung innerhalb von Dialogsituationen bietet. Das Verbmobil-System erkennt gesprochene Spontansprache, analysiert die Eingabe, übersetzt sie in eine Fremdsprache, erzeugt einen Satz und spricht ihn aus.
Erkennung von Prosodie:
Erkennung von Akzenten und Phrasengrenzen (Volker Strom)
Automatische Erkennung von prosodischem Fokus (Anja Elsner)
Automatische Segmentierung (Karlheinz Stöber)
CTS-Synthese Deutsch und Englisch (Karlheinz Stöber, Thomas Portele, Petra Wagner, Lioba Faust, Stefan Breuer, Jörg Bröggelwirth, Felicitas Haas, u.v.a.m.)
Es wurde eine CTS-Synthese für das Englische und Deutsche entwickelt, welche semantisch und pragmatisch relevante prosodische Information wie den prosodischen Fokus, Kontrast sowie Emphase umsetzen kann. Für die gezielte Untersuchung dieser Phänomene wurde für das Englische eine prosodische Datenbank erstellt. Mit den höher werdenden Anforderungen an den Klangeindruck synthetischer Sprache wurde im letzten Abschnitt des Projekts zusätzlich zum traditionellen Diphon-/Halbsilbenansatz ein Sprachsynthesemodul erstellt, welches mit Hilfe einer UnitSelection (BOSS) auf Wortebene funktioniert. Dieser Ansatz hat sich gerade im Bereich der beschränkten Domäne als sehr erfolgreich herausgestellt.
Eigene Software / Ressourcen
- BOSS - Link zur Sourceforge-Seite
- Txt2pho - ein Programm zur Graphem-Phonem-Konvertierung
- BOMP - ein maschinenlesbares deutsches Aussprachewörterbuch
- Bonner Prosodische Datenbank
Kooperationspartner
- Universität Köln - Institut für Phonetik
- Universität Bielefeld
- Universität Stuttgart - Institut für maschinelle Sprachverarbeitung
- Fraunhofer IAIS
- Fraunhofer FKIE
- Universität Poznan
- CNGL Dublin

