Benutzerspezifische Werkzeuge
Sie sind hier: Startseite Forschung Phonetik Erkennung von Prosodie

Erkennung von Akzenten und Phrasengrenzen

Automatische Erkennung von Satzmodus, Akzentuierung und Phrasengrenzen in einem sprachverstehendem System

Inauguraldissertation
zur
Erlangung der Doktorwürde
der Mathematisch-Naturwissenschaftlichen Fakultät
der Rheinischen Friedrich-Wilhelms-Universität Bonn

 
vorgelegt von
Volker Strom

 
Bonn, Januar 1998

Dissertation als Postscript File (145 Seiten, 2.6 MB)


Die vorliegende Dissertation entstand in der Zeit zwischen 1994 und 1997 am Institut für Kommunikationsforschung und Phonetik der Universität Bonn, in der ich für das vom BMBF geförderte Verbundvorhaben VERBMOBIL tätig war.

Schwerpunkt der Arbeit war die Entwicklung von Detektoren für Akzente und Phrasengrenzen, sowie deren Integration als Prosodie-Modul in das INTARC-System.

Das INTARC-System, eine Art `Mini-Verbmobil', ist ein Übersetzter von Deutsch nach Englisch mit gesprochener Ein- und Ausgabe. Das Prosodie-Modul darin unterstützt die Worterkennung und den Syntax-Parser; dazu verwendet es neben Grundfrequenz- und Energiemerkmalen auch Dauermerkmale, jedoch ohne auf Wortinformation zuzugreifen, da es (zumindest in einer Systemversion) der Worterkennung vorgeschaltet ist. Die Arbeiten am linguistischen Worterkenner BELLE, der den akustisch detektierten prosodischen Akzent verwendet, wurden vorzeitig eingestellt. Aber die akustisch detektierten Phrasengrenzen konnten die Syntakanalyse deutlich verbessern bzw. beschleunigen, und mithilfe der prosodischen Satzmodus-Klassifikation konnten Mehrdeutigkeiten während der Semantik-Auswertung aufgelöst werden.

Den Abschluß der Arbeit bilden Wahrnehmungsexperimente mit delexikalisierter Sprache: Spontan gesprochene Dialogbeiträge wurden so verfremdet, daß die prosodischen Charakteristika (Satzmelodie, Sprechrhythmus, etc.) erhalten bleiben, die Verständlichkeit aber verloren ging. Die Versuchsteilnehmer hatten die Aufgabe, in dieser Sprache Akzente und Phrasengrenzen zu erkennen. Dabei stellte sich heraus, daß die menschlichen Hörer dabei etwa genauso gut (bzw. schlecht) abschneiden wie das - auf rein akustischen Merkmalen basierende - Prosodiemodul.

Artikelaktionen