IKP-Kolloquium: Wintersemester 2006/07
Das IKP-Kolloquium findet an den genannten Terminen – es handelt sich (außer bei Sonderterminen) um Dienstage – im Hörsaal der Alten Sternwarte statt. Es beginnt jeweils um 13 Uhr c.t.
Alle Interessierten (insbesondere auch Studentinnen und Studenten) sind herzlich eingeladen.
The IKP Colloquium is held on the dates given below, on Tuesdays (exceptions excepted), 1:15pm, in the lecture room of the Old Observatory. We invite everybody who is interested, explicitly encouraging students.
Termine im Wintersemester 2006/07:
Datum Vorträge 24.10.6 krankheitsbedingt ausgefallen; Nachholtermin: 7.11. 7.11.6
Projekte und laufende Arbeiten der Abteilung Sprache und Kommunikation (7)
- Charlotte Wollermann: Linguistische Evaluation der Übersetzungsqualität von Langenscheidts T1 und Linguatecs Personal Translator – ein Vergleich
Dieser Vortrag befasst sich mit einem klassischen Thema der Computerlinguistik, der Maschinellen Sprachübersetzung. Immer mehr automatische Übersetzungsprogramme versprechen die einfache und schnelle Übersetzung von Geschäftsbriefen, Bedienungsanleitungen, Web-Seiten, e-Mails etc. per Knopfdruck. In diesem Zusammenhang stellt sich besonders unter linguistischem Gesichtspunkt die Frage nach der Leistungsfähigkeit solcher Systeme. Im Rahmen der vorgestellten empirischen Untersuchung werden die Programme T1 Professional 6.0 von Langenscheidt und der Personal Translator 2006 pro von Linguatec hinsichtlich ausgewählter linguistischer Phänomene für das Sprachpaar Deutsch-Englisch vergleichend evaluiert. Zu den untersuchten Phänomen zählen hierbei Imperative und Anweisungsstrukturen aus der Domäne Geräteanleitungen für Haushaltsgeräte, Komposita aus dem Gebiet ästhetisch-plastische Chirurgie sowie syntaktische und lexikalische Ambiguitäten. Zur Evaluation werden die Kriterien herangezogen, wie sie im Rahmen des Arbeitskreises Maschinelle Übersetzung der Gesellschaft für Linguistische Datenverarbeitung aufgestellt wurden (Nübel und Seewald-Heeg 1998).
Literatur:
Nübel, Rita; Seewald-Heeg, Uta (1998). Evaluation of the Linguistic Performance of Machine Translation System. / Evaluation der linguistischen Performanz maschineller Übersetzungssysteme. Proceedings of the Konvens-98 Workshop in Bonn. / Beiträge des Workshops auf der Konvens-98 in Bonn. St. Augustin: Gardez! Verlag.
- Petra Wagner: Das Wetter ist nebligtrüb – Empirische Untersuchung zur Betonung deutscher Kopulativkomposita
Obwohl die bekannte Compound Stress Rule die meisten Fälle deutscher Betonung von Komposita erklärt, gibt es einige Ausnahmegruppen. Zu diesen gehören u.a. Kopulativkomposita wie ‚süßsauer‘ oder ‚nebligtrüb‘, von denen im Normalfall eine Endbetonung angenommen wird, die aber unter bestimmten Bedinungen auch auf der ersten Konstituente betont werden können. Verschiedene Erklärungen für diese Alternationen werden in zwei Experimenten an komplexen Kardinalzahlen und adjektivischen Kopulativkomposita empirisch überprüft. Die Ergebnisse zeigen, dass die variierenden Betonungsmuster nicht durch Akzentzusammenstöße hervorgerufen werden und dass die Kopulativkomposita bevorzugt nach den Regeln der Compound Stress Rule betont werden, außer, ihnen folgt eine prosodische Phrasengrenze. In diesen Fällen (die „Zitierform“ ist einer dieser Fälle) wird klar eine Endbetonung bevorzugt. In komplexen Komposita kann gut beobachtet werden, dass die linke und die rechte Konstituente um die Wortbetonung regelrecht konkurrieren.
Die Alternation ist dadurch zu erklären, dass die Komposita von der phonologischen Grammatik offenbar als hybride Strukturen zwischen Komposita und unabhängigen Bestandteilen einer Phrase behandelt werden: Folgt ihnen eine Phrasengrenze, platziert der Sprecher auf dem letzten, als unabhängig wahrgenommenen Inhaltswort den Phrasenakzent, also der rechten Konstituente des Kompositums. Die Nuclear Stress Rule neutralisiert offenbar in vielen Fällen den Einfluss der Compound Stress Rule. Folgt keine Phrasengrenze, greift lediglich die Compound Stress Rule und die Betonung landet auf der linken Konstituente. Bei komplexen Komposita wie längeren Numeralia kann der Einfluss beider Betonungsregeln nachvollzogen werden.
21.11.6
Computerlinguistische und phonetische Magisterarbeiten bei der Forschungsgesellschaft für Angewandte Naturwissenschaften e.V. (FGAN)
Achtung: Beginn 13:00 s.t.!
- Carolin Kremer: Eine Untersuchung von Bewegungsverben im KFOR-Korpus im Vergleich zu FrameNet
- Corinna Harwardt: Spracherkennung auf militärischen Funksprüchen
- Silverius Kawaletz: Annotationstransformation am Beispiel des KFOR-Korpus
5.12.6
Syntaxtheorie
Marco Kuhlmann: Expressivity and Processing Complexity of Non-projective Dependency Grammars
Syntactic parsing of natural language requires a fine balance between expressivity and complexity, so that naturally occurring structures can be accurately parsed without compromising efficiency. In dependency-based parsing, several structural restrictions have been proposed to reduce the search space for admissible analyses. While the most well-known of these restrictions, projectivity, is generally taken to be too restrictive for natural language syntax, it is not clear which of the other proposals strikes the best balance between expressivity and complexity.
In the first part of the talk, I present four such restrictions on dependency structures (totally ordered trees), and provide an experimental evaluation using data from two dependency treebanks, investigating how large a proportion of the structures found in the treebanks are permitted under different constraints. I also argue that the class of dependency structures that a given grammar formalism can induce is an interesting measure for its language-theoretic expressivity.
In the second part of the talk, I present a declarative characterization of 'mildly context-sensitive' dependency languages (i.e., sets of dependency structures) in terms of context-free hypergraph grammars. The resulting dependency languages are semi-linear, and have a fixed recognition problem that can be decided in polynomial time. For dependency languages induced by a certain restricted class of hypergraph grammars, which is motivated by one of the evaluated structural restrictions, even the universal recognition problem is polynomial.
Projekte und laufende Arbeiten der Abteilung Sprache und Kommunikation (8)
Taalke Nieberding: Newsbots – Nutzungstypen und Mehrwert von Personalisierung
19.12.6
Syntax und Informationsstruktur
Philip von Böselager: Generierung von Prosodie aus syntaktisch-semantischen Informationen
Die Arbeit beschreibt den Aufbau eines dreiteiligen CTS-Szenarios. In diesem Szenario werden a) syntaktisch-semantisch tiefe Informationen generiert, b) aus diesen mittels eines Transformators prosodische Informationen abgeleitet und c) diese wiederum zur Sprachsynthese verwandt. Der Transformator arbeitet XML-basiert und verwendet in XSLT-Stylesheets formulierte Transformationsregeln. Aufgrund des modularen Aufbaus des Szenarios sind verschiedene grammatische Generatoren und Sprachsyntheseprogramme einsetzbar. Die Anwendung des Szenarios wird anhand des HPSG-Generators LKB, der deutschen HPSG-Grammatik GG und des Sprachsyntheseprogramms MARY exemplifiziert. Dabei werden bei oberflächlich ambigen Sätzen entsprechend der möglichen Tiefenstrukturen disambiguierende prosodische Muster realisiert. Die auf diese Weise prosodisch markierten Sätze werden anhand eines Perzeptionsexperiments evaluiert. Die Ergebnisse des Experiments belegen die Funktionalität des Szenarios klar.
Phonetik und Phonologie
Maria Wolters: Speech technology for older people
9.1.7
Nichtlautsprachliche Phonologie (1)
Eva Waleschkowski und Annika Herrmann (Frankfurt): Gebärdensprach-Phonologie und Fokus in der Deutschen Gebärdensprache
23.1.7 Entfällt leider! 6.2.7
Projekte und laufende Arbeiten der Abteilung Sprache und Kommunikation (9)
Donata Moers: Schnell gesprochene Sprache in der Unit-Selection-Synthese
Die Modellierung unterschiedlicher Sprechstile gewinnt in der Sprachsynthese mehr und mehr an Bedeutung. Dabei steht zum einen die Erforschung charakteristischer Merkmale einzelner Sprechstile im Mittelpunkt des Interesses. Auf der anderen Seite spielt die Möglichkeit der Darstellung verschiedener Sprechstile (schnell/langsam, emotional/sachlich), um dem Hörer/Nutzer bspw. die Einstellung persönlicher Präferenzen bezüglich der Sprecher- oder Spracheigenschaften zu ermöglichen, eine zentrale Rolle. In diesem Zusammenhang werden im Vortrag Ansätze zur Erzeugung von schnell gesprochener Sprache in der Unit-Selection-Synthese vorgestellt. Dabei geht es zunächst um die wichtigsten charakteristischen Eigenschaften schnell gesprochener Sprache. Anschließend werden bisherige Forschungsergebnisse bzgl. dieses Sprechstils in der Sprachsynthese vorgestellt. Das aktuelle Projekt wird kurz skizziert, bevor abschließend geplante Experimente erläutert werden.
Arne Bachmann: A simple intonation model for a complex tone language – Development of an Ibibio intonation module for BOSS
Ziel der Arbeit ist die Entwicklung eines BOSS-Intonationsmoduls für die nigerianische Tonsprache Ibibio. Wichtige Kriterien für die Entwicklung sind die Adaptierbarkeit des Moduls auf andere Tonsprachen, ein geringes sprachspezifisches Vorwissen, einfache und effiziente Modelle, Nachvollziehbarkeit des maschinellen Lernens und nachträglicher phonologischer Wissensgewinn.
Als Grundlage dient ein 10-minütiges minimal annotiertes Korpus (Orthografie, Phone, Töne) und allgemeine Informationen zum Phonem- und Tonemsystem (s. Literatur).
Es wird eine silbenweise dauernormalisierte polynominelle Grundfrequenzstilisierung durchgeführt. Die Menge aller Polynome wird in zu einem Codebook mit 64 Codevektoren (Prototypen) vektorquantisiert. Die Prädiktion nutzt einen Klassifikationsbaum und liefert für jede zu prädizierende Silbe einen Codevektor, wobei 17 der von der linguistischen Vorverarbeitung gelieferten Parameter genutzt werden. Die Ergebnisse wurden per nichteinheitlicher Einheitenauswahl ohne weitere Manipulation synthetisiert. Zusätzlich wurde eine silbenbasierte Dauerprädiktion realisiert und die Rolle strukturierender Downtrends untersucht.
Literatur:
Bruce Connell (2001): “Downdrift, Downstep and Declination”. In: Typology of African Prosodic Systems Workshop.
Eno-Abasi Urua (2001): “The tone system of Ibibio”. In: Typology of African Prosodic Systems Workshop.
Eno-Abasi Urua (2004): “Ibibio”. In: Journal of the International Phonetic Association, 34/1, S. 105–109.
Dafydd Gibbon, Eno-Abasi Urua, Moses Ekpenyong (2006): “Problems and solutions in African tone language Text-To-Speech”. In: ISCA Workshop on Multilingual Speech and Language Processing (MULTILING 2006).
[ Termine vergangener Semester ]

