Benutzerspezifische Werkzeuge
Sie sind hier: Startseite Forschung IKP-Kolloquium IKP-Kolloquium: Sommersemester 2006

IKP-Kolloquium: Sommersemester 2006

Das IKP-Kolloquium findet an den genannten Terminen -- es handelt sich (außer bei Sonderterminen) um Dienstage -- im Hörsaal des Pavillons an der Sternwarte statt. Es beginnt jeweils um 13h c.t. Neu: [ Arbeitsbericht mit den Folien aller Vorträge des Sommersemesters 2005 ]

Termine im Sommersemester 2006:

11.4.2006   Projekte und laufende Arbeiten der Abteilung Sprache und Kommunikation (6)

  1. Hannes Rohde: Eine Harmonic-plus-Noise-Implementierung für die Sprachsynthese
  2. Charlotte Wollermann, Bernhard Fisseni, Bernhard Schröder, Frank Hülsken: akzente brauen fokus?

25.4.2006   Artikulatorische Phonetik

  1. Bernd Kröger (Universitätsklinik Aachen): Die neuronale Modellierung der sensomotorischen Entwicklung des Sprechens

    Hintergrund: Die detaillierte Kenntnis der Neurophysiologie der Sprachproduktion ist wichtig für das Verständnis z.B. der Sprachentwicklung und seiner evtl. auftretenden Verzögerungen und Störungen. Methode: Es wurde ein computerimplementiertes neuronales Modell zur Sensomotorik des Sprechens entwickelt, das in der Lage ist, die neuronale Funktion unterschiedlicher kortikaler Areale beim Sprechen detailliert darzustellen. Ergebnisse: Das Modell zeigt: (i) Zwei sensorische und zwei motorische Repräsentationen und zugehörige neuronale Abbildungen bilden die sensomotorische Rückmeldesteuerung. Diese Repräsentationen und Abbildungen werden bereits während der prälinguistischen Phase des Spracherwerbs ausgebildet und trainiert. (ii) Im Zentrum der linguistischen Phase des Spracherwerbs steht der Aufbau der lexikalischen Repräsentation (Laut-, Silben- und Wortrepräsentationen) und das Training der zugehörigen Abbildungen vom Lexikon zur Sensorik und Motorik, i.e. der Aufbau der sensomotorische Vorwärtssteuerung. (iii) Drei Subphasen des prälinguistischen Spracherwerbs können aus Simulationsstudien mit dem neuronalen Modell definiert werden. Schlussfolgerungen: Das neuronale Modell gibt Aufschluss über die detaillierte Funktion bestimmter kortikaler Areale beim Sprechen. Insbesondere kann angenommen werden, dass Sprachentwicklungsverzögerungen oder -störungen bereits durch eine zeitliche Verzögerung oder eine Störung einer der im Modell definierten Subphasen des prälinguistischen Spracherwerbs entstehen.

  2. Peter Birkholz (Universität Rostock): Artikulatorische Sprachsynthese mit einem 3D-Vokaltraktmodell

    In dem Vortrag wird die Konstruktion und Ansteuerung eines 3D-Vokaltraktmodells sowie eine strömungsakustische Simulation für die artikulatorische Sprachsynthese vorgestellt. Die Form des Vokaltraktmodells ist durch 23 geometrische Parameter definiert, die die Nachbildung aller Phoneme der deutschen Sprache erlauben. Die zeitliche Steuerung der Parameter erfolgt mit einem gestischen Dominanzmodell auf der Basis eines "gesturalen Ablaufplans". Damit lassen sich sprachliche Äußerungen auf der Basis artikulatorischer Gesten definieren. Die strömungsakustische Simulation arbeitet im Zeitbereich und simuliert die räumliche und zeitliche Änderung von Druck und Volumenstrom im Sprechapparat. Sie erlaubt neben der Simulation stimmhafter Laute auch die Synthese von Frikativen und Plosiven. Beispiele für die Synthese ganzer Sätze auf Basis dieser Modelle werden im Vortrag vorgestellt.

9.5.2006   Phoniatrie und Audiologie

  1. Hartmut Meister (Universitätsklinik Köln): Sprachsignalverarbeitung mit Innenohrprothesen (Cochlea-Implantate)
  2. Götz Schade (Universitätsklinik Bonn): Der Weg von der endolaryngalen Laservermessung bis zur Geschwindigkeitsmessung der Stimmlippenbewegung

23.5.2006   Information Retrieval 1 / Psycholinguistik

  1. Melanie Gnasa (Institut für Informatik, Uni Bonn): Congenial Web Search. A Conceptual Framework for Personalized, Collaborative, and Social Peer-to-Peer Retrieval.

    Traditional information retrieval methods fail to address the fact that information consumption and production are social activities. Most Web search engines do not consider the social-cultural environment of user's information needs and their strategy to satisfy them in order to enable awareness between users. This talk presents a new search paradigm for Web information retrieval denoted as Congenial Web Search, with emphasis on personalization, collaboration, and socialization methods in order to improve effectiveness.

    The client-server architecture of Web search engines defines a stringent roll allocation of all searchers only as information consumers. A peer-to-peer system architecture that leverages the independence of central services has been developed in this research to improve information seeking in distributed information collections where each user is assisted by an active information production. Based on a personalization strategy on each peer, the user is supported to give explicit feedback for relevant documents to his information need expressed by a query that is stored in a Peer Search Memory. On one hand, query-document associations are incorporated in a personalized ranking method for repeated information needs and the performance is shown in a known-item retrieval setting. On the other hand, explicit feedback of each user is considered to discover collaborative information needs.

    A new method for a controlled grouping of query terms, links, and users was developed to maintain Virtual Knowledge Communities. The quality of this grouping has been shown with regard to the effectiveness of grouped terms and links. Both strategies personalization and collaboration tackle the problem of a missing socialization among searchers by an integrated representation of static information needs and collections.

    Finally, a concept of integrated information seeking was developed that incorporates the representation to improve effectiveness of information retrieval and information filtering. An integrated information retrieval process explores a virtual search network of Peer Search Memories in order to accomplish a reputation-based ranking. In addition, the community structure is considered by an integrated information filtering process. Both concepts have been evaluated and showed a better performance than traditional techniques.

    The methods presented in this talk offer the potential towards more transparency and control of Web search.

  2. Nina Groten (Uni Maastricht): Auf der Suche nach paralleler Aktivierung mehrerer Wortformen... - in Experimenten mit Assoziationen

20.6.2006   Information Retrieval 2 / Computerlinguistik

  1. Joachim Köhler (Fraunhofer IMK): Methoden und Anwendungen des Spoken Document Retrieval
  2. Martin Müller (Uni Amsterdam): Accent and Focus in OT: a Cross-linguistic Perspective

    Optimality Theory (OT) is a good framework for cross-linguistic comparisons since it assumes universal constraints which can be ranked differently for different languages. Existing OT analyses on the relation between accent and information structure have been (partly extended and) tested on cross-linguistic data.

4.7.2006   Linda Shockey (University of Reading): Another Way to Make Speech Synthesis More Natural

A large amount of the work being expended on speech synthesis these days is aimed at making the output sound more natural, either through improving intonation or through introducing paralinguistic features such as expression of emotion. There is, however, a more straightforward way of making synthetic speech less difficult to listen to, and that is to make the pronunciation more like that produced by real people.

I propose that we do this by including processes found in connected speech, regardless of the style of speech being modelled. It is often assumed that pronunciations which do not closely follow spelling occur only in informal settings, but my research shows that virtually all speech, regardless of style, shows the same patterns of difference from most-careful forms. This is because speakers do not know they are using speech shortcuts and cannot therefore suppress them or favour them in any particular style. For English, these can be tied to factors such as lack of contrast in unstressed positions and simplification of syllable structure.

Studies show that listening to synthetic speech is more tiring than listening to natural speech, that more mistakes in perception are made, and that less information is retained over time when the input is synthetic (cf. Francis and Nusbaum, 1999, Stevens et all, 2005). I will try to convince you that far from making synthetic speech less understandable, the inclusion of normal phonological reductions in synthetic speech can improve the naturalness of the output, thus making it easier to listen to. Inclusion of variation in pronunciation in a synthesis strategy is difficult in general because it requires linguistic knowledge and more difficult to include in concatenative synthesis than in other types, but ways to do so will be a point of discussion.

  1. Francis, A.L., Nusbaum, H.C. (1999). Evaluating the quality of synthetic speech. In Gardner-Bonneau, D. (Ed.), Human Factors and Voice Interactive Systems, 63 - 97
  2. Stevens, C, Lees, N, Vonwiller, J and Burnham, D., (2005), On-line experimental methods to evaluate text-to-speech (TTS) synthesis, Computer Speech and Language 19, 129-146

 [ Termine vergangener Semester ]

Artikelaktionen