Technisch unterstütztes Erklären von Stimmcharakteristika (Projekt C06)

Eine Stimme kann als heiser beschrieben werden oder auch als klar, tief oder brüchig. Wie sich die verschiedenen Stimmcharakteristika anhören und wie eine Stimme in all ihren Facetten dargestellt werden kann, sind Fragen, mit denen sich die Wissenschaftler*innen im Projekt C06 beschäftigen. Die Linguist*innen und Informatiker*innen entwickeln ein intelligentes System, das Expert*innen einsetzen können, um Laien das Phänomen Stimme erklären zu können. Dafür generiert das KI-System Sprachproben, bei denen derselbe Inhalt von unterschiedlichen Stimmen gesprochen wird. Diese können auch für klinische Linguist*innen in der Diagnostik hilfreich sein, um beispielsweise Stimmcharakteristika der Parkinson-Krankheit zu erkennen. Indem ebenfalls aufgezeigt wird, wie das System Unterschiede zwischen Stimmen misst, wird die Modellierung von Stimme transparenter und interpretierbar. Das Ziel des Forschungsteams ist es, herauszufinden, ob Menschen mit Hilfe des KI-Systems eine Stimme besser nachmachen und beschreiben können.

Publikationen

Rautenberg F., Kuhlmann M., Ebbers J., et al. (2023). Speech Disentanglement for Analysis and Modification of Acoustic and Perceptual Speaker Characteristics. In: Fortschritte der Akustik - DAGA 2023. ; 2023:1409-1412. https://ris.uni-paderborn.de/record/44849

In diesem Video stellen die Projektleiter*innen ihre Sicht von Ko-Konstruktion vor (auf Englisch).
Forschungsgebiete

Informatik, Linguistik

Projektleitung

Prof. Dr. Reinhold Häb-Umbach, Universität Paderborn

Prof. Dr. Petra Wagner, Universität Bielefeld

Mitarbeiter*innen

Frederik Rautenberg, Universität Paderborn

Jana Wiechmann, Universität Bielefeld

Hilfskräfte

Marc Deegen, Universität Paderborn

Lisa Kalinitschenko, Universität Bielefeld

Alexandra Schmidt, Universität Bielefeld