Open Sci­ence - Wis­sen­schaft ge­mein­sam ge­stal­ten

Bei der „Offenen Wissenschaft“ (englisch: Open Science) machen Wissenschaftler*innen ihre Forschungsprozesse öffentlich zugänglich. Sie geben Einblicke in ihre Arbeitsschritte und teilen ihre Forschungsdaten. Auf diese Weise können auch Wissenschaftler*innen und Expert*innen außerhalb der Forschungseinrichtung die Projekte und Prozesse nachvollziehen und gegebenenfalls gemeinsam weiterentwickeln.

„Wir erhöhen die Qualität unserer Forschung, wenn wir diese transparent machen“, sagt Professorin Dr. Katharina Rohlfing, Sprecherin des TRR 318. „Innerhalb des Transregios arbeiten wir bereits disziplinenübergreifend: Die Forschenden kommen aus verschiedenen wissenschaftlichen Feldern zusammen, tauschen sich aus und ergänzen so ihr Wissen gegenseitg. Mit Open Science suchen wir genau diese Art von Austausch auch mit Expert*innen außerhalb des Projekts.“

Res­sour­cen

Das linguistische ADEX-Kodierschema (auf Englisch) dient der Annotation von Äußerungen, die Gesprächspartner*innen beim Erklären eines Spiels verwenden. Es erfasst sowohl die sprachliche Form als auch die inhaltliche Klassifikation dieser Äußerungen. Entwickelt wurde das Kodierschema von Josephine Fisher, Forscherin im Projekt A01 Adaptives Erklären.

Download

Weitere Kodierschemata und Instrumente des Projekts sind auf OSF verfügbar: osf.io/daqv9

Um zu untersuchen, wie gut aktuelle Sprachmodelle (LLMs) ko-konstruktive Erklärdialoge führen können, haben Forschende des INF-Projekts einen Datensatz erstellt. Er umfasst Erklärinteraktionen zwischen Menschen und LLMs sowie Vor- und Nachbefragungen zum Verständnis der Nutzer*innen. Die Daten wurden analysiert und in einem Forschungsartikel veröffentlicht.

Zu den Daten

 

Forschende des INF-Projekts haben einen Datensatz mit dialogischen Erklärungen erstellt, um NLP-Forschung an Erklärungen voranzutreiben und KI-Systemen das Imitieren dieses Prozesses beizubringen. Das Korpus umfasst 65 transkribierte englischsprachige Dialoge mit 1.550 manuell annotierten Gesprächsbeiträgen aus der Wired-Videoserie „5 Levels“, in der 13 Themen fünf Explainees mit unterschiedlichem Wissensstand erklärt werden.

Mehr Informationen im Forschungsartikel

Zu den Daten
 

Datensatz mit Metaphern zum Erklären und Verstehen, erstellt und erläutert von ca. 300 Teilnehmer*innen. Daten in Deutsch und Englisch. Verbmetaphern und nominalisierte Verbmetaphern sind kodiert. Zur Identifizierung der Metaphern wurde MIPVU (Steen et al., 2010) verwendet. 

Der Datensatz ist Teil einer laufenden Untersuchung zur Funktion und Verwendung von Metaphern in Erklärungen. Der Datensatz enthält Transkripte von 24 Videos der Reihe „5 Levels” von Wired. In diesen Videos erklärt ein*e Expert*in Menschen mit fünf verschiedenen Kenntnisständen ein abstraktes und komplexes Konzept. Die Metaphern in diesen Dialogen sind kodiert.

Entscheidungen von Künstlicher Intelligenz basieren nicht nur auf einem Merkmal, sondern auf vielen verschiedenen. Oft stehen diese Merkmale auch in Wechselwirkung miteinander. Um diese Wechselwirkungen besser verstehen zu können, haben Forscher*innen des Teilprojekts C03 das OpenSource-Tool shapiq entwickelt. Es ermöglicht die effiziente Berechnung der Merkmale sowie die Visualisierung der Interaktionen.

Weitere Informationen im GitHub-Repository.

Diese Software wurde im Projekt A05 entwickelt. Der Schwerpunkt des Systems liegt darin, die Arbeit in interdisziplinären Teams zu unterstützen und auch Nicht-Informatiker*innen in die Lage zu versetzen, adaptive Scaffolding-Strategien für Roboter in der Mensch-Roboter-Interaktion zu erstellen, zu diskutieren und zu generieren.

Weitere Informationen: MAS / Projects / SFB TRR318 / A05 / SHIFT · GitLab

Zur Software

Das Wiki enthält ein Glossar mit Begriffen aus dem Bereich der erklärbaren KI, die in den Teilprojekten des TRR 318 verwendet werden. Die Mitglieder des Teilprojekts INF haben das Wiki entwickelt und bauen es kontinuierlich aus.

Link: Das TRR-Wiki

Der OSF (Open Science) Bereich des Projekts A01 enthält eine Vielzahl von Kodierschemata und Instrumenten.

Um den Einfluss von Stress auf soziale Signale im Zusammenhang mit Verständnis und Verwirrung zu untersuchen, hat das Projekt A06 eine Studie konzipiert und vorab registriert, um diese Signale zwischen zwei Brettspiel-Erklärungsszenarien, einem unter Stress und einem ohne Stress, aufzuzeichnen und zu vergleichen. 

De­mon­s­tra­to­ren aus den Work­shops

Medusa ist eine KI, die mithilfe von neuronalen Netzen Gesichter erkennt und anschließend dem männlichen oder weiblichen Geschlecht zuordnet. Dabei können Nutzer*innen Bilder von sich selbst mittels Webcam machen oder Bilder hochladen, bspw. von prominenten Personen, um diese zu testen (Medusa Image-Checker).

Medusa - GitLab

Falcon ist eine Lernsoftware, die dabei helfen soll, Schüler*innen neuronale Netze näherzubringen. Dabei lernen Raumschiffe per Reinforcement Learning, Asteroiden auszuweichen. Die zugrunde liegenden neuronalen Netze der Agenten können dabei über die verschiedenen Generationen hinweg exploriert werden.

Falcon - GitLab

Dieses Programm zeigt den Nutzenden verschiedene Bilder von KI-generierten und nicht KI-generierten Tieren, Menschen und Landschaften. Die Nutzenden müssen sich jeweils entscheiden, ob das Bild KI-generiert ist oder nicht.

Real or Fake - GitLab

Die KI Etana basiert auf dem Prinzip der Klassifikation. Die Nutzer*innen können Zahlen von 0-9 in ein Eingabefenster zeichnen und diese werden dann durch die KI erkannt.

Etana GitLab

Die KI Demeter zeichnet sich dadurch aus, dass sie nach dem Prinzip des Reinforcement Learnings arbeitet. Die KI lernt ein Spiel zu spielen, welches dem Mobile Game Flappy Bird ähnelt. Nutzer*innen haben auch die Möglichkeit, das Spiel selbst zu spielen. Ansonsten können sie die KI spielen lassen und beobachten, wie diese dazulernt und immer besser wird.

Demeter - GitLab

Do Sci­ence Your­self! - An­lei­tun­gen & Tu­to­ri­a­ls zu wis­sen­schaft­li­chen Me­tho­den

Git ist ein kostenloses, verteiltes Versionskontrollsystem für Softwareprojekte, das in seiner ersten Version 2005 veröffentlicht wurde. Das Programm ermöglicht es mehreren Entwickler*innen, unabhängig von ihrem Aufenthaltsort gleichzeitig an einem Projekt zu arbeiten.

Die Versionskontrolle macht es einfach, Änderungen eigenständig und von überall aus dem Projekt hinzuzufügen, diese Änderungen zu protokollieren und nachzuvollziehen sowie zu einem späteren Zeitpunkt auf ältere Stände des Projekts zuzugreifen. Git ist plattformunabhängig und lässt sich somit in nahezu jeder Umgebung nutzen.

Wie Git funktioniert und wie eine sinnvolle und nachhaltige Datenspeicherung aussieht, haben die TRR-Forschenden Vivien Lohmer (A04) und Amelie Sophie Robrecht (A01) in einer Anleitung und auf einem Cheatsheet (Spickzettel) zusammengefasst (auf Englisch):

Anleitung: GitLab-Tutorial and Guidelines

Cheatsheet: How to use GitLab