OpenScience

Open Science - Wissenschaft gemeinsam gestalten

Bei der „Offenen Wissenschaft“ (englisch: Open Science) machen Wissenschaftler*innen ihre Forschungsprozesse öffentlich zugänglich. Sie geben Einblicke in ihre Arbeitsschritte und teilen ihre Forschungsdaten. Auf diese Weise können auch Wissenschaftler*innen und Expert*innen außerhalb der Forschungseinrichtung die Projekte und Prozesse nachvollziehen und gegebenenfalls gemeinsam weiterentwickeln.

„Wir erhöhen die Qualität unserer Forschung, wenn wir diese transparent machen“, sagt Professorin Dr. Katharina Rohlfing, Sprecherin des TRR 318. „Innerhalb des Transregios arbeiten wir bereits disziplinenübergreifend: Die Forschenden kommen aus verschiedenen wissenschaftlichen Feldern zusammen, tauschen sich aus und ergänzen so ihr Wissen gegenseitg. Mit Open Science suchen wir genau diese Art von Austausch auch mit Expert*innen außerhalb des Projekts.“

Ressourcen

Annotationen: MUNDEX Korpus (A02)

Diese Datenveröffentlichung enthält die Annotationen von MUNDEX (MUltimodal UNderstanding of EXplanations), einem multimodalen Korpus zur Untersuchung des Verständnisses von Erklärungen, das im Rahmen des Projekts A02 erstellt wurde.

Code Repositories: Projekt C02

Dieses Projekt stellt mehrere Code-Repositories für verschiedene C02-Veröffentlichungen bereit.

Zum GitHub

Datensatz: Positionen im Fußball

Dies ist ein Datensatz für die Mehrklassenklassifizierung, der darauf abzielt, die Positionen der Spieler anhand verschiedener Merkmale wie Größe, Schüsse pro Spiel, Spielminuten pro Spiel und anderer Faktoren vorherzusagen.

Kodierschema A01: ADEX

Das linguistische ADEX-Kodierschema (auf Englisch) dient der Annotation von Äußerungen, die Gesprächspartner*innen beim Erklären eines Spiels verwenden. Es erfasst sowohl die sprachliche Form als auch die inhaltliche Klassifikation dieser Äußerungen. Entwickelt wurde das Kodierschema von Josephine Fisher, Forscherin im Projekt A01 Adaptives Erklären.

Download

Weitere Kodierschemata und Instrumente des Projekts sind auf OSF verfügbar: osf.io/daqv9

Korpus: Erklärungen in Dialogen

Forschende des INF-Projekts haben einen Datensatz mit dialogischen Erklärungen erstellt, um NLP-Forschung an Erklärungen voranzutreiben und KI-Systemen das Imitieren dieses Prozesses beizubringen. Das Korpus umfasst 65 transkribierte englischsprachige Dialoge mit 1.550 manuell annotierten Gesprächsbeiträgen aus der Wired-Videoserie „5 Levels“, in der 13 Themen fünf Explainees mit unterschiedlichem Wissensstand erklärt werden.

Mehr Informationen im Forschungsartikel

Zu den Daten

Korpus: Erklärinteraktionen Zwischen Menschen und LLMs

Um zu untersuchen, wie gut aktuelle Sprachmodelle (LLMs) ko-konstruktive Erklärdialoge führen können, haben Forschende des INF-Projekts einen Datensatz erstellt. Er umfasst Erklärinteraktionen zwischen Menschen und LLMs sowie Vor- und Nachbefragungen zum Verständnis der Nutzer*innen. Die Daten wurden analysiert und in einem Forschungsartikel veröffentlicht.

Zu den Daten

Korpus: Ein Kommentiertes Korpus von Hervorgerufenen Metaphern zum Erklären und Verstehen unter Verwendung von MIPVU

Datensatz mit Metaphern zum Erklären und Verstehen, erstellt und erläutert von ca. 300 Teilnehmer*innen. Daten in Deutsch und Englisch. Verbmetaphern und nominalisierte Verbmetaphern sind kodiert. Zur Identifizierung der Metaphern wurde MIPVU (Steen et al., 2010) verwendet.

Korpus: Metaphern in 24 WIRED Level 5-Videos

Der Datensatz ist Teil einer laufenden Untersuchung zur Funktion und Verwendung von Metaphern in Erklärungen. Der Datensatz enthält Transkripte von 24 Videos der Reihe „5 Levels” von Wired. In diesen Videos erklärt ein*e Expert*in Menschen mit fünf verschiedenen Kenntnisständen ein abstraktes und komplexes Konzept. Die Metaphern in diesen Dialogen sind kodiert.

Korpus: Metaphorische Natürliche Sprachinferenz und Erklärungen

Dieses Korpus ist eine Erweiterung des bestehenden FLUTE-Datensatzes um Quell- und Zielbereiche. Ursprünglich für figurative natürliche Sprachinferenzaufgaben entwickelt, sollen die bereits vorhandenen Erklärungen und die hinzugefügten Quell- und Zielbereiche dazu dienen, die Informationen der Bereiche in nachgelagerten NLI-Aufgaben zu nutzen.

Korpus: Verwendung von Metaphern in Politischen Erklärungen zu Ideologien

Dieses Korpus ist eine Annotation von 300 Leitartikeln aus der New York Times mit den jeweiligen Metaphern und den zugehörigen Quell- und Zielbereichen. Die Metaphern und Bereiche stehen in einem signifikanten Zusammenhang mit der Überzeugungskraft der Haltung des Lesers zu dem behandelten Thema und veranschaulichen, wie Metaphern und ihre Bereiche in der alltäglichen Erklärungssprache verwendet werden.

Scales Manual: Fragebogen (A01)

Der kurze Fragebogen wurde im Projekt A01 entwickelt. Er erfasst das ko-konstruktive Verhalten von Erklärenden – so, wie es sowohl von den Erklärenden selbst als auch von den Personen, denen etwas erklärt wird, berichtet wird.

Scales Manual: WP 2.1 (A01)

Skala zur Bewertung der Partnermodell-Dimensionen von Erklärenden und Erklärten.

Scales Manual: WP 2.2 (A01)

Skala zur Bewertung der Partnermodell-Dimensionen von Erklärenden und Erklärten.

Software: shapiq - Komplexe KI-Merkmale Verständlich Machen

Entscheidungen von Künstlicher Intelligenz basieren nicht nur auf einem Merkmal, sondern auf vielen verschiedenen. Oft stehen diese Merkmale auch in Wechselwirkung miteinander. Um diese Wechselwirkungen besser verstehen zu können, haben Forscher*innen des Teilprojekts C03 das OpenSource-Tool shapiq entwickelt. Es ermöglicht die effiziente Berechnung der Merkmale sowie die Visualisierung der Interaktionen.

Weitere Informationen im GitHub-Repository.

Software: SHIFT - Adaptives Scaffolding in der Robotergestützten Erklärungsentwicklung

Diese Software wurde im Projekt A05 entwickelt. Der Schwerpunkt des Systems liegt darin, die Arbeit in interdisziplinären Teams zu unterstützen und auch Nicht-Informatiker*innen in die Lage zu versetzen, adaptive Scaffolding-Strategien für Roboter in der Mensch-Roboter-Interaktion zu erstellen, zu diskutieren und zu generieren.

Weitere Informationen: MAS / Projects / SFB TRR318 / A05 / SHIFT · GitLab

Zur Software

Studienparadigma A06: Soziale Signale in Erklärungen unter Stress

Um den Einfluss von Stress auf soziale Signale im Zusammenhang mit Verständnis und Verwirrung zu untersuchen, hat das Projekt A06 eine Studie konzipiert und vorab registriert. In der Studie werden Signale zwischen zwei Brettspiel-Erklärungsszenarien, einem unter Stress und einem ohne Stress, aufgezeichnet und verglichen.

TRR-Wiki: Explainability Erklärt

Das Wiki enthält ein Glossar mit Begriffen aus dem Bereich der erklärbaren KI, die in den Teilprojekten des TRR 318 verwendet werden. Die Mitglieder des Teilprojekts INF haben das Wiki entwickelt und bauen es kontinuierlich aus.

Link: Das TRR-Wiki

Demonstratoren aus den Workshops

Medusa

Medusa ist eine KI, die mithilfe von neuronalen Netzen Gesichter erkennt und anschließend dem männlichen oder weiblichen Geschlecht zuordnet. Dabei können Nutzer*innen Bilder von sich selbst mittels Webcam machen oder Bilder hochladen, bspw. von prominenten Personen, um diese zu testen (Medusa Image-Checker).

Medusa - GitLab

Falcon

Falcon ist eine Lernsoftware, die dabei helfen soll, Schüler*innen neuronale Netze näherzubringen. Dabei lernen Raumschiffe per Reinforcement Learning, Asteroiden auszuweichen. Die zugrunde liegenden neuronalen Netze der Agenten können dabei über die verschiedenen Generationen hinweg exploriert werden.

Falcon - GitLab

Real or Fake

Dieses Programm zeigt den Nutzenden verschiedene Bilder von KI-generierten und nicht KI-generierten Tieren, Menschen und Landschaften. Die Nutzenden müssen sich jeweils entscheiden, ob das Bild KI-generiert ist oder nicht.

Real or Fake - GitLab

Etana

Die KI Etana basiert auf dem Prinzip der Klassifikation. Die Nutzer*innen können Zahlen von 0-9 in ein Eingabefenster zeichnen und diese werden dann durch die KI erkannt.

Etana GitLab

Demeter

Die KI Demeter zeichnet sich dadurch aus, dass sie nach dem Prinzip des Reinforcement Learnings arbeitet. Die KI lernt ein Spiel zu spielen, welches dem Mobile Game Flappy Bird ähnelt. Nutzer*innen haben auch die Möglichkeit, das Spiel selbst zu spielen. Ansonsten können sie die KI spielen lassen und beobachten, wie diese dazulernt und immer besser wird.

Demeter - GitLab

Artemis Simulation

Artemis-Simulation - GitLab

Do Science Yourself! - Anleitungen & Tutorials zu wissenschaftlichen Methoden

Versionskontrolle und gemeinsames Arbeiten an Projekten mit dem Tool "Git"

Git ist ein kostenloses, verteiltes Versionskontrollsystem für Softwareprojekte, das in seiner ersten Version 2005 veröffentlicht wurde. Das Programm ermöglicht es mehreren Entwickler*innen, unabhängig von ihrem Aufenthaltsort gleichzeitig an einem Projekt zu arbeiten.

Die Versionskontrolle macht es einfach, Änderungen eigenständig und von überall aus dem Projekt hinzuzufügen, diese Änderungen zu protokollieren und nachzuvollziehen sowie zu einem späteren Zeitpunkt auf ältere Stände des Projekts zuzugreifen. Git ist plattformunabhängig und lässt sich somit in nahezu jeder Umgebung nutzen.

Wie Git funktioniert und wie eine sinnvolle und nachhaltige Datenspeicherung aussieht, haben die TRR-Forschenden Vivien Lohmer (A04) und Amelie Sophie Robrecht (A01) in einer Anleitung und auf einem Cheatsheet (Spickzettel) zusammengefasst (auf Englisch):

Anleitung: GitLab-Tutorial and Guidelines

Cheatsheet: How to use GitLab