Biases in Forschungsdaten: Ein Rückblick auf den DIKUSA-Workshop§

Am 28. April 2025 fand in der SAW Leipzig ein Workshop des Projekts „DIKUSA“ zum Thema „Biases in Forschungsdaten“ statt. Der Workshop, war eine wichtige Reflexion des Projekts und zielte darauf ab, ein Bewusstsein für Verzerrungen in Forschungsdaten zu schaffen und Strategien für den Umgang damit zu entwickeln. Dieser Blogbeitrag fasst Mitschriften und Erkenntnisse aus diesem anregenden Tag zusammen.

Der Ausgangspunkt: Biases erkennen und thematisieren§

Die Mitarbeitenden von „DIKUSA“ erkannten auf der Präsentation der Halbzeitbilanz im April 2024 die Notwendigkeit, sich intensiv mit dem Thema der Biases auseinanderzusetzen – sowohl im Hinblick auf die eigene Forschung als auch im Kontext der Erstellung von Publikationen und Visualisierungen. Biases in der Forschung können auf verschiedenen Ebenen bestehen: bei der Themenwahl, der Auswahl von Quellen und Entitäten, aber auch bei der Präsentation von Ergebnissen. Der Workshop sollte dazu dienen, diese Mechanismen zu verstehen und Wege zu finden, sie zu reflektieren und zu thematisieren.

Dr. Sabine Imeri: Ein inspirierender Input§

Als Expertin konnten wir Dr. Sabine Imeri (Fachinformationsdienst Sozial- und Kulturanthropologie, HU Berlin) gewinnen. Ihr Vortrag war der Kern des Workshops und bot eine Fülle an Denkanstößen. Ein zentraler Punkt war die Erkenntnis, dass Biases nicht als rein technisches Problem betrachtet werden dürfen. Vielmehr geht es darum, theoretische und methodologische Perspektiven in die Entwicklung von Infrastrukturen und Standards einzubinden. Sabine Imeri betonte die Bedeutung von Normdaten (GND) und Thesauri, insbesondere im Umgang mit kolonialen Kontexten, wies aber gleichzeitig auf die Problematik der Eindeutigkeit und der notwendigen ergänzenden Erklärungen hin. Sie hob die Rolle von Forschungsinformationsdiensten (FIDs) hervor, die beispielsweise Retrodigitalisierung betreiben, und dadurch mit problematischer Sprache und Bildern aus dem 19. und 20. Jahrhundert konfrontiert sind – Aspekte, die Gedächtniseinrichtungen aller Art betreffen.

Wichtige Konzepte und Debatten§

Der Vortrag beleuchtete eine Reihe wichtiger Konzepte und Debatten:

FAIR-Prinzipien: Während FAIR (Findable, Accessible, Interoperable, Reusable) die Auffindbarkeit und Zugänglichkeit von Daten betont, wird konstatiert, dass sie Machtverhältnisse und ethische Fragen oft vernachlässigen.
CARE-Prinzipien: Diese Prinzipien, entwickelt von GIDA und RDA, zielen auf die Datensouveränität indigener Völker und Communities ab und berücksichtigen Machtverhältnisse. Sie können jedoch im Widerspruch zu Konzepten von „offener Wissenschaft“ stehen.
Local Context Ecosystem: Traditional Knowledge (TK) Labels, die Informationen über die ethische Verwendung von Daten bereitstellen.
"All data are local" / "Data Feminism": Diese Publikationen liefern wichtige Beiträge zur Debatte über die ethischen und politischen Implikationen von Daten.
Toolkritik: Algorithmen und digitale Tools sind nicht neutral, sondern können bestehende Biases verstärken.
Archivischer Bias: Die Entscheidung, was gesammelt und erschlossen wird, ist immer subjektiv und beeinflusst die Forschung.
Sprachlicher Bias: Sprache ist nicht neutral und kann bestehende Vorurteile widerspiegeln.

Konkrete Beispiele und Lösungsansätze§

Sabine Imeri präsentierte eine Reihe von Beispielen, wie mit Biases umgegangen werden kann:

REM Mannheim: Maschinenlesbare Stoppzeichen in digitalen Sammlungen.
SKD: Zunächst Filterung von problematischen Inhalten durch Sterne ****, Einblendung von Informationen bei Klick
Grassi Leipzig: Portraitfotos aus Südpazifik: Nachfahren von gefragt, ob eine Veröffentlichung in Ordnung ist
DDB: Portal zu Sammlungsgut aus kolonialen Kontexten mit der Möglichkeit zur Beteiligung der Community.
Haus der Wannseekonferenz: Einbettung von Informationen in Fotoalben, um „stumme Zeugnisse“ zu kontextualisieren.

Diskussion und projektbezogene Fragen§

Im zweiten Teil des Workshops wurden dezidierte Fragen aus dem DIKUSA-Projekt diskutiert. Hier der Fragenkatalog:

Welche Chancen siehst Du allgemein in Bezug auf Digitalisierung und Forschungsmethoden der Digital Humanities in Deinem Arbeitsbereich? Und welche Risiken?
Gibt es Aspekte Deines im Rahmen von DIKUSA bearbeiteten Materials, die Du für problematisch hältst? Aus welchem Grund (z.B. Provenienz, Quellenauswahl, sensible persönliche Daten)? Wie bist Du damit verfahren?
Denkst Du, dass durch die Digitalisierung Deines Materials und die Forschungsmethoden der Digital Humanities inhärente Strukturen eine andere Gewichtung erfahren können als zuvor? Hast Du dafür Beispiele? Wie wertest Du diese?
Siehst Du Möglichkeiten, Ambivalenzen und problematische Aspekte für die Nutzer:innen Deines Materials transparent zu machen? Wie könnte das adressiert werden?

Die Diskussion verdeutlichte die Komplexität des Themas und die Notwendigkeit, Entscheidungen bei der Datenmodellierung zu dokumentieren, um den Eindruck von Neutralität zu vermeiden.

Fazit: Bias als dynamischer Prozess§

Der Workshop hat gezeigt, dass Bias kein feststehendes Konzept ist, sondern ein dynamischer Prozess, der ständig reflektiert und neu verhandelt werden muss. Zentrale Instrumente dafür sind Quellenkritik, Kontextualisierung, Multidimensionalität und die Reflexion der eigenen Positionen als Forschende. Die Erkenntnisse aus dem Workshop halfen dabei, die eigenen Forschungspraktiken zu verbessern und sicherzustellen, dass die Ergebnisse transparent und verantwortungsvoll präsentiert und publiziert werden. Der Workshop war ein wichtiger Schritt auf dem Weg zu einer kritischeren und reflektierteren Auseinandersetzung mit Forschungsdaten.

Im Sinne des Wissenstransfers sind auf Nachfrage beim KompetenzwerkD die Folien der Vorträge und ein Protokoll erhältlich. Kontaktieren Sie uns gerne unter KompetenzwerkD@saw-leipzig.de.