2026-05-07

Bericht: Workshop “Der Gender-Data-Gap in der geisteswissenschaftlichen Forschung – Geschlechterrepräsentanz und Geschlechterrollen in digitalen Daten”§ 

Am 9. April 2025 fand an der Sächsischen Akademie der Wissenschaften unter der Leitung des KompetenzwerkD der Workshop „Der Gender Data Gap in der geisteswissenschaftlichen Forschung – Geschlechterrepräsentanz und Geschlechterrollen in digitalen Daten“ statt. Mit „Gender Data Gap“ wird die Unterrepräsentation von Frauen und marginalisierten Gruppen in digitalen Daten bezeichnet. Dieses Phänomen tritt auch in der geisteswissenschaftlichen Forschung auf, häufig bedingt durch die begrenzte Verfügbarkeit geeigneter Quellen. Infolgedessen können bestehende Ungleichverhältnisse durch digitale Forschung weiter reproduziert werden.

Ziel des Workshops war es, lokale Forschungsprojekte mit digitalen Komponenten unter diesem Aspekt zu analysieren, auf die Problematik aufmerksam zu machen, Erfahrungen auszutauschen sowie effektive Strategien und Lösungsansätze zu deren Bewältigung zu entwickeln. Thematische Schwerpunkte umfassten Projektdesign, Quellenlage, Datenmodellierung, User Interfaces und Forschungspraktiken.

Den Auftakt bildete eine Einführung in das Thema durch Dr. Frederike Neuber (Berlin-Brandenburgische Akademie der Wissenschaften, BBAW). In Anlehnung an Caroline Criado Perez, beschrieb Neuber die Geschichte als eine „einzige Datenlücke“. Dies betrifft nicht nur Frauen, sondern steht auch im Zusammenhang mit anderen Kategorien von Benachteiligung. Ein eindrückliches Beispiel für die strukturelle Benachteiligung von Frauen in der geisteswissenschaftlichen Forschung lieferte Neuber mit einer Untersuchung personenbezogener Editionsvorhaben an den deutschen Akademien: Von insgesamt 87 Vorhaben sind 85 einem Mann gewidmet und zwei einem Mann-Frau-Paar; kein einziges Editionsvorhaben ist ausschließlich einer Frau gewidmet. Als Gründe hierfür nannte sie unter anderem den Gender Gap in der Mitgliedschaft der Akademien, sprich die männlich geprägte Strukturen, eine geringe Sensibilisierung für die Problematik sowie die Ausrichtung der Programmlinie, die bereits gut erschlossene Quellenbestände voraussetzt, welche bei Frauen häufig weniger etabliert sind. Um diesen Problemen entgegenzuwirken, setzt die BBAW auf vier Maßnahmen: Öffentlichkeitsarbeit und Bewusstseinsbildung in Form von Workshops und Tagungen, die Entwicklung von Leitlinien und Arbeitsmitteln sowie das Anregen von wissenschaftspolitischen Maßnahmen.

Im Anschluss an diesen Vortrag betrachteten Peter Mühleder, Franziska Naether und Uwe Kretschmer verschiedene konkrete Projekte an außeruniversitären sächsischen Forschungseinrichtungen unter dem Aspekt des Gender Data Gap.

Als Beispiel für den Gender Gap in Forschungsdaten stellte Mühleder das Projekt „Widerstand, Opposition und Kirche in der DDR“ vor. Im Zentrum des Projekts steht eine Datenbank, die rund 2200 Personen sowie 730 kirchliche und nichtkirchliche Oppositionsbewegungen umfasst. Diese Datenbank basiert auf Wiki-Biogrammen, die von der Arbeitsstelle „Kirchliche Praxis in der DDR“ erfasst wurden. Geschlecht wurde in den Biogrammen nicht explizit erfasst und fehlte daher auch bei der Übertragung in die Datenbank. Um zumindest grundlegende Abfragen nach Genderaspekten zu ermöglichen, wurde entschieden, eine automatische Zuordnung auf Basis der Personennamen vorzunehmen. Um diesen Schritt jedoch möglichst transparent zu gestalten, wurde bei jedem Gendereintrag der verwendete Workflow (einschließlich des verwendeten Codes) als Provenienzangabe hinterlegt. Die Ergebnisse zeigen, dass auch in dieser Datenbank ein deutlicher Gender Gap existiert: Nur etwa 10 % der Personen wurden als weiblich erkannt, zudem ist die durchschnittliche Anzahl erfasster Informationen bei Frauen geringer als bei Männern.

Uwe Kretschmer skizzierte anschließend Strategien zur Datenmodellierung historischer Daten, die auch für einen differenzierteren Umgang mit Genderdaten genutzt werden können. Er beschrieb unter anderem ein Modell, das historische Fakten als aushandelbar versteht: Daten können durch Quellen belegt und ebenso falsifiziert werden, sodass auch widersprüchliche Angaben dokumentiert werden können. Ein Nachteil dieses differenzierten Ansatzes besteht jedoch im hohen Erfassungsaufwand sowie in der Notwendigkeit, entsprechend komplexe User Interfaces zu entwickeln, was insbesondere für kleinere geisteswissenschaftliche Projekte eine erhebliche Herausforderung darstellt. Einen anderen Ansatz verfolgt correspSearch mit dem CMIF-Datenformat. Hier ist Geschlecht nicht explizit in den Editionsmetadaten enthalten, kann jedoch über Normdaten-Identifikatoren angereichert werden. Dabei ist zu berücksichtigen, dass Normdaten im Hinblick auf Gender häufig nur vereinfachte und nicht ausreichend belegte Informationen liefern. Zudem zeigte eine genauere Betrachtung der von correspSearch bereitgestellten Abfrage- und Visualisierungsmöglichkeiten Grenzen bei der Auswertung nach Geschlecht, etwa bei der Frage, wie viele weibliche und männliche Personen in den Editionen vorkommen.

Zum Abschluss des ersten Teils des Workshops beschäftigte sich Franziska Naether mit dem Gender Gap in öffentlichen Wissensressourcen anhand von zwei Projekten des ISGV. Die Sächsische Biografie (SäBi) ist eine Sammlung von Biogrammen zu „Frauen und Männern aus den Bereichen Wissenschaft und Kunst, Politik und Verwaltung, Wirtschaft und Technik, Handel und Verkehr, Schule, Kirche und soziales Leben“ aus Sachsen. Auch hier zeigt sich ein deutlicher Bias: Von 1770 Artikeln befassen sich lediglich 169 mit Frauen. Auf der Startseite der Onlineplattform werden jedoch bewusst sowohl weibliche als auch männliche Biografien hervorgehoben. Durch diese Entscheidung wird zumindest teilweise verhindert, dass die aufgrund der Datenlage entstandene Ungleichheit Frauen weiter unsichtbar macht. Ein weiteres Beispiel bildete eine Portalseite zu historischen Reiseberichten. Auch hier zeigt sich ein starkes Ungleichgewicht: 194 der Autoren konnten als männlich identifiziert werden, lediglich acht als weiblich. Dieses Ungleichgewicht ist im Portal jedoch nicht unmittelbar ersichtlich, da die Möglichkeit fehlt, Autor:innen nach Geschlecht zu filtern.

Nach einem gemeinsamen Mittagessen wurde den Teilnehmenden im zweiten Teil des Workshops die Möglichkeit gegeben, über ihre eigenen Projekte zu berichten und sich untereinander auszutauschen:

  • Dr. Ute Tischer untersuchte das Akademievorhaben „Johann Christoph und Luise Adelgunde Victorie Gottsched: Briefwechsel. Ein Korrespondenznetzwerk im Zeitalter der Aufklärung. Historisch-kritische Ausgabe“ unter Genderaspekten. Dieses Projekt ist eines der zwei personenbezogenen Editionsprojekten, die nicht nur ienem Mann gewidmet sind.
  • Judith Pieper (FU Berlin) präsentierte ihr Projekt “Politisches Theater und Straßenpolitik um 1968”. In den Quellen identifizierte sie einen deutlichen Data Gap: Als primäre Quellen dienen Zeitzeug:innen, jedoch ist es schwierig, insbesondere Zeitzeuginnen zu finden bzw. zu erreichen.
  • Prof. Dorothee Alfermann stellte ein Forschungsprojekt zum BMBF-PRojekt „Doktorandinnen in der IT“ vor. Alfermann stellt dabei fest, dass es Datenlücken auch über die längsschnittliche Entwicklugn von Frauen in der Wissenschaft gibt, wodurch es auch schwierig ist Antworten auf strukturelle Fragen in Bezug auf Gleichstellung im Wissenschaftsbreich (z.B. Warum verschwinden so viele frauen nach der Promotion?) zu geben.

Die Diskussionen nach den Beiträgen und in der Abschlussrunde wurden zu Aspekten der Forschung (wo sind Quellen ungenutzt vs. wo muss man mit fehlenden Quellenbeständen arbeiten und Geschlechteranteile mitdenken ohne Belege), der Wissenschaftspolitik (strukturelle Aspekte, Fächerkanones) und technischen Machbarkeit (Datenmodellierung) geführt. Es wurde offenkundig, dass gerade die Digital Humanities als Disziplin gelten, die Themen wir den Gender Data Gap benennen und angehen können und sollen, da sie sich mit Fragen der Zugänglichkeit von Quellen, diversen Publikationsformen, der digitalen Zusammenführung von oft analogen Quellen, der Differenzierung von Gender, Vernetzung von Normdaten und DH-Methoden der Analyse unterschiedliche Geschlechter besser sichtbar machen. Mit den bestehenden Gefahren, dass KI-Tools Biases und bestehende Ungleichheiten repräsentieren können, sollte hier Fachexpertise entgegengesetzt werden. Dies zeigte auch klar der Vortrag von Frederike Neuber.

Die Teilnehmenden des Workshops, die aus Forschungseinrichtungen in Mitteldeutschland und dem Großraum Berlin kamen, nutzten die Möglichkeit der fachlichen Vernetzung. Aus dieser Veranstaltung ging auch ein weiterer Workshop hervor, der im Februar 2026 auf der Jahreskonferenz des Fachverband “Digital Humanities im deutschprachigen Raum” durchgeführt wurde.

Mehr dazu hier: Sauer, Philipp; Mühleder, Peter & Naether, Franziska (2026, Februar 20). Beyond „m/w/d“ – Queere Perspektiven auf die Modellierung geschlechtlicher Diversität und der Gender Data Gap in den Digital Humanities. DHd 2026 Nicht nur Text, nicht nur Daten (DHd2026) (DHd2026), Wien, Österreich. https://doi.org/10.5281/zenodo.18702751

Im Sinne des Wissenstransfers sind auf Nachfrage beim KompetenzwerkD die Folien der Vorträge und ein Protokoll erhältlich. Kontaktieren Sie uns gerne unter KompetenzwerkD@saw-leipzig.de.