2023-09-26

Digitale Daten speichern und verwalten in einem Digital-Asset-Management-System – Übersicht und Möglichkeiten des Eigenbetriebs§ 

In den letzten Monaten gab es bezüglich des möglichen Einsatzes von Digital-Asset-Management-Lösungen (DAM) Anfragen von zwei Partnern, die uns dazu bewegt haben, uns damit auseinanderzusetzen. Die gewonnenen Erkenntnisse wollen wir auf diesem Wege teilen.

Definition und wichtigste Funktionen§ 

Was aber sind eigentlich Digital-Asset-Management-Systeme? DAM-Systeme sind Softwarelösungen zur Ablage und Verwaltung von digitalen Inhalten insbesondere von Mediendateien wie Bildern, Videos, Audiodateien oder Texten.

Vielleicht hat diese Definition schon ein wenig neugierig gemacht. Vielleicht fragen Sie sich, ob ein DAM auch in Ihrem Institut von Nutzen sein könnte? Im Falle unserer Partner gab es gleich mehrere Gründe, die ein Interesse an DAM hervorgerufen haben. Folgende Aspekte sind die typischen Möglichkeiten und Vorteile von DAM-Systemen:

  • Ablegen, Beschreiben und Organisieren von Mediendateien
  • Aufbau von Kollektionen oder Sammlungen
  • Anzeigen und Sichten
  • Sicherstellen einer Durchsuchbarkeit
  • Import, Export und Konvertierung von Mediendateien
  • Anreicherung mit Metadaten
  • Sicherung und Archivierung
  • Versionierung von Inhalten
  • flexible Bereitstellung für Mitarbeitende, Externe oder für Webauftritte

Anwendungsszenarien und Einsatzgebiete§ 

Aus dieser kurzen Auflistung lassen sich schnell typische Anwendungsszenarien von DAM-Systemen ableiten. Im Rahmen der Arbeit der außeruniversitären geisteswissenschaftlichen Forschungseinrichtungen in Sachsen ist dies insbesondere der Umgang mit multimedialen Forschungsdaten. In vielen Projekten fallen im Forschungsprozess verschiedenartige Mediendateien an. Dies können unter anderem Fotoaufnahmen oder Videos von Orten, Ereignissen oder Personen sein, oder aber Interviews in Form von Audio- oder Videodateien oder Scans von Textdokumenten.

Der Anspruch der Forschenden wird in diesem Zusammenhang sein, dass sie in ihrer Arbeit an und bei der Verwendung von diesen Dateien möglichst stark von der im Institut zur Verfügung gestellten IT-Infrastruktur unterstützt werden. So können dank eines DAM-Systems die Dateien auf einheitliche Weise abgelegt werden, wobei sowohl manuelles Anlegen von Objekten als auch automatisierter Import von großen Sammlungen möglich ist. Dateien können dabei und auch nachträglich aufgrund unterschiedlicher Kriterien zu verschiedenen Kollektionen zusammengefasst werden, um die strukturierte Arbeit mit ihnen zu erleichtern. Typische Eigenschaften der Dateien lassen sich in objektart-spezifischen sogenannten Metadaten im DAM ablegen. Für ein Foto könnten dies Angaben sein wie Aufnahmedatum, Kategorisierungen, Inhalte wie vorkommende Personen oder Orte, Fotograf, Rechteinhaber und Lizenz. Das System ermöglicht dann, dank integrierter Suchfunktionalität, dass Objekte auf Basis dieser Angaben wiedergefunden werden können. Durch die Nutzendenrechteverwaltung und das Workflowmanagement kann gemeinsam und mit festen Rollen an der Eingabe, Qualitätssicherung und Verwaltung der Digitalobjekte gearbeitet werden. Auch können die Kollektionen flexibel weiterverwendet werden. Sie können für Interne oder Externe im im DAM-System zur Sichtung bereitgestellt werden.

Dank vorhandener Schnittstellen und medienspezifischer Erweiterungen ist auch eine weitergehende Verwendbarkeit gespeicherter Mediendateien sichergestellt. Beispielsweise stellt der integrierte IIIF-Image-Server Bilddateien konvertiert und skaliert in verschiedenen vorher festgelegten Dateiformaten (wie tiff oder jpg) und Bildgrößen bereit, um eine flexible Nutzung auf Webseiten oder für Social-Media-Auftritte (und weitere Maßnahmen der Öffentlichkeitsarbeit) zu gewährleisten. Die im System hinterlegten Metadaten sind Basis für eine Beschreibung bereitgestellter Inhalte.

Ein DAM ist mehr als eine Cloud§ 

Die Speicherung von Inhalten im DAM kann dabei auf einfache Weise mit anderen institutsinternen Abläufen wie einer Datensicherung und einer nötigen Archivierung verzahnt werden. Die Repositorien-Software im Kern der DAM-Systeme stellt die Datensätze in den dazu nötigen Formaten wie AIP (Archival Information Package) bereit.

Mit etwas mehr Einblick in die Möglichkeiten, die ein DAM-System bietet, wird nun eine Abgrenzung zu anderen Ansätzen der Datenhaltung möglich. Es ist deutlich, dass die Fähigkeiten einer DAM-Lösung weit über die eines (Cloud) Fileservers hinausgehen. Letzteres beherrscht in der Regel nur die reine ordnerbasierte Speicherung von Daten. Es wird keine Durchsuchbarkeit anhand von Metadaten sichergestellt und typischerweise kein über reinen Dateizugriff hinausgehende Bereitstellung von Mediendateien ermöglicht.

Weiterhin existieren Datenrepositorien. Ein DAM ist im Kern genau solch ein Repositorium, bietet aber weitergehende Möglichkeiten im Umgang mit und für die Verwendung von Mediendateien. Schließlich sei noch auf den Unterschied zu Content-Management-Systemen (CMS) hingewiesen. CMS dienen der Darstellung und Veröffentlichung von redaktionellen Inhalten auf Webseiten. Ein DAM hingegen dient dazu, (Medien-)Dateien zu erstellen, zu verwalten und nachzunutzen.

Anbieter von DAM-Systemen im Test§ 

Sollten die vorgestellten Nutzungsszenarien in ihrem Institut von Bedeutung sein und ist die aktuell vorhandene Infrastruktur weit von von diesen Möglichkeiten entfernt, könnte sich die Verwendung eines DAM-Systems anbieten. In diesem Fall gilt es zu überlegen, welches System man einsetzen will und wie es (von wem) bereitgestellt werden soll.

Für unsere Partner ging es zunächst nicht um eine der vielzähligen kommerziellen Lösungen, die gegen eine monatliche Gebühr entsprechende Dienste für Institutionen betreiben: Stattdessen standen selbst-gehostete Open Source-Lösungen im Mittelpunkt des Interesses. Insofern derartige Lösungen die eigenen Anforderungen erfüllen und der Eigenbetrieb im Haus technisch und personell gestemmt werden kann – und das ist der entscheidende Punkt an dieser Stelle – können so weitere laufende Kosten umgangen werden.

Daher haben wir uns zwei der am häufigsten eingesetzten Systeme genauer angeschaut:

Die vorgestellten Systeme haben dabei eine Vielzahl an Gemeinsamkeiten.

Beide sind oder besitzen im Kern eine Repositorien-Software. DSpace ist an sich selbst ein Repositorium, Islandora ist um die Fedora Commons Repositorien-Software herum gebaut. Die vorgestellten Lösungen eignen sich somit beide für den generellen Einsatz rund um die Speicherung, Kuration und Archivierung digitaler Objekte auch dank ihrer OAIS (Open Archival Information System)-Konformität, der Integration typischer PID-Standards, der Unterstützung von Versionierung und dem Vorhandensein von Schnittstellen wie OAI-PMH für Metadaten sowie generellem REST-basiertem Zugriff auf die gesamte Datenbasis.

Darauf aufbauend bieten beide Lösungen viele weiterführende Eigenschaften, die sich teils ähneln, teils aber auch in entscheidender Hinsicht voneinander abheben.

Zentral ist bei beiden das nutzendenfreundliche Frontend zur Dateneingabe, -verwaltung und -darstellung zu nennen. DSpace beinhaltet ein eigenes simples Angular-basiertes Frontend. Dieses deckt die wichtigsten Aufgaben rund um die Bearbeitung und Verwaltung von Daten ab. Einschränkungen gibt es beispielsweise in Bezug auf die Modellierung. Typischerweise müssen für die abzulegenden Objekttypen spezifische Metadaten-Schemata angelegt werden, welche diese Objekte beschreiben. Dies kann bei DSpace leider nicht GUI-gestützt im Frontend erfolgen, sondern durch manuelles Editieren entsprechender Konfigurationsdateien. Auch bei der Präsentation der Daten müssen Abstriche gemacht werden. Nötige Plugins für die Anzeige von Mediendateien stehen seitens des Entwicklers nur für Bilddateien bereit, weitere Medienarten können verwaltet, aber nicht im System angezeigt werden. Sollte die Präsentation also eine zentrale Rolle spielen, ist DSpace vermutlich nicht die erste Wahl (wobei dank vorhandener Schnittstellen und des IIIF-Medienservers natürlich stets eine externe Lösung zur Präsentation angebunden werden kann).

Islandora setzt als Frontend auf Drupal, eine weit verbreitete Content Management Software. Es bietet umfangreiche Funktionalität für die Arbeit mit Daten, von der Eingabe, über die Verwaltung und Modellierung bis hin zur Präsentation. Auch Plugins für alle relevanten Medienarten sind verfügbar. Großer Vorteil ist das vorhandene Drupal-Ökosystem, das mehrere Tausend Erweiterungsmodule zur Verfügung stellt, um das System den eigenen Bedürfnissen anzupassen. Das Drupal-Frontend kann darüber hinaus auch flexibel ohne Fedora mit anderem Backend betrieben werden. Die umfangreichen Möglichkeiten der Drupal-basierten Lösung gehen auf der anderen Seite natürlich mit einer höheren Komplexität des Systems einher, was beim Betrieb bedacht werden sollte.

In das jeweilige Frontend integriert ist bei beiden eine auf Apache Solr basierte Suchfunktionalität. Diese erprobte und performante Lösung erleichtert es auch bei großen Datenbeständen, die Übersicht zu behalten.

DSpace und Islandora ist gemein, dass beide eine Nutzendenrechteverwaltung im Frontend integriert haben. Zugriffsrechte können dabei auf einfache Weise über die Zuweisung zu Nutzendengruppen geregelt werden. Ergänzend zur Nutzendenverwaltung gibt es jeweils ein Workflowsystem, das die Festlegung typischer Abläufe der Datenbearbeitung auf dem Weg zur Veröffentlichung und die Vergabe von Rollen für diese Abläufe ermöglicht.

Beide Lösungen sind unter Open Source-Lizenzen (DSpace: BSD-Lizenz, Islandora: GNU GPL v2.0) verfügbar.

Der Quellcode ist dabei jeweils auf github zu finden:

An dieser Stelle noch ein kurzer Hinweis auf die Organisationen hinter beiden Systemen. Die Entwicklung von Islandora wird von der gemeinnützigen Islandora Foundation gesteuert, welche hauptsächlich von einer Gruppe nordamerikanischer Universitäten finanziert wird. DSpace wird unter der Verantwortung der Non-Profit-Organisation Lyrasis entwickelt. Beiden Organisationen kann beigetreten werden, um die weitere Entwicklung zu unterstützen und mit zu steuern. Die jährlichen Mitgliedsbeiträge liegen bei wachsendem Grad der Mitbestimmung zwischen 500$ und 20.000$.

Beide Systeme weisen eine umfangreiche Dokumentation auf. Dadurch wird es für technisch versiertes Personal ohne größere Probleme möglich, diese komplexen Systeme selbst aufzusetzen, zu konfigurieren und zu betreiben.

Ein vergleichsweise unkomplizierter Weg für die Installation und Konfiguration eines dieser DAM-Systeme ist die Nutzung von Docker-Compose. Dies ist zu empfehlen, da beide Lösungen jeweils aus mehreren Einzelkomponenten bestehen, was die Einrichtung verkompliziert. Typische Bestandteile des Setups sind dabei:

  • Frontend
  • Backend
  • Datenbank
  • Suchfunktionalität (Solr)
  • IIIF-Server (Bild- bzw. Medienbereitstellung)

In der Standardkonfiguration von Islandora kommen noch mehrere weitere Container dazu wie Traefik und Watchtower. Außerdem kann Islandora auf einfache Weise in seiner Funktionalität um weitere vorkonfigurierte Container erweitert werden. Hervorzuheben ist hier eine Blazegraph-Instanz, welche integriert werden kann, um die Linked Data-Fähigkeiten des Systems zu erweitern. Die nötigen Docker-Compose-Dateien sind für beide Ökosysteme ebenfalls auf GitHub zu finden:

Im Fall der Dspace-Version wird ausdrücklich darauf hingewiesen, dass das Docker-Orchestrat nicht für den Einsatz in einer Produktivumgebung fertig konfiguriert ist. Jedoch muss eine Docker-Compose-Installation ohnehin an die Umgebung des Host-Systems angepasst werden (Zugänglichmachung von Ports, Einrichtung von Reverse Proxy-Servern und Firewalls, Konfiguration der Nutzendenkonten, Verteilung auf mehrere Maschinen usw.), so dass diese Aussage nicht unnötig abschrecken sollte. Ein Aufsetzen zu Testzwecken gelingt dabei mit beiden Lösungen ohne größeren Aufwand und ohne wirkliche Probleme. Davon ausgehend können mit Hilfe der Dokumentation typische Abläufe getestet und erprobt werden wie das Anlegen von Objekten, ihre Verwaltung, Organisation und Präsentation, die Suche im DAM-System, die Nutzendenverwaltung und vieles mehr.

Somit lässt sich grundlegend erproben, ob der Einsatz der jeweiligen Lösung als institutsinternes DAM in Frage kommt. Beide eignen sich generell ausdrücklich für diese Verwendung. Bezüglich der Unterschiede zwischen beiden lässt sich festhalten, dass Islandora durch ein deutlich mächtigeres und vielseitig erweiterbares Frontend besticht, das komfortable Datenverwaltung, Modellierung, Systemverwaltung und Präsentation ermöglicht. Bei Verwendung von DSpace muss man hier teilweise Abstriche machen. Außerdem bietet Islandora zusätzliche Komponenten, um das System mit geringem Aufwand um Funktionalität wie LOD-Unterstützung zu erweitern. Damit einher geht eine nicht zu vernachlässigende Erhöhung der Komplexität des Frontends und des zu pflegenden Gesamtsystems. Dies steigert entsprechend den Einrichtungs- und Wartungsaufwand.

Zusammenfassung§ 

Unabhängig davon muss aber die generelle Entscheidung getroffen werden, ob ein Eigenbetrieb überhaupt möglich und gewünscht ist. Schließlich bindet dies knappe Ressourcen des IT-Personals und so kann, je nach Situation im Haus, auch der Einkauf einer entsprechenden Dienstleistung rund um ein kommerziell entwickeltes und professionell gehostetes DAM die passendere Option sein.

Die folgenden Anhaltspunkte können hoffentlich bei dieser Entscheidung helfen.

Eigenhosting

  • Open Source-Lösungen
  • Große Anwendenden-Communities
  • Volle Kontrolle über eigene Daten
  • Kostenersparnis
  • Systeme anpassbar/flexibel
  • Offene Schnittstellen für Daten-Zugriff, -Export
  • Personelle und technische Ressourcen nötig
  • Hohe Verantwortung für Daten(sicherheit)

Dienstleistung

  • Professionelle Betreuung
  • Keine dauerhaften personellen oder technischen Ressourcen nötig
  • Datensicherheit und Verfügbarkeit gewährleistet
  • Monatliche Kosten
  • I.d.R. geschlossene Systeme
  • Daten i.d.R. außer Haus
  • Anpassungen nicht möglich oder teuer
  • Generelle Abhängigkeit von einem Dienstleister

Wir hoffen, dass sich unsere kurze Abhandlung zu DAM-Systemen für unsere Partner als nützlich erweisen wird, insbesondere bei Überlegungen zur Notwendigkeit eines DAM-Systems oder zu dessen Umsetzung. Kommen sie gerne auf uns zu, wenn ihrerseits Diskussionsbedarf zu diesem Thema besteht.

Weiterhin haben wir Erfahrungen im praktischen Umgang mit den beschriebenen Systemen gesammelt (insbesondere bezüglich Installation, Konfiguration und zentraler Funktionalität). Gerne stehen wir auch diesbezüglich für einen Austausch zur Verfügung.

Sollte Bedarf oder Interesse an einem Workshop oder Hands-on zu Islandora und/oder DSpace bestehen, so teilen sie uns dies bitte mit. Gerne können wir das bei unseren zukünftigen Planungen berücksichtigen.