Glossar§
AIP§
[Archival Information Package] mit Metadaten ergänzte digitale Objekte, zur langfristigen Ablage in Archiven. AIP ist ein Bestandteil des Open Archival Information Systems Reference Model.
Allea ist der Zusammenschluss aller europäischen Akademien der Wissenschaften. Das Gremium wird von der EU unterstützt und ist derzeit stark deutsch/österreichisch dominiert.
Angular§
ist ein TypeScript-basiertes Single-Page Front-End-Webapplikationsframework, welches unter einer Open Source-Lizenz steht.
Anonymisierung§
Veränderung von personen- oder sachbezogenen Daten, so dass Angaben dazu gar nicht oder nur durch unverhältnismäßigen Aufwand einer Person oder Sache zugeordnet werden können. Wichtiger Aspekt des Datenschutzes, ist Teil der guten wissenschaftlichen Praxis z. B. bei Interviews mit Zeitzeugen. Siehe auch Pseudonymisierung.
Apache Solr§
Solr ist eine Implementierung eines Suchservers basierend auf der Apache Lucene Programmbibliothek zur Volltextsuche.
API§
[Application Programming Interface] Eine Schnittstelle, welche den programmatischen Zugriff auf ein Programm/Datenbank oder Online-Dienst erlaubt.
Archivierung§
"die dauerhafte und unveränderbare Speicherung von elektronischen Dokumenten und anderen Daten" (Bundesamt für Sicherheit in der Informationstechnik) mit dem Ziel aufbewahrungspflichtige oder -würdige Daten vorzuhalten. Archivierte Forschungsdaten können den Kolleg/innen, Institutionen, Folgeprojekten und Fördergebern zur Verfügung gestellt werden. Eine Erweiterung der Archivierung ist die Langzeitdatenarchivierung, für die mindestens 10 Jahre der Sicherung gewährleistet werden müssen.
Backup§
Sicherungskopie von Daten, beispielsweise derer, die aktuell in einem Forschungsprojekt verwendet werden, mit dem Ziel der Wiederherstellung der ursprünglichen Daten im Falle eines Datenverlusts. Kann auf weiteren Computern, in einer Cloud oder auf einem externen Datenträger erfolgen und sollte regelmäßig (z. B. wöchentlich, täglich) geupdated werden - idealerweise automatisiert. In der Regel werden im Forschungsdatenmanagement vier Backups von Daten empfohlen.
Bundesministerium für Bildung und Forschung
CIDOC-CRM§
Normierte (ISO 21127:2023) und erweiterbare Ontologie zur Speicherung und zum Austausch von Informationen im Bereich des Kulturerbes.
CIS§
[Contact Image Sensor] Technologie für Bildsensoren beim Scanvorgang.
Citizen Science§
Offene Wissenschaftsform, bei dem Forschungsprojekte Mithilfe von interessierten Laien oder durch Bürger:innenbeteiligung durchgeführt werden.
CLARIAH-DE ist ein Kooperationsprojekt der Verbünde CLARIN-D und DARIAH-DE, die in diesem Rahmen zusammengeführt werden. Es ist ein Beitrag zur digitalen Forschungsinfrastruktur für die Geisteswissenschaften und weitere Disziplinen.
[Common Language Resources and Technology Infrastructure] Deutscher Teil einer Forschungsdateninfrastruktur für die text- oder sprachbasierten Geistes- und Sozialwissenschaften.
Cloud§
Über ein Rechnernetz (bzw. das Internet) zur Verfügung gestellte IT-Infrastruktur. Dabei kann es sich um Speicherplatz (Cloud Storage), Rechenleistung (Cloud Computing) oder Anwendungsdienste (Cloud Application) handeln.
CMS§
[Content Management System] Softwaresystem zur kollaborativen Erstellung, Bearbeitung und Organisation von digitalen Inhalten. Bekannte CMS-Systeme sind Wordpress, Drupal, Joomla und Typo3.
CSV§
[Comma-separated values (seltener Character-separated values)] Dateiformat zur Speicherung von Listen oder Tabellen, bei denen ein festgelegtes Zeichen zur Trennung von Datensätzen benutzt wird.
Eine gemeinsame Zertifizierung für vertrauenswürdige Forschungsdatenrepositorien des International Science Council (WDS) und des Data Seal of Approval (DSA).
Gemeinnützige Organisation, die Standard-Lizenzverträge veröffentlicht, mittels derer man Nutzungsrechte für seine Werke einräumen kann. Diese Lizenzen sind für beliebige Werke anwendbar, die unter das Urheberrecht fallen (Texte, Bilder, Filme, ...).
DAM§
[Digital-Asset-Management] Digital-Asset-Management-Systeme sind Softwarelösungen zur Ablage und Verwaltung von digitalen Inhalten insbesondere von Mediendateien wie Bildern, Videos, Audiodateien oder Texten.
[Digital Research Infrastructure for the Arts and Humanities] Deutscher Anteil einer Initiative zur Schaffung einer digitalen Forschungsinfrastruktur für die Geistes- und Kulturwissenschaften.
Art und Weise, wie eine Datei gespeichert wird und mit welcher Software sie geöffnet werden kann - in der Regel erkennbar am Suffix im Dateinamen wie ".PDF" (= Datei kann mit einem PDF-Programm angezeigt und bearbeitet werden. Zu bedenken ist, dass sich nicht alle Dateiformate für die Langzeitarchivierung von Forschungsdaten eignen. Wichtig ist es, auf nachhaltige, offene und gut dokumentierte Dateiformate, die im jeweiligen Fachbereich verbreitet sind, zu setzen und kommerzielle, nicht quelloffene Formate zu vermeiden. I.d.R. geben Fachverbände oder die NFDI-Konsortien Empfehlungen, welche Dateiformate empfehlenswert sind oder von welchen proprietären Formaten abzuraten ist.
Datenbankschutzrecht§
Die methodische und systematische Zusammenstellung von Daten kann geschützt sein - das sieht das Datenbankschutzrecht vor, und zwar bis zu 15 Jahre. Dies ist getrennt vom Urheberrecht zu sehen.
Datenkuration§
verschiedenartige Aktivitäten, die nötig sind, um Forschungsdaten langfristig zu pflegen und ihre Qualität zu erhalten. Die Kuration hat in erster Linie eine mögliche Wiederverwendung, Nachnutzung bzw. Erhaltung von Daten zum Ziel und soll beispielsweise eine Auffindbarkeit und Abrufbarkeit der Daten gewährleisten.
Datenmanagementplan§
strukturiert den Umgang mit Forschungsdaten eines wissenschaftlichen Projekts und legt dabei unter anderem fest, welche Forschungsdaten wann, wie, wo, durch wen erhoben, gesichert, gespeichert und archiviert werden.
Datenmodell§
Modell das dazu dient, die Struktur der in einem System zu verarbeitenden und zu speichernden Daten (und ihre Beziehungen zueinander) festzulegen.
Datenschutz§
Unter Datenschutz versteht man allgemein den Schutz vor missbräuchlicher Verarbeitung von Daten durch technische und organisatorische Maßnahmen. Darunter fallen unter anderem der Schutz der Privatsphäre, der Schutz des Rechts auf informationelle Selbstbestimmung und der Schutz von Persönlichkeitsrechten.
Datensicherheit§
bezieht sich auf Eigenschaften von Systemen, die Daten halten oder verarbeiten. Maßnahmen der Datensicherheit sollen Vertraulichkeit, Verfügbarkeit und Integrität von Daten sicherstellen und somit wirtschaftliche Schäden und andere Riskien minimieren.
Deutsche Forschungsgemeinschaft
Dubnow Institut - Leibniz-Institut für jüdische Geschichte und Kultur – Simon Dubnow e.V., Leipzig
Das Digital Curation Center ist ein international anerkanntes Kompetenzzentrum für digitale Kuration mit dem Schwerpunkt auf dem Aufbau von Fähigkeiten und Fertigkeiten für das Management von Forschungsdaten.
DMP§
siehe Datenmanagementplan
Deutsche Nationalbibliothek, wo u. a. die Gemeinsame Normdaten (GND) gehostet wird.
[Documentation of Endangered Languages] Portal zur Erforschung von bedrohten Sprachen.
Docker§
Freie Virtualisierungssoftware zur Bereitstellung von Anwendungen. Dabei werden alle für eine Anwendung benötigten Pakete und Abhängigkeiten in "Container" verpackt, welche dann auf einfachem Wege über die Docker-Software gestartet und verwaltet werden können.
[Digital Object Identifier] Gebräuchlicher eindeutiger und dauerhafter digitaler Identifikator (Persistent Identifier) für beliebige physische, digitale oder abstrakte Objekte. Das DOI-System wird von der International DOI Foundation betrieben.
DSGVO§
[Datenschutz-Grundverordnung] Verordnung der Europäischen Union, mit der die Regeln zur Verarbeitung personenbezogener Daten EU-weit vereinheitlicht werden.
Ein verbreitetes Metadaten-Schema, das aufbauend auf ein kleines Vokabular zur Beschreibung von digitalen sowie physischen Ressourcen genutzt werden kann.
Embargo§
Durch ein (meist zeitlich beschränktes) Embargo kann verhindert werden, dass bestimmte Daten in einem festgelegten Zeitraum eingesehen werden können, z. B. Primärdaten zu einem Forschungsprojekt o. ä.
[European Open Science Cloud] Initiative der Europäischen Kommission zur Entwicklung einer Infrastruktur, die ihren Nutzern Dienste zur Förderung von Open Science bietet. Dabei soll der Zugang zu wissenschaftlichen Daten sowie zu Plattformen und Dienstleistungen für deren Verarbeitung erleichtert werden.
[European Strategy Forum on Research Infrastructures] Multidisziplinäres Forum der Europäischen Union, welches eine Roadmap im Bereich der Forschungsdateninfrastrukturen entwickelt. Unter anderem sind CLARIN und DARIAH ESFRI-Initiativen.
Kollaborative Dateninfrastruktur für integrierte Datendienste und Ressourcen zur Unterstützung der Forschung in Europa. EUDAT bietet unter anderem Dienste in den Bereichen Hosting, Backup, Persistent Identifier und Archivierung.
Förderformat für Wissenschaftsprojekte der Europäischen Union.
Früher Sondersammelgebiete, sind FIDs heute in ausgewählten Bibliotheken eingerichtete Abteilungen, die i.d.R. den kompletten Bestand der Fachliteratur zu einem Themengebiet erwerben und bereithalten. Neben Publikationen (print und digital) betrifft dies auch Fachkenntnisse über Forschungsdatenmanagement in der jeweiligen Fachkultur und ggf. weitere Dienste wie Publikationsservices und Repositorien. Beispiele sind OstData (Osteuropaforschung), Propylaeum (Altertumswissenschaften), AMAD (mittelalterliche Geschichte), Historicum (Geschichtswissenschaft allgemein).
Facettensuche§
Bei der Facettensuche oder facettierten Suche werden die Suchergebnisse anhand einer oder mehrerer Klassifikationen eingegrenzt. In einem Bibliothekskatalog könnte dies zum Beispiel auf Basis des Erscheinungsdatums oder des Sachgebiets erfolgen. Die Facetten nutzen zur Filterung die Metadaten der Einträge. In modernen Wissensbasen können damit aus großen Datenmengen gezielt einzelne Datensets ermittelt werden, so dass eine elaborierte Sucheeingabe selbst Teil der Forschungsdaten werden kann.
Die "FAIR Data Principles" stellen wichtige Grundsätze nachhaltig nachnutzbarer Forschungsdaten dar. Die Prinzipien besagen, dass Daten "Findable, Accessible, Interoperable, and Re-usable" sein sollen, also auffindbar, zugänglich, interoperabel und wiederverwendbar.
FDM§
Siehe Forschungsdatenmanagement
Forschungsdaten§
All jene Quellen, Materialien und Ergebnisse, die im Rahmen eines Forschungsvorhabens erhoben, gesammelt, ermittelt, erzeugt, beschrieben und/oder analysiert werden. Im Unterschied (oder in Ergänzung) dazu gibt es Metadaten (diese beschrieben die Forschungsdaten) und Paradaten (diese stellen Daten dar, die bei der Erhebung der Forschungsdaten anfallen, z. B. zu Zwischenschritten in Analyse oder Visualisierung führen) und nicht nur wissenschaftshistorisch von Interesse sein können.
Forschungsdateninfrastruktur§
Forschungsdateninfrastrukturen haben das Ziel Daten, Werkzeuge und Dienste aus Wissenschaft und Forschung systematisch zu erschließen, zugänglich zu machen, nachhaltig zu sichern und zu vernetzen.
Forschungsdatenmanagement§
Alle Aktionen wie Erhebung, Aufzeichnung, Qualitätssicherung, Speicherung, (Langzeitdaten-)Archivierung, Veröffentlichung zur Zugänglichmachung und Nachnutzbarkeit von Forschungsdaten sind Teil des Forschungsdatenmanagements. Dazu gehören alle im Rahmen der Organisation und technischen Umsetzung unternommenen Maßnahmen.
Forschungsdatenrichtlinie§
Dokument, das vorgibt, wie an einer Institution mit Forschungsdaten umgegangen werden soll.
Gemeinfreiheit§
Gemeinfreiheit gilt für all jene geistigen Schöpfungen, an denen keinerlei Immaterialgüterrechte, also insbesondere kein Urheberrecht, bestehen. Die Gemeinfreiheit richtet sich dabei stets nach dem jeweiligen nationalen Recht des Nutzungsvorgangs.
GeoNames.org ist eine freie, geograpische Datenbank, welche verschiedene Webdienste bereitstellt und unter einer Creative Commons Namensnennung Lizenz bereitsteht.
Git§
Ein Git ist ein freies Versionskontrollsystem, welches es ermöglicht Änderungen in Dateien nachzuverfolgen. Eingesetzt wird Git in erster Linie in der (verteilten) Softwareentwicklung.
GitHub ist ein netzbasierter Versionsverwaltungsdienst, das in erster Linie bei der Softwareentwicklung eingesetzt wird. Es wird angeboten von der Firma GitHub Inc., die 2018 von Microsoft übernommen wurde.
GitLab ist Open-Source-Versionsverwaltungsdienst, den man selbst betreiben kann.
[Gemeinsame Normdatei] Normdatensatz geführt durch die Deutsche Nationalbibliothek, die deutschsprachigen Bibliotheksverbünde, die Zeitschriftendatenbank und weitere Institutionen. Die GND enthält verschiedene Entitäten, darunter Personen, Institutionen, geographische Daten, Sachbegriffe und Werktitel mit kulturellem oder wissenschaftlichem Bezug. Eingesetzt wird sie zur Katalogisierung in Bibliotheken, aber mittlerweile verstärkt auch in Archiven, Museen und wissenschaftlichen Projekten.
Good Practice§
Der verbreitete Begriff Best Practice impliziert, dass eine einzelne Vorgehensweise der beste und damit einzige Weg zur Lösung eines Problems ist. In der Regel trifft dies nicht zu. Good Practices beschreiben daher Vorgehensweisen, die gut geeignet sind, bestimmte Aufgaben zu lösen. Es gibt in der Regel mehr als eine Good Practice für ein Problem, eventuell auch bessere. Good Practices beruhen oft auf positiven Erfahrungen oder sogenannten "Lessons Learned", die bezüglich eines konkreten Problems mit einer bestimmten Lösungsstrategie erzielt wurden.
Bereits 1998 wurden seitens der DFG "Vorschläge zur Sicherung guter wissenschaftlicher Praxis" erarbeitet, die 2013 ergänzt wurden und mittlerweile ihren Weg in die Ordnungen der meisten wissenschaftlichen Institutionen gefunden haben. Diese sollten ein Leitbild in der täglichen wissenschaftlichen Arbeit darstellen.
GUI§
[Graphic User Interface] Nutzeroberfläche einer Anwendung, z. B. klickbare Buttons, Menüs, Fenster.
Leibniz-Institut für Geschichte und Kultur des östlichen Europa
Hackathon§
Veranstaltung bei der in der Regel kallobarativ Software entwickelt wird. Während eines Hackathon sollen zu gegebenen Problemstellungen oder Themen möglichst nützliche, aber auch kreative Lösungen gemeinsam erstellt werden.
Hannah-Arendt-Institut für Totalitarismusforschung
Handle§
Das Handle-System ist eine Registrierung, die Informationsressourcen spezielle persistente Kennungen (Persistent Identifier) - sogenannte Handles - zuweist und diese Handles auflöst, wodurch ein Zugriff auf die eigentliche Ressource ermöglicht wird.
Harvesting§
bezeichnet das maschinelle Zusammentragen von Daten und/oder Metadaten aus (mehreren) vorhandenen Archiven oder Repositorien. Dafür existieren Provider, die den Prozess über festgelegte Protokolle (z. B. OAI-PMH) unter Verwendung verbreiteter Standards (wie Dublin Core für Metadaten) durchführen und somit die Daten gezielt einsammeln und beispielweise zentral durchsuchbar bereitstellen.
Das [International Image Interoperability Framework] definiert mehrere Anwendungsschnittstellen zur standardisierten Beschreibung und Bereitstellung von Bildern über das Internet. Werden Bildsammlungen seitens einer Institution über eine IIIF-Schnittstelle bereitgestellt, können diese (samt ihrer Metadaten) durch beliebige IIIF-kompatible Viewer oder Anwendungen angezeigt und verwendet werden.
Ingest§
Teil des Lebenszyklus von Forschungsdaten, genauer der Archivierung. Dabei werden die Daten in ein Forschungsdatenrepositorium oder in ein Archiv aufgenommen. Der Ingest kann je nach Datensatz verschiedene Arbeitsschritte beinhalten. Wichtige Aspekte sind beispielsweise Qualitätskontrollen aber auch weitere Formen der Datenaufbereitung bzw. der Kuration (Konvertierung, Metadatenanreicherung usw.).
Interoperabilität§
Möglichkeit, Daten zwischen verschiedenen Systemen auszutauschen. Die Grundlage dafür sind gemeinsame Standards.
Institut für Sächsische Geschichte und Volkskunde
Unter dem Begriff Java versteht man eine Programmiersprache sowie die dazugehörige Software-Plattform als Laufzeitumgebung für in Java geschriebene Programme. Java ist eine universelle, klassenbasierte und objektorientierte Programmiersprache mit möglichst wenigen Implementierungsabhängigkeiten. Somit kann kompilierter Java-Code auf allen Plattformen ausgeführt werden, die Java unterstützen, ohne dass eine Neukompilierung erforderlich ist.
JSON§
[JavaScript Object Notation] Datenformat in auch für Menschen lesbarer Textform, das für den Datenaustausches zwischen Anwendungen genutzt wird.
Kontrolliertes Vokabular§
Sammlung von Bezeichnungen mit eindeutiger Zuordnung zu Begriffen, um Mehrdeutigkeiten zu verhindern. Das Vokabular wird üblicherweise in einem einem Thesaurus oder einer Normdatei zusammengefasst.
Langzeitarchivierung§
Unter Langzeitarchivierung versteht man die langfristige Aufbewahrung von Informationen und somit die Erhaltung ihrer dauerhaften Verfügbarkeit (jedoch mindestens 10 Jahre). Die Langzeitarchivierung spielt im Bereich des Forschungsdatenmanagements eine wichtige Rolle. Es ist eine stete Herausforderung, da selten mehr als 25 Jahre Verfügbarkeit garantiert werden (können).
Lebenszyklus von Forschungsdaten§
beinhaltet all jene Stationen, die Forschungsdaten von der Generierung bis zu einer möglichen Nachnutzung durchlaufen können. Die typischen Phasen in diesem Zyklus sind: Antragstellung und Vorbereitung, Erstellung/Erhebung, Verarbeitung, Analyse, Archivierung, Zugang und Nachnutzung. Variationen bestehen je nach Forschungsfrage und Fachdisziplin.
Legacy Project§
Vom englischen “Legacy”: Vermächtnis, Hinterlassenschaft, aber auch Altlast. In der Wissenschaft oft abgeschlossene Projekte, die z. B. digital weiter vorgehalten werden, wie Internet-Datenbanken.
Linked Open Data§
Daten (z.B. Forschungsdaten), die im Internet frei zugänglich (“Open”, sonst nur “Linked Data”) und mit speziellen persistenten Identifikatoren - sogenannten Uniform Resource Identifiern - versehen sind und daurch maschinenlesbar verlinkt werden können. Durch Verknüpfung der Daten ergibt sich so ein umfangreiches Wissensnetzwerk, das auch als "Linked Open Data Cloud" bezeichnet wird.
Lizenz§
Juristisches Dokument, das angibt, was ein Benutzer mit einer digitalen Ressource tun kann.
LOD§
Siehe Linked Open Data
Mapping§
Mapping bezeichnet den Prozess des Abgleiches von Datenfeldern zwischen Datenmodellen und somit in der Regel das Übertragen von Daten oder anderen Elementen von einem Modell auf ein anderes - z. B. das Übertragen von Metadaten in ein anderes Schema oder in einen anderen Standard zur Datenspeicherung.
Mappings ermöglichen oder erleichtern somit den (automatisierten) Datenaustausch zwischen unterschiedlichen Systemen (z. B. die Übertragung von Metadaten in ein neues System).
Unter der GPL-Lizenz stehendes quell-offenes Wiki-System, welches als Community-Projekt der Wikimedia Foundation entstanden ist und weiterentwickelt wird. Eingesetzt wird MediaWiki unter anderem von der Wikipedia.
Beschreibende Daten zu z. B. Forschungsdaten. Metadaten sind strukturiert und geben Hinweise zu Eigenschaften der Daten, die sie näher bestimmen. Dazu gehören Name, ISBN, Sachgebiet, Autor etc.
Formale Sprache, die als Syntax für RDF-Daten verwendet werden kann und von Tim Berners-Lee entwickelt wurde.
Ein Siegel bzw. eine Zertifizierung für digitale Langzeitarchive, das in einer erweiterten Selbstevaluierung auf der Grundlage der DIN-Norm 31644 „Kriterien für vertrauenswürdige digitale Langzeitarchive“ erlangt werden kann.
Open-Source-Cloudanbieter zum Sichern, Austauschen und gemeinsamen Bearbeiten zahlreicher Dateiformate, weit verbreitet u. a. an Forschungseinrichtungen. Der genaue Umfang der Dienste in der Cloud variiert je nach Abonnement der Einrichtung.
Normdaten§
bzw. Normdatei. Verzeichnis von normierten Begriffen, genutzt beispielsweise als Teil der Metadaten zur Datenbeschreibung, z. B. bei Personen- oder Ortsnamen, die nach einer bestimmten festgeschriebenen Ontologie verschlagwortet werden. Beispiel: GND
[Nationale Forschungsdateninfrastruktur] Förderinitiative der DFG zum Aufbau einer deutschlandweiten Forschungsdateninfrastruktur. Sie "...soll die Datenbestände von Wissenschaft und Forschung systematisch erschließen, nachhaltig sichern und zugänglich machen sowie (inter-)national vernetzen. Sie wird in einem aus der Wissenschaft getriebenen Prozess als vernetzte Struktur eigeninitiativ agierender Konsortien aufgebaut werden." (DFG)
OAI-PMH§
[Open Archives Initiative - Protocol for Metadata Harvesting] Auf XML und REST basierendes Protokoll zum Bereitstellen und Übertragen von Metadaten. OAI-PMH dient dem Sammeln von Metadaten, welche von so genannten Data Providern bereitgestellt werden, um beispielsweise eine zentrale Suche in Metadaten ermöglichen zu können. Ein Beispiel ist das CLARIN Virtual Language Observatory.
OAIS§
[Open Archival Information System oder Offenes Archiv-Informations-System] Referenzmodell für ein dynamisches, erweiterungsfähiges Archivinformationssystem. ISO-Standard.
OCR§
[Optical Character Recognition] Maschinengesteuerte Erschließung von Text aus Bilddaten. Während die Genauigkeit bei gedruckten Daten recht gut ist, bieten handschriftliche Dokumente, Schreibschriften und nicht alphabet-basierte Schriften große Herausforderungen.
Ontologie§
Altgrch. die “Lehre vom Seienden”. In der Informatik Klassifikationssysteme für Daten, um diese maschinenlesbar einzuordnen und zu repräsentieren. Genauer handelt es sich um formal geordnete Darstellungen einer Menge von Begriffen und der zwischen ihnen bestehenden Beziehungen in einem bestimmten Gegenstandsbereich. Es gibt zahlreiche Ontologien, auf die man sich beziehen kann, z. B. das “Getty Vocabulary” oder der “UNESCO Thesaurus”. Steht in Zusammenhang mit den Begriffen Thesaurus, Taxonomie, kontrolliertes Vokabular, Datenmodell.
Bezeichnet den freien Zugang zu Werken im Internet, z. B. wissenschaftliche Artikel und Bücher, manchmal mit Datensätzen. Wird durch Fördergeber verstärkt gefordert und gefördert (Unterstützung bei Publikationskosten). Es gibt den grauen, den grünen, den goldenen und den diamantenen Weg der Veröffentlichungsform.
Open Code§
Siehe Open Source.
Open Data§
Siehe Linked Open Data.
Open-Source-Applikation für Datenbereinigung bzw. -transformation. Es erlaubt das Einlesen von Daten im CSV/TSV, XML, RDF, JSON und Google Spreadsheets Format und ist auch ein nützliches Tool zum Abgleich bzw. Matching von Daten.
Open Science§
Wissenschaftsprinzip, das sich Open Access, Open Source, Linked Open Data etc. verpflichtet fühlt. Forschungsdaten werden transparent zur Verfügung gestellt, kollaborativ bearbeitet und nachnutzbar gemacht.
Open Source§
Bezeichnet den freien Zugang zu quelloffener Software im Internet. Oftmals ist die Verwendung auch kostenlos. Wird durch Fördergeber verstärkt gefordert.
[Open Access Infrastructure for Research in Europe] Europäisches Forschungsinformationssystem für Forschungsergebnisse, das Metadaten aus verschiedenen Quellen aggregiert. Unter anderem wird Zenodo durch OpenAIRE gefördert.
[Open Researcher Contributor Identification Initiative] Dienst, der wissenschaftlichen Autor/innen eine eindeutige Identifikationsnummer zuweist, die Orcid-ID. Wird oft für elektronische Publikationen abgefragt.
OWL§
[Web Ontology Language] Formale Sprache zur Wissensrepräsentation, welche der Beschreibung von Ontologien dient und einen wichtige Rolle im Bereich des Semantic Web spielt.
Open-Source-Cloud-Anbieter zum Sichern, Austauschen und gemeinsamen Bearbeiten zahlreicher Dateiformate, weit verbreitet an Forschungseinrichtungen.
Persistent Identifier§
Erlaubt die eindeutige und dauerhafte Referenzierung einer (digitalen) Ressource durch Zuweisung eines Codes. In der Regel führt die Eingabe eines Persistent Identifier im Webbrowser zu einer Weiterleitung zur Ressource.
PID§
Siehe Persistent Identifier.
Pseudonymisierung§
Anders als bei Anonymisierung werden Codes oder Tarnnamen für Personen und Sachen verwendet, für die es intern eine Aufschlüsselung gibt.
Public Domain§
Siehe Gemeinfreiheit
Programmiersprache, die sich über durch ihre einfache, gut lesbare Syntax auszeichnet. Aufgrund ihrer Zugänglichkeit und der großen Community ist Python auch zu einer weit verbreiteten Programmiersprache in den Digital Humanities geworden.
[Research Data Alliance] Internationale Organisation mit dem Ziel, eine soziale und technische Infrastruktur aufzubauen, damit Daten offen ausgetauscht und wiederverwendet werden können.
RDF§
[Resource Description Framework] vom World Wide Web Consortium (W3C) entwickelter Standard, der die Formulierung logischer Aussagen über beliebige Entitäten (Ressourcen) ermöglicht. Einzelne Aussagen bestehen stets aus den drei Einheiten Subjekt, Prädikat und Objekt. RDF ist ein grundlegender Baustein des Semantic Web.
Reconciliation§
Bei Reconciliation handelt es sich um einen Prozess zum Vergleichen und Abgleichen von Daten. Dabei geht es beispielsweise darum, Diskrepanzen oder Inkonsistenzen zwischen Datensätzen zu identifizieren und Maßnahmen zu deren Behebung zu ergreifen. Eine typische Anwendung ist der Abgleich mit Normdaten, mit dem Ziel der Übernahme von PIDs und weiteren Merkmalen in die eigene Datenbasis.
Repositorium§
Repositorien sind Einrichtungen, welche verschiedene Arten digitaler Objekte speichern und verwalten und wenn gewünscht Zugriff darauf bieten. Handelt es sich bei diesen Objekten um Forschungsdaten, so spricht man von einem Forschungsdatenrepositorium. Das dortige Ablegen von Forschungsdaten ist in der Regel Teil der Nachhaltigkeitsbestrebungen des Datenmanagementplans von Forschungsprojekten und dient der Zugänglichmachung, dem Publizieren und teilweise der Archivierung der Daten. Durch Ablegen der Daten zusammen mit Metadaten kann seitens des Repositoriums eine Durchsuchbarkeit gewährleistet werden. Die Vergabe eines dauerhaften Identifikators (Persistent Identifier) durch das Repositorium ermöglicht zusätzlich die langfristige Zitierbarkeit. Repositorien weisen in der Regel die Einhaltung gewisser Qualitätsstandards durch erfolgreiche Zertifizierungen nach (z.B. Core Trust Seal oder Nestor).
REST§
[Representational State Transfer] Programmierparadigma für verteilte Systeme, in erster Linie Webservices im World Wide Web.
[Rat für Informationsinfrastrukturen] Gremium, welches Politik und Wissenschaft im Bereich von Digitalstrategien berät.
[RDF Site Summary or Really Simple Syndication] Dateiformat für Web-Feeds, die Updates von Webseiten erfassen können.
Sächsische Akademie der Wissenschaften zu Leipzig
Initiative sächsischer Hochschulen und Forschungseinrichtungen zur Vernetzung, Kooperation und Koordination der Aktivitäten rund um das Forschungsdatenmanagement.
Schema§
Festgelegte Ordnung, Plan oder Konzept von einem Sachverhalt, wonach man sich richtet. Eine Rolle spielen Schemata beispielsweise im Bereich der Metadaten. Ein Metadatenschema gibt den Inhalt und die Gliederung von Metadaten vor.
Semantic Web, Semantische Technologien§
Technologien, die Daten durch Maschinenlesbarkeit besser austauschbar und verwertbar machen können. Das Semantic Web ist eine Erweiterung des World Wide Web durch Standards, die Daten im Internet maschinenlesbar machen.
[Sonderforschungsbereich] SFBs sind langfristige, auf die Dauer von bis zu zwölf Jahren angelegte Forschungseinrichtungen der Hochschulen, die durch die DFG gefördert werden.
Serbski institut / Sorbisches Institut
SKOS§
[Simple Knowledge Organization System] ist ein gemeinsames Datenmodell zum Teilen und Verknüpfen von Wissensorganisationssystemen, insbesondere sogenannten Vokabularen.
Sächsische Landesbibliothek – Staats- und Universitätsbibliothek
Sächsisches Staatsministerium für Wissenschaft, Kultur und Tourismus
SPARQL§
[SPARQL Protocol And RDF Query Language] ist eine graphbasierte Abfragesprache für RDF.
Standard§
Einheitliche und weithin anerkannte Art und Weise, etwas zu tun. Beispielsweise ist die Einhaltung von Standards für die automatische Verarbeitung von Daten von großer Bedeutung. Bei einem Standard, an dem man sich orientieren sollte, spricht man auch vom "Goldstandard".
[Text Encoding Initiative] Auf XML basierende Initiative zur Kodierung von Textdaten.
Thesaurus§
Auch Wortnetz, ist ein kontrolliertes Vokabular, dessen Begriffe durch (semantische) Relationen wie Synonymie oder Hyponymie miteinander verbunden sind.
Turtle§
[Terse RDF Triple Language] Syntax, die es ermöglicht, Daten im RDF-Datenmodell zu beschreiben.
URI§
[Uniform Resource Identifier] Zeichenkette, die eindeutig eine Ressource identifiziert. Dazu wird folgende Syntax verwendet: URI = scheme:[//authority]path[?query][#fragment]
URL§
[Uniform Resource Locator] Eine Referenz zu einer Webressource. Es handelt sich dabei um eine spezifische Form einer URI. Oft sind es Verweise zu Websiten (http), Dateitransfer (ftp) oder Emails (mailto).
URN§
[Uniform Resource Name] Eine Referenz zu einem dauerhaften Namen einer Ressource. Es kann sich dabei um ein Konzept oder einen Wert handeln, aber auch um eine Publikation im Internet. Vgl. auch DOI.
Use Case§
Hier definiert als ein wissenschaftlicher Anwendungsfall.
[Virtuelle Maschine] Abgekapselte Rechnerumgebung, die mittels spezieller Software innerhalb eines anderen lauffähigen Rechnersystems läuft. Die Virtuelle Maschine bildet dabei meist real existierende Hardware nach.
Wiki§
Wikis sind Webseiten, deren Inhalte von den Besuchern im Webbrowser bearbeitet und geändert werden können. Sie ermöglichen somit auf einfache Weise kollaborative Arbeit an gemeinsamen Inhalten.
Freie Erweiterung zu MediaWiki, mithilfe derer maschinenlesbare, strukturierte Wissensdatenbanken erstellt werden können. Es verwendet dabei LOD-Prinzipien und die Daten können mittels Standards wie SPARQL abgefragt werden bzw. u. a. als RDF/XML, N3, Json, Yaml etc. exportiert werden.
Eine gemeinschaftlich kuratierte offene Wissensbasis, welche von der Wikimedia Foundation betrieben wird. Darin werden Informationen strukturiert erfasst und maschinenlesbar zur Verfügung gestellt. Die Daten werden auch in anderen Wikimedia-Projekten wie z.B. Wikipedia eingebunden. Technisch basiert Wikidata auf MediaWiki mit der Wikibase-Erweiterung.
[Wikimedia Foundation] Gemeinnützige Gesellschaft nach US-amerikanischen Recht mit dem Ziel freies Wissen zu fördern. Zu ihren Projekten zählen Wikipedia, Wikidata, Wikimedia Commons sowie zahlreiche weitere Wiki-Projekte (Wiktionary, Wikibooks, Wikisource, ...)
Freie Mediendatenbank mit Bildern, Videos und Audiodateien. Wird von der Wikimedia Foundation betrieben. Es können nur Inhalte veröffentlicht werden, die den Ansprüchen von freiem Wissen entsprechen, d. h. gemeinfrei sind, oder unter einer freien Lizenz veröffentlicht werden.
Sammlung von urheberrechtsfreien oder unter freien Lizenzen veröffentlichten Texten. Das Projekt ein Schwesterprojekt von Wikipedia und wird ebenso von der Wikimedia Foundation betrieben.
Wissensbasis§
System zur Speicherung von strukturierten oder unstrukturierten Daten unterschiedlicher Komplexität. Die Hinterlegung von (oft domänen- oder problemspezifischem) Wissen erfolgt maschinenlesbar und -interpretierbar. Häufig wird auch von Wissensdatenbanken gesprochen. Eine klare begriffliche Trennung ist hier schwierig.
XML§
[Extensible Markup Language] Menschen- und maschinenlesbare Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten in einer Textdatei.
YAML§
[YAML Ain’t Markup Language, bzw. ursprünglich Yet Another Markup Language] Einfache Auszeichnungssprache zur Datenserialisierung, angelehnt an XML.
Zenodo ist ein fachübergreifendes Forschungsdatenrepositorium, das vom Datenzentrum des CERN betrieben wird. Als OpenAIRE-Projekt unterstützt es ausdrücklich Open Access, Open Data und Open Science.