Zum Hauptinhalt springen

Digital Sustainability: Relaunch of the MHDBDB

Hosting-Organisationen
Universität Salzburg und Uni Salzburg - Mittelhochdeutsche Begriffsdatenbank (MHDBDB)
Verantwortliche Personen
Katharina Zeppezauer-Wachauer, Manfred Kern, Peter Färberböck und Alan Lena van Beek
Beginn
Ende

Die Mittelhochdetusche Begriffsdatenbank ( MHDBDB ) ist eine frei zugängliche, komplexe Suchmaschine für mittelalterliche und frühneuzeitliche Literatur. Sie ermöglicht den Zugang zu den wichtigsten Werken der mittelhochdeutschen Dichtung und unzählige andere Texte aus einer Vielzahl von Perspektiven mittels einer extrem vielseitigen Suchfunktion. Die MHDBDB wurde in den frühen 1970ern gegründet und ist seit 1995 als ein Informationssystem online. Wir wurde seit 2002 von der Universität Salzburg gepflegt und überging schlussendlich 2016 als Schenkung an die Universität. Es wurde ein vollständiges Redsign und eine Migration entwickelt - ein Teil davon ist dieses Projekt. Die existierenden Texte wurden in ein XML-TEI-Format konvertiert und die Metadaten entsprechend RDF-Standards aufbereitet. Durch eine neue Abfragesprache wird die komplexe Suche intiuitiver. Die Website bekam außerdem ein responsives Design und wird insgesamt schneller. Die Verbindung zwischen externen Datenquellen (z.B. dem Semantic Web wie LOD) und dem Export der Daten in die meisten üblichen Formate und der volle Zugriff auf den Großteil der Texte ist ebenso möglich. Stand 2019 sind 666 Texte im Korpus der MHDBDB.

Da das Frontend nicht mehr zeitgmäß war, benötigte es eine dringende Generalüberholung.

Das Ziel dieses Projekts war es, die nötige IT- und Entwicklungsbasis zu schaffen, um eine Interoperabilität, Zugänglichkeit, Wiederverwendbarkeit und Nachhaltigkeit der existierenden Daten zu gewährleisten.

Keywords: Mittelhochdeutsch, TEI, Datenbank, RDF, SKOS, OWL, semantic web Vokabularien, semantic web, LOD, Germanistik, Mittelalter, Literaturwissenschaft


Outcomes

Die neue MHDBDB stützt sich nun auf ein Datenmodell, das auf verschiedenen semantischen Webtechnologien wie RDF-Vokabularen und Ontologien sowie auf TEI zur Kodierung der Korpustexte basiert. TEI-Texte wurden mit Hilfe der Stand-off-Methode mit Linked Open Data (LOD) verknüpft. Annotationen wie Part of Speech (PoS) oder Phrasen- und Satzstrukturen wurden direkt mit den Token der Texte verknüpft. Die Verknüpfung zwischen RDF- und TEI-Daten erfolgt über das Web Annotation Vocabulary gemäß der Empfehlung des W3-Konsortiums. Das Begriffssystem, das onomastische Benennungssystem und die neue MHDBDB-Textreihentypologie (für Kategorien, Gattungen und Textsorten des Mittelalters und der frühen Neuzeit) wurden als kontrollierte Vokabulare oder Thesauri unter Verwendung des Simple Knowledge Organisation System (SKOS) beschrieben. Die Lemmata wurden nach den Vorgaben des OntoLex-Lemon-Lexikographiemoduls kodiert. Weitere verwendete Ontologien und Vokabulare sind BibFrame 2.0 und die GND Ontologie.

Normungsdaten aus der Gemeinsamen Normdatei (GND) und Wikidata werden nun in der MHDBDB wiederverwendet, um den Nutzern einen besseren Zugang zum Datenmaterial zu ermöglichen. Die Vernetzung mit Metadaten-Repositorien ermöglicht die gegenseitige Anreicherung von Daten. Alle Forschungsdaten wie Annotationen, bibliografische Metadaten und beschreibende Metadaten zu Personen, Zeit, Orten und Ereignissen (basierend auf dem CIDOC Conceptual Reference Model (CRM) für Kulturerbe-Daten) werden mit dem Semantic Web verknüpft.

Alle MHDBDB-Daten werden unter einer Creative-Commons-Lizenz (CC BY-NC-SA 3.0 AT) bereitgestellt. Die MHDBDB nutzt Java in Kombination mit Spring Boot, was eine robuste und skalierbare Backend-Lösung gewährleistet.


Link zur Website Textreihentypologie MHDBD

Outreach

  • Marco Heiles und Katharina Zeppezauer-Wachauer: Poster: MHDBDB-Textreihentypologie. Ein kontrolliertes SKOS-Vokabular zur Annotation mediävistischer Datenbestände (Version 1.0.1). 2023. Für die Tagung „Archäologie der Handschrift – Erschließung, Präsentation und Forschung im digitalen Raum”, Freiburg im Breisgau, 9.-11. Oktober 2023. http://doi.org/10.25592/uhhfdm.13381
  • Alan Lena van Beek und Katharina Zeppezauer-Wachauer: Poster. Mittelhochdeutsche Begriffsdatenbank 2023. 2023. Für die Tagung “Materiality and Virtuality.: Entanglements of Material and Virtual Worlds in Medieval and Early Modern Material Culture”, Krems an der Donau, Österreich, 19. – 21. September 2023. https://doi.org/10.5281/zenodo.8375554

Außerdem wurde der MHDBD im Rahmen der „Dazzling Data“ - Ringvorlesung an der Universität Salzburg vorgestellt, eine Aufzeichnung des Vortrags ist über YouTube verfügbar:

Mittelhochdeutsche Begriffsdatenbank Reloaded