ACDH Lecture 12.1
From Punch Cards to Prompt Engineering: The MHDBDB and the Future of Semantic Annotation with LLMs
mit Katharina Zeppezauer-Wachauer , Senior Scientist an der Universität Salzburg und Julia Hintersteiner , Senior Scientist und Doktorandin an der Universität Salzburg.
Wann: Dienstag, 20. Jänner 2026; 16:45 - 18:15 Uhr
Wo: Universität Wien, Universitätsring 1, 1010 Vienna,
Hörsaal 6 Franz König Hauptgebäude, Tiefparterre, Stiege 9 Hof 5 und online (u:stream).
Registration: Die Anmeldung ist geschlossen.
Die Mittelhochdeutsche Begriffsdatenbank ( MHDBDB ) hat über Generationen hinweg Forschende unterstützt, die mit deutschsprachigen Texten des Mittelalters arbeiten. Nach jahrzehntelanger Entwicklung auf der Basis relationaler Datenbanken und – in jüngerer Zeit – RDF-gestützter Grapharchitekturen hat die MHDBDB nun eine vollständige technologische Neugestaltung durchlaufen, die auf ein TEI-first-Modell ausgerichtet ist und LLM-basierte Forschungsworkflows direkt unterstützt.
Der Vortrag erläutert die Gründe für diesen Paradigmenwechsel und die daraus gewonnenen Erkenntnisse: die wachsende Bedeutung strukturierter, KI-lesbarer Daten; die technischen und infrastrukturellen Grenzen hochkomplexer Standoff-Modelle; sowie die ernüchternde Tatsache, dass die Verwaltung von Milliarden RDF-Tripeln Personal- und Finanzierungskapazitäten erfordert, die in geisteswissenschaftlichen Projekten selten verfügbar sind. In diesem Kontext erweist sich KI – insbesondere große Sprachmodelle – nicht nur als ergänzendes Werkzeug, sondern als tatsächlicher Game Changer. Da LLMs zunehmend in Annotation, Suche und Interpretation eingebunden werden, hat sich das klassische TEI-XML als ideale Umgebung für Expert-in-the-Loop-Workflows bewährt: Es ermöglicht transparente, semantisch reichhaltige und interoperable Datenstrukturen, die zugleich menschenlesbar und maschinenverarbeitbar sind – und damit philologische Präzision mit der Skalierbarkeit von KI verbinden.
Literatur:
- Alan van Beek. 2025. Von historischen Daten zu KI – Bericht zum interdisziplinären Workshop. Digital Humanities an der Universität Salzburg. DOI: https://doi.org/10.58079/155ob . Darin verlinkt: Foliensatz und Aufzeichnung des Vortrags von Christopher Pollin und Katharina Zeppezauer-Wachauer (hinterer Teil zur technischen Neuausrichtung der MHDBDB).
- Alan van Beek und Julia Hintersteiner. 2025. „Poc, the Black Knight“ – Wie voreingenommen sind LLMs bei mittelalterlicher Literatur? Digital Humanities an der Universität Salzburg. DOI: https://doi.org/10.58079/153my
- Julia Hintersteiner, Michael Göggelmann, Alan van Beek, Katharina Zeppezauer-Wachauer. 2024. Von der Datenpflege zur Schnittstellenentwicklung: Eine Evaluation des Datenkolosses MHDBDB. Digital Humanities an der Universität Salzburg. DOI: https://doi.org/10.58079/12p9n
- Katharina Zeppezauer-Wachauer. 2022. „50 Jahre Mittelhochdeutsche Begriffsdatenbank (MHDBDB). Eine Jubiläums-Zeitreise zwischen Lochkarten, Pixel-Drachen, Relationaler Datenbank und Graphdaten.“ In: Beiträge zur mediävistischen Erzählforschung, Digitale Mediävistik. Perspektiven der Digital Humanities für die Altgermanistik, no. Themenheft 12 (2022): 161–186. DOI: https://doi.org/10.25619/BmE20223203 .
Please RSVP for the onsite-lecture / register for the online lecture.
Diese ACDH Lecture wird in enger Zusammenarbeit mit der Universität Wien im Rahmen der Vorlesung Einführung in die Digital Humanities organisiert.
über die Sprecherinnen
Katharina Zeppezauer-Wachauer ist Senior Scientist an der Universität Salzburg, wo sie seit 2010 zum Team der Mittelhochdeutschen Begriffsdatenbank (MHDBDB) gehört und das Projekt seit 2016 leitet.
Ihre Forschungsschwerpunkte liegen in der Korpuslinguistik, der computergestützten Textsemantik und der Anwendung von KI und großen Sprachmodellen auf historische Korpora, mit einem besonderen Fokus auf semantische Modellierung, narrative Strukturen und FAIR Data-Praktiken.
Sie promovierte in Germanistik an der Universität Graz mit einer Spezialisierung in den Digital Humanities und fungiert als Sprecherin der Universität Salzburg im österreichischen Infrastrukturkonsortium CLARIAH-AT.
Erfahren Sie mehr über Katharina Zeppezauer-Wachauer:
- PLUS Salzburg: https://uni-salzburg.elsevierpure.com/de/persons/katharina-b-zeppezauer/
- Bluesky: https://bsky.app/profile/mhdbdb.bsky.social
- Mastodon: https://fedihum.org/@mhdbdb

Julia Hintersteiner, MA BA, ist Senior Scientist und Doktorandin an der Universität Salzburg.
Sie arbeitet an der Schnittstelle von Mediävistik und Digital Humanities und widmet sich der Weiterentwicklung der Mittelhochdeutschen Begriffsdatenbank (MHDBDB). Ihre Dissertation befasst sich direkt mit dieser Ressource und konzentriert sich auf Word Sense Disambiguation und semantische Annotation, um die Leistungsfähigkeit der Datenbank weiter zu schärfen.
Darüber hinaus verfügt Julia über Expertise zur Wenzelsbibel , insbesondere in den Bereichen der automatisierten Erschließung von Text-Bild-Beziehungen und der ikonographischen Annotation. Ihren MA erwarb sie 2023 an der Universität Graz; zuvor studierte sie in Salzburg und Utrecht.
Erfahren Sie mehr über Julia Hintersteiner:
- PLUS Salzburg: https://uni-salzburg.elsevierpure.com/de/persons/julia-hintersteiner/
- ORCID: https://orcid.org/0009-0008-8333-3658
- Bluesky: https://bsky.app/profile/mhdbdb.bsky.social
- Mastodon: https://fedihum.org/@mhdbdb