Call for Papers: PressMint Workshop at LREC2026
Erster Workshop zur Erstellung interoperabler Korpora historischer Zeitungen (PressMint-LREC 2026)
Call for Papers
Datum: 16 Mai 2026, halbtägiger Workshop
Location: Palma de Mallorca, Spain
Einreichfrist: 1. März 2026
Submission link: https://softconf.com/lrec2026/PressMint/
Workshopbeschreibung
Historische Zeitungen sind für Historiker:innen und historische Linguist:innen ebenso von Interesse wie für Sozial- und Politikwissenschaftler:innen, Ethnolog:innen, Anthropolog:innen, Medien- und Kommunikationswissenschaftler:innen sowie Forschende der Kulturwissenschaften. In all diesen Disziplinen werden zeitgenössische digitale Ressourcen, Werkzeuge und Methoden (z. B. „Distant Reading“) bislang noch vergleichsweise wenig genutzt. Gleichzeitig existieren für zahlreiche Sprachen und Länder bereits in großem Umfang Korpora historischer Zeitungen, da diese in der Regel gemeinfrei sind. Zudem stellen Nationalbibliotheken häufig die Digitalisate und oftmals auch OCR-Daten zur Verfügung. In den letzten Jahren sind diese Daten verstärkt in den Fokus der Forschung gerückt, da sie das historische, kulturelle, politische und gesellschaftliche Erbe bewahren. Allerdings sind die bestehenden Korpora nicht interoperabel, was vergleichende Analysen ebenso wie translinguale und transnationale Forschung verhindert. Dies ist insbesondere problematisch, da Staatlichkeit und Nationenbildung im in den Projektkorpora abzudeckenden Zeitraum in Europa hochgradig dynamisch waren.
Ein erster gemeinsamer Ansatz zur Erstellung eines Korpus historischer Zeitungen ab dem Beginn des 20. Jahrhunderts ist das CLARIN-Flagship-Projekt PressMint . Das Projekt vereint derzeit Daten von 20 Partnern und zielt darauf ab, einen Standard für interoperable Zeitungsressourcen über diachrone Zeiträume hinweg zu entwickeln. Das übergeordnete Ziel besteht darin, strukturierte und qualitativ hochwertige mehrsprachige Daten in einem gemeinsamen Format bereitzustellen, die über denselben Typ linguistischer Annotation verfügen und (zumindest teilweise) denselben Zeitraum abdecken.
Der Workshop wird von CLARIN ERIC und dem PressMint-Projekt unterstützt.
Zielsetzung
Der PressMint-Workshop hat zum Ziel, Expert:innen zusammenzubringen, die an der Erstellung, Verarbeitung und Analyse interoperabler Korpora historischer Daten im Allgemeinen und mit besonderem Fokus auf Zeitungen interessiert sind. Ein weiteres zentrales Anliegen ist es, auch die Perspektive jener Communities einzubeziehen, die historische Daten nutzen – ihre Zielsetzungen, Anforderungen und ihr Feedback.
Interessierte Kolleg:innen sind eingeladen, ihre Arbeiten auf unterschiedlichen Ebenen vorzustellen: national wie paneuropäisch, monolingual wie multilingual sowie aufgabenspezifisch wie multidisziplinär. Der Workshop versteht sich als Forum für den Austausch von Forschungsansätzen und als Ausgangspunkt für neue Kooperationen in diesem Themenfeld.
Der Workshop umfasst eine:n eingeladene:n Vortragende:n: Maud Ehrmann, EPFL, Schweiz.
Eingereicht werden können unveröffentlichte Originalarbeiten, die sich – nicht ausschließlich – mit folgenden Themen befassen:
- Kompilierung, Annotation, Visualisierung und Nutzung historischer Zeitungskorpora für den für PressMint relevanten Zeitraum (idealerweise um den Beginn des 20. Jahrhunderts, jedoch nicht auf diesen Zeitraum beschränkt)
- Harmonisierung bestehender mehrsprachiger historischer Zeitungskorpora, die synchrone und/oder diachrone Daten enthalten
- Verknüpfung oder Vergleich historischer Zeitungskorpora mit anderen Datensätzen, einschließlich Quellen strukturierten Wissens wie formalen Ontologien und LOD-Datensätzen
- Anreicherung historischer Zeitungskorpora (z. B. durch Sentiment-Annotationen u. Ä.)
- Maschinelle Übersetzung historischer Zeitungskorpora
- Einsatz von LLMs als eigenständige Werkzeuge oder als Bestandteil von NLP-Architekturen zur Verarbeitung, Pflege und Wissensbereitstellung für historische Daten
- unterschiedliche Nutzungsszenarien historischer Daten
Einreichung & Publikation
Es werden Einreichungen von Langbeiträgen (6–8 Seiten), Kurzbeiträgen (4 Seiten) sowie Demo-Beiträgen (4 Seiten) akzeptiert, die im Rahmen des Workshops als längere oder kürzere mündliche Präsentationen oder als Poster präsentiert werden. Zur Unterstützung des Double-Blind-Review-Verfahrens müssen alle Einreichungen vollständig anonymisiert sein und gemäß dem auf der LREC-2026-Website verfügbaren Styleguide formatiert werden. Die Beiträge des Workshops werden in Online-Proceedings veröffentlicht.
Zum Zeitpunkt der Einreichung haben die Autor:innen zudem die Möglichkeit, zugehörige Sprachressourcen mit der Community zu teilen. Alle Repositoriumseinträge werden mit der LRE Map ( https://lremap.elra.info/ ) verknüpft, die Metadaten zu den Ressourcen bereitstellt.
Bitte beachten Sie, dass der LREC-Styleguide verbindlich einzuhalten ist. Die Formatierungsrichtlinien sind hier verfügbar: https://lrec2026.info/authors-kit/ .
Wichtige Termine
- Abgabefrist für Beiträge: 1. März 2026
- Benachrichtigung über Annahme: 15. März 2026
- Camera-ready-Version: 30. März 2026
- Workshop-Termin: noch festzulegen
Organisationskomitee
- Maciej Ogrodniczuk, Institute of Computer Science, Polish Academy of Sciences, PL
- Tanja Wissik, Austrian Academy of Sciences, AT
- Petya Osenova, Sofia University ”St. Kl. Ohridski” & Bulgarian Academy of Sciences, BG
To contact the organisers, please email maciej.ogrodniczuk@gmail.com .
Programmkomittee (A-Z)
- Tomaž Erjavec, Jožef Stefan Institute, SI
- Maria Gavriilidou, Institute for Language and Speech Processing, Athena Research Center, GR
- Normunds Grūzītis, University of Latvia, LV
- Matyáš Kopp, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics. Charles University, CZ
- Taja Kuzman, Jožef Stefan Institute, SI
- Nikola Ljubešic, Jožef Stefan Institute, SI ́
- Maciej Ogrodniczuk, Institute of Computer Science, Polish Academy of Sciences, PL
- Petya Osenova, Sofia University „St. Kl. Ohridski“ and IICT-BAS, BG
- Adam Pawłowski, University of Wrocław, PL
- Stelios Piperidis, Athena Research Centre, GR
- German Rigau, HiTZ Basque Research Center for Language Technology, EHU, ES
- Claudia Resch, Austrian Academy of Sciences, AT
- Inguna Skadiņa, Institute of Mathematics and Computer Science, University of Latvia, LV
- Steinþór Steingrímsson, The Árni Magnússon Institute for Icelandic Studies, IS
- Tanja Wissik, Austrian Academy of Sciences, AT
Dieser Call for Papers wurde ursprünglich auf der CLARIN ERIC Website veröffentlicht:
PressMint-LREC2026