Unlocking the full potential of textual resources – Application of FAIR data principles through CLARIN Federated Content Search Implementation
- Beginn
- Ende
Das Projekt „Unlocking the full potential of textual resources – Application of FAIR data principles through CLARIN Federated Content Search Implementation“ zielt darauf ab, die Auffindbarkeit und Zugänglichkeit österreichischer Textressourcen für Forschung und Lehre nachhaltig zu verbessern. Am Austrian Centre for Digital Humanities (ACDH) entstehen umfangreiche digitale Textsammlungen aus Projekten in Linguistik, Literaturwissenschaft und Editionen. Diese Daten werden im Repositorium ARCHE archiviert und über das CLARIN-Netzwerk bereits auf Metadatenebene durchsuchbar gemacht. Durch die Implementierung der CLARIN Federated Content Search (FCS) soll künftig auch eine inhaltliche Volltextsuche über verteilte Datenbestände möglich werden – ein entscheidender Schritt zur Umsetzung der FAIR-Prinzipien (insbesondere Findable, Accessible) im österreichischen Kontext.
Über das Projekt
Das Projekt umfasst die technische Umsetzung einer Volltext-Suchmaschine am ACDH, die Anbindung an die CLARIN FCS sowie die Integration in die CLARIAH-AT Website. Die FCS ermöglicht es, verschiedene, an unterschiedlichen Standorten gehostete Textressourcen zentral zu durchsuchen – sowohl nach Schlüsselwörtern als auch nach komplexen Mustern (z. B. Kollokationen). Dabei werden unterschiedliche Datenformate und linguistische Annotationen unterstützt.
Die Umsetzung erfolgt in mehreren Schritten: Auswahl geeigneter Textressourcen für die Test- und Endphase, Implementierung und Test des FCS-Endpunkts, Entwicklung von Workflows zur Integration neuer Ressourcen sowie Erstellung einer Dokumentation für andere Konsortialpartner. Geplant sind Präsentationen bei der CLARIN-Konferenz 2025 und der Österreichischen Linguistiktagung , sowie eine Veröffentlichung im Tagungsband der CLARIN-Konferenz. Die Ergebnisse – einschließlich Quellcode und Dokumentation – werden in einem öffentlichen Repository bereitgestellt.
Dieses Projekt eröffnet neue Nutzungsszenarien – insbesondere im Hochschulbereich – und steigert die internationale Sichtbarkeit österreichischer Dateninfrastrukturen. Fördermittel wirken hier direkt auf nachhaltige Verbesserungen in der digitalen Forschungslandschaft und stärken die Wettbewerbsfähigkeit im europäischen Kontext.