Context matters. Opportunities and challenges when working with artificial intelligence and cultural heritage data
Wann: Tuesday, September 9th, 2025 at 18:00 (CEST)
Wo: onsite and online (hybrid)
onsite: University of Graz, Elisabethstraße 50b, SR 19.02, 8010 Graz, Austria
online: via this stream
Organisation: Der Vortrag findet im Rahmen der CLARIAH-AT Summer School ‘Machine Learning for Digital Scholarly Editions’ des Instituts für Digitale Geisteswissenschaften (Universität Graz) statt.
Die Fortschritte im Bereich des maschinellen Lernens bzw. der Künstlichen Intelligenz (ML/AI) eröffnen vielfältige Chancen für Bibliotheken und die digitale Wissenschaft. In Projekten wie Mensch.Maschine.Kultur entwickelt die Staatsbibliothek zu Berlin - Preußischer Kulturbesitz (SBB) ML-Technologien für ein breites Spektrum an Anwendungen: von der Text- und Layout-Erkennung über die Bildanalyse und Informationsextraktion bis hin zur maschinengestützten Sacherschließung sowie – nicht zuletzt – zur Bereitstellung von Sammlungen als Daten und deren digitaler Kuratierung.
Gleichzeitig müssen bei der Nutzung von ML-Technologien im Zusammenspiel mit historischen Quellen und Kulturerbe-Materialien stets deren historische und kulturelle Kontexte berücksichtigt werden. Von Bibliotheken digitalisierte Sammlungen sind in Bezug auf abgedeckte Zeiträume, Perspektiven, Orte oder Regionen sowie die jeweiligen kulturellen Kontexte äußerst heterogen. Historische Dokumente enthalten häufig Verzerrungen, die nicht mehr den heutigen ethischen Werten entsprechen. Während Historiker:innen darin geschult sind, Quellen kritisch einzuordnen und Quellenkritik als methodisches Werkzeug anzuwenden, werden KI-Systeme der Industrie überwiegend mit modernen Texten aus dem Internet trainiert und sind hierzu nicht in der Lage.
Am Beispiel der Erfahrungen der SBB mit maschinellem Lernen und Künstlicher Intelligenz möchte dieser Vortrag Einblicke in praktische Anwendungen geben und gleichzeitig für einen bewussten und verantwortungsvollen Umgang mit ML und Kulturerbe-Daten sensibilisieren.
Clemens Neudecker studierte Philosophie, Informatik und Politikwissenschaft an der LMU München und leitet das Data Science Team in der Abteilung Informations- und Datenmanagement der Staatsbibliothek zu Berlin – Preußischer Kulturbesitz.
Der Schwerpunkt seiner Arbeit und Forschung liegt in den Bereichen Computer Vision, Natural Language Processing und Machine Learning/Künstliche Intelligenz sowie deren Anwendungen im Kontext der Digitalisierung und der Digital Humanities.
weiterführende Links: