Zum Hauptinhalt springen

Summer School: Machine Learning for Digital Scholarly Editions

Hosting-Organisationen
Universität Graz (Institut für Digitale Geisteswissenschaften)
Verantwortliche Personen
Martina Scholger, Sarah Lang, Bernhard Geiger und Roman Bleier
Beginn
Ende

Maschinelles Lernen gewinnt in den Digital Humanities zunehmend an Bedeutung, insbesondere im Bereich der Digitalen Wissenschaftlichen Editionen. Die Machine Learning and Digital Scholarly Editing Summer School knüpft thematisch an die internationale Konferenz „Machine Learning and Data Mining for Digital Scholarly Editions“ (Universität Rostock, 2022) an und richtet sich an Studierende und Forschende, die an der Schnittstelle von Digital Humanities und KI-Technologien arbeiten. Ziel ist es, theoretische Grundlagen mit praktischer Anwendung zu verbinden und so das Potenzial maschineller Lernverfahren für historische Texteditionen zu erschließen.


Geisteswissenschaftliche Forschung ist zunehmend geprägt von leistungsstarke Werkzeugen, die maschinelles Lernen zur Analyse und Anreicherung von Textdaten verwenden. Mithilfe der Python-Bibliothek BERTopic werden die Teilnehmer:innen verschiedene Schritte des Topic Modelling erkunden. Aufbauend auf der modularen Architektur von BERTopic werden die Teilnehmer:innen in verschiedene wesentliche Methoden des maschinellen Lernens eingeführt, wie z.B. Einbettung (embedding), Dimensionsreduktion (dimensionality reduction) und Clustering. Durch praktische Übungen lernen die Teilnehmer:innen diese Techniken auf historische Texte anzuwenden. Ziel ist es, Nicht-Expert:innen einen praktischen Überblick über die Verwendung der BERTopic-Bibliothek und die grundlegende Theorie hinter ihren Modulen zu vermitteln.

Über das Projekt

Die einwöchige Summer School wird vom Institut für Digitale Geisteswissenschaften an der Universität Graz in Kooperation mit der Know Center Research GmbH Graz und dem Institut für Dokumentologie und Editorik ( IDE ) organisiert.

Die Summer School richtet sich sowohl an Studierende als auch an Forschende, die sich für die Schnittstelle zwischen digitaler wissenschaftlicher Edition und maschinellem Lernen interessieren. Nach dem Besuch des Kurses werden die Teilnehmer:innen über ein grundlegendes Verständnis von Algorithmen des maschinellen Lernens verfügen und in der Lage sein, ihre Anwendungsmöglichkeiten sowie ihre Stärken und Grenzen einzuschätzen. Die Teilnehmer:innen werden in der Lage sein, BERTopic praktisch auf ihre eigenen Daten anzuwenden.

Neben Vorträgen und Tutorien sind zwei Keynote-Vorträge von international renommierten Forscherpersönlichkeiten vorgesehen. Networking wird durch gemeinsame Veranstaltungen gefördert.

Die Lehrmaterialien – darunter kompakte Einführungsvideos, Präsentationsfolien und Code-Notebooks – werden offen zugänglich über GitHub und DARIAH-Campus bereitgestellt, um eine nachhaltige Nutzung über die Präsenzveranstaltung hinaus zu ermöglichen.

Summer School Website Call for Participation