Zum Hauptinhalt springen

Summer School: Machine Learning for Digital Scholarly Editions - Anmeldung offen!

Wann: Montag, 8. September - Freitag, 12. September 2025

Wo: Institut für Digitale Geisteswissenschaften (Universität Graz)
Elisabethstraße 59/III, 8010 Graz, Österreich

Anmeldung: Die Frist für Einreichungen ist bereits verstrichen (31. März 2025).

Organisation: Martina Scholger, Sarah Lang, Bernhard Geiger, und Roman Bleier ( Universität Graz ), in Kooperation mit dem Know Center Graz , TU Graz und CLARIAH-AT.


Maschinelles Lernen prägt zunehmend die Forschung in den Digital Humanities und bietet leistungsstarke Werkzeuge zur Analyse und Anreicherung von Textdaten. Mithilfe der Python-Bibliothek BERTopic werden die Teilnehmer:innen verschiedene Schritte des Topic Modelling erkunden. Aufbauend auf der modularen Architektur von BERTopic werden die Teilnehmer:innen in verschiedene wesentliche Methoden des maschinellen Lernens eingeführt, wie z.B. Einbettung (embedding), Dimensionsreduktion (dimensionality reduction) und Clustering. Durch praktische Übungen lernen die Teilnehmer:innen diese Techniken auf historische Texte anzuwenden. Ziel ist es, Nicht-Expert:innen einen praktischen Überblick über die Verwendung der BERTopic-Bibliothek und die grundlegende Theorie hinter ihren Modulen zu vermitteln.

Das Seminar richtet sich sowohl an Studierende als auch an Forschende, die sich für die Schnittstelle zwischen digitaler wissenschaftlicher Edition und maschinellem Lernen interessieren. Nach dem Besuch des Kurses werden die Teilnehmer:innen über ein grundlegendes Verständnis von Algorithmen des maschinellen Lernens verfügen und in der Lage sein, ihre Anwendungsmöglichkeiten sowie ihre Stärken und Grenzen einzuschätzen. Die Teilnehmer:innen werden in der Lage sein, BERTopic praktisch auf ihre eigenen Daten anzuwenden.

Für weitere Informationen beachten Sie bitte den Call for Participation .


Schedule

ZeitMontag (8.9.)Dienstag (9.9.)Mittwoch (10.9.)Donnerstag (11.9.)Freitag (12.9.)
8:30 - 9:00Registration
9:00 - 10:30Welcome and setup (Georg Vogeler, Walter Scholger) (Roman Bleier, Martina Scholger)Embeddings (Michael Jantscher)Clustering (Max Toller)Tokenization and weighting (Klara Venglarova)Experiments
10:30 - 11:00Coffee breakCoffee breakCoffee breakCoffee breakCoffee break
11:00 - 12:30BERTopic: overview and example (Selina Galka)Embeddings (Michael Jantscher)Clustering (Max Toller)Topic finetuning (Lucija Brozić)Machine learning and DSE wrap up (Sarah Lang)
12:30 - 13:30LunchLunchPoster SessionLunchLunch
13:30 - 15:00Introduction to PythonDimensionality reduction (Bernhard Geiger)Exkursion:Built your BERTopic pipeline (Roman Bleier, Martina Scholger)Keynote Ulrike Henny-Krahmer (online)
15:00 - 15:30Coffee breakCoffee break“Buschenschank“Coffee breakGoodbye coffee
15:30 - 17:00Prepare a dataset (Roman Bleier, Martina Scholger)Dimensionality reduction (Bernhard Geiger)Experiments (Michael Otto)
18:00Keynotezurück in Graz um ca. 21:30

Weitere Informationen, Anmeldung, Details zu den Tutoren und Keynote-Sprecher*innen finden sich auf der dezidierten Website der Summer School:

Summer School: ML for DSE

related Links: