Sentiment analysis for 18th century multilingual corpora
- Hosting-Organisationen
- Zentrum für Informationsmodellierung - Austrian Centre for Digital Humanities (ZIM-ACDH), Institut für Romanistik, TU Graz - Know-Center und TU Graz - Institute of Interactive Systems and Data Science
- Verantwortliche Personen
- Bernhard Geiger, Elisabeth Hobisch, Philipp Koncar, Martina Scholger und Denis Helic
- Beginn
- Ende
Das derzeit laufende, von der Österreichischen Akademie der Wissenschaften geförderte Projekt Distant Reading for Periodicals of the Enlightenment (DiSpecs - http://gams.uni-graz.at/dispecs) analysiert die Spectator-Periodika aus dem Digitalen Editionsprojekt „The Spectators in the International Context“ (Ertler et al. 2011) mit verschiedenen digitalen Methoden der Computerlinguistik.
In dem darauf aufbauenden, von CLARIAH-AT geförderten Projekt zur Sentimentanalyse der Spectator Periodika wird eine Toolchain zur Sentimentanalyse für mehrsprachige Textkorpora des 18. Jahrhunderts entwickelt. Mit dem Fokus auf lexikonbasierter Sentimentanalyse ist der erste Schritt zu diesem Ziel die Annotation von Texten des 18. Jahrhunderts in Bezug auf die „Polarität“, d.h. den Grad, in dem einzelne Wörter im Text als positiv oder negativ wahrgenommen werden. Diese Annotation, die von ExpertInnen auf dem Gebiet der Romanistik vorgenommen wird, bildet die Grundlage für die Erstellung neuer Sentiment-Lexika in der jeweiligen Sprache. Die so gewonnenen Lexika werden anschließend innerhalb einer Sentiment-Toolchain verwendet, die im Bereich der natürlichen Sprachverarbeitung State-of-the-Art ist, aber bislang nur selten im Bereich der Digital Humanities angewendet wurde.
Die Toolchain ist in einem GitHub-Repository veröffentlicht (https://github.com/philkon/sentiment-tool-chain) und besteht aus zwei Teilen: (i) der Erstellung von Sentiment-Wörterbüchern und (ii) der eigentlichen Sentiment-Analyse. Der erste Teil - der übersprungen werden kann, falls bereits Wörterbücher vorhanden sind - bietet einen Ansatz zur Erstellung von Sentiment-Wörterbüchern, die auf die Sprachen des 18. Jahrhunderts anwendbar sind. Im zweiten Teil werden die so generierten Wörterbücher (Französisch, Italienisch und Spanisch) angewendet und die Sentimentanalyse auf das jeweilige Textkorpus durchgeführt.
Publikationen
Ertler, Klaus-Dieter; Fuchs, Alexandra; Fischer-Pernkopf, Michaela; Hobisch, Elisabeth; Scholger, Martina; Völkl, Yvonne (2011-2021) The Spectators in the international context. https://gams.uni-graz.at/spectators.
Koncar, Philipp; Fuchs, Alexandra; Hobisch, Elisabeth; Geiger, Bernhard; Scholger, Martina; Helić, Denis (2020): Text sentiment in the Age of Enlightenment: an analysis of spectator periodicals. In: Applied Network Science, 5(1), pp. 1-32.
Projektteam
- Bernhard Geiger
- Christina Glatz
- Denis Helic
- Elisabeth Hobisch
- Philipp Koncar
- Martina Scholger
- Yvonne Völkl
Annotation
- Lena Druml
- Klaus-Dieter Ertler
- Alexandra Fuchs
- Christina Glatz
- Elisabeth Hobisch
- Pia Mayer
- Yvonne Völkl