ACDH-CH Research Lunch mit Nikola Ljubešić
Wann: Dienstag, 10. September - 12:30 Uhr
Wo: ACDH-CH, ÖAW
Bäckerstraße 13, 1010 Wien
Besprechungsraum 2D (2. Stock)
Das Austrian Centre for Digital Humanities and Cultural Heritage (ACDH-CH) der ÖAW freu sich, Sie zum Research Lunch einzuladen:
Wir begrüßen Nikola Ljubešić, Senior Researcher am Jožef Stefan Institute in Ljubljana / Faculty of Computer and Information Science an der Universität Ljubljana, sowie Institute of Contemporary History in Ljubljana, der über das Projekt “ParlaMint - How recent developments in NLP help us reveal the hidden treasures of parliamentary proceedings” referieren wird:
Parlamente sind der Eckpfeiler der Demokratie und gewährleisten die politische Vertretung der Bürger. Trotz ihrer empirischen Relevanz beschränkten sich parlamentarische Studien bisher oft auf ein einzelnes parlamentarisches Gremium oder eine kleine Gruppe von Parlamenten, die in einer vergleichenden Perspektive analysiert wurden. Zwei aktuelle Entwicklungen bieten die Möglichkeit, dies zu ändern. Die erste Entwicklung ist die Verfügbarkeit offener, vergleichbarer parlamentarischer Daten im Rahmen des ParlaMint-Projekts, das Transkripte von 26 europäischen nationalen Parlamenten mit über 7 Millionen Reden in mehr als 20 Sprachen umfasst. Die zweite Entwicklung sind Verbesserungen im Bereich der Verarbeitung natürlicher Sprache, die eine automatische und konsistente Anreicherung umfangreicher Textdaten in verschiedenen Sprachen sowie eine erheblich verbesserte Verarbeitung und Anreicherung großer Mengen von Sprachaufzeichnungen ermöglichen. In diesem Vortrag werde ich zwei Folgeprojekte von ParlaMint vorstellen.
Das erste Projekt, ParlaCAP, konzentriert sich auf die Anreicherung jeder der 7 Millionen parlamentarischen Reden, unabhängig von ihrer Sprache, durch mehrsprachige Sprachmodelle. Jeder Text wird automatisch mit dem erörterten Thema und der zum Ausdruck gebrachten Stimmung versehen, was dazu beitragen wird, die Unterschiede bei der Festlegung der Tagesordnung in den 26 nationalen Parlamenten Europas zu erhellen und die Theorie der „Kernthemen“, die in den europäischen Demokratien vorrangig behandelt werden, neu zu beleuchten. Diese konfirmatorische Arbeit wird durch die Frage erweitert, inwieweit sich der Tonfall, vor allem die Negativität in Gesetzgebungsdebatten, von Land zu Land unterscheidet und wie diese Unterschiede in der Kommunikation mit der Vielfalt der Tagesordnung zusammenhängen.
Das zweite Projekt, ParlaSpeech, konzentriert sich auf die Sicherstellung der Verfügbarkeit der ursprünglichen, gesprochenen Modalität von Parlamentsdebatten. Durch den Abgleich mit den Texttranskripten stellen wir sicher, dass große Mengen an abgeglichenem Sprach- und Textmaterial aus dem öffentlichen Bereich verfügbar sind. Ich werde die Nützlichkeit dieser Daten in Verbindung mit den jüngsten Verbesserungen in der Sprachverarbeitung demonstrieren, indem ich ein vorab trainiertes Sprachmodell zur automatischen Erkennung von Füllwörtern in der Sprache anwende, die nicht Teil der offiziellen Parlamentsabschriften sind. Dies wird es uns ermöglichen, eine informationstheoretische Betrachtung der Funktion von Füllwörtern in der gesprochenen Kommunikation vorzunehmen.
Das Research Lunch findet im Besprechungsraum 2D im 2. Stock des ACDH-CH am Dienstag, 10. September 2024 um 12:30 statt, mit freundlicher Unterstützung von CLARIN-ERIC und CLARIAH-AT .
Wir freuen uns auf eine rege Teilnahme und möchten insbesondere jene Kolleg*innen um Erscheinen bitten, die Interesse für die Themen rund um (Korpus-)Linguistik und/oder natürliche Sprachverarbeitung (NLP) mitbringen, und ihr (Fach-)Wissen teilen und diskutieren möchten!