CLARIN Café - Computer-Assisted Pragmatic Annotation of Native and Learner Corpora
Wann: Freitag, 14. Juni 2024; 14:00 – 16:00
Wo: virtuelles CLARIN Zoom Meeting
CLARIN Host: Iulianna van der Lek
Anmeldung erbeten, nutzen Sie dafür diesen Link.
Das CLARIN Café wird in englischer Sprache statt finden.
Die Korpora DisDir und Ladder bestehen aus elizitierten Sprechakten der Absage und Aufforderung in Italienisch L1 und L2, Deutsch und kolumbianischem Spanisch. Sie wurden für die pragmatische Forschung im Bereich der transkulturellen Pragmatik und des Zweitsprachenunterrichts gesammelt und teilweise manuell annotiert. Basierend auf den oben genannten Daten verfolgt das Projekt LadderWeb folgende Ziele:
- eine auf maschinellem Lernen basierende Software zu trainieren, die für die automatische Annotation von pragmatischen Kategorien in Anfragen und Absagen in Italienisch L1 und L2 und den anderen oben genannten Sprachen programmiert ist.
- Einen Teil des Korpus mit KI-Unterstützung zu annotieren und alle ermittelten Daten im ARCHE CLARIN Repository zu archivieren.
- Das Korpus soll für Lernende und Praktiker über eine Webschnittstelle zugänglich und abfragbar sein.
Im Gegensatz zu früheren Versuchen der pragmatischen Annotation basiert das LadderWeb-Projekt auf elizitierten Daten, die Sprechakte einschränken, außersprachliche Kontexte kontrollieren und die Erkennung von impliziten Informationen ermöglichen. Dies ermöglicht es, die traditionellen Probleme, die mit der pragmatischen Annotation verbunden sind, zu umgehen und zeichnet das Projekt als Pionierleistung in der Annotation von Muttersprachler- und Lernerkorpora aus.
Diese Präsentation wird die Schritte aufzeigen, die zur Sammlung und (automatischen) Annotation des Korpus sowie zur Entwicklung des Codes für die automatische Annotation durchgeführt wurden. Außerdem werden eine Demo und Best-Practice-Empfehlungen für Pädagogen, die das Web-Interface nutzen, vorgestellt.
Programm
14:00-14:05 Opening and CLARIN 1-0-1 by Francesca Frontini, Member of the CLARIN Board of Directors
14:05-14:15 DisDir and Ladder: Aims and architecture of the corpora
Diego Cortés Velásquez, Elena Nuzzo (Roma Tre), Nicola Brocca (UIBK)
14:15-14:30 Pragmatic categories and annotation challenges
Nicola Brocca, Maria Rudigier, Valentin Spielthenner (UIBK)
14:30-14:40 Q&A
14:40-14:50 Building a machine-learning based software for the automatic annotation
Joseph Wang-Kathrein (UIBK)
14:50-15:00 Archiving according FAIR principles
Joseph Wang-Kathrein, Nicola Brocca (UIBK)
15:00-15:10 Publication and long time archiving in CLARIN, via the ARCHE repository
Seta Štuhec (ÖAW)
15:10-15:30 LadderWeb: chances for practitioners, learners and researchers
Nicola Brocca, Eva Maria Hirzinger-Unterrainer (UIBK)
15:30-16:00 Q&A
Den aktuellen Stand zum oben angeführten Programm und Updates zur Veranstaltung finden Sie auf der CLARIN ERIC Website.
Eine Übersicht zu geplanten CLARIN Café Sessions finden Sie auf der CLARIN Café Website.