Zum Hauptinhalt springen

Digital Edition Creation Pipelines: Tools and Transitions

Hosting-Organisationen
Institut für Digitale Geisteswissenschaften
Verantwortliche Personen
Helmut W. Klug
Beginn
Ende

Digitale Editionen sind ein Schlüsselbereich der Digital Humanities und ermöglichen es, Quellen für die wissenschaftliche Gemeinschaft zugänglich zu machen. Editionsprojekte umfassen die Erfassung, Kommentierung, Anreicherung und Veröffentlichung von Quellenmaterial und verwandeln diese in Forschungsdaten. Sie umfassen textuelle, visuelle und potenziell quantitative Daten und erfordern oft maßgeschneiderte Benutzeroberflächen, um domänenspezifische Forschungsfragen zu repräsentieren. Obwohl jedes Editionsprojekt seine eigenen spezifischen Anforderungen hat, lassen sich einzelne Schritte identifizieren, die projektübergreifend notwendig sind.

Zusammengefasst handelt es sich um folgende Schritte:

  • Transkription und Verwaltung von Bildern und Text, Umwandlung des transkribierten Textes in Textstrukturen (Absätze, Überschriften usw.), die als XML/TEI ausgedrückt werden,
  • Modellierung relevanter Textphänomene,
  • Annotation semantischer Informationen und benannter Entitäten und Erstellung von Indizes,
  • Erstellung von FAIR-Daten und Veröffentlichung einschließlich einer Webdarstellung.

Bei jedem Schritt kommen unterschiedliche Methoden und Werkzeuge zum Einsatz.

Ziel des Projekts ist es, Best-Practice-Leitfäden und Tutorials für die Übergänge zwischen ausgewählten Werkzeugen (z.B. Transkribus, From The Page, Ediarum, LAKomp, GAMS, TEI Publisher) zu erstellen, sowie Schulungsmaterialien mit Fokus auf die Werkzeuge selbst. Diese Tutorials und Richtlinien werden als Erweiterung des KONDE Weißbuchs realisiert, Tools und Skripte werden auf GitHub veröffentlicht. Die Ressourcen werden auch in die jeweiligen Community-Infrastrukturen (z.B. DARIAH Campus ) integriert.

Damit wird sichergestellt, dass zukünftige Editionsprojekte ihre maßgeschneiderten Workflows einfach und effizient planen können. Gemeinsame Werkzeuge können so im Hinblick auf ihre Anforderungen und ihr Zusammenspiel mit anderen Werkzeugen evaluiert und verbessert werden.

Keywords: digitale Edition, Tools, Tutorials


Outcomes

Link zur Website Digital Creation Pipelines
  • DigEdTnT Workshop: Meet the Tools and Developers
    Ein erster hybrider Workshop wurde abgehalten: Die in diesem Workshop behandelten Tools waren Transkribus, FairCopy, FromThePage, ediarum, IIIF und ein Abendvortrag mit dem Titel „Tools für digitale Editionen als Helfer und Hürden: Wie haben wir die Werkzeuge im Griff?“. Die Ergebnisse des Workshops wurden auf der Projektwebsite veröffentlicht. Zwei Tool-Beschreibungen, FromThePage und Transkribus, wurden bereits fertiggestellt und auf der gleichen Plattform veröffentlicht. Anhand von Beispielprojekten wird an zwei Übergängen gearbeitet: von FromThePage zu ediarum und von Transkribus zu FairCopy.

<blockquote class=„twitter-tweet“><p lang=„de“ dir=„ltr“>Ulrike Henny-Krahmer <a href=„ https://twitter.com/u_henny?ref_src=twsrc%5Etfw“>@u_henny</a > von der Universität Rostock gestaltet die Abend Keynote: “Tools für digitale Editionen als Helfer und Hürden: Wie nehmen wir die Werkzeuge in die Hand?”<a href=„ https://twitter.com/ideinfo?ref_src=twsrc%5Etfw“>@ideinfo</a > <a href=„ https://twitter.com/DH_Graz?ref_src=twsrc%5Etfw“>@DH_Graz</a > <a href=„ https://twitter.com/AtClariah?ref_src=twsrc%5Etfw“>@AtClariah</a > <a href=„ https://twitter.com/hashtag/DigEdTnT?src=hash&amp;ref_src=twsrc%5Etfw“>#DigEdTnT</a > <a href=„ https://t.co/B2RuKp02oU“>pic.twitter.com/B2RuKp02oU</a></p>&mdash ; Christopher Pollin (@LurchPollin) <a href=„ https://twitter.com/LurchPollin/status/1628795745988972547?ref_src=twsrc%5Etfw“>February 23, 2023</a></blockquote> <script async src=„ https://platform.twitter.com/widgets.js “ charset=„utf-8“></script>

Impressionen von dem Workshop (Februar 2023)

<blockquote class=„twitter-tweet“><p lang=„en“ dir=„ltr“>FairCopy presented by <a href=„ https://twitter.com/nick_performant?ref_src=twsrc%5Etfw“>@nick_performant</a><br > (Nicholas Laiacona) from <a href=„ https://twitter.com/PerformantSoft?ref_src=twsrc%5Etfw“>@PerformantSoft</a><br > . <a href=„ https://t.co/6DII3vsEXb“>https://t.co/6DII3vsEXb</a><a href=„ https://twitter.com/hashtag/DigEdTnT?src=hash&amp;ref_src=twsrc%5Etfw“>#DigEdTnT</a > <a href=„ https://twitter.com/DH_Graz?ref_src=twsrc%5Etfw“>@DH_Graz</a > <a href=„ https://twitter.com/AtClariah?ref_src=twsrc%5Etfw“>@AtClariah</a > <a href=„ https://twitter.com/hashtag/FairCopy?src=hash&amp;ref_src=twsrc%5Etfw“>#FairCopy</a > <a href=„ https://t.co/ZGVRNd8JFF“>pic.twitter.com/ZGVRNd8JFF</a></p>&mdash ; Christopher Pollin (@LurchPollin) <a href=„ https://twitter.com/LurchPollin/status/1628782847577268228?ref_src=twsrc%5Etfw“>February 23, 2023</a></blockquote> <script async src=„ https://platform.twitter.com/widgets.js “ charset=„utf-8“></script>

Workshop Präsentation: Tool für Annotation

Im Herbst 2023 wurde eine Reihe von Webinaren angeboten, in denen die Übergänge der Tools vorgestellt und Feedback von den Teilnehmern eingeholt wurden, um den Publikationsprozess zu verbessern sowie Wissen zu teilen und weiterzugeben. Darüber hinaus wurden weitere externe Referenten eingeladen, um Tools vorzustellen, die im ersten Workshop noch nicht behandelt wurden, wie z. B. ba[sic], OpenRefine, correspSearch und teiPublisher.\

Das Projekt DigEdTnT zielt darauf ab, Best-Practice-Pipelines und Tutorials für ausgewählte Werkzeuge zu entwickeln. Diese Werkzeuge helfen in verschiedenen Phasen der Erstellung digitaler Editionen, einschließlich Bild- und Textmanagement, Transkription, Modellierung von Textphänomenen durch geeignete Auszeichnungssprachen, semantische Annotation und Erstellung von Indizes. Ein wichtiges Ziel ist es, Übergänge oder Herausforderungen zu bewältigen, die bei der Übertragung von Ausgaben zwischen Tools auftreten, z. B. von FromThePage zu ediarum für weitere Annotationen.