Zum Hauptinhalt springen

SARIT—Search and Retrieval of Indic Texts

Hosting-Organisationen
IKGA - Institut für Kultur u. Geistesgeschichte Asiens
Verantwortliche Personen
Birgit Kellner, Patrick McAllister, Liudmila Olalde, Andrew Ollett und Dominik Wujastyk
Beginn
Ende

SARIT, „Search and Retrieval of Indic Texts“, ist ein internationales Projekt mit dem Ziel indische Texte in einer möglichst einheitlichen Weise zugänglich zu machen. Als „indische Texte“ gelten hierbei alle vormodernen und in indischen Sprachen verfassten Werke.

SARIT erstellt Empfehlungen für das Markup indischer Texte der besagten Art, wendet diese Regeln auf die von SARIT direkt verwalteten Texte an und stellt eine Anwendung öffentlich zur Verfügung, mit der diese Texte gelesen und durchsucht werden können.

Dementsprechend fallen die Ergebnisse von SARIT in drei unterschiedliche Bereiche:

  1. SARIT erstellt detaillierte Anleitungen für das Mark-up indischer Texte: https://github.com/sarit/SARIT-corpus/blob/master/schemas/odd/sarit-guidelines.xml (mit einer HTML Version auf https://sarit.indology.info/sarit-pm/docs/encoding-guidelines-simple.html). SARIT verwendet dazu einen Teil des analytischen Vokabulars, das von dem Konsortium der Text Encoding Initiative in den Guidelines for Electronic Text Encoding and Interchange (https://www.tei-c.org/P5/) erstellt wurde und fügt eigene Dokumentation hinzu. Dieses Bemühungen haben zur Gründung einer Arbeitsgruppe (Special Interest Group „Indic Texts“) als Teil der TEI geführt (https://wiki.tei-c.org/index.php/SIG:IndicTexts).
  2. SARIT verwaltet auf https://github.com/sarit/sarit-corpus eine Bibliothek von Texten, die gemäß diesen Empfehlungen kodiert wurden: diese Texte sind unter freizügigen Creative Commons Lizenzen verfügbar. Entsprechend den unterschiedlichen Forschungsinteressen der für SARIT tätigen Personen enthält diese Bibliothek Texte in verschiedenen Sprachen und aus diversen literarischen Gattungen.
  3. Eine Anwendung zum Lesen und Durchsuchen dieser Texte läuft auf https://sarit.indology.info/. Aktuell ist diese Anwendung eine auf die Bedürfnisse von SARIT angepasste Version der „eXist-db Native XML Database“ (https://github.com/eXist-db/exist). Der Quellcode dieser Anwendung ist auf https://github.com/sarit/sarit-existdb frei zugänglich.

Von 2013 bis 2017 wurde SARIT im Rahmen eines „NEH/DFG Bilateral Digital Humanities“ Projektes unter der Leitung von Prof. Sheldon Pollock (Columbia University) und Prof. Birgit Kellner (heute IKGA, ÖAW) großzügig gefördert. Aktuell wird SARIT von ForscherInnen an verschiedenen Instituten getragen, darunter dem IKGA.