29. Sep 2022   Bildung & Uni Business Nova

KI entziffert handgeschriebene Dokumente

©Uni Innsbruck

Transkribus. Eine Software der Uni Innsbruck analysiert mit Hilfe Künstlicher Intelligenz handgeschriebene Dokumente. Damit können historische Dokumente in großen Archiven entziffert und durchsucht werden.

In Archiven und Bibliotheken lagern historische Dokumente in großen Mengen. So füllen zum Beispiel die Dokumente im Staatsarchiv in Wien 350 Regalkilometer. Der Großteil dieser Dokumente liegt nur handschriftlich vor und ist für viele Benutzer nicht mehr lesbar, da sie in Kurrentschrift verfasst sind.

„Hier hilft die Transkribus-Plattform, auf der diese Handschrift automatisiert erkannt und damit für alle lesbar gemacht wird“, so Günter Mühlberger von der Arbeitsgruppe Digitalisierung/Archivierung an der Uni Innsbruck und Verwaltungsratsvorsitzender der europäischen Genossenschaft Read-Coop. Die Dokumente werden dadurch auch durchsuchbar. Das erleichtert laut Mühlberger die Recherche in historischen Beständen enorm, weil auf diese Weise Tausende Dokumente gleichzeitig nach Familiennamen oder anderen Begriffen durchsucht werden können.

Kurrent, Arabisch und Chinesisch lesen

Transkribus arbeitet mit neuronalen Netzen. Diese maschinenlernenden Methoden haben den Vorteil, dass sie nicht speziell für eine bestimmte Handschrift programmiert werden müssen. „Die Benutzer bringen der Maschine bei, die Schrift zu lesen“, so Mühlberger. „Und eine Maschine ermüdet nicht, das heißt, sie kann auch Tausende, Hundertausende oder Millionen von Seiten automatisiert verarbeiten. Das haben wir beispielsweise für das finnische Nationalarchiv gemacht, bei dem nunmehr über 2 Millionen handschriftliche Dokumente aus dem 19. Jahrhundert für alle durchsuchbar sind.“

Die verwendete Technologie ist unabhängig von der Sprache und der Schriftart. Transkribus erkennt nicht nur Kurrentschrift oder auch moderne Handschriften, sondern auch mittelalterliche Schriften, aber auch Hebräisch, Arabisch oder indische Schriften. „Und derzeit führen wir gerade Experimente für Chinesisch durch, für altes Chinesisch“, so Mühlberger.

Erleichterung für die Forschung

In der Wissenschaft sind die Anwendungsmöglichkeiten von Transkribus vielfältig. Der Innsbrucker Altphilologe William Barton vom Institut für Neulateinische Studien, der für seine Forschung mit Unterstützung von Transkribus den mit 1,2 Mio. Euro dotierten Start-Preis erhalten hat, entschlüsselt beispielsweise verloren geglaubte Tagebuchaufzeichnungen von Karl Benedikt Hase aus dem 19. Jahrhundert, geschrieben in handschriftlichem Altgriechisch.

„Die Textmenge ist enorm, es sind etwa 2.500 Seiten. Ich habe der Maschine anhand von 100 Seiten ein Modell für Hases Handschrift antrainiert. Jetzt ist sie selbst in der Lage, alle seine Tagebücher zu lesen und den Text zuverlässig zu transkribieren“, so Barton. Eine aktuelle Studie der Uni Edinburgh hat zutage gefördert, dass inzwischen über 400 wissenschaftliche Publikationen erschienen sind, die unter Zuhilfenahme von Transkribus entstanden sind.

Tagung in Innsbruck und online

Transkribus wurde mit Unterstützung der Europäischen Union entwickelt und wird seit 2019 von der von der Uni Innsbruck mitgegründeten europäischen Genossenschaft Read-Coop betrieben, die mittlerweile mehr als 120 Mitglieder aus 27 Ländern vorweisen kann.

Am 29. und 30. September treffen sich an der Uni Innsbruck Experten für Handschriftenerkennung und Nutzer der Plattform, um die jüngsten Fortschritte der Technologie und deren Anwendungen auf unterschiedlichsten Gebieten zu diskutieren. Die Tagung kann auch online mitverfolgt werden.

    Weitere Meldungen:

  1. Griechenlands vielfältige Armeen im Blick der Forscher
  2. Diktatur und Widerstand: Symposium ab 29. Juni 2022
  3. „Advokaten 1938“ beleuchtet Schicksale der NS-Zeit
  4. Was zum Henker …? Alte Rechtspraktiken in heutiger Sprache