Hilfe für Historiker: KI füllt Lücken in lateinischen Inschriften

Fachleute haben ein KI-Modell erstellt, das antike lateinische Inschriften entziffert: Die künstliche Intelligenz namens »Aeneas« kann nicht nur bestimmen, wo und wann ein Text wahrscheinlich verfasst wurde, sondern auch fehlende Partien rekonstruieren. Das Modell, das KI-Experten und Althistoriker am 23. Juli in einer Studie in »Nature« vorstellten, haben einige Mitglieder jenes Teams entwickelt, das zuvor schon ein KI-Tool erarbeitet hatte, um antike griechische Inschriften zu entziffern.
Das Studium antiker Inschriften, die sogenannte Epigraphik, ist ein anspruchsvolles Unterfangen, da in den Texten häufig Buchstaben, Wörter oder ganze Abschnitte verlorengegangen sind. Außerdem veränderte sich im Lauf der Zeit die Sprache selbst. Bei einer Analyse vergleichen Historikerinnen und Historiker die Inschriften deshalb mit anderen Texten, die ähnliche Wörter oder Formulierungen enthalten. Doch das Vergleichsmaterial erst einmal zu finden, sei unglaublich zeitaufwändig, sagt die Epigraphikerin und Koautorin der Studie Thea Sommerschield von der University of Nottingham.
Die Sache wird dadurch erschwert, dass immer wieder neue Inschriften entdeckt werden – schätzungsweise 1500 lateinische Inschriften kommen pro Jahr zum gesamten Textkorpus hinzu. Eine solche Menge an Texten kann keine Einzelperson erfassen, erklärt die Latinistin Anne Rogerson von der University of Sydney.
Trainiert an tausenden Inschriften
Um die Ergänzung, Übersetzung und Untersuchung von Inschriften zu erleichtern, haben Forscher von britischen und griechischen Universitäten sowie vom Google-KI-Unternehmen DeepMind in London ein generatives KI-Modell entwickelt, das sie mit den Inschriften aus den drei weltweit umfangreichsten Datenbanken für lateinische Epigraphik trainierten, unter anderem mit der Epigraphischen Datenbank Heidelberg. Der so zusammengestellte Datensatz umfasste insgesamt 176 861 Inschriften – zirka fünf Prozent davon lagen auch im Bild vor. Das Material stammt aus einem Zeitraum vom 7. Jahrhundert v. Chr. bis zum 8. Jahrhundert n. Chr.
Das Modell besteht aus drei neuronalen Netzen, die jeweils unterschiedliche Aufgaben übernehmen: Eines soll Lücken ergänzen, ein weiteres den wahrscheinlichsten Herkunftsort eines Textes vorschlagen und ein drittes dessen Alter bestimmen. Mit den Ergebnissen fügt »Aeneas« auch eine Liste ähnlicher Inschriften aus dem Datensatz bei, um Belege für sein Ergebnis zu liefern. Diese Nachweise ordnet die KI nach ihrer Relevanz für die untersuchte Inschrift.
»›Aeneas‹ kann relevante Parallelen aus unserem gesamten Datensatz sofort abrufen«, da jeder Text eine eindeutige Kennung in der Datenbank habe, sagt Koautor Yannis Assael, der bei Google DeepMind als Forscher tätig ist.
Test mit Historikern
Wie genau und nützlich das Modell arbeitet, prüfte das Team mit einem Test: 23 Epigraphiker sollten eine lückenhafte Inschrift ergänzen. Die Spezialisten wurden auch gebeten, die Texte zu datieren und deren Ursprung zu bestimmen – sowohl im Alleingang als auch mit Hilfe des Modells. Versuchten die Fachleute ohne KI-Hilfe die Entstehungszeit der Inschrift einzugrenzen, näherten sie sich im Durchschnitt mit einer Schwankungsbreite von etwa 31 Jahren der richtigen Antwort. »Aeneas« lieferte Daten mit einer Genauigkeit von 13 Jahren.
Sollten die Historiker die Herkunft der Inschriften bestimmen und die Texte rekonstruieren, dann konnten sie genauere Ergebnisse liefern, wenn sie auf die Liste ähnlicher Inschriften des KI-Modells und dessen Vorschläge zugreifen konnten. Die Zusammenarbeit mit dem Modell verbesserte also ihre Resultate im Vergleich zur Arbeit ohne KI oder einer gänzlich allein agierenden KI. Mit den Daten der künstlichen Intelligenz verbesserten sich auch die Datierungen der Fachleute: Sie grenzten die Altersbestimmung auf eine Spanne von etwa 14 Jahren um das richtige Datum ein.
Dann prüften Assael, Sommerschield und ihr Team, wie das Modell mit einem bekannten Text umgehen würde – den »Res gestae divi Augusti«, dem Rechenschaftsbericht des ersten römischen Kaisers, Augustus (63 v. Chr.–14 n. Chr.). Dieser ist durch drei Inschriften überliefert, von denen sich die längste (Monumentum Ancyranum) an einer römischen Tempelwand in Ankara findet. Das Modell schätzte das Alter der Inschrift so ähnlich ein wie die Historiker, dabei ließ es sich nicht durch im Text genannte Daten beirren. Es erkannte auch Abweichungen in der Schreibweise und identifizierte andere Merkmale, die Epigraphiker nutzen, um Alter und Herkunft einer Inschrift zu bestimmen.
Auch als »Aeneas« eine Altarinschrift aus dem römischen Mainz (Mogontiacum) untersuchen sollte, schnitt sie gut ab. Zu dem Weihealtar gesellte die KI als beste Parallele einen weiteren Altar, der unweit des anderen gefunden worden war, etwas älter ist und womöglich die jüngere Opfergabe inspiriert hatte. Laut dem Team war der Vorschlag der KI bemerkenswert, weil das Modell den gemeinsamen archäologischen und zeitlichen Kontext der beiden Altäre nicht kannte.
Eine Hilfe, um der Inschriftenflut Herr zu werden
Rogerson ist überzeugt davon: Das Modell lässt sich zur Analyse riesiger Datenmengen einsetzen, die eine einzelne Person nicht bewältigen könnte. Ebenso leistet es Historikern Hilfe, Vergleiche für Inschriften zu finden – eine Arbeit, die sonst Wochen oder sogar Monate in Anspruch nehmen kann. Laut Rogerson dürfte die KI auch für Studenten hilfreich sein, die Epigraphik erlernen möchten.
Die Antworten des Modells scheinen zudem besser durchdacht zu sein und es dürfte weniger fabulieren als gängige KI-Tools, die thematisch nicht spezialisiert sind, fügt Rogerson hinzu. »Es liefert eine Hypothese, die auf Belegen beruht, aus denen sich die Arbeit auch speist – es gibt daher eher eine rationale Vermutung ab als einen wilden Schuss ins Blaue.«
Das Team hinter »Aeneas« betont jedoch, dass das Modell seine Grenzen habe. Da die Trainingsdatenbank kleiner ist als die anderer Modelle wie ChatGPT und Microsofts Copilot, könnte die KI bei außergewöhnlichen Inschriften schlechte Ergebnisse liefern. Für singulär Texte oder Inschriften aus Zeiten, aus denen wenige Vergleiche bekannt sind, ist »Aeneas« daher möglicherweise weniger hilfreich.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.