Direkt zum Inhalt

Datenrettung aus der Vergangenheit: Uralte Wetteraufzeichnungen, KI und das Klima der Zukunft

In Archiven weltweit lagern jahrhundertealte handschriftliche Wetteraufzeichnungen. Forschende machen die Daten mit hochspezialisierten KI-Modellen nutzbar, um Klimamodelle und Wettervorhersagen zu verbessern. 
Regale voller alter Papierdokumente in einem Archivraum in der Demokratischen Republik Kongo. Die Dokumente sind gestapelt und teilweise vergilbt. Im Raum stehen mehrere Reihen von Metallregalen eng nebeneinander.
Tausende Papierdokumente schlummern weltweit in meteorologischen Archiven, wie hier in der Demokratischen Republik Kongo. Forschungsgruppen wollen sie mithilfe von KI nutzbar zu machen.

Woher soll man wissen, wie der Klimawandel eine bestimmte Region eines Landes beeinflussen wird? Kann künstliche Intelligenz helfen, Hurrikans oder andere Extremwetterereignisse vorherzusagen? Und hat die Welt ihr Ziel, die globale Erwärmung auf anderthalb Grad Celsius über dem vorindustriellen Niveau zu beschränken, schon verfehlt?

Auf der Suche nach Antworten auf drängende Fragen wie diese steigen Wissenschaftlerinnen und Wissenschaftler hinunter in riesige, lange nicht genutzte Archive, die handgeschriebene Wetteraufzeichnungen beherbergen. Teilweise reichen die Dokumentationen mehr als 200 Jahre zurück. Diese wertvollen, aber manchmal unlesbaren Datenschätze werden jetzt dank immer ausgefeilteren KI-Werkzeugen leichter zugänglich.

»Alle Wetterdienste, egal wo auf der Welt, haben irgendwo einen Keller, in denen sie noch nicht digitalisierte Daten aus dem 19. Jahrhundert aufbewahren«, sagt Marlies van der Schee, Klimaforscherin am Royal Netherlands Meteorological Institute in De Bilt. »Viele Institute wissen nicht einmal, was in ihren Archiven liegt.«

Auf der Suche nach fehlenden Klimadaten ist Derrick Muheki weiter gereist als die meisten anderen. Der Klimawissenschaftler wollte Zugang zu den meteorologischen Archiven der Demokratischen Republik Kongo (DRK). Sie beherbergen Aufzeichnungen aus der Zeit um 1960, als das Land unabhängig wurde, zusammengetragen von 37 Wetterstationen im ganzen Land. Muheki flog von der Hauptstadt Kinshasa aus in die Stadt Kisangani im Norden des Landes, fuhr dann mit dem Boot den Kongo-Fluss entlang und erreichte schließlich auf einer unbefestigten Straße per Motorrad die Zweigstelle Yangambi des Nationalen Instituts für landwirtschaftliche Forschung (INERA) der DRK. Dort blieb er Anfang 2025 für zwei Monate und las tausende Seiten mit Wetteraufzeichnungen.

Muheki brachte genügend Batterien mit, um seine Digitalkamera während des Aufenthalts mit Strom zu versorgen, denn die abgelegene Zweigstelle des INERA ist nicht an das nationale Stromnetz angeschlossen. Er lernte die Bantu-Sprache Lingala, um sich mit anderen INERA-Mitarbeitern zu verständigen. Dabei sei es hilfreich gewesen, dass viele Wörter denen in der Sprache ähnelten, mit der er in seiner Heimat Uganda aufgewachsen ist, sagt der Wissenschaftler.

Zurück an der Freien Universität Brüssel, wo er seine Doktorarbeit anfertigt, begann Muheki, Daten aus den mehr als 9000 eingescannten Bildern zu extrahieren. Dazu verwendete er ein maschinelles Lernprogramm namens MeteoSaver, das er zum Lesen der Wetterprotokolle entwickelt hatte.

Auf Datensuche

In ersten Tests konnte MeteoSaver die Daten nur mit einer Genauigkeit von 75 Prozent transkribieren. Doch Muheki verfeinerte das Programm und trainierte sein neuronales Netz mit Tesseract, einem Open-Source-Paket für die Erkennung von handgeschriebenen Texten. So habe er die Genauigkeit auf 90 Prozent erhöht, sagt der Doktorand.

Die Daten, die er aus den alten Aufzeichnungen gewinnt, sollen entscheidende Informationen darüber liefern, wie sich die Klimabedingungen im zweitgrößten Regenwald der Erde über die Zeit verändert haben. Im Bereich des bewaldeten Zentrums Afrikas klaffte im Bericht des Weltklimarats von 2021 eine große Datenlücke, erzählt Wim Thiery, Muhekis Betreuer an der Freien Universität. Das liege daran, dass zu wenig über die Temperaturen bekannt sei, die dort in der Vergangenheit herrschten. Thiery hofft, dass Arbeiten wie die von Muheki dazu beitragen werden, diese Wissenslücke zu schließen.

Wertvolle Fracht | Mit den Daten aus Wetteraufzeichnungen in alten Schiffslogbüchern lassen sich Klimamodelle füttern. Das hier abgebildete Dokument enthält Daten von Bord des britischen Schiffs »HMBS Dolphin« aus dem 18. Jahrhundert.

Muheki musste zwar ungewöhnlich hohe logistische Hürden überwinden. Doch die DRK ist nicht das einzige Land, das seine Wetteraufzeichnungen bisher nicht vollständig digitalisiert hat. »Überall auf der Welt schlummern noch Papieraufzeichnungen in den Archiven«, sagt Ed Hawkins, Klimawissenschaftler an der University of Reading in Großbritannien. Dazu gehören Millionen ungenutzter Niederschlagsbeobachtungen im Nationalen Meteorologischen Archiv des Vereinigten Königreichs.

Vergessene Zahlen

Hawkins hat mehrere Projekte geleitet, bei denen Bürgerwissenschaftler die Klimaaufzeichnungen von Hand übertrugen. In den 2010er Jahren seien maschinelle Lernprogramme dieser Aufgabe einfach nicht gewachsen gewesen, sagt er. Das Schwierigste ist für diese Tools nicht, handgeschriebenen Text zu entziffern, sondern die tabellarische Struktur in den Dokumenten zu erkennen. »Als meine Kollegen und ich anfingen, [KI-]Tools auszuprobieren, funktionierten sie einfach nicht bei Zahlentabellen«, sagt Hawkins. »So etwas war in ihren Trainingsdaten nicht enthalten gewesen.« Ein Großteil von Muhekis Arbeit bestand daher darin, spezielle Algorithmen für genau diese Aufgabe zu entwickeln. Jetzt endlich würden die Tools langsam so gut, dass sie ähnlich gute Ergebnisse erzielen wie ein Mensch, sagt Hawkins, einer der Mitautoren der Veröffentlichung, in der MeteoSaver vorgestellt wird. Ähnliche Bemühungen anderer Forschungsteams zeigen, dass maschinelles Lernen die Übertragung historischer Aufzeichnungen drastisch beschleunigen könnte. »Das revolutioniert wirklich unsere Fähigkeit, Daten zu retten«, sagt Thiery.

Martin Stendel ist Klimawissenschaftler am Dänischen Meteorologischen Institut in Kopenhagen. Seine Gruppe entwickelt derzeit eigene, maßgeschneiderte Systeme für maschinelles Lernen. Sie sollen tausende Logbücher von dänischen Schiffen mit Aufzeichnungen aus dem 19. Jahrhundert transkribieren, um mit den Daten entscheidende Lücken in den historischen Dokumentationen der Klimasysteme über dem Atlantik und der Nordsee zu füllen.

Wichtige Details

Seit Beginn der Klimamodellierung würden Daten unauffällig im Hintergrund gerettet, sagt Ed Hawkins. Jetzt erkenne man zunehmend, wie wichtig diese Arbeit sei.

Mit dem Aufkommen datenhungriger, auf maschinellem Lernen basierender Modelle für Klimavorhersagen werden Rohdaten immer wertvoller. Da sich die Technik, diese Daten nutzbar zu machen, laufend verbessert, werden Fachleute künftig nicht nur neue Dokumentensätze digitalisieren können, sondern auch erneut auf bereits gesichtete Dokumente zurückgreifen. Als die Informationen noch von Hand übertragen wurden, durchsuchte man die Datenblätter möglicherweise nur nach der monatlichen Durchschnittstemperatur, selbst wenn sie stündliche Daten und qualitative Informationen wie die Windrichtung oder Himmelsbedeckung enthielten. »Wir hoffen, dass mit Methoden des maschinellen Lernens auch solche Informationen ausgewertet werden können«, sagt Stefan Brönnimann, Klimaforscher an der Universität Bern.

Seite für Seite | Der Klimawissenschaftler Derrick Muheki fotografierte historische Aufzeichnungen ab. Anschließend programmierte er ein KI-gestütztes Verfahren, um die Dokumente zu lesen und nützliche Daten daraus zu extrahieren.

Derartige fein aufgelöste Daten werden dem wachsenden Bedarf zugutekommen, kurzfristige Wetterschwankungen sowie langfristige Trends zu verstehen und vorherzusagen – ebenso wie seltene, zerstörerische Ereignisse. So ist es entscheidend zu wissen, wie häufig etwa Wirbelstürme und großflächige Überschwemmungen früher auftraten und mit welcher Heftigkeit. Nur dann kann man feststellen, ob aktuelle Ereignisse dieser Art durch die Erderwärmung bedingt sind.

Und schließlich ist für Klimawissenschaftler die Frage wichtig, ob die globalen Durchschnittstemperaturen bereits um 1,5 Grad Celsius über das vorindustrielle Niveau gestiegen sind. Darauf, diese Obergrenze einzuhalten, haben sich die Nationen im Pariser Abkommen geeinigt. Normalerweise legen Fachleute das Jahr 1850 als Basis für die vorindustriellen Temperaturen zugrunde, vor allem deshalb, weil zu diesem Zeitpunkt zuverlässige Wetteraufzeichnungen begannen. Doch die Berechnung dessen, was zu jener Zeit »normal« war, ist immer noch mit großen Unsicherheiten behaftet. Darüber hinaus beginnen Forschende, Aufzeichnungen zu digitalisieren, die sogar noch weiter zurückreichen, bis ins späte 18. Jahrhundert. »Die größte Unsicherheit bei der Frage, wo wir [jetzt] stehen, liegt in der Vergangenheit«, sagt Hawkins.

WEITERLESEN MIT »SPEKTRUM +«

Im Abo erhalten Sie exklusiven Zugang zu allen Premiumartikeln von »spektrum.de« sowie »Spektrum - Die Woche« als PDF- und App-Ausgabe. Testen Sie 30 Tage uneingeschränkten Zugang zu »Spektrum+« gratis:

Jetzt testen

(Sie müssen Javascript erlauben, um nach der Anmeldung auf diesen Artikel zugreifen zu können)

  • Quellen
Muheki, D. et al., EGUsphere 10.5194/egusphere-2024–377, 2025 (Preprint)

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.