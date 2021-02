Die riesigen Genom- und Protein-Datenbanken verdanken wir der Arbeit von Margaret Dayhoff, einer Pionierin der Bioinformatik an der National Biomedical Research Foundation in Silver Spring, Maryland. In den frühen 1960er Jahren versuchten Biologen, die Aminosäuresequenzen von Proteinen zu entschlüsseln. Damals begann Dayhoff diese Informationen zu sammeln, um nach Hinweisen auf evolutionäre Beziehungen zwischen verschiedenen Arten zu suchen. Ihr »Atlas of Protein Sequence and Structure«, den sie 1965 zusammen mit drei Kollegen veröffentlichte, enthielt das bisherige Wissen über die Sequenzen, Strukturen und Ähnlichkeiten von 65 Proteinen. Das war die erste Sammlung, die »nicht an eine bestimmte Forschungsfrage gebunden war«, schrieb der Historiker Bruno Strasser 2010. Dayhoff codierte ihre Daten durch Lochkarten, wodurch sich die Datenbank am Computer durchsuchen und erweitern ließ.

Ein bakterielles »Expressom« | Diese molekulare Struktur ist eine von mehr als 170 000 im Archiv der Protein Data Bank.

Daraufhin folgten ähnliche Systeme: Die »Protein Data Bank«, in der heute mehr als 170 000 makromolekulare Strukturen erfasst sind, ging 1971 in Betrieb. Zehn Jahre später erstellte der Evolutionsbiologe Russell Doolittle von der University of California, San Diego, eine weitere Protein-Datenbank namens »Newat«. 1982 erschien das heute als »GenBank« bekannte DNA-Archiv, das die US National Institutes of Health unterhalten.

Im Juli 1983 erwiesen sich diese Ressourcen als besonders wertvoll. Zwei Teams unter der Leitung von Doolittle und dem Biochemiker Michael Waterfield vom Imperial Cancer Research Fund in London machten damals unabhängig voneinander eine erstaunliche Entdeckung: Sie erkannten eine Ähnlichkeit zwischen den Sequenzen eines menschlichen Wachstumsfaktors und eines Proteins in einem Virus, das bei Affen Krebs verursacht. Das legte einen Mechanismus für die Onkogenese (die Entwicklung von bösartigen Tumoren) durch Viren nahe. In der Folge begannen Biologen, Krebs durch den Vergleich von Sequenzen zu erforschen, wie James Ostell berichtet, ehemaliger Direktor des US national Center for Biotechnology Information (NCBI).

Darüber hinaus, erklärt Ostell, war das »der Start der objektiven Biologie«. Zusätzlich zu Experimenten, die Hypothesen testen, konnten Forscher frei zugängliche Datensätze auf bestimmte Zusammenhänge hin untersuchen, die den Datensammlern vielleicht nie in den Sinn gekommen wären. 1991 erweiterten die Programmierer des NCBI die Möglichkeiten, indem sie die verfügbaren Informationen miteinander verknüpften: Die Datenbank »Entrez« verbindet mehrere Biochemie-Datenbanken.

4. Wetter- und Klimavorhersage: Das allgemeine Zirkulationsmodell (1969)

Am Ende des Zweiten Weltkriegs nutzte der Informatikpionier John von Neumann Computer, die ein paar Jahre zuvor noch Flugbahnen und Waffendesigns berechnet hatten, um das Wetter vorherzusagen. Bis zu diesem Zeitpunkt, erklärt der Klimatologe Manabe von der Princeton University, machte man das rein empirisch. Man stützte sich auf Erfahrungswerte und Vermutungen, um in die Zukunft zu extrapolieren. Von Neumanns Team versuchte hingegen, eine numerische Vorhersage auf der Grundlage physikalischer Gesetze zu entwickeln.

Die dazugehörigen Gleichungen waren zwar schon seit Jahrzehnten bekannt, aber in der Praxis nicht lösbar: Man musste dafür die exakten Witterungsbedingungen bestimmen, anschließend berechnen, wie sie sich innerhalb eines sehr kurzen Zeitraums ändern würden, und dieses Prozedere immer wieder wiederholen. Das erwies sich als so zeitaufwändig, dass das Wetter die Wissenschaftler dabei einholte: 1922 verbrachte Lewis Fry Richardson Monate damit, eine Vorhersage für die nächsten sechs Stunden zu kalkulieren. Das Ergebnis erwies sich als extrem ungenau und enthielt Phänomene, die in der Realität nicht eintreten können.