Neuronale Netze in der Biologie

News: Neuronale Netze in der Biologie

Wenn viele eine Sache machen – doch eben nicht alle, oder nur so ähnlich, aber nicht genauso –, dann müssen Verhaltensforscher ihre Daten mit mathematischen Methoden ordnen, kategorisieren und nach den verschiedenen Gründen suchen. Im klassischen Fall bedienen sie sich dabei statistischer Verfahren. Die stellen allerdings gewisse Bedingungen an die Qualität und Quantität der Daten. Und je mehr Parameter die Wissenschaftler bei komplexen Systemen berücksichtigen müssen, umso schwieriger wird es, überhaupt aussagekräftige Ergebnisse zu erlangen. Eine mögliche Lösung des Problems bieten künstliche neuronale Netze. Derartige Computerprogramme lernen an Beispielen, nach welchen Regeln die verschiedenen Größen auf ein System einwirken, und helfen dann bei der Interpretation komplizierter Zusammenhänge in echten Datensätzen. Nach Physikern, Ingenieuren und Mathematikern erkennen nun auch Ethologen und Ökologen die Möglichkeiten neuronaler Netze und ergründen zusammen mit Bioinformatikern, wann das Plankton wiederkehrt und wo die Gänse fressen.

Gänse verstehen nichts von Statistik. Dementsprechend unvorschriftsmäßig bewegen sie sich einfach, wie ihnen der Schnabel gewachsen ist, über die Salzwiesen des Nationalparks Wattenmeer und fressen dort, was einem Gänsegaumen eben so mundet. Doch nicht nur die Verteilung der Vegetationstypen bestimmt, wo die Vögel weiden, sondern eine ganze Reihe von Faktoren wirkt mit an der Unterscheidung zwischen einer attraktiven und einer nicht so begehrten Wiese: Weidevieh hält das Gras kurz, Touristen auf Fahrrädern wirken aus Gänsesicht bedrohlich, Bauarbeiten am Deich beeinflussen in größerem Maßstab die nordische Idylle. Um geeignete Schutzmaßnahmen für die Tiere einzuleiten, damit sie frisch gestärkt ihren Rückflug in die sibirischen Brutgebiete antreten können, müssen Wissenschaftler genau wissen, wonach die Nonnen- und Ringelgänse ihre Futterplätze auswählen.

Im Rahmen dieser Fragestellung beobachtete Heike Weigt von der Universität Osnabrück im Frühjahr 1999 über mehrere Monate die Vögel. Anhand der Verteilung des Gänsekots bestimmte sie, wie oft die Tiere welche Flächen aufsuchten. Ein Vergleich mit den jeweiligen Vegetationsparametern sollte Aufschluss darüber bringen, auf welche Faktoren die Gänse bei ihrer Wahl besonders achten. Als die Biologin jedoch ihre Beobachtungen auswerten wollte, stellte sie fest, dass es kein geeignetes statistisches Verfahren für dieses Analyseziel gab. Das Datenmaterial bestand aus einer Mischung von Nominal-, Ordinal- sowie Intervalldaten, die zudem nicht normalverteilt waren. Mit den klassischen mathematischen Methoden ließen sich daraus keine verlässlichen Aussagen gewinnen.

Wenn die gewohnten Wege nicht zum Ziel führen, muss man eben neue suchen. Weigt wandte sich mit ihrem Problem an die Systemwissenschaftler Marc Strickert und Barbara Hammer, die sich intensiv mit neuronalen Netzen beschäftigen. Derartige Computermodelle sind wie geschaffen für die Modellierung komplexer Systeme, in denen es für normale Software "zu unübersichtlich" wird.

Mehr Flexibilität für komplexere Probleme

Neuronale Netze haben nicht nur ihren Namen aus der Biologie entliehen, sondern sind auch ähnlich strukturiert wie die Nervensysteme von Tieren. "Ein neuronales Netz ist eine Menge von Zellen mit Verbindungen zwischen ihnen. Diese allgemeine Formulierung hat in der Informatik und der Biologie gleichermaßen Gültigkeit", erklärt Strickert.

Bereits im Jahre 1943 beschrieben McCulloch und Pitts eine Struktur, die man heute als neuronales Netz bezeichnen würde. Der von ihnen eingeführte Zelltyp besteht aus erregenden und abschwächenden Eingangskanälen, die von anderen Zellen gespeist werden und aktiv oder inaktiv sein können. Dabei wird aktiv erregenden Zellen der Wert +1 zugeordnet, aktiv abschwächenden Zellen -1 und inaktiven Einheiten eine 0. Jede Zelle addiert die Werte der Eingangskanäle auf. Überschreitet die Summe einen bestimmten Schwellenwert, feuert sie als Ausgangssignal je nach Typ +1 oder -1, ansonsten setzt sie ihren Ausgangskanal auf 0. Die beiden Wissenschaftler wiesen nach, dass solche Systeme jede arithmetische und logische Funktion berechnen können, wenn die Einzelzellen in der richtigen Weise zu einem größeren Verband gekoppelt und mit passenden Schwellenwerten versehen werden.

Heute existieren verschiedene Typen von neuronalen Netzen, die auf unterschiedliche Problemstellungen spezialisiert sind. Vom Standpunkt der Informatik aus handelt es sich jedoch stets um einen gewichteten Graphen, also eine Menge von Knoten (Zellen) mit Kanten (Axonen) dazwischen und Gewichten (Synapsen), mit denen die Stärke der Neuronenverbindungen eingestellt wird.

Die Netze des häufig genutzten Feedforward-Typs sind recht einfach aufgebaut: Auf eine Schicht von Eingabeneuronen folgen beliebig viele hintereinandergeschaltete Schichten von Knoten, in denen die Informationen kombiniert und verarbeitet werden. Das Ergebnis gibt schließlich eine Ausgabeschicht wieder.

Im Gegensatz zu den Zellen von McCulloch und Pitt arbeiten die Neuronen mittlerweile mit reellen Zahlen, statt dem "Alles-oder-nichts"-Prinzip. Das ermöglicht zum einen eine feinere Charakterisierung ihrer Aktivität, andrerseits kann damit eine Feineinstellung der Synapsen erfolgen.

Bei den Eingabedaten muss es sich nicht um Größen handeln, die von sich aus als Zahlenwert vorliegen. Auch Ordinaldaten – wie "wenig", "mäßig" und "viel" – lassen sich in ein reelles Intervall abbilden. Nominaldaten wie zum Beispiel Farben können eingefüttert werden, indem man jedem Zustand ein eigenes Eingabeneuron zuordnet, das auf 1 oder 0 gesetzt wird. Binäre "Entweder-oder"-Entscheidungen sind mit einem einzelnen Neuron, das ein oder aus ist, zu erfassen. Selbst gemischte Datentypen stellen kein Problem dar: Arten, deren Namen Nominaldaten darstellen, sind über ihre Verwandschaft oder Zugehörigkeit zu einer Pflanzengesellschaft mehr oder minder eng miteinander verbunden, was als Zahlenwert wiedergegeben werden kann. Vorausgesetzt, man hat das Datenmaterial sinnvoll aufbereitet, werden alle Informationen entsprechend ihrer Gewichtung berücksichtigt.

Auch Netze müssen lernen

Diese Gewichtung ermittelt das neuronale Netz selbst in einer Reihe von Trainingsläufen. Dazu füttert man es mit repräsentativen, widerspruchsfreien Daten. Das können zum Beispiel Angaben über die Vegetationstypen und den Nutzungsgrad einer Wiese sein. Schicht für Schicht bilden die Neuronen hinter der Eingabeebene aus den Werten, die sie erhalten, das Skalarprodukt mit den Synapsen-Gewichten, ziehen einen neuronenspezifischen Schwellenwert ab und ermitteln mit einer Aktivierungsfunktion ihre Ausgabe. Im Falle des Gänseproblems etwa die Dichte des Vogelkots auf einem bestimmten Wiesentyp. In den ersten Durchläufen errechnet das Netz für die Ausgabeneuronen häufig noch Zustände, die nicht zu den Eingaben passen. So könnte es anfangs zu dem Schluss kommen, dass viele Gänse den Weidetyp A besuchen, obwohl der Anteil schmackhafter Pflanzen dort außerordentlich niedrig liegt. Der Computer vergleicht während des Trainings seine Prognose mit dem tatsächlich im Freiland ermittelten Ergebnis. Ein Backpropagation-Algorithmus verändert nach jeder Runde in einem umgekehrten Durchgang die Gewichte, so dass schließlich die Abweichung der errechneten Aussage vom bekannten realen Zustand ein Minimum erreicht. Diese Prozedur wird für jedes Muster von Eingabe und Ausgabe so oft wiederholt, bis der Gesamtfehler des Netzes hinreichend klein geworden ist. Durch ein abgewandeltes Verfahren ist bereits in dieser Phase zu erkennen, welche Eingabedaten einen großen Einfluss auf das Resultat haben und welche ohne Probleme vernachlässigt werden können.

Genügend große Netze werden jede Aufgabe bewältigen, indem sie tatsächlich nur die zusammengehörigen Daten auswendig lernen. Deshalb sollte ihre Architektur so gewählt sein, dass sie mit möglichst wenig verdeckten Schichten die Trainingsdaten erfolgreich erklären können.

Ein geübtes neuronales Netz hat schließlich von selbst Regeln gefunden, mit denen sich aus beliebigen Ausgangsdaten der wahrscheinlichste Endzustand berechnen lässt. Im Rahmen einer Sensitivitätsanalyse kann man einfach ausprobieren, was passiert, wenn sich ein Parameter verändert, zum Beispiel die Beweidung der Flächen durch Rinder. Während traditionelle Verfahren wie Korrelationsmodelle eine gewisse Linearität des Systems voraussetzen, sind neuronale Netze nicht durch solche Annahmen in ihrer Aussagekraft eingeschränkt.

Erfolge in der "echten" Welt der Biologie

Nach und nach erkennen Biologen die Vorteile der Methode. So bestimmte die Systems Ecology Group am Forschungsinstitut Senckenberg mit Hilfe von Simulationsmodellen und neuronalen Netzen erfolgreich den Zeitpunkt, zu dem das Zooplankton bei Helgoland auftaucht. Dem Team unter der Leitung von Wulf Greve standen Messdaten aus den letzten 20 Jahren zur Verfügung. Zunächst für 17 Arten berechneten die Forscher, welchen Einfluss die einzelnen Parameter wie zum Beispiel Futtermenge, Fraßfeinde und Strömungen hatten. Es stellte sich heraus, dass der Temperatur des Meereswassers eine größere Bedeutung zukam, als dies in den bisherigen Modellen angenommen worden war. Bis auf durchschnittlich zwei Wochen genau konnten die Wissenschaftler die Ankunft des Zooplanktons vorhersagen. Demnächst wollen sie ihr Prognosesystem auf annähernd 200 Arten ausdehnen – die dabei zu bewältigende Datenmenge dürfte mit konventionellen Verfahren schwierig zu verarbeiten sein.

Auch die Frage, wonach Gänse ihre Lieblingswiesen aussuchen, lässt sich mit Hilfe neuronaler Netze klären. "Am wichtigsten waren bei meinen Untersuchungen der Beweidungsgrad durch Nutztiere und die Bedeckung der Fläche mit Gras", erklärt Weigt. "Im Vergleich dazu war der Vegetationstyp von geringer Bedeutung. Vermutlich hat das Untersuchungsgebiet einfach seine Tragkapazität so gut wie erreicht." Der Andrang ist also so groß, dass die Vögel nicht völlig frei wählen können, was auf ihrer Speisekarte stehen soll.

Da haben es die Biologen im Zeitalter der Informatik schon besser: In ihrem Kampf mit immer größeren heterogenen Datenmengen haben sie mit der Entwicklung neuronaler Netze ein mächtiges Werkzeug zur Auswertung dazugewonnen.

Siehe auch

Spektrum Ticker vom 24.1.2000
"Erfolgreiche Planktonprognose"
(nur für Ticker-Abonnenten zugänglich)
Spektrum der Wissenschaft 6/96, Seite 31
"Neuronale Netze lernen im Schlaf"
(nur für Heft-Abonnenten online zugänglich)
Spektrum der Wissenschaft 11/95, Seite 84
"Lernhilfen für neuronale Netze"
(nur für Heft-Abonnenten online zugänglich)

Der Heidelberger Verlag Spektrum der Wissenschaft ist Betreiber dieses Portals. Seine Online- und Print-Magazine, darunter »Spektrum der Wissenschaft«, »Gehirn&Geist« und »Spektrum – Die Woche«, berichten über aktuelle Erkenntnisse aus der Forschung.