Pflanzenzucht: Mit Pangenomik zum Getreide der Zukunft

Es kommt nicht oft vor, dass eine Pflanze das Cover der renommierten Fachzeitschrift »Nature« ziert. Doch am 14. Dezember 2000 war darauf die zarte weiße Blüte der Acker-Schmalwand (Arabidopsis thaliana) zu sehen. Der Grund: Einer mehr als 100-köpfigen internationalen Expertengruppe war es nach gut zehn Jahren gelungen, das vollständige Erbgut, auch Genom genannt, von A. thaliana in mühevoller Kleinarbeit zu entschlüsseln. Ein Meilenstein.
Seitdem hat sich die Pflanzenforschung enorm verändert. Grund dafür sind vor allem die rasanten Fortschritte in der DNA-Sequenzierung und der Genomanalyse. Die systematische Untersuchung des gesamten Erbguts einer Pflanze hat inzwischen Einzug in nahezu alle Bereiche der Pflanzenbiologie gehalten: von der Aufklärung evolutionärer Zusammenhänge über die Identifikation ackerbaulich wichtiger Gene bis hin zur beschleunigten Züchtung neuer Sorten. Gerade in der Nutzpflanzenzucht hat die Genomik, wie dieser Teilbereich der Biologie heißt, dazu beigetragen, komplexe Merkmale wie Trockenstresstoleranz, Krankheitsresistenz oder Ertragsbildung besser zu verstehen und gezielter zu beeinflussen.
Komplette Referenzgenome wie jenes der Acker-Schmalwand aus dem Jahr 2000 dienten lange als Grundlage für funktionelle Studien und die Entwicklung molekularer Marker. Doch eine einzige Referenz bildet immer nur einen Ausschnitt der genetischen Vielfalt ab – meist stammt sie von einer einzelnen, kultivierten Sorte. Viele Gene, vorrangig solche, die für die Anpassung an spezielle Umweltbedingungen oder für bestimmte Resistenzen wichtig sind, fehlen darin oder liegen in anderer Form vor.
Themenwoche »Revolution auf dem Acker«
Zwischen den wilden Süßgräsern, die die Menschen in der Jungsteinzeit anbauten, und den heutigen Getreidesorten liegen Welten. Jahrtausendelange Züchtung hat die Erträge vervielfacht, die Ernten erleichtert und die Pflanzen widerstandsfähiger gegen Schädlinge gemacht. Mit dem rasanten Fortschritt der Molekularbiologie nimmt diese Entwicklung noch einmal drastisch an Fahrt auf. Wie funktioniert moderne Pflanzenzucht, welche Methoden stehen hierfür zur Auswahl? Was ist Genomeditierung und wofür braucht man Pangenomik? Wieso regen sich viele über Grüne Gentechnik auf, aber kaum jemand darüber, dass ein Großteil der heutigen Ackerpflanzen schon einmal mit ionisierenden Strahlen beschossen worden ist? In dieser Themenwoche beantworten wir das und zeigen, wohin sich die moderne Landwirtschaft entwickelt.
- Genomeditierung: Revolution in der Pflanzenzucht?
- Grüne Gentechnik: »Wir müssen endlich eine gescheite Risikoforschung entwickeln«
- Infografik: So geht Pflanzenzucht
- Erbgutanalysen: Mit Pangenomik zum Getreide der Zukunft
- PhänoSphäre: Ein Hightech-Gewächshaus für die Pflanzenforschung
- TILLING-Verfahren: Gene verändern ohne Gentechnik
Alle Inhalte zur Themenwoche »Revolution auf dem Acker« finden Sie auf unserer Themenseite »Landwirtschaft«.
Hier setzt das Konzept der Pangenomik an: Statt nur ein einzelnes Genom zu betrachten, werden viele verschiedene Individuen einer Art sequenziert und verglichen. Dadurch lässt sich nicht nur das sogenannte Kern-Genom erfassen – also jene Gene, die allen Vertretern gemeinsam sind –, sondern auch die variablen Anteile, die zwischen verschiedenen Linien stark schwanken können. Diese genetische Vielfalt ist von großer Bedeutung für die Anpassungsfähigkeit von Pflanzen an sich verändernde Umweltbedingungen und eröffnet neue Perspektiven für die Züchtung. Der Übergang vom Einzelgenom zum Pangenom markiert somit einen Paradigmenwechsel in der Pflanzenforschung.
Technologischer Grundstein wurde 1977 gelegt
Die Genomforschung hat ihren Ursprung in den Pionierarbeiten von Frederick Sanger, der 1977 ein Verfahren zur Sequenzierung der DNA entwickelte. Diesen Durchbruch, der 1980 mit einem Nobelpreis belohnt wurde, verdankte er der damals neu geschaffenen Möglichkeit, einzelne Nukleotidsequenzen präzise zu bestimmen – ein Verfahren, das sich im Lauf der Jahrzehnte rasant weiterentwickelte. Bereits das erste vollständig sequenzierte Genom eines Bakteriums im Jahr 1995 ebnete den Weg für immer umfangreichere Projekte, allen voran die Entschlüsselung des Humangenoms, die im Jahr 2000 ihren Abschluss fand. Diese technologischen Fortschritte schafften die Voraussetzungen dafür, Nutzpflanzengenome zu untersuchen, darunter die von Weizen, Roggen, Hafer und insbesondere der Gerste.
In den Anfangsjahren der Genomik lag der Fokus darauf, ein Referenzgenom pro Art zu dokumentieren. Dieser Ansatz ist allerdings stets nur eine Momentaufnahme der genetischen Ausstattung, die der immensen Vielfalt innerhalb einer Art nicht gerecht wird. Die zunehmende Beschleunigung des Verfahrens und sinkende Kosten machten es schließlich möglich, zahlreiche Individuen einer Art zu sequenzieren und miteinander zu vergleichen. So entstand die Idee, statt eines einzelnen Referenzgenoms ein sogenanntes Pangenom zu erstellen, das die gesamte genetische Bandbreite einer Art abbildet.
Ein Pangenom besteht aus drei wesentlichen Komponenten: dem Kern-Genom, den variablen Genen und den spezifischen Genen. Das Kern-Genom umfasst alle Gene, die in jedem untersuchten Individuum vorhanden sind und essenzielle Funktionen sicherstellen. Die variablen Gene sind solche, die in einem Teil der Population vorkommen und oft Anpassungsprozesse oder umweltabhängige Reaktionen steuern. Genetische Elemente, die nur in einzelnen Linien oder Populationen zu finden sind und potenziell wertvolle, bisher unerkannte Merkmale codieren, werden als spezifische Gene bezeichnet.
Dieser umfassendere Ansatz ermöglicht es, genetische Charakteristika, die für die Anpassungsfähigkeit und somit für den züchterischen Fortschritt entscheidend sind, systematisch zu erfassen. Das Pangenom liefert somit nicht nur ein vollständigeres Bild der genetischen Ausstattung einer Art, sondern bildet auch die Grundlage für die Identifikation von Genen, die in bestimmten Kontexten – etwa bei Stress oder Krankheit – eine bedeutende Rolle spielen.
Ein nahezu idealer Kandidat für pangenomische Studien ist die Gerste (Hordeum vulgare). Sie zählt zu den ältesten domestizierten Kulturpflanzen und nimmt seit Jahrtausenden eine zentrale Stellung in der Landwirtschaft ein. Neben ihrer traditionellen Verwendung als Futtermittel in der Tierhaltung und als Malz in der Brauindustrie ist die Gerste ein wichtiger Modellorganismus in der Pflanzenforschung. Ihr großes, komplexes Genom, das reich an sich wiederholenden Elementen ist, stellt Forschende vor besondere Herausforderungen – und bietet zugleich einzigartige Chancen.
Die enorme genetische Vielfalt der Gerste ist das Ergebnis der jahrtausendelangen Anpassung an verschiedenste Umweltbedingungen
Gerste wird weltweit in sehr unterschiedlichen Klimazonen angebaut, was sich in einer großen genetischen Diversität, unter anderem bei der Regulierung des Blühzeitpunkts und der Kältetoleranz, widerspiegelt. Diese Vielfalt ist das Ergebnis der jahrtausendelangen Anpassung an verschiedenste Umweltbedingungen. Erkenntnisse aus der Gerstenforschung können dabei zum einen zur Verbesserung der Ertragsstabilität und Krankheitsresistenz beitragen und lassen zum anderen wertvolle Rückschlüsse auf die evolutionären Mechanismen in anderen Kulturpflanzen zu.
Diversität der betrachteten Genome ist entscheidend
Die Erstellung eines solchen Pangenoms ist ein komplexer Prozess, der modernste Technologien und interdisziplinäre Zusammenarbeit erfordert. Die wesentlichen Schritte umfassen die Auswahl vielfältiger Genotypen, die Hochdurchsatzsequenzierung, die sogenannte Genomassemblierung, die vergleichende Analyse und die abschließende Validierung.
Um die gesamte genetische Bandbreite abzubilden, werden unterschiedliche Gerstenlinien ausgewählt – darunter Wildgersten, traditionelle Landrassen und moderne Zuchtformen. Diese Diversität ist entscheidend, um seltene und adaptive Gene zu identifizieren. Anschließend wird die DNA mit modernen Sequenzierungsmaschinen ausgelesen. Die unterschiedlichen marktverfügbaren Technologien haben jeweils ihre Vor- und Nachteile hinsichtlich Lesequalität und Länge der Fragmente, weshalb häufig verschiedene Methoden miteinander kombiniert werden. Dabei liefern die einen kurze, aber sehr genaue Abschnitte, während die anderen lange Stücke des Genoms etwas ungenauer erfassen. Zusammengenommen entsteht daraus ein lückenloses und zuverlässiges Bild. Die so gewonnenen Daten lassen sich mithilfe spezieller Software zu vollständigen Genomen zusammensetzen. Anschließend werden die Gene, regulatorischen Abschnitte und sich wiederholenden Sequenzen im Genom identifiziert und kartiert. Das ist entscheidend, um zu verstehen, welche Funktionen diese Bereiche erfüllen und wie sie zusammenwirken.
Nun werden die unterschiedlichen Genome mittels bioinformatischer Verfahren miteinander verglichen. Dabei erfolgt die Identifikation von Kern-, variablen und spezifischen Genen. Statistische Modelle und maschinelles Lernen helfen, Muster in der genetischen Variation zu erkennen und diese mit phänotypischen Merkmalen zu korrelieren. Doch die genomischen Daten allein liefern noch keine Antworten auf die Frage, welche Gene tatsächlich für wichtige ackerbauliche Eigenschaften verantwortlich sind. An dieser Stelle kommen funktionelle Studien im Labor und auf dem Acker ins Spiel. Dazu gehören Knockout-Experimente, bei denen einzelne Gene gezielt ausgeschaltet werden, Transgenese-Experimente, bei denen neue Gene in die Pflanze eingebracht oder vorhandene verändert werden, sowie Expressionsanalysen, mit denen untersucht wird, wann und wie stark bestimmte Gene aktiv sind. So lässt sich herausfinden, welche Gene für wichtige Eigenschaften der Gerste verantwortlich sind und wie sie zur Anpassungsfähigkeit und zum Züchtungserfolg beitragen.
Auf Grundlage der zuvor beschriebenen methodischen Entwicklungen liegt nun ein umfangreiches Datenset vor, das einen differenzierten Blick auf die genetische Vielfalt der Gerste erlaubt. Eine im November 2024 veröffentlichte Studie, an der unser Team am IPK Gatersleben maßgeblich beteiligt war, beschreibt diese Vielfalt anhand einer umfassenden Pangenom-Analyse. Dafür wurden vollständige Genomsequenzen von 76 Wild- und Kulturgersten erstellt und mit zusätzlichen Sequenzdaten von mehr als 1300 weiteren Linien kombiniert. Im Mittelpunkt stand die systematische Erfassung genetischer Unterschiede, vor allem solcher, die mit strukturellen Veränderungen im Erbgut verbunden sind – etwa Genverluste, -duplikationen oder -umordnungen.
Viele dieser Unterschiede betreffen Gene, die eine Rolle für Merkmale wie Krankheitsresistenz, Wuchsform, Nährstoffverwertung oder die Entwicklung der Kornoberfläche spielen. Ein Teil der beobachteten Varianten ist vermutlich bereits im Verlauf der Domestikation entstanden, andere stehen womöglich mit gezielter Selektion in der modernen Pflanzenzüchtung in Verbindung.
Ein Beispiel ist das Mla-Gen in Gerste, das für die Mehltau-Resistenz verantwortlich ist. Wir haben in Genomanalysen entdeckt, dass es in einigen Gerstensorten vierfach hintereinander vorkommt, in anderen jedoch überhaupt nicht. So konnten wir mehr als 149 verschiedene Varianten des Gens identifizieren, ein paar davon in mehrfacher Kopie innerhalb derselben Pflanze. Doch allein aus der Sequenz lässt sich noch nicht ableiten, welche dieser Varianten tatsächlich wirksam sind. Erst die Kombination aus Genom- und Funktionsanalysen wird langfristig Aufschluss über die beste genetische Ausstattung für resistente Pflanzen geben.
Wie sich die Gerste an klimatische Herausforderungen anpasst
Insgesamt fanden wir 169 solcher komplexen Genomregionen mit einer Größe zwischen 20 Kilobasen und 2,2 Megabasen. Besonders auffällig war die extreme Variation in der Zahl der Genkopien, die möglicherweise an der Abwehr von Fraßfeinden beteiligt sind. So existieren Gene aus der Thionin-Familie in manchen Gerstensorten nur dreifach, in anderen jedoch bis zu 74-fach.
Ebenfalls interessant ist das HvTB1-Gen, das eine zentrale Rolle bei der Regulation der Verzweigung im Ährenbereich spielt. Genauer gesagt beeinflusst es die Fertilität der Seitenährchen, also jener seitlichen Blütchen, die in der Gerste neben dem zentralen Blütchen angelegt werden. In Wildgerste liegt HvTB1 in der Regel in einfacher Kopie vor. In bestimmten Kulturgerstensorten mit sechszeiliger Ähre wurden hingegen bis zu vier Kopien desselben Gens nachgewiesen. Diese Vervielfachung könnte mit einer gesteigerten Fruchtbarkeit der Seitenährchen in Zusammenhang stehen – ein zentrales Merkmal, das zur Ausbildung der sechszeiligen Ähre beiträgt und somit unmittelbar die Kornertragsleistung beeinflusst.
Die genaue funktionelle Bedeutung dieser Kopienzahlvariation ist allerdings noch nicht abschließend geklärt. Zwar legen die Ergebnisse der Pangenom-Analyse einen Zusammenhang zwischen Genstruktur und Phänotyp nahe, doch es sind weitere experimentelle Untersuchungen nötig, um eine kausale Beziehung nachzuweisen – etwa mithilfe von gezielten Genfunktionsanalysen oder transgenen Studien. Erst dann lässt sich beurteilen, inwieweit die Variation von HvTB1 züchterisch gezielt genutzt werden kann.
Eine der wirtschaftlich wichtigsten Entdeckungen betrifft das amy1_1-Gen, das die Produktion von α-Amylasen steuert. Diese Enzyme spielen eine zentrale Rolle beim Abbau von Stärke in Zucker, was sowohl für das Wachstum des Keimlings als auch für die Malzproduktion in der Brauerei entscheidend ist. Die Forschenden stellten fest, dass die Kopienzahl des amy1_1-Gens zwischen verschiedenen Gerstensorten stark variiert: Während einige nur zwei Kopien besitzen, finden sich in anderen bis zu acht. Höchst interessant ist, dass eine hohe Kopienzahl mit einer gesteigerten Enzymaktivität korreliert.
Die Genomanalyse ermöglichte es, genau zu bestimmen, welche genetischen Varianten in den beliebtesten Malzgerstensorten wie Morex, Barke und RGT Planet vorkommen. So konnte nachgewiesen werden, dass die deutsche Gerstensorte Barke besonders vorteilhaft für die Malzproduktion ist, da sie eine hohe Enzymaktivität aufweist.
Dank der modernen Sequenzierungstechniken lassen sich genetische Muster entschlüsseln, die jahrtausendelange Züchtungsbemühungen geformt haben
Eine weitere faszinierende Entdeckung betrifft die winzigen Haare an der Gerste, die früher zur Samenverbreitung dienten. Wilde Gerstenarten besitzen lange, einfache Haare, während in manchen modernen Züchtungen kurze, verzweigte Haare auftreten. Der Unterschied hängt an einem bestimmten Gen, das für die Zellteilung während der Haarentwicklung verantwortlich ist. Bei kurzhaarigen Sorten fehlt offenbar ein regulatorisches Element, das die Expression dieses Gens steuert. Diese Erkenntnis könnte dazu beitragen, spezifische Marker zu entwickeln, die es Züchtern erleichtern, bestimmte Haarvarianten auszuwählen.
All die Beispiele zeigen, dass sich dank der modernen Sequenzierungstechniken genetische Muster entschlüsseln lassen, die jahrtausendelange Züchtungsbemühungen geformt haben. Dies wird in Zukunft dabei helfen, widerstandsfähige und wirtschaftlich wertvolle Gerstensorten zu entwickeln, die sowohl Landwirten als auch Verbrauchern zugutekommen.
Große Datenmengen erfordern fortschrittliche Algorithmen
Eine Herausforderung jedoch bleibt: Moderne Sequenzierungstechnologien erzeugen Terabytes an Rohdaten, deren Verarbeitung und Analyse enorme Rechenressourcen benötigen. Diese immense Datenmenge, die bei der Erstellung eines Pangenoms anfällt, erfordert fortschrittliche Algorithmen und leistungsfähige Computersysteme.
Ein weiteres Problemfeld ist die funktionelle Überprüfung der identifizierten Gene. Während bioinformatische Analysen statistisch robuste Verknüpfungen zwischen Genvarianten und phänotypischen Merkmalen herstellen können, bleibt die Frage, wie diese Zusammenhänge im lebenden Organismus tatsächlich wirken. Dazu sind zeitintensive Laborexperimente und Feldversuche nötig.
Dazu bedarf es einer engen interdisziplinären Zusammenarbeit. Molekularbiologen, Bioinformatiker, Statistiker und Züchter müssen ihre Expertise bündeln, um die komplexen Zusammenhänge der Genomvariationen in nutzbare Erkenntnisse für die Züchtung umzusetzen. Nur so können die gewonnenen Daten in konkrete Züchtungsstrategien münden, die langfristig robustere und ertragreichere Gerstensorten zur Folge haben.
Eine zentrale Voraussetzung dafür, pangenomische Daten breit und weltweit nutzbar zu machen, ist ihre systematische Archivierung und Bereitstellung in öffentlich zugänglichen Repositorien. Hierbei spielen die weltweit kooperierenden Datenbanken der International Nucleotide Sequence Database Collaboration (INSDC) – insbesondere NCBI (USA) und ENA (Europa) – eine Schlüsselrolle. Sie ermöglichen es, die umfangreichen Sequenzdaten standardisiert zu speichern, langfristig verfügbar zu machen und international zu vernetzen. Dies schafft die Grundlage dafür, dass Forschungsteams weltweit auf dieselben Datensätze zugreifen und Ergebnisse transparent nachverfolgen können.
Ein wichtiger Arbeitsschwerpunkt wird künftig darin bestehen, diese Daten nicht nur zu speichern, sondern auch benutzerfreundlich zu visualisieren. Spezialisierte Pangenom-Browser sollen es künftig ermöglichen, komplexe strukturelle Varianten, Genkopien und deren Verteilung über verschiedene Linien hinweg interaktiv darzustellen und zu analysieren. Solche Werkzeuge sind entscheidend, um die gewonnenen Erkenntnisse effizient in biologische und züchterische Kontexte zu überführen.
Darüber hinaus gewinnen ergänzende Technologien wie die Genomeditierung mittels CRISPR-Cas-Systemen an Bedeutung. Nachdem pangenomische Analysen potenzielle Zielgene identifiziert haben, lassen sich diese mithilfe von Genomeditierung präzise verändern. Die Kombination aus umfassender Datenerfassung und gezielter Manipulation bietet enorme Chancen, um neue, widerstandsfähige und ertragreiche Gerstensorten zu entwickeln. Die technologischen Fortschritte wirken sich somit auf allen Ebenen der Pangenomik aus – von der Datenerhebung über die Analyse bis hin zur praktischen Anwendung in der Züchtung. Sie sind der Schlüssel, um das enorme Potenzial genetischer Diversität in konkrete Lösungen für die Landwirtschaft umzusetzen.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.