Direkt zum Inhalt
Genforschung

Die Top 10 des menschlichen Erbguts

In der Hitliste des humanen Genoms zeigt sich, wie die Diskussion über einzelne Erkrankungen und Probleme der öffentlichen Gesundheit die Prioritäten der Forschung auf die genetische Ebene verlagerte. Deutlich wird unter anderem die Dominanz ein paar weniger Gene, die meist in mehreren Bereichen und Erkrankungen eine Rolle spielen.
Illustration eines DNA-Moleküls

Peter Kerpedjiev brauchte unbedingt einen Crashkurs in Sachen Genetik. Der Informatiker mit Zusatzausbildung in Bioinformatik arbeitete an seiner Promotion und wollte einfach etwas mehr über die Grundlagen der Biologie erfahren. »Welche Gene muss ich kennen, um mich gut mit jemandem über Biologie unterhalten zu können?«, fragte er sich.

Kerpedjiev fackelte nicht lange und suchte gleich nach Daten. Die US National Library of Medicine (NLM) führt die berühmte PubMed-Datenbank und kennzeichnet darin ganz systematisch alle Veröffentlichung mit Informationen zur Funktion von Genen. Kerpedjiev extrahierte alle Studien, in denen irgendetwas zur Struktur, Funktion oder Lokalisation eines Gens oder seines kodierten Proteins zu finden war. Dann erstellte er eine Liste mit den am häufigsten untersuchten Genen – eine Art Top Ten des Genoms des Menschen und einiger weiterer Spezies.

Ganz oben auf der Liste stand ein Gen namens TP53. Als Kerpedjiev 2014 zum ersten Mal seine Auswertung machte, gab es bereits mehr als 6600 Artikel zu TP53 oder seinem Proteinprodukt p53. Bis heute ist die Zahl auf 8500 gestiegen und es werden immer mehr; im Schnitt kommen täglich zwei wissenschaftliche Artikel dazu, in denen neue Details zu ihren biologischen Grundlagen beschrieben werden.

Diese Popularität ist für die meisten Biologen nichts Neues. Es handelt sich um einen Tumorsuppressor, der weithin als Hüter des Genoms bekannt und in fast der Hälfte aller humanen Krebserkrankungen mutiert ist. »Das erklärt seine anhaltende Popularität«, sagt Bert Vogelstein, Krebsgenetiker von der Johns Hopkins University School of Medicine in Baltimore in Maryland. Im Krebs »ist es das wichtigste Gen überhaupt», sagt er.

Überraschende Liste der Top-Ten-Gene

Andere Gene ganz oben auf der Liste sind heute weniger bekannt, waren aber in früheren Zeiten der Genetikforschung berühmt und kamen mit der Entwicklung neuer Technologien aus der Mode. »Die Liste war wirklich überraschend«, sagt Kerpedjiev, der nun als Postdoc in der Visualisierung genomischer Daten an der Harvard Medical School in Boston in Massachusetts arbeitet. »Bei manchen Genen war klar, dass sie dabei sein würden, bei anderen war es völlig unerwartet.«

»Nature« arbeitete mit Kerpedjiev zusammen, um mehr zu den meistuntersuchten Genen aller Zeiten zu erfahren. Die Analysen erbrachten nicht nur jede Menge Einzelheiten, sondern beleuchteten auch die wichtigsten Trends in der biomedizinischen Forschung. Dabei zeigte sich, wie die Diskussion über einzelne Erkrankungen und Probleme der öffentlichen Gesundheit die Prioritäten der Forschung auf die genetische Ebene verlagerte. Deutlich wurde auch die Dominanz ein paar weniger Gene, die meist in mehreren Bereichen und Erkrankungen eine Rolle spielen.

»Das zeigt doch, wie viel wir eigentlich gar nicht wissen, allein, weil wir uns um diese Gene und Proteine nicht kümmern«(Helen Anne Curry)

Im humanen Genom sind etwa 20 000 Proteine kodiert, doch nur 100 davon kommen immer wieder vor, nämlich in einem Viertel der von der NLM getaggten wissenschaftlichen Artikel. Dabei werden Tausende Gene von der Forschung erst gar nicht untersucht. »Das zeigt doch, wie viel wir eigentlich gar nicht wissen, allein weil wir uns um diese Gene und Proteine nicht kümmern«, sagt die Wissenschaftshistorikerin Helen Anne Curry von der University of Cambridge im Vereinigten Königreich.

Kurz nach der Veröffentlichung der ersten Daten zum humanen Genom, im Jahr 2002, begann die NLM ganz systematisch so genannte GeneRIFs (gene reference into function) als Zusatz an alle wissenschaftlichen Artikel mit Daten zur Struktur von Genen zu heften, auch rückwirkend bis 1960 und teils mit Hilfe von Informationen aus anderen Datenbanken. Das System ist nicht ganz perfekt und »ist etwas verrauscht beziehungsweise ungenau«, sagt der Wissenschaftler Terence Murphy von der NLM in Bethesda in Maryland. Außerdem kommt es bei Veröffentlichungen aus der Zeit vor 2002 wahrscheinlich zu einem gewissen Bias, gibt er zu, eine Verzerrung, die bedeutet, dass einige Gene überrepräsentiert sind und andere fälschlicherweise fehlen. »Das ist aber nicht so schlimm, weil normalerweise über mehrere Gene aggregiert und manches in der Analyse wieder ausgeglichen wird«, erklärt er.

Top 10 des humanen Genoms
Top 10 des humanen Genoms

Forschung folgt Moden

Eines zeigt sich unabhängig davon sehr deutlich: Es gibt immer verschiedene Perioden, in denen sich die Veröffentlichungen auf bestimmte Themen fokussieren (siehe »Mode-Gene der verschiedenen Jahre«). Bis Mitte der 1980er Jahre ging es bei vielen Projekten der Genetik um das Sauerstofftransportmolekül Hämoglobin der Erythrozyten, und vor 1985 befassten sich mehr als zehn Prozent aller Untersuchungen zur Genetik beim Menschen mit dem roten Blutfarbstoff.

Damals stützten sich die Wissenschaftler noch auf vorausgegangene Arbeiten von Linus Pauling und Vernon Ingram, die in den 1940er und 1950er Jahren den Weg für die Untersuchung molekular basierter Erkrankungen ebneten. Die beiden Wissenschaftler hatten herausgefunden, wie abnormales Hämoglobin zur Sichelzellenanämie führt. Der Molekularbiologe Max Perutz erhielt dann 1962 den Nobelpreis für Chemie für die Entwicklung einer 3-D-Map der Hämoglobinstruktur, womit er die Basis für die Aufklärung des Zusammenhangs von Struktur und Funktion des Proteins gelegt hatte.

Alan Schechter ist Physiologe und Senior-Berater der US-Gesundheitsbehörde National Institutes of Health (NIH) in Bethesda. Seiner Meinung nach hat das Hämoglobingen, mehr als irgendein anderes Gen, »den Einstieg in das Verständnis und vielleicht auch die Behandlung molekular basierter Erkrankungen geliefert«. Schechter hat selbst auch an Sichelzellenanämie gearbeitet. Er erzählt, wie die Gene in den 1970er und anfangs der 1980er Jahre auf großen Kongressen zu Genetik oder Bluterkrankungen Thema Nummer eins waren. Als dann aber neue Methoden zur Sequenzierung und Modulation der DNA aufkamen, wandten sich viele Forscher anderen Genen und Erkrankungen zu, darunter auch einer damals mysteriösen Infektion, die insbesondere homosexuelle Männer traf.

1983 wurde HIV als die Ursache von Aids entdeckt

Doch noch bevor im Jahr 1983 HIV als Ursache von AIDS identifiziert wurde, hatten klinische Immunologen wie David Klatzmann schon eine ungewöhnliche Entdeckung gemacht. »Damals war ich ganz perplex, dass die Erkrankten keine T4-Zellen hatten«, erinnert sich Klatzmann, der heute an der Université Pierre et Marie Curie (UPMC) in Paris beschäftigt ist. Er konnte in Zellkulturen zeigen, wie HIV anscheinend selektiv genau diese bestimmte Art von T-Zellen des Immunsystems infizierte und zerstörte. Die Frage war nur: Wie gelangt das Virus eigentlich in die Zelle hinein?

Klatzmann postulierte ein Oberflächenmolekül, das auch als Rezeptor für HIV wirkt und diesem den Weg ins Innere der Zellen ermöglicht, was er mit seinen Kollegen im Dezember 1984 in einer Studie beschrieb. Seine Veröffentlichung erschien zeitgleich mit einem wissenschaftlichen Artikel des Molekularvirologen Robin Weiss, der damals am Institute of Cancer Research in London forschte. Der Rezeptor wurde später CD4 genannt und definiert eine Population der T-Zellen.

Innerhalb von drei Jahren wurde CD4 zum Hit der biomedizinischen Forschung und blieb dies auch zwischen 1987 und 1996, einer Zeit, in der sich ein bis zwei Prozent aller Tags der NLM-Veröffentlichungen auf CD4 beziehen. Ein Teil des Interesses war natürlich dem Versuch geschuldet, dringend die AIDS-Krise in den Griff zu bekommen. So wollten Ende der 1980er Jahre einige Unternehmen Therapieformen des CD4-Proteins entwickeln, um HIV-Partikel abfangen zu können, bevor sie gesunde Zellen infizieren. Die Ergebnisse kleinere Studien waren dann aber doch eher »nicht berrauschend«, erzählt Jeffrey Lifson, der Direktor des AIDS and Cancer Virus Program des National Cancer Institute in Frederick in Maryland.

Mode der Genforschung
Mode der Genforschung

Wesentlich mehr hat dagegen die Grundlagenforschung der Immunologie zur Popularität von CD4 beigetragen. 1986 zeigte sich, dass CD4-exprimierende T-Zellen in zwei verschiedene Populationen aufgeteilt werden können: Die eine eliminiert Bakterien und Viren, die Zellen infizieren, die andere schützt vor Parasiten wie Würmern, die Erkrankungen auslösen, ohne in die Körperzellen einzudringen. »Das war eine ziemlich spannende Zeit, weil wir eigentlich relativ wenig davon wirklich verstanden«, erinnert sich der Immunologe Dan Littman von der New York University School of Medicine. Er hatte im Jahr davor die CD4-kodierende DNA kloniert und in Bakterien eingebracht, so dass nun große Mengen an Protein für die Forschung produziert werden konnten.

Kurz im Rampenlicht

Etwa ein Jahrzehnt später konnte Littman als Co-Leiter einer von drei beteiligten Gruppen zeigen, dass HIV neben CD4 auch noch den Rezeptor CCR5 zum Eindringen in Zellen nutzen. Seitdem gilt diesen beiden Rezeptoren und einem weiteren Co-Rezeptor namens CXCR4 das Hauptaugenmerk der internationalen HIV-Forschung, immer mit dem – bisher noch nicht erfüllten – Ziel, das Eintreten des Virus in Zellen verhindern zu können.

In den frühen 1990er Jahren begann dann schon der Aufstieg von TP53. Doch bevor es die Spitze des Rankings übernahm, stand ein paar Jahre lang ein weit weniger bekanntes Gen mit dem Namen GRB2 im Rampenlicht. Damals wollten die Wissenschaftler herausfinden, welche Wechselwirkungen zwischen Proteinen speziell in der Zellkommunikation relevant sind. Aus ersten Arbeiten von Tony Pawson war bekannt, dass einige kleine intrazelluläre Proteine eine so genannte SH2-Domäne besitzen, die an aktivierte Proteine der Zelloberfläche binden und das Signal an den Zellkern vermitteln.

Wie 1992 der Biochemiker Joseph Schlessinger von der Yale University School of Medicine in New Haven in Connecticut zeigte, wirkt das von GRB2 kodierte Protein (ein an Wachstumsfaktorrezeptoren gebundenes Protein, growth factor receptor-bound protein 2) als Umschaltstelle. Es enthält eine SH2-Domäne sowie zwei weitere Domänen, die Proteine im Rahmen von Zellwachstum und Überleben aktivieren. »Das ist ein molekularer Matchmaker«, sagt Schlessinger.

Andere Forscher konnten schon bald die Lücke schließen und eröffneten damit das Forschungsfeld der Signaltransduktion. Etliche weitere Bausteine der Zellsignalleitung wurden schon bald entziffert und führten letzten Endes zu Behandlungsmöglichkeiten von Krebs, Autoimmunerkrankungen, Diabetes und Herzerkrankungen – GRB2 war aber immer an vorderster Front dabei und das am häufigsten zitierte Gen in den letzten drei Jahren der 1990er Jahre. Das lag sicherlich auch daran, dass GRB2 »die erste physische Verbindung zwischen zwei Teilen der Signalkaskade ist«, erklärt der Biochemiker Peter van der Geer von der San Diego State University in Kalifornien. Außerdem »ist es in so vielen verschiedenen Bereichen der Zellregulation involviert«.

Top Gene
Top Gene
»Einige Superstars sind sehr schnell wieder verschwunden, weil sie keinen klinischen Nutzen zeigten«(Thierry Soussi)

GRB2 ist allerdings die Ausnahme in der Liste der am häufigsten untersuchten Gene. Es ist weder Ursache einer Erkrankung noch Ziel eines Medikaments, was vielleicht auch erklärt, warum es nur kurz im Rampenlicht stand. »Einige Superstars sind sehr schnell wieder verschwunden, weil sie keinen klinischen Nutzen zeigten«, sagt Thierry Soussi, der lange Zeit am Karolinska Institut in Stockholm und an der Université Pierre et Marie Curie (UPMC) in Paris an TP53 gearbeitet hat. Gene mit langfristigem Erfolg haben irgendein therapeutisches Potenzial, das Geldgeber anzieht. »Das ist immer dasselbe«, sagt Soussi. »Wie bedeutend ein Gen ist, hängt von seinem klinischen Wert ab.«

Aber auch bestimmte Eigenschaften des Gens können entscheidend sein, sei es das Expressionslevel, die Variabilität zwischen verschiedenen Populationen oder die charakteristische Struktur. Der Systembiologe Stoeger von der Northwestern University in Evanston in Illinois erklärte im November 2017 auf einem Symposium in Heidelberg, wie er anhand solcher Attribute und Algorithmen voraussagen kann, welche Gene die meiste Aufmerksamkeit erhalten werden. Den Grund für diese Zusammenhänge nennt Stoeger »Entdeckbarkeit«. Die häufig untersuchten Gene betrafen immer die gerade aktuellen Themen der Biologie und konnten mit den damaligen Tools dann auch nachgewiesen werden. »Manches lässt sich einfach leichter untersuchen als anderes«, weiß Stoeger. Und das ist genau der Knackpunkt, warum eine Vielzahl von Genen gar nicht charakterisiert oder erforscht wird, und weshalb unser Wissen und Verständnis von Gesundheit und Krankheit nach wie vor lückenhaft ist.

Zur richtigen Zeit am richtigen Ort

Curry verweist auch auf »verzwickte technische, soziale und ökonomische Faktoren«, die von Politikern, Arzneimittelproduzenten und Patientenvertretern ausgestaltet werden. Stoeger hat auch untersucht, wie sich die allgemeinen Merkmale der beliebten Gene zu verschiedenen Zeiten gewandelt haben. So fokussierten sich die Forscher in den 1980er Jahren größtenteils auf Gene, deren zugehörige Proteine außerhalb von Zellen zu finden waren, was vielleicht daran lag, dass diese besser zu isolieren und zu untersuchen waren. Erst neuerdings richtet sich das Interesse mehr und mehr auf Gene mit intrazellulär aktiven Produkten.

Zu diesem Wandel kam es parallel zur Veröffentlichung des humanen Genoms, erklärt Stoeger, weil hierdurch der Anteil von untersuchbaren Genen wesentlich gesteigert wurde. Allerdings passt dieses Konzept für viele der Top-Gene doch nicht so ganz. Das Protein p53 beispielsweise ist im Kern aktiv – das zugehörige Gen TP53 gehörte aber schon um das Jahr 2000 zu den meistuntersuchten Genen. Nicht nur TP53, sondern auch viele andere in der biologischen Forschung dominante Gene, blieben nach ihrer Erstentdeckung noch länger unverstanden. Das erklärt auch, warum es nach der Charakterisierung des Proteins p53 im Jahr 1979 mehrere Jahrzehnte dauerte, bis das zugehörige Gen in Sachen Veröffentlichungen an die Spitze kam.

Anfangs wurde es von den Krebsforschern fälschlicherweise als Onkogen verstanden – ein Gen also, das im mutierten Zustand die Entwicklung von Krebs vorantreibt. Erst 1989 konnte die Doktorandin Suzanne Baker aus Vogelsteins Labor zeigen, dass es sich eigentlich um einen Tumorsuppressor handelt. Und erst dann kam es zu einer echten Welle von Untersuchungen über seine Funktion. »Der Peak in den Publikationen genau zu diesem Zeitpunkt zeigt, wie viele Leute daran stark interessiert waren», erklärt Baker, die inzwischen am St. Jude Children’s Research Hospital in Memphis in Tennessee an Gehirntumoren forscht.

Krebsforschung treibt Genforschung

Die Krebsforschung brachte die Wissenschaftler auch auf TNF, den Zweitplatzierten nach TP53 hinsichtlich der am meisten zitierten humanen Gene aller Zeiten, mit 5300 Vermerken in der NLM-Datenbank (siehe »Top 10 des humanen Genoms«). TNF kodiert für das Protein Tumornekrosefaktor, das 1975 seinen Namen erhielt, weil es Krebszellen absterben ließ. Allerdings stellten sich therapeutische Formen von TNF in Studien beim Menschen als stark toxisch heraus, und die Wirkung gegen Krebszellen erwies sich nicht als wichtigste Funktion des Proteins.

Der Effekt von TNF auf Tumoren ist eher sekundär; stattdessen ist das Protein primär ein Entzündungsmediator. Sobald dies Mitte der 1980er Jahre klar wurde, verlagerte sich das Interesse der Forschung eher auf die Entwicklung TNF blockierender Antikörper. Heutzutage bilden Anti-TNF-Therapien eines der Standbeine der Behandlung entzündlicher Erkrankungen wie rheumatoider Arthritis, für die jährlich mehrere zehn Milliarden Dollar weltweit ausgegeben werden. »Das ist eines der Moleküle, bei dem die Erkenntnisse über Gen und Genprodukt relativ schnell die Gesundheitsbranche verändert haben«, sagt Kevin Tracey, der als Neurochirurg und Immunologe am Feinstein Institute for Medical Research in Manhasset in New York arbeitet.

Gen-Menagerie
Gen-Menagerie

TP53 wurde auch von dem Gen APOE kurzzeitig von Platz eins verdrängt. Nach dessen Beschreibung als Transporter von Cholesterin aus dem Blut Mitte der 1970er Jahre wurde das APOE-Protein anfangs als Lipidsenker zur Behandlung von Herzerkrankungen »ernsthaft erwogen», erzählt Robert Mahley von der University of California in San Francisco, einer der Pioniere im Feld, der diesen therapeutischen Ansatz an Kaninchen testete.

Mülleimer der Pharmaziegeschichte

Die Entwicklung der Statine in den späten 1980er Jahren führte letztlich aber dazu, dass die Strategie erst einmal im Mülleimer der Pharmaziegeschichte landete. Wie der Neurowissenschaftler Allen Roses mit seinen Kollegen dann entdeckte, kommt das APOE-Protein in verklumpten Plaques im Gehirn von Alzheimerpatienten vor. 1993 fanden die Forscher dann den Zusammenhang einer bestimmte Form des Gens (APOE4) mit einem stark gesteigerten Erkrankungsrisiko.

Damit wurde das Gen wieder interessanter, auch wenn es noch etwas dauern sollte, bis es zu den Top-Genen gehörte. »Anfangs war die Resonanz sehr verhalten«, erinnert sich Ann Saunders, Neurogenetikerin und Geschäftsführerin von Zinfandel Pharmaceuticals in Chapel Hill in North Carolina, die damals mit ihrem späteren Ehemann Roses zusammenarbeitete. Laut Amyloid-Hypothese ist die Anhäufung von Proteinfragmenten, genannt Amyloid-β, für die Erkrankung verantwortlich. Dies brachte zu Beginn das ganze Feld der Alzheimerforschung völlig in Aufruhr. Nur wenig Forscher schienen daran interessiert, was das Cholesterin-Transportprotein mit der Krankheit zu tun hatte. Der genetische Link zwischen APOE4 und Alzheimerrisiko war »unanfechtbar«, erzählt Mahley, und im Jahr 2001 überholte APOE kurzzeitig TP53 auf der Hitliste. Aber auch über die Zeit hinweg gesehen blieb es unter den ersten fünf des Rankings, zumindest das humane Gen betreffend.

»Ich sage es nur ungern, aber es waren genau diese misslungenen Studien, die mir geholfen haben«(Robert Mahley)

Wie andere sehr populäre Gene bekam auch APOE all seine Aufmerksamkeit, weil es sehr zentral an einem der größten noch ungelösten Gesundheitsprobleme unserer Zeit beteiligt ist. Dazu kommt noch, dass die meisten Anti-Amyloid-Therapien die klinischen Prüfungen nicht überstanden haben. »Ich sage es nur ungern, aber es waren genau diese misslungenen Studien, die mir geholfen haben«, erzählt Mahley, der gerade 63 Millionen US-Dollar für sein Unternehmen E-Scape Bio aufgetrieben hat, um Medikamente gegen das APOE4-Protein zu entwickeln. Die misslungenen Studien zwangen seiner Meinung nach die Industrie und die Geldgeber dazu, die Behandlungsstrategien für Alzheimerpatienten zu überdenken.

Und genau da drückt der Schuh: Damit ein Gen mehr als andere untersucht wird, muss Verschiedenes zusammen kommen, nämlich Biologie, gesellschaftlicher Druck, Businessmöglichkeiten und medizinischer Bedarf. Wenn es ein Gen aber erst einmal aufs Treppchen geschafft hat, »dann hält es sich dort erst einmal«, weiß der Wissenschaftshistoriker Gregory Radick von der University of Leeds im Vereinigten Königreich. »Dabei sind manche Gene eine sichere Sache und halten sich, bis sich die Forschungslandschaft wirklich wesentlich ändert.« Die Frage ist aber doch, wie es zu solchen Veränderungen kommt. Welche neuen Entdeckungen werden es schaffen, andere Gene nach oben zu schicken und die Topgene von heute von ihrem Podest zu stoßen?

Der Artikel ist im Original unter dem Titel „The Most Popular Genes in the Human Genome« am 22. November 2017 in »Nature« erschienen.

15/2018

Dieser Artikel ist enthalten in Spektrum - Die Woche, 15/2018

Lesermeinung

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Leserzuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Leserzuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmer sich leichter auf Ihre Beiträge beziehen können. Vielen Dank!

Partnervideos