Mikroproteine: Die dunkle Materie in unseren Zellen

Im Jahr 2009 suchte Jonathan Weissman nach einem Weg, um herauszufinden, welche Proteine eine Zelle zu bestimmten Zeitpunkten herstellte. Um Momentaufnahmen vom Zellinhalt anfertigen zu können, entwickelte sein Labor am Whitehead Institute in Cambridge, Massachusetts, eine ganz neue Methode. Mit ihr ließ sich die Arbeit der Ribosomen – der Proteinfabriken der Zelle – direkt messbar machen.
Im ersten Schritt isoliert man dabei alle Ribosomen einer Zelle, inklusive der mRNA-Stränge, die an ihnen haften. In letzteren sind die Bauanleitungen enthalten, die die Zelle in dem Moment in Proteine »übersetzt« (fachsprachlich: translatiert). Im Anschluss löst man die mRNA von den Proteinfabriken und entschlüsselt ihre Sequenz. Mit diesem Ribosomen-Profiling lässt sich die Gesamtheit aller Proteine erfassen, die eine Zelle gerade herstellt.
Doch als die Fachleute die neue Technik ausprobierten, erlebten sie eine gewaltige Überraschung: Die Ribosomen produzierten nicht nur von bekannten Genen eifrig Proteine, sondern stellten zusätzlich Tausende unbekannter »dunkler« Proteine her. Ihre Bauanleitungen finden sich in Abschnitten des Genoms, in denen man sie nicht erwartet hatte. »Das war der Aha-Moment für uns«, sagt Weissman. Bald darauf entdeckten seine und andere Arbeitsgruppen derartige unerwartete Translationen in nahezu jedem untersuchten Organismus. 15 Jahre später rätseln Wissenschaftler immer noch, was sie von ihnen halten sollen.
- Kurz erklärt: Wie die Proteinsynthese funktioniertFast das gesamte Erbgut (Genom) unserer Zellen befindet sich im Zellkern. Es besteht aus Desoxyribonukleinsäure, kurz DNA. Deren Grundbausteine kommen in vier Ausführungen mit jeweils unterschiedlicher Nukleinbase vor. In dem doppelsträngigen DNA-Molekül findet man Abertausende offene Leseraster (ORFs). Ihren Anfang und ihr Ende markiert eine bestimmte Dreiersequenz aus Nukleinbasen. Dazwischen kann sich ein Gen befinden, das für ein Protein codiert. Damit die Zelle dieses herstellen kann, muss sie zuerst den entsprechenden DNA-Abschnitt abschreiben, also eine Transkription vornehmen. Hierbei stellt sie eine einsträngige Kette aus Ribonukleinsäuren her, die so genannte messenger RNA (mRNA). Die mRNA kann den Zellkern verlassen und sich dann an Ribosomen binden, die Proteinfabriken der Zelle. Sie lesen die mRNA ab und erzeugen gleichzeitig eine Kette aus Aminosäuren, die sich zu einem Protein faltet. Dieser Prozess, die Translation, funktioniert mit Hilfe des genetischen Codes: Jede der 20 Aminosäuren, die Ribosomen in Proteine einbauen, wird von einer Dreiersequenz von Nukleinbasen (einem Codon) codiert. Ein durchschnittliches menschliches Protein enthält etwa 500 Aminosäuren. Es gibt jedoch viele, die noch deutlich länger sind.© Jaitham / stock.adobe.com (Ausschnitt)Von der DNA zur RNA zum Protein | Der genetische Code, der in der DNA festgeschrieben ist, besteht aus vier »Buchstaben« (hier mit G, C, A und T abgekürzt) – gleiches gilt für die RNA. Aus der Kombination von jeweils drei dieser Bausteine liest das Ribosom bei der Proteinherstellung ab, welche Aminosäure es als nächstes an die von ihm produzierte Kette anhängen muss.
Dunkle Proteine sind meist klein – sie enthalten oft nur einige Dutzend Aminosäuren. Viele von ihnen waren zuvor unbekannt und besitzen keine nahen Verwandten in den Genomen anderer Organismen. Dennoch scheinen manche von ihnen eine wesentliche Rolle in der Zelle zu spielen und die menschliche Gesundheit zu beeinflussen, wie neuere Studien zeigen. So sind sie bei einigen Krebsarten reichlich in den entarteten Zellen vorhanden. Mehrere Unternehmen arbeiten deshalb an Behandlungsansätzen, die auf dunkle Proteine abzielen.
Marie Brunet von der Universität Sherbrooke in Kanada weist auf eine generelle Schwierigkeit auf dem Feld hin: Wissenschaftler können noch gar nicht abschätzen, wie viele Proteine ihnen bisher entgangen sind. Sie wirkt deshalb an einer weltweiten Initiative mit, die alle in der menschlichen DNA codierten dunklen Proteine dokumentieren und untersuchen will.
DNA-Sequenzierung lieferte keine vollständige Proteinliste
Anfang der 2000er-Jahre entstanden die ersten Komplettsequenzierungen des menschlichen Genoms. Anhand von ihnen schätzten Fachleute die Anzahl der proteincodierenden Gene im Erbgut. Typischerweise suchten sie dabei nach sogenannten offenen Leserastern (ORFs). Solche DNA-Abschnitte enthalten bestimmte Dreiersequenzen der vier Nukleinbasen – sogenannte Codons – , die für die Aminosäureabfolge in einem Protein codieren. Darüber hinaus sammelten Genomforscher weitere Hinweise, die darauf hindeuten, dass das Genprodukt tatsächlich eine Funktion erfüllen könnte. Sie prüften etwa, ob in anderen Organismen nahezu deckungsgleiche Sequenzen existieren und ob die Aminosäurekette ausreichend lang für ein arbeitsfähiges Protein wäre.
»Den Leitern des Humangenomprojekts war immer klar, dass sie die Diskussion gerade erst starten«John Prensner, Krebsbiologe
Viele ORFs, die diese Kriterien nicht erfüllten, wurden ignoriert oder schlichtweg übersehen. Diverse Konsortien pflegen Listen vorhergesagter Gene; so führt etwa das GENCODE-Projekt derzeit knapp 20 000 Gene, die für Proteine codieren. Circa 90 Prozent von ihnen hat man bereits experimentell nachgewiesen. Die Listen werden regelmäßig angepasst, sobald neue Daten vorliegen.
John Prensner, Krebsbiologe an der University of Michigan Medical School (USA), weist auf die Lücken in dieser Bilanz hin. Die Vorstellung, dass Forschende 2001 eine vollständige Liste aller proteincodierenden Gene hätten erstellen können, sei ein populäres Missverständnis. »Den Leitern des Humangenomprojekts war immer klar, dass sie die Diskussion gerade erst starten«, betont er.
Bauanleitungen schlummern an ungewöhnlichen Orten
Die Ergebnisse aus dem Ribosomen-Profiling führten zu einem explosionsartigen Interesse an zuvor übersehenen ORFs. Viele Fachleute wollten wissen, ob aus den gefundenen Sequenzen funktionierende Proteine hervorgehen könnten. Im Jahr 2022 erstellte ein Team unter der Leitung von Prensner eine Liste mit mehr als 7000 »nichtkanonischen« ORFs. Diese erfüllten im Allgemeinen nicht die Anforderungen, um als proteincodierende Gene zu gelten. Sie fehlten deshalb in den einschlägigen Datenbanken.
Die meisten solcher unkonventionellen ORFs befinden sich entweder in der Nähe von kanonischen Genen oder sie überlappen mit ihnen. Etwa ein Drittel liegt fernab von bekannten Genen, in Sequenzen für lange nichtcodierende RNAs. Von derartigen DNA-Abschnitten hatte man, wie ihr Name bereits verrät, nicht erwartet, dass sie Bauanleitungen für Proteine enthalten. Vielmehr sprach man ihnen Rollen bei der Regulierung einiger zellulärer Prozesse zu.
Doch nur, weil von einem DNA-Abschnitt RNA abgeschrieben und diese dann in ein Protein übersetzt wird, muss Letzteres noch lange nicht stabil sein oder wichtige Aufgaben in einer Zelle erfüllen. In manchen Fällen könnten die RNAs dazu dienen, die Aktivität eines benachbarten Gens zu steuern. Die in ihnen enthaltene Bauanleitung könnte etwa Ribosomen blockieren, indem sie diese zwingt, bestimmte Proteine herzustellen, die danach schnell wieder abgebaut werden, erklärt Prensner. Einige ORFs, die vor einer proteincodierenden Sequenz erscheinen, triggern genau solche Mechanismen.
Ein Team um Prensner durchforstete Hunderte von Datensätzen zum Proteingehalt von Zellen, mit Milliarden von Einzeldaten aus Studien, die mittels Massenspektrometrie und anderen Methoden Proteine identifiziert hatten. Insgesamt fanden sie Fragmente von mehr als 1700 Aminosäureketten, deren Bauanleitungen in den im Jahr 2022 entdeckten, nichtkanonischen ORFs lagen. Für mindestens 15 davon waren die Belege laut den Forschenden ausreichend stark gewesen, um sie in die offiziellen Listen der proteincodierenden Gene aufzunehmen.
Mikroproteine fallen eher durchs Raster
Für die meisten unkonventionellen ORFs hat man allerdings noch kein Protein nachgewiesen, das eindeutig aus ihnen hervorging. Eine Herausforderung ist die geringe Größe der potenziellen Produkte. Fachleute nennen sie manchmal Mikroproteine, weil sie in der Regel weniger als 100 Aminosäuren umfassen. Durchschnittlich enthalten menschliche Proteine dagegen mehrere Hundert dieser Bausteine, viele sind sogar deutlich länger. Die Kürze erschwert ihr Auffinden, denn: Um sie nachzuweisen, werden alle in den Zellen vorhandenen Proteine in Fragmente zerlegt und dann anhand ihrer Masse identifiziert. Ein solches Vorgehen erleichtert die Entdeckung längerer Proteine, die dabei eine größere Zahl Bruchstücke produzieren – je mehr es davon gibt, desto bessere Chancen hat man auch, eines nachzuweisen. Das gilt besonders dann, wenn die Mikroproteine nur in geringen Mengen vorkommen.
»Wir sind nicht skeptisch. Wir sind nur vorsichtig«Jonathan Mudge, Beitragender zu GENCODE
Um die 3D-Struktur der neuen Moleküle vorherzusagen, hat sich in letzter Zeit zunehmend das KI-Tool AlphaFold bewährt. Die meisten damit erstellten räumlichen Strukturen ähneln allerdings kaum dem, was man von klassischen, ordentlich gefalteten Proteinen kennt. Doch Prensner ergänzt: »Es gibt auch einige, die wie kanonische Proteine aussehen und einfach übersehen wurden«. Entsprechend hat man damit begonnen, sie in Datenbanken aufzunehmen. Jonathan Mudge, Mitautor und Beitragender zu GENCODE, spricht von 50 Sequenzen, die aufgrund von Ribosomen-Profilierung in die Liste des Konsortiums Einzug hielten.
Dabei müsse man aber behutsam vorgehen, fügt er hinzu. Denn nicht nur Laborbiologen verlassen sich auf Datenbanken wie die von GENCODE, um die Resultate ihrer Experimente zu interpretieren. Kliniker sind ebenfalls auf sie angewiesen. Wenn sich fragwürdige Gene in ihnen häufen, könnte das ihre Bemühungen erschweren, schädliche Genvarianten in Patientengenomen zu identifizieren, erläutert Mudge. »Wir sind nicht skeptisch. Wir sind nur vorsichtig«, betont er.
Genomchirurgie revolutioniert die Erforschung dunkler Proteine
Zur gleichen Zeit, als dunkle Proteine in den Fokus einiger Forschender rückten, gelang anderen Fachleuten mit der CRISPR/Cas9-Geneditierung ein wissenschaftlicher Durchbruch. Die Technik ermöglichte auf einen Schlag, die Rollen jedweder Genprodukte systematisch in lebenden Zellen zu untersuchen. »Plötzlich konnten wir chirurgisch die codierende Sequenz nichtkanonischer Proteine entfernen und fragen: Sind sie wichtig für die Funktion der Zelle?«, erzählt Weissman.
In einer 2020 veröffentlichten Arbeit prüfte sein Team genau das. Es unterbrach Tausende nichtkanonischer ORFs in humanen induzierten pluripotenten Zellen sowie in einer Krebszelllinie und verhinderte damit die Herstellung der dort codierten Proteine. In Hunderten von Fällen beobachteten sie im Anschluss einen Wachstumsdefekt in den Zellen. »Viele Mikroproteine waren wirklich wichtig für Zellen«, fasst Weissman die Erkenntnisse zusammen.
Mit weiteren Experimenten wiesen sie nach, wie einige dieser Effekte zustande kamen. So hafteten manche nichtkanonische ORFs an ein Protein, das gemeinsam mit ihnen auf einer mRNA-Sequenz codiert war. Weissman sieht hier Ähnlichkeiten zu der Art und Weise, wie Bakterien mittels nebeneinanderliegender Einheiten Gene regulierten. Darüber hinaus übernahmen dunkle Proteine weitere, vielfältige Rollen in Zellen: Eines war am Zellzyklus beteiligt, ein anderes an der Mitochondrienfunktion.
Die dunklen Geheimnisse der Tumoren
Krebszellen scheinen besonders reich an dunklen Proteinen zu sein. Das weckte das Interesse des Neuroonkologen Prensner. Mit seinem Team untersucht er bereits, ob nichtkanonische ORFs in einigen Krebsarten fehlreguliert werden. Er vermutet, das könnte zu unterschiedlichen Behandlungsergebnissen beitragen, die er und andere Fachleute bei ihren Patienten beobachten. »Wir stellen die zentrale Frage, warum Tumoren diese Substanzen produzieren«, erläutert er.
In Experimenten, die denen von Weissman ähnelten, ging sein Team jener Frage nach und inaktivierte dazu über 500 nichtkanonische ORFs mittels CRISPR. In etwa 10 Prozent der Fälle entstanden in der Folge Wachstumsdefekte in menschlichen Krebszellen. Prensner und Co fanden so ein dunkles Protein, das Brustkrebszellen in erhöhten Mengen herstellen und das offenbar ihre Vermehrung antreibt.
»Die Untersuchung eines dieser Proteine dauert drei bis vier Jahre. Wir haben Tausende gefunden«Sebastiaan van Heesch, Systembiologe
In einer 2024 veröffentlichten Studie identifizierten die Wissenschaftlerinnen und Wissenschaftler mehrere dunkle Proteine, die zu bestimmten Hirntumoren bei Kindern beitragen. Eines trieb demnach das Wachstum besonders aggressiver Formen dieser Medulloblastome an und benötigte dafür kein kanonisches Protein, das von einem benachbarten ORF codiert wird.
Solche Beispiele offenbaren nur die Spitze des Eisbergs, meint der an den Arbeiten beteiligte Systembiologe Sebastiaan van Heesch. Er betont, es müsse noch viel mehr getan werden, um zu verstehen, was dunkle Proteine in gesunden und kranken Zellen bewirken. Dazu sei es notwendig, die Aufmerksamkeit weiterer Wissenschaftler auf das Feld zu lenken. »Die Untersuchung eines dieser Proteine dauert drei bis vier Jahre. Wir haben Tausende gefunden«, sagt er. »Es gibt hier noch viel Biologie zu entdecken.«
Zellulärer Müll oder wichtiger Immunfaktor?
Die Forschung steht vor großen Herausforderungen. Momentan kann man noch kaum eine der vielen Thesen zu den möglichen Aufgaben dunkler Proteine entkräften. »Manche meinen, dass sie nicht stabil oder nicht funktional sind und gewissermaßen einen Müllhaufen darstellen«, erklärt Prensner.
Andere Fachleute glauben, dass die Moleküle zu einem immunologischen Überwachungssystem beitragen: Die Proteine des humanen Leukozytenantigen-Komplexes (HLA) trainieren Immunzellen darauf, gesundes Gewebe nicht anzugreifen; zugleich machen sie auf Bedrohungen wie Viren und Krebszellen aufmerksam. Nahezu jede Aminosäurekette, die Zellen herstellen – selbst solche ohne Funktion – wird hierzu mit ihrer Hilfe auf der Oberfläche von weißen Blutkörperchen präsentiert.
Viele dunkle Proteine hat man bislang ausschließlich im Zusammenhang mit diesem System nachgewiesen. Forschende nutzen dazu eine Technik, die kurze Proteinschnippsel identifiziert, die an den HLA-Komplex gebunden sind. Xuebing Wu, Molekularbiologe an der Columbia University in New York City, rät zur Vorsicht bei der Interpretation der bisherigen Erkenntnisse. Noch habe man nur wenige andere Hinweise auf diese Proteine gesehen. Das spreche dafür, dass die überwiegende Mehrheit von ihnen Übersetzungsfehler darstellen oder dass sie nur beim Regulieren der Ribosomenaktivität eine Rolle spielen. Er vermutet, viele von ihnen gelangen zu schnell in zelluläre Recyclingsysteme, als dass sie definierte Aufgaben übernehmen könnten. 2023 fand ein Team um Wu heraus, dass zahlreiche dunkle Proteine eine chemische Signatur tragen, die sie direkt vom Ribosom in die Müllverarbeitung schickt.
Doch die Arbeiten deckten auch einen Mechanismus auf, der einen kleinen Teil der Moleküle zur Zellmembran leitet. Hier sind sie vor dem rapiden Abbau geschützt und haben theoretisch die Chance, neue Aufgaben zu erfüllen. In einer Anfang 2025 veröffentlichten Übersichtsarbeit identifizierte Wus Team rund 1000 solcher Proteine, von denen es vermutet, dass sie funktional sind. Wus Interpretation zufolge müssten Zellen ein Gleichgewicht finden, um einerseits potenziell problematische Produkte zu entfernen, ohne andererseits jedwede Innovation zu blockieren.
Selbst wenn die meisten dunklen Proteine keine klar definierte Funktion haben, könnte ihre Präsenz dennoch wichtig sein. Die Tatsache, dass viele bislang nur als Fragmente im Immunkontext nachgewiesen wurden, deute auf Rollen in der Körperabwehr hin, meint etwa van Heesch. Ribosomen sind energiehungrige Organellen; die Kosten für die Herstellung von Proteinen sind »ziemlich enorm«, so van Heesch. »Warum sollte eine Zelle also immer wieder Müll produzieren?«
»Wir könnten hier die Geburt eines neuen Proteins beobachten«Jonathan Weissman, Molekularbiologe
Arzneimittelhersteller nehmen dunkle Antigene ins Visier
Obwohl aktuell unklar ist, was dunkle Proteine in Zellen tun – falls sie überhaupt konkrete Funktionen erfüllen – , zeigen Pharmaunternehmen bereits Interesse an ihnen. So manches Biotechunternehmen betrachtet sie als potenzielles therapeutisches Ziel. Enara Bio in Oxford und Mnemo Therapeutics in Paris arbeiten etwa schon an Immunzelltherapien, die auf »dunkle Antigene« abzielen, die in Krebszellen hergestellt und vom HLA-Komplex präsentiert werden. Eine klinische Studie in China wird eine der ersten sein, die die Moleküle ins Visier nehmen. Dabei soll eine Art Impfstoff Immunzellen auf ein dunkles Protein aufmerksam machen, das von einigen Brustkrebsarten produziert wird. Nachdem das Vakzin bei Mäusen vielversprechende Ergebnisse erzielte, geht es nun darum, ob es auch bei Menschen Behandlungsergebnisse verbessern kann. Ein anderes Unternehmen, ProFound Therapeutics in Cambridge, Massachusetts, arbeitet mit dem Pharmariesen Pfizer zusammen. Gemeinsam suchen sie unter den dunklen Proteinen nach Behandlungsansätzen für Adipositas. Prensner berät die Firmen in diesem Bestreben.
Viele Fachleute sind einfach gespannt, welche biologischen Erkenntnisse man aus den Entdeckungen ziehen wird. Einige spekulieren, dunkle Proteine könnten eine Spielwiese für genetische Innovation in der Evolution darstellen. »Wir könnten hier die Geburt eines neuen Proteins beobachten«, kommentiert Weissman. In einer 2024 veröffentlichten Studie identifizierten van Heesch und seine Kollegen eine Gruppe der Moleküle, die ausschließlich in verschiedenen Primaten, darunter auch im Menschen, vorkommen. Einige von ihnen tragen zur Herzfunktion bei.
Doch die Innovation könnte einen hohen Preis haben. Denn die dunklen Proteine scheinen bei Personen mit Herzerkrankungen häufiger fehlreguliert zu sein als die Produkte konventioneller Gene. Prensner mahnt, solche Moleküle könnten leichter entgleisen und Krebs verursachen, wenn sie Rollen in der normalen Entwicklung übernehmen. Das gilt insbesondere für Tumoren bei Kindern, fügt er hinzu.
Vermutlich wird es keine universelle Erklärung dafür geben, was dunkle Proteine in Zellen tun. Und die Lösung dürfte so chaotisch und komplex sein wie der Rest der Biologie. Aber vor allem wollen Prensner, van Heesch und andere Gleichgesinnte erreichen, dass Biologinnen und Biologen den Proteinen etwas mehr Aufmerksamkeit schenken – und sich nicht zu sehr darum kümmern, wie man sie denn nun am besten kategorisiert. »Was ich befürworten würde, ist, Dinge ein bisschen weniger in Schubladen zu stecken«, betont van Heesch.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.