Gensuche für medizinische Entwicklungen

Dank neuer Techniken ist nun von einem Großteil der vielleicht 100000 Gene des Menschen Teilinformation erarbeitet, mittels derer man die zugehörigen Proteine ausmachen und ihre organspezifische Aktivität erforschen kann. Das geschilderte Projekt eine Art anatomischen Atlas der Genaktivitäten zu erstellen zielt darauf ab, für Krankheiten hochspezifische Diagnoseverfahren und therapeutische Wirkstoffe zu finden.

Prof. Dr. William A. Haseltine

Nicht nur an Erbleiden sind Gene schuld – die Träger der Erbinfor- mation, die bestimmte Eigenschaften von einer Generation zur nächsten weitergeben. Denn auch sonst hängen die meisten Krankheitsgeschehen eng mit ihnen und ihrer Regulation zusammen. Ob nun eine erbliche Disposition vorhanden ist oder nicht: Für Krebs, Arteriosklerose, Osteoporose, Arthritis oder Alzheimer beispielsweise sind spezifische Veränderungen in Genaktivitäten typisch. Auch die Bekämpfung von Infektionen verlangt das korrekte Zusammenspiel von Genen. Und selbst manche Alterserscheinungen gehen wahrscheinlich darauf zurück, daß sich im Laufe des Lebens aufgrund von Schadstoffen und ionisierender Strahlung genetische Defekte angehäuft haben.

Vor diesem Hintergrund beschlossen ich und einige ähnlich denkende Kollegen vor mehreren Jahren, die Genaktivierungsmuster aller Gewebe und Organe des Menschen aufzuklären. Damit solche Information sich medizinisch nutzen läßt, muß dies nicht nur für den gesunden Organismus – und zudem in sämtlichen Entwicklungsstadien – geschehen, sondern auch differenziert für Krankheiten. Denn wenn man möglichst genau wüßte, wo und wann in welchen Organen und unter welchen Umständen welche Gene eingeschaltet werden, würde dies sicherlich sehr helfen, Krankheiten vorherzusagen und zu verhindern, aber auch zu bekämpfen und zu heilen. Das Ziel ist eine Art Atlas sämtlicher Genaktivitätsmuster des menschlichen Körpers.

Daß ein Gen aktiv ist – oder exprimiert wird, wie der Genetiker sagt – bedeutet, daß die in der Reihenfolge seiner Bausteine verschlüsselte Information abgelesen und ihr gemäß ein Protein hergestellt wird (die meisten Gene codieren für Eiweißstoffe). Auf die eine oder andere Weise sind die diversen Proteine für die vielerlei Zellfunktionen unabdingbar. Sie liefern Strukturkomponenten, katalysieren als Enzyme die vielfältigen biochemischen Prozesse oder steuern als Kontrollinstanzen und Signalüberträger auf sämtlichen Regulationsebenen Teilung, Spezialisierung und physiologische Aktivitäten der Zellen.

Welche Gene überhaupt aktiviert werden und wie stark dies geschieht, richtet sich dabei gewöhnlich nach dem lokalen und aktuellen Bedarf an den entsprechenden Proteinen. Das reibungslose Funktionieren eines Organismus wie auch die Ausbildung all seiner Gewebe und Organe von der befruchteten Eizelle an ist das Resultat einer wohlabgestimmten Choreographie der Gene.

Über den letztlich angestrebten Vergleich des Expressionsprofils gesunder und erkrankter Gewebe würden sich einerseits die für ein normales Funktionieren erforderlichen Proteine identifizieren, andererseits krankheitsrelevante Abweichungen ausfindig machen lassen. Das wiederum würde erlauben, für verschiedene Leiden neue Diagnoseverfahren zu entwickeln sowie Medikamente, die daran beteiligte Eiweißstoffe oder ihre Gene in der gewünschten Weise beeinflussen. Ebenso ist ein direkter therapeutischer Einsatz einzelner Proteine oder Gene denkbar.

Medizinische Genomik

Eine umfassende Bestandsaufnahme exprimierter Gene in jedem der Dutzende von Geweben des Menschen, sozusagen ein anatomischer Steckbrief auf molekularer Ebene, stellt fraglos eine gewaltige Aufgabe dar. Von den schätzungsweise 100000 Genen einer menschlichen Körperzelle ist immer nur ein Bruchteil – gewöhnlich wohl um ein Siebtel – aktuell in Benutzung. Welche dies im einzelnen sind, variiert je nach Zelltyp. Das Expressionsmuster eines Typs kann ganz verschieden von dem eines anderen sein – und bei Erkrankungen ist es wieder anders, gar nicht zu sprechen von den spezifischen Genaktivierungen in den einzelnen Entwicklungs- und Reifungsstadien.

Inzwischen stehen jedoch besondere technische Verfahren zur Verfügung, dank derer sich das umfangreiche Vorhaben bewältigen läßt. Sie ermöglichen es, für jedes beliebige Gewebe im Körper rasch herauszufinden, welches Repertoire es momentan nutzt. Die hier beschriebene Vorgehensweise hat sich als die derzeit schnellste erwiesen, medizinisch bedeutsame Gene zu identifizieren.

Das sei am Beispiel der Arteriosklerose verdeutlicht. Bei diesem verbreiteten Zivilisationsleiden bilden sich an den Innenwänden der Arterien herdförmige fetthaltige Ablagerungen und Gewebsverdickungen, sogenannte Plaques, welche die Gefäße verengen und schließlich verstopfen können, was besonders bei den Herzkranzgefäßen gefürchtet ist. Mit unserem Verfahren können wir zweierlei feststellen: welche Gene in gesunden Arterien überhaupt aktiv sind und wie stark. Das gleiche läßt sich für Arteriosklerose-Patienten machen: Die Unterschiede zwischen den beiden Expressionsprofilen zeigen auf, welche Gene mit der Krankheit in Verbindung stehen, also zum Beispiel, ob bestimmte von ihnen nun stärker oder schwächer arbeiten als normal. Eine erkrankte Zelle wird von den zugehörigen Proteinen entsprechend mehr oder weniger bilden.

Über die Klonierung eines solchen Gens läßt sich heute auf biotechnischem Wege das interessierende Protein zur weiteren Erforschung in gewünschter Menge herstellen. Hat man es erst einmal in reiner Form, läßt sich auch relativ leicht ein Nachweistest entwickeln, etwa zur Früherkennung. So könnte im genannten Beispiel die Überproduktion eines bestimmten in Plaques vorkommenden Proteins auf eine beginnende Arteriosklerose hindeuten, der sich im frühen Stadium leichter begegnen ließe. Das Molekül könnte zudem Ziel neu zu entwickelnder Pharmaka sein, die seine Wirkung oder seine Herstellung hemmen. Sie wären aussichtsreiche Kandidaten für ein Medikament gegen Arteriosklerose.

Mit unserem Ansatz, den ich als medizinische Genomik (also medizinisch orientierte Erforschung des Genoms, des Erbguts) bezeichne, bewegen wir uns etwas abseits der gegenwärtigen Hauptbemühungen in der Humangenetik. Sehr viele Wissenschaftler weltweit beteiligen sich derzeit am sogenannten Human-Genom-Projekt, bei dem bis zum Jahre 2003 in internationaler Zusammenarbeit die Abfolge der Bausteine in der gesamten menschlichen DNA entziffert werden soll. (Das genetische Alphabet besteht aus nur vier Buchstaben, da sich die verketteten DNA-Bausteine nur in ihrer Base unterscheiden: Adenin, Cytosin, Guanin oder Thymin, kurz A, C, G und T; jeweils drei hintereinander können für eine Aminosäure codieren, also für ein Kettenglied im Proteinfaden.) Von der zusammenkommenden Datenfülle werden Studien zur Wirkweise und Evolution von Genen profitieren, und vor allem auch Forschungen über Erbkrankheiten. Nur ist die Sequenzierung des Gesamtgenoms nicht die schnellste Art, Gene zu entdecken. Die meisten DNA-Bereiche stellen nämlich gar keine Gene dar, sondern haben, wenn überhaupt, andere Funktion. Zudem zielt das Human-Genom-Projekt nicht in erster Linie auf krankheitsrelevante Erbmasse.

Für unser Projekt eines genanatomischen Atlasses des Menschen gründeten wir 1992 die Firma Human Genome Sciences (HGS: Human-Genom-Wissenschaften). Anfänglich arbeiteten wir mit dem nichtkommerziellen Institut für Genomforschung in Rockville (Maryland) zusammen, das von HGS unterstützt wird. Seinem Direktor J. Craig Venter verdankt die Genomforschung einige ihrer Schlüsselideen. Nach sechs Monaten schloß sich SmithKline Beecham, eines der weltweit größten Pharmaunternehmen, dem Vorhaben an, und nach einem Jahr setzten die beiden Firmen die Arbeit zunächst allein fort. Später traten dem Projekt Schering-Plough in den USA, Takeda Chemical Industries in Japan, Synthelabo in Frankreich und Merck KGaA in Deutschland bei.

Komplementäre DNA-Moleküle

Der Schlüssel zur Entwicklung neuer Medikamente liegt in erster Linie in den Proteinen, nicht in den Genen selbst. Daß man sich statt dessen um die Erbmoleküle bemüht, hat praktische Gründe. Die Eiweißstoffe einer Zelle lassen sich zwar durchaus direkt analysieren; doch selbst wenn man den Aufbau eines solchen komplexen Moleküls kennt, ist es nicht zu synthetisieren. Zur Entwicklung von Medikamenten, die medizinisch interessant erscheinende Proteine beeinflussen, und erst recht für eine eventuelle direkte Nutzung benötigt man aber erhebliche Mengen. Die einzig praktikable Methode hierfür besteht darin, die Gene zu isolieren und in geeignete, kultivierte Zellen, etwa Bakterien, einzubringen, welche dann das gewünschte Produkt herstellen.

Bei unserer Methode der Gensuche bedienen wir uns des Zwischenprodukts, das in der Zelle entsteht, wann immer ein Gen exprimiert wird: der Boten-RNA oder mRNA (nach englisch messenger für Bote). Sie ähnelt in ihrem Aufbau der DNA und ist in fertiger Form praktisch eine Art Kopie der codierenden Sequenzen des Gens; erstellt wird das Molekül an der DNA, gelangt aber aus dem Zellkern und ist dann die eigentliche Bauvorlage zur Produktion des Proteins (Kasten auf den Seiten 64/65).

Unseren Zwecken kommt die RNA aus mehreren Gründen zustatten. Zum einen wird sie nur hergestellt, wenn das Gen aktiv ist – somit deutet eine spezifische Boten-RNA auf die Expression eines bestimmten Gens; zum anderen entspricht ihre Basensequenz jener der DNA in einfacher und eindeutiger Weise. Ein Gen enthält zwar noch Abschnitte, die nicht für sein Protein codieren und die in der reifen Boten-RNA entfernt sind, doch beinhaltet diese genügend Information, um das Ursprungsgen aus der Masse der DNA von Zellen zu isolieren. Mit ihm läßt sich dann, falls gewünscht, das Protein biotechnisch herstellen.

Allerdings ist Boten-RNA manchmal heikel zu handhaben, deshalb arbeiten wir mit einer stabileren Kopie von ihr aus DNA. Bei dem seit vielen Jahren etablierten Verfahren wird die von Zellen praktizierte Prozedur schlicht umgekehrt: Normalerweise dient ein Strang der DNA als Vorlage zur Herstellung komplementärer Boten-RNA; ein virales Enzym macht jedoch das Rückkopieren möglich. Solche zudem doppelsträngig gemachten Ersatzmoleküle nennt man deswegen komplementäre oder cDNAs.

Eine Boten-RNA kann viele Tausende von Basen lang sein, unsere cDNA-Kopien repräsentieren jedoch gewöhnlich nur Teilabschnitte der Kette. Es ist darum möglich, daß mehrere verschiedene cDNA-Moleküle zum selben Gen gehören, auch wenn dies nicht direkt ersichtlich ist. Doch um ein Gen eindeutig zu identifizieren, genügt schon ein solcher wenige tausend Basen langer Ausschnitt – so wie man ein Buch an einem beliebig herausgegriffenen Kapitel eindeutig erkennt. Es ist nämlich praktisch ausgeschlossen, daß zwei verschiedene Gene auf einer derart langen Strecke übereinstimmen.

Eine cDNA kann man beliebig vervielfältigen und anhand der analysierbaren Menge ihre Basenabfolge bestimmen (siehe Kasten auf Seite 68). Daraus läßt sich dann, nach dem bekannten genetischen Code, die Aminosäuresequenz des zugehörigen Proteinfragments ableiten. Ihr Vergleich mit der von anderen, bekannten Proteinen verrät nicht selten etwas über die Funktion des kompletten gesuchten Moleküls, denn Proteine mit ähnlichen Teilsequenzen haben oft ähnliche Aufgaben.

Früher war die Sequenzierung von cDNA-Molekülen sehr zeitaufwendig, doch in den letzten Jahren sind automatische Apparaturen entwickelt worden, die das zuverlässig und rasch erledigen. Äußerst wichtig für ein Unterfangen unseres Umfangs sind vor allem auch die modernen Hochleistungsrechner, ohne die man niemals die anfallende Datenmenge bewältigen könnte. Die Software, um diese Daten zu sichten, haben wir und andere auch bereits geschrieben.

Gen-Etiketten und Contigs

Unser Verfahren, die in einer Zelle aktiven Gene zu ermitteln, ist ökonomisch. Wir bestimmen nur jeweils eine Teilsequenz der vielen cDNA-Moleküle, nämlich nur die ersten 300 bis 500 Basen von einem der Enden. Das spart Zeit, denn diese Länge reicht immer noch, ein Gen zweifelsfrei zu identifizieren. Wir sprechen deswegen gern von exprimierten Sequenzetiketten (englisch expressed sequence tags oder ESTs). Um bei dem Vergleich einer cDNA mit einem Buchkapitel zu bleiben: Ihr Etikett entspräche, sagen wir, dessen erster Seite; auch die würde genügen, um das zugehörige ganze Buch – sprich Gen – zu erkennen. Und ansatzweise ist selbst bei so wenig Text schon ersichtlich, worum es in dem Werk geht. Das ist bei dem kurzen Etiketten-Text ähnlich. Bei HGS gewinnen wir mit dieser Strategie pro Tag rund eine Million Basen an Sequenzrohdaten.

Der Ansatz, nur Teilsequenzen aufzuschlüsseln, hat sich bewährt: In knapp fünf Jahren konnten wir damit Tausende von Genen identifizieren, von denen viele möglicherweise bei Krankheiten mitspielen. Auch bei anderen Firmen und in Forschungsinstituten laufen Projekte zur Gewinnung partieller cDNA-Sequenzen.

Viele der neu bei HGS produzierten Teilsequenzen lassen sich bei den anschließenden Computerrecherchen entweder einem der rund 6000 bekannten Gene zuordnen, die Wissenschaftler mit anderen Verfahren identifiziert haben, oder einem der zuvor bei uns gefundenen. Gelingt solch eine definitive Zuordnung nicht, wird die Sache spannender, denn nun müssen unsere und die anderen zugänglichen Gen-Datenbanken danach abgesucht werden, ob irgendeine der dort deponierten Sequenzstücke sich mit der fraglichen in einem kleinen Bereich klar überschneidet.

Im Erfolgsfall fügt man zusammenpassende Sequenzen im Computer zu sogenannten Contigs zusammen (nach englisch contiguous für angrenzend, benachbart); es ist anzunehmen, daß sie zusammengehören, also einer noch unvollständigen Folge irgendwo in einem Gen entsprechen. Man kann die Verlängerung mit weiteren hinzukommenden paßgenauen Sequenzen fortsetzen, so daß sich allmählich ein immer vollständigeres Bild des Gens ergibt. Die Vorgehensweise erinnert an die bei einem Texträtsel: Aus "Vom Eise befreit si" und "ise befreit sind Strom und Bäche" fügt sich die Eingangszeile des Osterspaziergangs aus Goethes Faust.

Zugleich versuchen wir anhand der vorliegenden Teilsequenzen auf strukturelle Besonderheiten und damit auf die wahrscheinliche Funktion der zugehörigen Proteine zu schließen. Die Primärstruktur, die Reihenfolge der Aminosäuren, läßt sich anhand der Basensequenz ausmachen, wenn man das richtige Leseraster hat; die Funktion ergibt sich, wie oben angesprochen, aus dem Vergleich mit bekannten, ähnlich gebauten Proteinen. Mitunter stammen diese vom Menschen, häufiger aber von allen möglichen anderen Organismen, die genetisch gut erforscht sind, etwa von Bakterien, Pilzen, grünen Pflanzen oder Insekten. Das ist nicht überraschend. Es hängt damit zusammen, daß viele der grundlegenden Lebensfunktionen quer durch die Stammbäume sehr ähnlich ablaufen. Unsere Computerdatei hält sämtliche neuen Befunde zu solchen provisorischen Klassifikationen fest – und das hat sich bereits ausgezahlt.

Zum Beispiel haben wir vor drei Jahren für vier spezifische (menschliche) Contigs vorausgesagt, daß die Proteine der zugehörigen Gene einigen von Bakterien und Hefe ähneln würden, die Mutationen der DNA korrigieren. Da damals schon bekannt war, daß Dickdarmkrebs auf Störungen von zelleigenen Reparaturmechanismen zurückgehen kann, begannen wir damit, die vier Gene vollständig zu sequenzieren. Als dann später ein namhafter Krebsforscher an uns herantrat und uns bat, ihm bei der Suche nach Colon-Karzinome verursachenden Genen behilflich zu sein – von einem wußte er bereits –, konnten wir ihm mitteilen, daß wir uns schon mit drei weiteren möglichen Kandidaten befaßten.

Wie sich später herausstellte, kann tatsächlich jedes dieser vier Gene Krebs hervorrufen, wenn es mutiert ist, und nicht nur im Dickdarm, sondern auch im Eierstock und an der Gebärmutterschleimhaut. Ungefähr bei jedem zweihundertsten Europäer und Nordamerikaner ist eines dieser Reparaturgene mutiert; diese Menschen sind deshalb für solche Karzinome besonders anfällig. Nun, da man den Hintergrund kennt, lassen sich Gentests für Blutsverwandte von derartigen Krebspatienten entwickeln, damit veranlagte Personen sich regelmäßigen engmaschigen Vorsorgeuntersuchungen unterziehen können – bei einer Früherkennung und rechtzeitiger Operation sind die Heilungschancen viel besser. In der klinischen Forschung werden solche Tests bereits verwendet. Ein vermarktbarer Test muß freilich möglichst alle relevanten Mutationen in dem fraglichen Gen erfassen.

Angewandte Anatomie der Genaktivierung

Unsere Datenbank enthält inzwischen mehr als eine Million von cDNAs gewonnene partielle Gensequenzen, die sich zu 170000 Contigs gruppieren. Wir schätzen, daß wir bereits von fast allen exprimierten menschlichen Genen Teile ihrer Basensequenz kennen. Wenn nämlich andere Wissenschaftler neue Gensequenzen in einer öffentlichen Datenbank deponieren, was laufend geschieht, haben wir in mehr als 95 Prozent der Fälle bereits eine passende Teilsequenz dazu. Beim Zusammensetzen zu Contigs ergeben sich oftmals auch bislang völlig unbekannte Gene. Gut die Hälfte aller von uns gefundenen neuen Gene hat aber eine Ähnlichkeit zu schon bekannten mit zugeordneter mutmaßlicher Funktion, und dieser Anteil wird sicherlich mit der Zeit noch steigen.

Unser Verfahren erlaubt auch genaueren Aufschluß über die Intensität der Proteinproduktion in einem Gewebe. Wenn man ungewöhnlich viele cDNA-Sequenzen vom selben Gen findet, sollte von diesem Gen viel Boten-RNA entstanden sein. Die Zelle scheint das Protein dann in großen Mengen zu benötigen – es muß folglich eine wichtige Aufgabe haben. Besondere Aufmerksamkeit gilt solchen Genen, deren Expression sich auf einige wenige Gewebe und Organe beschränkt, denn sie könnten sich besonders als Ansatzpunkt für medizinische Maßnahmen eignen, wenn diese Organe bei einer Erkrankung in Mitleidenschaft gezogen sind. Unter den Tausenden bei uns entdeckten Genen sind bislang etwa 300 identifiziert, die medizinisch besonders bedeutsam erscheinen.

Dank der Suche mittels cDNA-Teilsequenzen läßt sich zum erstenmal abschätzen, wie viele Gene jeweils für die einzelnen zellulären Hauptfunktionen zuständig sind, also für den Stoffwechsel, für die Immunabwehr oder für eine der anderen wichtigen Aufgaben (Bild 2). Auch der Medizin eröffnen sich mit dieser Fülle von Information neue Möglichkeiten, die nun ausgelotet werden.

Die Datenbanken hierzu, auch die von anderen Projekten, konnten ihren praktischen Wert schon verschiedentlich bei der Suche nach Proteinen erweisen, die auf eine bestimmte Krankheit hindeuten. Ein Beispiel ist Prostatakrebs. Zur Früherkennung wird oft ein Test angewandt, bei dem man den Gehalt eines bestimmten Proteins im Blut mißt, das prostataspezifische Antigen. Solche Krebspatienten weisen es zwar oft in ungewöhnlich hoher Konzentration auf, doch kann dies auch bei harmloseren, langsam wachsenden Tumoren der Vorsteherdrüse der Fall sein. Ob eine aggressive Krebstherapie angeraten ist, läßt sich aus dem Testergebnis deswegen nicht erkennen.

Zusammen mit unseren Partnern haben wir die Boten-RNA in vielen Proben von Prostatagewebe analysiert, das teils von gesunden Drüsen stammte, teils von gutartigen wie auch von bösartigen Tumoren. Dabei fanden sich etwa 300 Gene, die nur in der Prostata exprimiert werden. Rund 100 davon sind nur in dort angesiedelten Tumoren aktiv, und von diesen wiederum etwa 20 allein in als bösartig eingestuften. Anhand dieser 20 Gene und ihrer Proteine erarbeiten wir genauere Nachweisverfahren für Prostatakrebs. Ähnliche Projekte sind auch für bösartige Tumoren von Brust, Lungen, Leber und Gehirn in Gang.

Datenbanken für partielle menschliche cDNA-Sequenzen eignen sich auch zur Suche nach Genen, die für seltene Erkrankungen verantwortlich sind. So weiß man seit langem, daß eine bestimmte erbliche Stoffwechselkrankheit – Galaktosämie –, die bei Kindern verschiedene Organschäden, Gehirnentwicklungsdefekte und Blindheit verursacht, auf einer Abbaustörung des Zuckers Galaktose beruht. In unserer Datenbank stießen wir auf zwei unbekannte menschliche Gene, deren abgeleitete Proteine strukturelle Ähnlichkeiten zu Enzymen erwarten ließen, die bei Bakterien und Hefe Galaktose abbauen. Wie die anschließende Überprüfung erwies, ist bei dieser Erbkrankheit tatsächlich das eine oder das andere dieser Gene defekt. Vielleicht kann man bei solchen Kindern künftig entweder die normalen Enzyme oder ihre Gene selbst vorbeugend einsetzen.

Datenbank für Medikamenten-Design

Es müssen aber nicht immer gleich große unhandliche Proteine oder Gene sein, wenn man die neue genetische Information therapeutisch nutzen möchte. Die cDNA-Sequenzen bieten auch eindrucksvolle Möglichkeiten, um mit modernen Techniken kleinere Kandidaten für künftige Medikamente zu finden. In den letzten Jahren wurden die Methoden zum Entwerfen, Erzeugen und Testen niedermolekularer Arzneistoffe, welche die weitaus meisten Medikamente stellen, rapide fortentwickelt (Spektrum der Wissenschaft, Juni 1996, Seite 98). So vermögen heute automatisierte Anlagen aus einer riesigen Menge von Naturstoffen oder synthetischen Verbindungen rasch diejenigen herauszulesen, die auf ein krankheitsrelevantes menschliches Protein irgendeinen Einfluß ausüben – wenn man denn dieses kennt. Bislang waren leider zu wenige solcher Zielproteine untersucht, doch dies dürfte sich nun deutlich ändern. Mehr als die Hälfte aller Leitsubstanzen für neue pharmakologische Ansatzpunkte von SmithKline Beecham geht mittlerweile auf unsere Arbeit zurück.

Diese Datenbanken erleichtern es aber nicht nur, unter einer Unmenge von Molekülen die mit zufällig nützlicher Aktivität aufzuspüren. Ist erst einmal die Struktur eines Zielproteins bekannt, dann kann man auch darangehen, einen Wirkstoff mit einem gewünschten Effekt maßzuschneidern. Dem gezielten Medikamenten-Design sind auch einige der neuen Protease-Hemmer zu verdanken, die jetzt manchen HIV-Infizierten zu helfen scheinen. (Hierbei war unsere Datenbank nicht beteiligt.) Wir sind sicher, daß Pharmakologen dank der partiellen cDNA-Sequenzen künftig verstärkt Medikamente nach Maß entwerfen können.

Ein Beispiel, bei dem sich unsere Datenbank als nützlich erwiesen hat, betrifft die riesigen Knochenfreßzellen, die Osteoklasten. Knochensubstanz wird zur Erneuerung ab- und wieder aufgebaut; beim Erwachsenen sind das normalerweise 5 bis 10 Prozent im Jahr. Osteoklasten verwenden zum Abbau ein Enzym, von dem bei bestimmten Krankheitsbildern, etwa bei Osteoarthritis oder bei Osteoporose, offenbar zuviel entsteht. In den Datenspeichern fanden wir unter den exprimierten genetischen Sequenzen dieser Zellen eine verdächtige. Sie ähnelte der für ein Gen, dessen Protein Knorpel enzymatisch abbaut. Wir konnten nachweisen, daß das verdächtige Gen der Osteoklasten tatsächlich jenes für das knochenzerstörende Enzym ist. Weil es, wie wir ferner zeigten, in keinem anderen Zelltyp ausgeprägt wird, würde man sein Protein hemmen können, ohne Schäden in anderen Gewebe befürchten zu müssen.

Wir stellten also das Enzym biotechnisch her, und SmithKline Beecham benutzt es zur Identifikation und Konstruktion potentiell geeigneter Hemmstoffe, wobei eine Kombination von automatisiertem Hochleistungs-Screening und gezieltem Design zum Einsatz kommt. Auch bei der Suche nach therapeutisch vielversprechenden Molekülen gegen Arteriosklerose greift das Unternehmen auf unsere Sequenzen zurück.

Eine besonders reiche Ader für medizinische Nutzungen bietet die Klasse der G-Protein-gekoppelten Rezeptoren. Solche Eiweißmoleküle durchspannen die Zellmembran, wo sie außen Signale von anderen Zellen empfangen und innen an ein G-Protein weitergeben. Somit sind sie eine entscheidende Instanz für viele der komplex gesteuerten zellulären Regelprozesse, und es ist anzunehmen, daß einer großen Bandbreite von Leiden abzuhelfen wäre, wenn man jeweils spezifische dieser Moleküle blockieren könnte. Die Palette umfaßt Bluthochdruck, Geschwüre, Migräne und Asthma ebenso wie gemeine Erkältungen und psychische Störungen.

Human Genome Sciences ist auf mehr als 70 neue dieser Rezeptoren gestoßen. Wir erforschen derzeit ihre Funktionen, indem wir die Gene in Zellen einschleusen, zur Expression bringen und die Reaktion der Zellen auf verschiedenste Reize beobachten. Von Interesse ist derzeit zum Beispiel ein Gen, dessen Protein für Bluthochdruck maßgeblich zu sein scheint, sowie eines, das offenbar beim Erwachsenen-Diabetes eine entscheidende Rolle spielt, der bei älteren Menschen auftritt. Auch hierfür suchen unsere Partner von der Pharmaindustrie nun nach geeigneten niedermolekularen Wirkstoffen, mit denen sich die Signalweitergabe unterbinden läßt.

Nicht zuletzt sehen wir uns durch unsere Forschungsergebnisse auch in der Annahme bestärkt, daß einige der von uns entdeckten Gene und Proteine selbst zur Behandlung herangezogen werden können, vielleicht in abgewandelter Form. Schon heute verabreicht man zu Therapiezwecken zahlreiche menschliche Proteine – die vielleicht bekanntesten sind Insulin für Diabetiker oder Gerinnungsfaktoren für Bluterkranke. Ein weiteres Beispiel sind blutbildende Proteine, die Patienten nach einer Chemotherapie erhalten, um die Regeneration von Blutzellen zu beschleunigen.

Etwa 200 der Gene, deren vollständige Sequenz HGS hat, codieren für Proteine, die sich möglicherweise zum medizinischen Einsatz eignen (Bild 3). Die meisten dieser Eiweißstoffe haben wir bereits biotechnisch hergestellt und prüfen nun deren Wirkung auf Zellen. Manche haben sich auch bereits im Tierversuch als vielversprechend erwiesen, darunter mehrere Moleküle, die Immunzellen stimulieren.

Neue Medikamente, ob dies nun Proteine, Gene selbst oder einfachere Substanzen sind, wird man niemals ohne Zeitaufwand entwickeln können; dazu dauern schon die vorgeschriebenen ausgedehnten Prüfungen zu lange. Immerhin dürften aber partielle cDNA-Sequenzen eine Frühphase in dem Prozeß beschleunigen: die oft zeitraubende Suche nach Wirkstoff-Kandidaten. Human Genome Sciences gewährt Forschungsinstitutionen auf einen großen Teil der Datenbank Zugriff, verlangt allerdings eine Gewinnbeteiligung an jeglichem daraus resultierenden Erzeugnis.

Die systematische Suche und Analyse von Genen unter Einsatz automatisierter und rechnergestützter Verfahren hat erstmals ermöglicht, ein umfassendes Bild zu zeichnen, wo im menschlichen Körper die verschiedenen Erbfaktoren aktiv sind – quasi die erste anatomische Karte seiner Genexpression. Auch was sich bei Krankheiten auf dieser Ebene ändert, beginnt sich zu erhellen. Zwar ist es noch zu früh, um genauer vorauszusagen, wann solche Erkenntnisse in die ärztliche Praxis Einzug halten. Doch sicherlich werden viele darauf beruhende Anwendungen die Medizin des 21. Jahrhunderts einschneidend prägen.

Literaturhinweise

- Die Sprache der Gene. Von Paul Berg und Maxine Singer. Spektrum Akademischer Verlag, Heidelberg, Berlin und Oxford 1993.

– Mutation of a MUTL Homolog in Hereditary Colon Cancer. Von N. Papadopoulos in: Science, Band 263, Seiten 1625 bis 1629, 18. März 1994.

– Mutations of Two PMS Homologues in Hereditary Nonpolyposis Colon Cancer. Von N. Nicolaides und anderen in: Nature, Band 317, Seiten 75 bis 80, 1. September 1994.

– Initial Assessment of Human Gene Diversity and Expression Patterns Based upon 83 Million Nucleotides of cDNA Sequence. Von Mark D. Adams und anderen in: Nature, Band 377, Sonderauflage, Seiten 3 bis 174, 28. September 1995.

– A cDNA Encoding the Calcitonin Gene-Related Peptide Type 1 Receptor. Von Nambi Aiyar und anderen in: Journal of Biological Chemistry, Band 271, Heft 19, Seiten 11325 bis 11329, 10. Mai 1996.

– Cathepsin K, but Not Cathepsins B, L or S, Is Abundantly Expressed in Human Osteoclasts. Von Fred H. Drake und anderen in: Journal of Biological Chemistry, Band 271, Heft 21, Seiten 12511 bis 12516, 24. Mai 1996.

Kasten: Herstellung und Auftrennung von menschlichen cDNA-Molekülen

Wenn Zellen ein Protein herstellen, wird das dafür codierende Gen – eine DNA-Sequenz – zunächst in eine dazu passende Sequenz aus ähnlichen Bausteinen umgeschrieben: eine Boten-RNA (oder mRNA; ganz links). Dieses Molekül – eine transportable Bauanweisung – geht an die Produktionsstätte für Proteine.

Um aktive Gene in menschlichen Zellen zu identifizieren, kopiert man als erstes alle darin enthaltenen Boten-RNA-Moleküle wieder zurück in komplementäre DNA-Stücke, kurz cDNAs (links unten). Diese Moleküle muß man dann einzeln klonieren (vervielfältigen), um eine analysierbare Menge zu erhalten. Dazu erstellen wir bei der Firma Human Genome Sciences eine cDNA-Bibliothek oder cDNA-Bank für jedes einzelne Organ oder Gewebe: Die aus ihm gewonnene Sammlung von cDNA-Molkülen wird Stück für Stück in geeignete DNA-Ringe, sogenannte Vektoren, eingebaut, die sich in Bakterienzellen vermehren können und an deren Nachkommenschaft weitergehen. Das Unternehmen hat mittlerweile solche Bibliotheken für fast alle gesunden Organe und Gewebe des Menschen angelegt wie auch für viele erkrankte.

Zur Vervielfältigung lassen wir Bakterien die Vektoren mit den cDNA-Stücken aufnehmen, und zwar so, daß jede Zelle höchstens eines bekommt. Sie werden dann sehr dünn auf einem Nährboden verteilt, damit jede Zelle zu einer Einzelkolonie heranwächst. Druch einen Trick werden Kolonien ohne eine cDNA blau. Die anderen sucht ein Roboter heraus, 10000 pro Tag (Mitte und Bild 1). Anschließend wird die cDNA jeder Kolonie automatisch einzeln aufgereinigt. Die erhaltene Menge genügt zur weiteren Analyse.

Kasten: Ermittlung partieller cDNA-Sequenzen

Zum Identifizieren der Gene dienen kurze Teilsequenzen der cDNA-Moleküle, sogenannte exprimierte Sequenzetiketten (ESTs nach englisch expressed sequence tags).

Für ein solches EST erzeugt man zunächst eine Population unterschiedlich langer DNA-Fragmente, die sich von dem zu sequenzierenden Stück ableiten. Sie haben ein fixes Ende und werden so aufgetrennt, daß sie immer um einen Baustein – eine Base – kürzer sind, also bezüglich ihrer Länge eine Reihe bilden. Die jeweils endständige Base ist gemäß ihrer Sorte mit einem eigenen Fluoreszenzfarbstoff markiert; da es nur vier verschiedene Basen gibt, genügen vier Farbstoffe.

Sortierung der Fragmente und Identifizierung der jeweils endständigen Base erfolgen automatisch: Die Stücke werden entsprechen ihrer Länge nacheinander an einem Laserstrahl vorbeigeführt, der den Farbstoff zur Fluoreszenz anregt; aus den elektronisch erfaßten Daten wird die Abfolge der Bausteine erstellt.

Zur Identifizierung eines Gens genügt ein solches EST von einigen hundert Basen Länge. Aus einer Vielzahl gewonnener Teilsequenzen kann ein Computer die sich überschneidenden ermitteln und nach und nach die vollständige Gensequenz zusammensetzen (unten).

Aus: Spektrum der Wissenschaft 5 / 1997, Seite 64
© Spektrum der Wissenschaft Verlagsgesellschaft mbH

Download (Abo)

Schreiben Sie uns!

Beitrag schreiben

Beitrag darf veröffentlicht werden

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Gensuche für medizinische Entwicklungen

Kennen Sie schon …

Spektrum Kompakt – Humangenom - Was in unserem Erbgut steht

Schreiben Sie uns!

Themenkanäle

Freundschaft

Handys

Die Signale des Körpers