Lexikon der Biologie

Sequenzierung



I. DNA-Sequenzierung



Die Sequenzierung von Desoxyribonucleinsäuren, heute eine der am meisten angewandten molekularbiologischen Methoden, hat seit Einführung der beiden grundlegenden Verfahren durch A. Maxam und W. Gilbert (basenspezifischer Abbau; Maxam-Gilbert-Methode) bzw. F. Sanger (basenspezifischer Kettenabbruch durch Didesoxynucleotide; Sanger-Verfahren) gegen Ende der 1970er Jahre bedeutende Weiterentwicklungen erfahren. Diese beruhen vor allem auf Automatisierung einzelner Arbeitsschritte, alternativen Markierungs- und Detektionsmethoden sowie der PCR-Technik (Polymerase-Kettenreaktion).



1. Fluoreszenz-Sequenzierung



Bei dieser modifizierten Didesoxymethode werden zur Markierung von DNA-Fragmenten (Endmarkierung von DNA-Fragmenten) anstelle radioaktiver Isotope Fluoreszenzfarbstoffe (Fluoreszenz, Fluorochrome) verwendet. Diese sind kovalent an den verwendeten Sequenzierungs-primer gebunden. Alternativ können jedoch auch fluoreszenzmarkierte Desoxynucleotide zur Kettenverlängerung (Elongation) oder fluoreszenzmarkierte Didesoxynucleotide zum Kettenabbruch (Termination) eingesetzt werden. Mit Hilfe eines sog. Laser-Fluoreszenz-DNA-Sequenators (DNA-Sequenzer; vgl. Abb. 3) werden die Farbstoffe im Verlauf der Elektrophorese an einer definierten Position im Sequenzgel bzw. an den zur Auftrennung der Terminationsprodukte verwendeten Kapillaren durch das Licht eines Laserstrahls (Laser) angeregt (Anregung) und das emittierte Fluoreszenzlicht durch spezielle Detektoren registriert. Die sequenzspezifischen Signale werden an einen Computer weitergeleitet, verrechnet und nahezu gleichzeitig („on-line“) am Monitor graphisch dargestellt bzw. auf einem Datenträger gespeichert. Zusammen mit der graphischen Darstellung wird vom Rechner auch direkt die Nucleotidsequenz im Datenbank-kompatiblen Format angegeben. Der Vorteil dieser Methode liegt neben dem Verzicht auf radioaktive Isotope vor allem darin, daß die bei konventioneller Sequenzierung notwendige Autoradiographie sowie die manuelle Auswertung des Films entfallen. Die Sequenzdaten können bereits während der gelelektrophoretischen Auftrennung (Gelelektrophorese) registriert werden.



2. Multiplex-Sequenzierung



Diese Methode ermöglicht die gleichzeitige Sequenzierung von bis zu 50 verschiedenen DNA-Fragmenten. Jedes dieser Fragmente wird zuvor in einen unterschiedlichen Plasmid-Vektor einkloniert. Die Vektoren unterscheiden sich dadurch, daß sie flankierend zur Klonierungsstelle vektorspezifische Oligonucleotidsequenzen (Oligonucleotide) aufweisen. Die zu sequenzierenden Fragmente werden mit geeigneten Restriktionsenzymen einschließlich der nun fragmentspezifischen Oligonucleotidsequenzen aus den Vektoren ausgeschnitten und im Gemisch nach dem Prinzip der chemischen Methode sequenziert. Die entstehenden Spaltprodukte werden gelelektrophoretisch aufgetrennt und auf einen Membranfilter übertragen (geblottet; blotting-Techniken). Die Sequenz eines Fragments kann nach Hybridisierung mit einer markierten Oligonucleotid-Sonde, deren Sequenz komplementär zu dem fragmentspezifischen DNA-Bereich ist, dargestellt werden. Nach Abwaschen der Sonde und Hybridisierung mit einer weiteren, für ein anderes DNA-Fragment spezifischen Sonde können nach und nach anhand der gleichen Membran alle weiteren Sequenzen sichtbar gemacht werden. Die Methode bietet den Vorteil, daß die basenspezifischen Spaltreaktionen und die anschließende gelelektrophoretische Auftrennung nur ein einziges Mal für bis zu 50 zu sequenzierende DNA-Fragmente durchgeführt werden müssen.



3. Zyklische Sequenzierung



Die zyklische Sequenzierung stellt eine Kombination der Didesoxymethode und der Polymerase-Kettenreaktion (PCR) dar. 4 verschiedene Reaktionsansätze, die neben der zu sequenzierenden DNA, einem für diese Sequenz spezifischen primer, Desoxynucleosidtriphosphaten und einer thermostabilen DNA-Polymerase je eines der 4 Didesoxynucleosidtriphosphate (ddATP, ddCTP, ddGTP, ddTTP; Desoxyribonucleoside) in geeigneter Konzentration enthalten, werden ähnlich der PCR-Reaktion einer Folge automatisierter Denaturierungs-, Hybridisierungs- und Polymerisationsschritte unterworfen. Nach ca. 50 Zyklen werden die Reaktionen gestoppt und die in den Reaktionsansätzen enthaltenen sequenzspezifischen DNA-Fragmente gelelektrophoretisch aufgetrennt. Zur Markierung können fluoreszierende primer eingesetzt werden. Werden mit 4 unterschiedlichen Fluoreszenzfarbstoffen gekoppelte Didesoxynucleosidtriphosphate verwendet, können alle 4 Terminationsreaktionen in einem Ansatz durchgeführt werden. Die Sequenzen können dann mit Hilfe eines DNA-Sequenzers ausgewertet werden.



II. RNA-Sequenzierung



Die hauptsächlich angewandte Methode zur Sequenzierung von Ribonucleinsäuren gleicht in ihrem Prinzip in etwa der chemischen Methode zur Ermittlung von DNA-Sequenzen. Durch basenspezifische chemische Spaltung radioaktiv markierter RNA-Moleküle werden verschiedene Sets an RNA-Fragmenten erzeugt, die in hochauflösenden Polyacrylamidgelen aufgetrennt und durch anschließende Autoradiographie sichtbar gemacht werden können. Heute werden zur sequenzspezifischen Fragmentierung von RNA-Molekülen meist basenspezifisch spaltende Ribonucleasen eingesetzt. Nach reverser Transkription von RNA und anschließender Sequenzierung der cDNA ist es auch auf indirektem Wege möglich, zu Sequenzdaten von RNA-Molekülen zu gelangen.



III. Protein-Sequenzierung



Die Sequenzierung von Proteinen wird heute automatisiert mittels sog. Protein-Sequenatoren nach dem Prinzip des Edmanschen Abbaus durchgeführt (Proteine). Neben Flüssigphasen-Sequenatoren werden auch Gasphasen-Sequenatoren eingesetzt. Letztere benötigen lediglich 20–100 Picomol Protein für eine Sequenzauflösung von bis zu 50 Aminosäuren. Mittels Massenspektrometrie können heute sogar Proteinmengen im Bereich von 1 Picomol mit einer Auflösung von etwa 20–30 Aminosäuren analysiert werden.



Genom-Sequenzierung



„Even the smallest functional DNA varieties seen, those occurring in certain small phages, must contain something like 5000 nucleotides in a row. We may, therefore, leave the task of reading the complete sequence of a DNA to the 21st century which will, however, have other worries.“ (E. Chargaff, 1968).

Dieses Zitat zeigt, wie skeptisch man noch Ende der 1960er Jahre der Möglichkeit, ganze Genome sequenzieren zu können, gegenüberstand. Keine 10 Jahre später konnte die Sequenz eines Phagengenoms (Bakteriophage ΦX174) mit über 5000 Nucleotiden Länge veröffentlicht werden (vgl. Tab.). Vor allem die Entwicklung der Didesoxymethode durch F. Sanger sowie der chemischen Sequenzierungsmethode durch A. Maxam und W. Gilbert gegen Ende der 1970er Jahre ermöglichte es, daß auch weitaus größere Genome sequenziert werden konnten. Bis Ende 2002 wurden über 28 Milliarden Nucleotide sequenziert und in Datenbanken, wie z.B. der EMBL-Datenbank (EMBO) in Europa, der DDBJ-Datenbank in Japan und der NCBI-GenBank in den USA, gespeichert. Ende 1992 waren es noch ca. 120 Millionen, Ende 1982 ca. 680.000 Nucleotide. Bis Ende 2002 waren die vollständigen Genomsequenzen von über 1000 Viren, über 100 Bakterien sowie mehrerer einzelliger und mehrzelliger Eukaryoten ermittelt, darunter die der Modellorganismen Escherichia coli (1997), Caenorhabditis elegans (1998), Drosophila melanogaster (2000), Arabidopsis thaliana (Acker-Schmalwand; Arabidopsis-Genom-Projekt; 2000) und der Hausmaus (Mus musculus; 2002) (Genomprojekt [Tab.]). Die in den großen Datenbanken (EMBL, DDBJ und GenBank; Bioinformatik) gesammelten Sequenzen sind über Datennetze weltweit in den einzelnen Forschungseinrichtungen abrufbar und stehen der Wissenschaftswelt für weitere Analysen frei zur Verfügung. Neu erhaltene Sequenzen können z.B. durch ein sog. Sequenz-alignment (die optimale Ausrichtung einzelner Sequenzen zueinander, bis maximale Übereinstimmung erreicht ist, wobei Deletionen bzw. Insertionen erlaubt sind) mit in den Datenbanken bereits gespeicherten Sequenzen nach Übereinstimmungen untersucht werden. Auf diese Weise können z.B. Aussagen über stammesgeschichtlich und/oder funktionell verwandtschaftliche Beziehungen einzelner Sequenzen zueinander gewonnen werden (Sequenzstammbaum).R.M.

[Drucken] [Fenster schliessen]