Direkt zum Inhalt

Lexikon der Biochemie: Genomprojekt

Genomprojekt, Sammelbezeichnung für Projekte zur vollständigen Sequenzierung und Analyse der Genome von Mensch, Hefe und anderen Organismen. Tab. 1 zeigt die geschätzte Genomgröße verschiedener Organismen. Bis August 1998 war für 15 Mikroorganismen die Sequenzierung des gesamten Genoms abgeschlossen (Tab.2).
Caenorhabditis elegans diente dabei als Modellorganismus für die geplante vollständige Sequenzierung des menschlichen Genoms. Dieses Mitte der 80er Jahre initiierte große amerikanische Sequenzierprojekt, mit dem das Erbgut des Menschen entschlüsselt werden soll, wird als Humangenomprojekt bezeichnet. Bis Oktober 1998 wurden von Wissenschaftlern weltweit in der Datenbank GenBank (Tab. 3) über 175 × 106 Nucleotide von Human-DNA-Sequenzen veröffentlicht (das entspricht ungefähr 5% der Gesamtsequenz). Zum gleichen Zeitpunkt waren – basierend auf YACs (künstliche Hefechromosomen) – 30.181 menschliche Gene kartiert. Dies entspricht ungefähr der Hälfte aller menschlichen Gene, deren Anzahl auf 60.000-80.000 geschätzt wird. In den ersten Jahren des Projekts konzentrierten sich die Bemühungen auf die Entwicklung neuer, schnellerer und kosteneffizienterer Sequenzierungs- und Kartierungsmethoden. Dies ist z. B. mit der Einführung der YACs und neuerdings der BACs (künstliche Bakterienchromosomen) sowie von Nucleotidchips gelungen, so dass zur Zeit die Hoffnung besteht, dass das Humangenom sogar schon im Jahr 2003 -zwei Jahre früher als geplant – vollständig sequenziert und kartiert ist und die Budgetvorgaben eingehalten werden.
Die Probleme bei der Sequenzierung des Humangenoms bestehen vor allem darin, dass 96% der menschlichen genomischen DNA nicht aus Genen, sondern aus nichtcodierenden DNA-Sequenzen bestehen. Weiter wird die Ermittlung der Basensequenz der Gene kompliziert durch die Fragmentierung ihrer DNA in codierende Exons und nichtcodierende Introns. Im Zuge der Sequenzierung des bisher umfangreichsten Genoms (von Caenorhabditis elegans) hat man herausgefunden, dass sich für 92% der Introns die Exon/Intron-Grenzen voraussagen lassen. Geht man aber davon aus, dass ein durchschnittliches Gen von C. elegans aus fünf Exons besteht, dann sinkt die Wahrscheinlichkeit für eine korrekte Vorhersage aller fünf Exons auf 65,9%. Bei weiterer Berücksichtigung der Tatsache, dass die Termini nur zu 70 % ausgehend von den Basensequenzen der DNA nachweisbar sind, so lassen sich letztlich für C. elegans nur etwa 46% aller Gene korrekt vorhersagen. Für das menschliche Genom führen diese Betrachtungen bei Berücksichtigung des weitaus höheren Anteils nichtcodierender Sequenzen (C. elegans: 73%; Mensch: 96%) zu der Schlussforderung, dass eine Vorhersagbarkeit von 100 % nicht zu erreichen ist. Darüber hinaus zeigt die Existenz von unterschiedlich gespleißten mRNAs, dass eine eindeutige Identifizierung von Introns und Exons selbst im zellulären Bereich nicht möglich ist.
Tab. 1. Genomprojekt. Die Genomgröße verschiedener Organismen im Vergleich.

Organismus geschätzte Anzahl Basenpaare [× 106] geschätzte Anzahl Gene
Mensch 3.000 60.000-80.000
Maus 3.000 50.000-100.000
Drosophila 165 15.000-25.000
Nematode 100 11.800-13.800
Hefe (Pilz) 14 8.355-8.947
E. coli (Bakterium) 4,67 3.237
H. influenza (Bakterium) 1,8
M. genitalium (Bakterium) 0,58

Tab. 2. Genomprojekt. Vollständig sequenzierte Genome.
Organismus Genomgröße [MBasen] geschätzte Anzahl der Gene
Saccharomyces cerevisiae 12,1 6.034
Escherichia coli 4,6 4.288
Bacillus subtilis 4,2 ~4.000
Synechocystis 3,6 3.168
Archaeoglobus fulgidus 2,2 2.471
Pyrobaculum aerophilum 2,2
Haemophilus influenza 1,8 1.740
Methanobacterium thermoautotrophicum 1,8 1.855
Helicobacter pylori 1,7 1.590
Methanococcus jannaschii 1,7 1.692
Aquifex aolicus 1,5 1.508
Borrelia burgdorferi 1,3 863
Treponema pallidum 1,1 1.234
Mycoplasma pneumoniae 0,8 677
Mycoplasma genitalium 0,6 470

Tab. 3. Genomprojekt. Die Humangenomdaten können über diese Knoten abgefragt werden.


Land

Anschrift
1) Telefon
2) Fax
3) e-mail

WWW-Seite
USA
(Hauptknoten)
GDB Human Genom Database
John Hopkins University School of Medicine
2024 E. Monument Street, Suite 1-200
Baltimore, Maryland 21205-2100
USA
1) 1-410-955-9705
2) 1-410-614-0434
3a) User Support and Registration: help@gdb.org
3b) Data Acquisition and Curation: data@gdb.org
http:gdbwww.gdb.org.
Australien Mrs. Carolyn Bucholtz
Australian National Genomic Information Service (ANGIS)
Dept. Of Electrical Engineering
Building J03
University of Sydney
Sydney, NSW 2006
Australia
1) und 2) 61-2-9351-2948
3) bucholtz@angis.su.oz.au
GDB Mirror Site
ANGIS Web Server
Dr. Anthony P. Kyne
The Walter and Eliza Hall Institute of Medical Research
Royal Melbourne Hospital Campus
Royal Parade
Parkville
Melbourne, Victoria 3050
Australia
1) 61-3-9345-2586
2) 61-3-9347-0852
3) tony@wehi.edu.au
GDB Mirror Site
WEHI (Walter and Eliza Hall Institute) Web Server
Belgien Mr. David Coornaert
Belgian EMBnet Node
Brussels Free Universities Computing Centre
Departement of Molecular Biology
Rue des Chevaux 67
B 1640 Rhode-St.-Genese
1) 32-2-6509764
2) 32-2-6509767
3) dcoorna@dbm.ulb.ac.be
GDB Mirror site
Belgian EMBnet Node
Deutschland The Biocomputing Unit
Abteilung für Molekularbiophysik
Deutsches Krebsforschungszentrum (DKFZ)
Im Neuenheimer Feld 280
69120 Heidelberg
Deutschland
1) 49-6221-42-2349
2) 49-6221-42-2333
3) gdb@dkfz-heidelberg.de
GDB Mirror Site
German Cancer Research Center Web Server
Frankreich Dr. Philippe Dessen
INFOBIOGEN
Service de bioinformatique
7, rue Guy Môquet – BP 8
94801 Villejuif Cedex
France
1) 33-1-49-59-52-41
2) 33-1-49-59-52-50
3) gdb@infobiogen.fr
GDB Mirror Site
INFOBIOGEN Web Server
Großbritannien UK HGMP Resource Centre
Hinxton
Cambridge CB10 1SB
U. K.
1) 44-1223-494520
2) 44-1223-494512
3) support@hgmp.mrc.ac.uk
GDB Mirror Site
UK HGMP Resource Centre Web Server
Israel Dr. Jaime Prilusky
Bioinformatics Unit
Weizmann Institute of Science
76100 Rehovot
Israel
1) 972-8-9343456
2) 972-8-9344113
3) Isprilus@weizmann.weizmann.ac.il
GDB Mirror Site
Weizmann Institute Web Server
Italien Mr. Gyorgy Simon
Tigem – Telethon Institute of Genetics and Medicine
Informatics Core
Via Olgettina, 58
20132 Milan
Italy
1) 39-2-21-560-212
2) 39-2-21-560-220
3) simon@tigem.it
GDB Mirror Site
Tigem Web Server
Dr. Luciano Melanesi
Istituto Tecnologie Biomediche Avanzate
L.I.T.A. – C.N.R. Via Fratelli Cervi, 93
20090 Segrate (MI)
Italy
1) 39-2-26422604
2) 39-2-26422770
3) melanesi@itba.mi.cnr.it
GDB Mirror Site
ITBA Web Server
Japan GDB Japan Node Staff
Japan Science and Technology Corporation (JST)
5-3, Yonban-cho
Tokyo 102
Japan
1) 81-3-5214-8491
2) 81-3-5214-8470
3) gdb-staff@gdbnet.ad.jp
GDB Mirror Site
JICST Web Server
Niederlande CAOS/CAMM Center
Faculty of Science
University of Nijmegen
P.O. Box 9010
6500 GL Nijmegen
The Netherlands
1) 31-24-3653391
2) 31-24-3652877
3) post@caos.kun.nl
GDB Mirror Site
CAOS/CAMM Centre Web Server
Schweden GDB User Support
Biomedical Centre
Box 570
S-751 23 Uppsala
Sweden
1) 46-18-17-44-32
2) 46-18-52-68-49
3) help@gdb.embnet.se
GDB Mirror Site
Biomedical Centre Web Server
Taiwan National Health Research Institutes
Department of Research Resources
Division of Computer and Information
128 Yen-Chiu-Yuan Rd., Sec. 2
Taipei 115
Taiwan R.O.C.
1) 886-2-26534401 x8223
2) 886-2-26513723
3) gdb@nhri.org.tw
GDB Mirror Site
National Health Research Institutes Web Server

Stand: Juli 1998.

Lesermeinung

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

  • Die Autoren

Partnervideos