Grundlagen der Molekularen Medizin, 3.Auflage [3., überarb. u. erw. Aufl.] 9783540694120, 3540694129 [PDF]

Das Wissen ?ber die molekularen Grundlagen der Medizin und seine Anwendung in der klinischen Medizin nimmt mit ungebroch

244 54 12MB

German Pages 546 [576] Year 2007

Table of contents :
Inhaltsverzeichnis......Page 8
Vorwort......Page 5
Autorenverzeichnis......Page 9
Abkürzungen und Erläuterungen......Page 13
1. Allgemeine Grundlagen......Page 36
1.1 Molekulare klinische Zellbiologie......Page 37
1.1.2 Subzelluläre Prozesse......Page 38
1.1.3 Zelluläre Prozesse......Page 48
1.1.4 Ausblick......Page 51
1.1.5 Literatur......Page 52
1.1.6 Zeittafel......Page 53
Literatur zur Zeittafel......Page 54
1.2 Molekulare Mechanismen von Zell-Zell- Wechselwirkungen......Page 55
1.2.2 Zelladhäsionsmoleküle......Page 56
1.2.3 Connexine und die Gap junctions......Page 68
1.2.4 Claudine, Occludin und Tight junctions......Page 69
1.2.6 Literatur......Page 70
1.2.7 Zeittafel......Page 73
Literatur zur Zeittafel......Page 74
1.3 Die zytogenetischen Grundlagen der Molekularen Medizin......Page 75
1.3.1 Einleitung......Page 76
1.3.2 Chromosomentheorie der Vererbung......Page 77
1.3.3 Grundlagen der Chromosomenphysiologie......Page 80
1.3.4 Zellzyklus und Checkpoint-Kontrolle......Page 83
1.3.5 Chromosomopathien......Page 85
1.3.6 Somatische Chromosomenmutationen......Page 88
1.3.7 Ausblick......Page 91
1.3.8 Literatur......Page 92
1.3.9 Zeittafel......Page 96
1.4 Analyse von Biochips: Von der Sequenz zum System......Page 97
1.4.1 Analyse von Krankheitsprozessen in der modernen Genomforschung......Page 99
1.4.2 Biochips I: Messung des Transkriptoms......Page 100
1.4.3 Biochips II:Messung transkriptioneller Abhängigkeiten......Page 103
1.4.4 Bildauswertung und Qualitätskontrolle von Biochips......Page 107
1.4.5 Detektion differenziell exprimierter Gene......Page 108
1.4.6 Analyse von Genexpressionsprofilen......Page 112
1.4.7 Klassifizierung......Page 117
1.4.8 Genetische Netzwerke......Page 120
1.4.9 Datenbanken und Datenintegration......Page 125
1.4.10 Ausblick – Systembiologie in der molekularen Medizin......Page 127
1.4.11 Literatur......Page 128
1.4.12 Zeittafel......Page 133
Literatur zur Zeittafel......Page 134
1.5 Mitochondriale DNA des Menschen......Page 135
1.5.1 Struktur und Funktion der Mitochondrien......Page 136
1.5.2 Das mitochondriale Genom des Menschen......Page 137
1.5.3 Transkription und RNA-Prozessierung......Page 138
1.5.4 Translation......Page 141
1.5.5 Replikation......Page 142
1.5.6 Mitochondriale Vererbung......Page 145
1.5.7 Mitochondriale Erkrankungen......Page 147
1.5.8 mtDNA als molekularer Marker......Page 149
1.5.9 Literatur......Page 150
Literatur zur Zeittafel......Page 152
1.6 Regulationsmechanismen der Transkription in Eukaryonten......Page 154
1.6.1 Transkription durch die RNA-Polymerase......Page 155
1.6.2 Das Chromatin......Page 159
1.6.3 „Regulationsmaschinen“......Page 163
1.6.4 Regulation durch nichtkodierende RNA......Page 165
1.6.5 Regulationsmodelle mit klinischer Relevanz......Page 166
1.6.7 Literatur......Page 169
1.6.8 Zeittafel......Page 171
Literatur zur Zeittafel......Page 172
1.7 Mechanismen der Translationskontrolle in Eukaryonten......Page 173
1.7.1 Der Ablauf der Translation......Page 174
1.7.2 Globale Kontrolle der Translationsinitiation......Page 176
1.7.3 mRNA-spezifische Translationskontrolle......Page 181
1.7.4 Ausblick......Page 188
1.7.5 Literatur......Page 189
1.7.6 Zeittafel......Page 190
Literatur zur Zeittafel......Page 191
1.8 Molekulare Grundlagen der Apoptose......Page 193
1.8.1 Eine biologische Rationale des programmierten Zelltods......Page 194
1.8.3 Zelltodsignalwege......Page 196
1.8.4 Stressinduzierte Signalwege......Page 210
1.8.5 Störungen der Zelltodregulation in der Pathogenese von Erkrankungen......Page 216
1.8.7 Literatur......Page 228
1.8.8 Zeittafel......Page 234
Literatur zur Zeittafel......Page 236
2. Modelle......Page 238
2.1 Tiermodelle in der biomedizinischen Forschung......Page 239
2.1.2 Strategien zur genetischen Veränderung von Versuchstieren......Page 240
2.1.3 Beispiele genetisch veränderter Tiermodelle in der biomedizinischen Forschung......Page 250
2.1.5 Literatur......Page 262
2.1.6 Zeittafel......Page 272
Literatur zur Zeittafel......Page 273
2.2 Zellkulturtechniken, Zellmodelle und Tissue Engineering......Page 274
2.2.2 Zellkulturtechniken......Page 275
2.2.3. Zellkulturmodelle......Page 284
2.2.4 Tissue Engineering......Page 295
2.2.5 Ausblick......Page 302
2.2.6 Literatur......Page 303
2.2.7 Zeittafel......Page 305
Literatur zur Zeittafel......Page 306
2.3 Molekülmodelle und Modellmoleküle: Strukturanalyse großer biologischer Moleküle für die Medizin......Page 307
2.3.1 Einleitung......Page 308
2.3.2 Strukturbiologische Methoden......Page 312
2.3.3 Molekülstrukturen in Biologie und Medizin......Page 315
2.3.4 Moleküle beflügeln die Arzneimittelentwicklung......Page 321
2.3.6 Literatur......Page 322
2.3.7 Zeittafel......Page 326
3. Diagnostik......Page 327
3.1 Klinische Proteomik......Page 328
3.1.1 Einführung......Page 329
3.1.2 Teilgebiete der Proteomik......Page 330
3.1.3 Klinische Proteomik......Page 336
3.1.5 Literatur......Page 339
Literatur zur Zeittafel......Page 343
3.2 Pharmakogenetik und Pharmakogenomik......Page 345
3.2.2 Pharmakogenomik......Page 346
3.2.3 Genvarianten arzneimittelmetabolisierender Enzyme, die zu Änderungen der Pharmakokinetik führen......Page 348
3.2.4 Genetische Varianten von Arzneimitteltransportern......Page 355
3.2.5 Genotyp-basierte Dosisempfehlungen......Page 356
3.2.6 Ausblick auf künftige Implementierung der Pharmakogenetik bei der Krankenversorgung......Page 358
3.2.7 Literatur......Page 359
3.2.8 Zeittafel......Page 361
Literatur zur Zeittafel......Page 362
3.3 Bioinformatik......Page 363
3.3.1 Einleitung......Page 364
3.3.2 Das menschliche Genom als Textspeicher......Page 365
3.3.3 Sequenzanalyse als Basis der Bioinformatik......Page 367
3.3.4 Genomkartierung......Page 370
3.3.5 Vergleichende Genomanalyse: Die evolutionäre Verwandtschaft allen Lebens......Page 371
3.3.6 „Transkriptom“: Expressionsanalyse des Genoms......Page 372
3.3.8 Strukturbiologie: Die Analyse der molekulären Raumstruktur von Proteinen und Nukleinsäuren......Page 373
3.3.9 Genetische Diversität des menschlichen Genoms......Page 374
3.3.11 Weiterführende Literatur......Page 375
Literatur zur Zeittafel......Page 376
3.4 Gendiagnostik......Page 377
3.4.1 Methodische Grundlagen......Page 378
3.4.2 Grundlagen der klinischen Anwendung......Page 394
3.4.3 Grundlagen der molekulargenetischen Diagnostik erblicher Krankheiten......Page 401
4. Therapie......Page 408
4.1 Gentherapie......Page 409
4.1.2 Gentransfer......Page 410
4.1.3 Experimentelle Anwendungen der DNA-Vakzinierung......Page 413
4.1.4 Update zu weiteren klinischen Studien und Herausforderungen der Zukunft......Page 418
4.1.5 Ausblick......Page 419
4.1.6 Literatur......Page 420
4.1.7 Zeittafel......Page 424
4.2 DNA-Reparatur und Mutagenese......Page 425
4.2.2 Bedeutung der DNA-Reparatur für den Menschen......Page 426
4.2.3 Reparatur von Basenschäden......Page 427
4.2.4 Reparatur von DNA-Doppelstrangbrüchen......Page 434
4.2.5 Reparatur und Transläsionssynthese von „DNA-Crosslinks“......Page 436
4.2.7 Literatur......Page 437
Literatur zur Zeittafel......Page 439
4.3 Antisense-, Ribozym- und RNA-Interferenz- Strategien: Methoden des posttranskriptionellen Gene Silencing in der Molekularen Medizin......Page 440
4.3.1 Einleitung......Page 441
4.3.2 Antisense-Oligonukleotide......Page 442
4.3.3 Ribozyme......Page 445
4.3.4 RNA-Interferenz......Page 447
4.3.6 Literatur......Page 453
4.3.7 Zeittafel......Page 454
4.4 Medizinische Perspektiven der kardialen Stammzellforschung......Page 455
4.4.1 Paradigmenwechsel in der Therapie: Von der medikamentösen Behandlung zur Zelltherapie......Page 456
4.4.2 Eigenschaften von Stammzellen......Page 457
4.4.3 Therapeutischer Nutzen der Stammzelltherapie des Myokardinfarkts – Ergebnisse bisheriger Studien......Page 464
4.4.4 Elektrophysiologische und molekularbiologische Untersuchungen an humanen ESKM......Page 467
4.4.5 Humane ESKM auf dem Weg zum klinischen Einsatz – welche nächsten Schritte sind zu tun?......Page 469
4.4.6 Reprogrammierungsstrategien......Page 470
4.4.8 Ausblick......Page 471
4.4.9 Literaturverzeichnis......Page 472
4.4.10 Zeittafel......Page 477
Literatur zur Zeittafel......Page 478
4.5 Monoklonale Antikörper: Grundlagen und ihre Bedeutung in Diagnostik und Therapie......Page 479
4.5.2 Eigenschaften von Antikörpern......Page 481
4.5.3 Immunisierungen......Page 482
4.5.4 Gewinnung polyklonaler Antikörper......Page 483
4.5.5 Gewinnung monoklonaler Antikörper......Page 484
4.5.6 Chemische und biochemische Modifizierung von Antikörpern......Page 486
4.5.7 Rekombinante Antikörpertechniken......Page 487
4.5.8 Nutzung von monoklonalen Antikörpern......Page 492
4.5.9 Antikörper in der Medizin......Page 494
4.5.10 Ausblick......Page 500
4.5.11 Literatur......Page 501
Literatur zur Zeittafel......Page 505
4.6 Gentechnische Grundlagen für biotechnologische Anwendungen......Page 506
4.6.2 Die Anfänge der Biotechnologie......Page 508
4.6.3 Von traditionellen zu modernen Biotechnologien......Page 509
4.6.4 Ein kleines Molekül des Bakteriums – eine große Bedeutung für die Menschheit......Page 514
4.6.5 „Enabling-Technologien“ ermöglichen eine rasante Entwicklung der Gentechnologie......Page 520
4.6.6 Moderne Biopharmazeutika sind quasi ubiquitär in der Molekularen Medizin......Page 522
4.6.7 Verschiedene Wirkmechanismen moderner Biopharmazeutika......Page 527
4.6.8 Beschleunigte Entwicklung mit Hochdurchsatz......Page 530
4.6.9 Die moderne Biotechnologie......Page 533
4.6.10 Ausblick......Page 534
4.6.11 Literatur......Page 536
4.6.12 Zeittafel......Page 538
4.7 Ethische Probleme der Molekularen Medizin: Grundlagen und Anwendungen unter Berücksichtigung der rechtlichen Rahmenbedingungen......Page 540
4.7.1 Einleitung......Page 541
4.7.2 Wissenschaftstheoretische Vorbemerkungen......Page 542
4.7.3 Ethische Grundlagen......Page 544
4.7.4 Ausgewählte Probleme der bioethischen Diskussion......Page 548
4.7.5 Ausblick......Page 559
4.7.6 Literatur......Page 560
A......Page 563
C......Page 564
D......Page 565
F......Page 566
G......Page 567
I......Page 568
K......Page 569
M......Page 570
O......Page 571
P......Page 572
R......Page 573
S......Page 574
V......Page 575
Z......Page 576

Grundlagen der Molekularen Medizin, 3.Auflage [3., überarb. u. erw. Aufl.]
9783540694120, 3540694129 [PDF]

Author / Uploaded
Detlev Ganten
Klaus Ruckpaul

0 0 0
Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden

Datei wird geladen, bitte warten...

Zitiervorschau

Herausgeberbeirat

Adriano Aguzzi, Zürich Heinz Bielka, Berlin Falko Herrmann, Greifswald Florian Holsboer, München Stefan H.E. Kaufmann, Berlin Peter C. Scriba, München Günter Stock, Berlin Harald zur Hausen, Heidelberg

Detlev Ganten Klaus Ruckpaul (Hrsg.)

Grundlagen der Molekularen Medizin 3., überarbeitete und erweiterte Auflage

Mit Beiträgen von Stefan Aretz, Andrea Bauer, Olaf Behrsing, Karsten Brand, Karl Kai Breuhahn, Stefan Britsch, Thomas Brümmendorf, Lukas Chavez, Peter Daniel, Volker A. Erdmann, Carl Friedrich Gethmann, Wolfgang Goedecke, Marcel Halbach, Udo Heinemann, Ulrich R. Hengge, Ralf Herwig, Jürgen Hescheler, Jörg D. Hoheisel, Birgit Kersten, Jörg Knäblein, Jens Kurreck, Gabriele Laschinski, Joerg Leers, Hans Lehrach, Heike Mertsching, Urs A. Meyer, Burkhard Micheel, Martina U. Muckenthaler, Yves A. Muller, Jochen Müller-Ehmsen, Heidemarie Neitzel, Roland Penzel, Petra Pfeiffer, Frank Pillekamp, Thomas Preiss, Jens G. Reich, Rainer Renkawitz, Michael Reppel, Ivar Roots, Peter Schirmacher, Steffen Schubert, Johannes Schuchhardt, Sabina Solinas-Toldo, Karl Sperling, Michael Strehle, Felix Thiele, Erich E. Wanker, Bernd Wissinger, Anna M. Wobus

Mit 180 Abbildungen, davon 127 in Farbe und 28 Tabellen

123

Professor Dr. Detlev Ganten Der Vorstandsvorsitzende (CEO) Charité – Universitätsmedizin Berlin Charitéplatz 1 10117 Berlin

Professor Dr. Klaus Ruckpaul Max-Delbrück-Centrum für Molekulare Medizin (MDC) Robert-Rössle-Straße 10 13125 Berlin-Buch

Legende zur Einbandabbildung: RNA-bindendes Zinkﬁnger-Protein. Kristallstruktur eines Komplexes eines 3-Finger-Peptids von TIFIIIA und einer verkürzten 5S RNA (Yu Chen, Gabriele Varani, FEBS Journal 272:2088-2097 (2005)) [mit freundlicher Genehmigung des Verlages Blackwell Publishing (Oxford, UK) und der Autoren]

ISBN-13

978-3-540-69412-0 3. Auﬂage Springer Medizin Verlag Heidelberg

Bibliograﬁsche Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliograﬁe; detaillierte bibliograﬁsche Daten sind im Internet über http://dnb.d-nb.de abrufbar Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverﬁlmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspﬂichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Springer Medizin Verlag springer.de © Springer Medizin Verlag Heidelberg 2008 Die Wiedergabe von Gebrauchsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutzgesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Produkthaftung: Für Angaben über Dosierungsanweisungen und Applikationsformen kann vom Verlag keine Gewähr übernommen werden. Derartige Angaben müssen vom Anwender im Einzelfall anhand anderer Literaturstellen auf ihre Richtigkeit überprüft werden. Planung: Dr. Rolf Lange, Heidelberg Projektmanagement: Hiltrud Wilbertz, Heidelberg Einbandgestaltung: deblik Berlin Satz: Fotosatz-Service Köhler GmbH, Würzburg SPIN: 11527084 Gedruckt auf säurefreiem Papier

19/2119 wi – 5 4 3 2 1 0

V

Vorwort Seit dem Erscheinen der 2. Auflage der ‚Grundlagen der Molekularen Medizin‘ sind 5 Jahre vergangen (2. Auflage 2003). Trotz dieser kurzen Zeitspanne haben Verlag und Herausgeber sich zur Herausgabe einer 3. Auflage entschlossen. Ausschlaggebend für diese Entscheidung waren und sind der ungebrochen dynamische Zuwachs molekularmedizinischer Forschungsergebnisse und deren zunehmende Anwendung in Diagnostik und Therapie. Eine umfassende Darstellung dieser Erkenntnisse und neuen Methoden hätte jedoch den Umfang der 2. Auflage erheblich erweitert und damit den Rahmen eines einbändigen Werkes gesprengt. Deshalb haben wir uns entschieden, ohne Verzicht auf bereits in der 2. Auflage dargestellte Sachverhalte eine Straffung des Textes zu verbinden mit der Darstellung neuester Ergebnisse sowie der Ergänzung durch neue Kapitel wie Pharmakogenetik/Pharmakogenomik, Gentherapie und Biotechnologische Anwendungen. Dabei war es unser besonderes Anliegen, solche Themen neu in die 3. Auflage aufzunehmen, die für die Molekulare Medizin zukünftig von besonderer Bedeutung sein könnten. Um die Orientierung und den Zugriff zu entscheidenden Entwicklungsetappen zu erleichtern, haben wir die Zeittafeln – anders als in der 2. Auflage – unmittelbar an das Ende eines jeden Kapitels gesetzt. Ohne auf alle thematischen Details eingehen zu können, seien einige Bemerkungen zum Inhalt dieses Bandes vorangestellt. Mit der Aufsehen erregenden Veröffentlichung der vollständigen, 3,1 Mrd. umfassenden Basen1 sequenz des menschlichen Genoms wurde ein neues Blatt in der biologischen Grundlagenforschung und der Kenntnis der Bausteine des menschlichen Lebens aufgeschlagen. Eine mit höchster Genauigkeit durchgeführte Sequenzierung aus dem Jahr 2004 (veröffentlicht in: Nature 431, pp. 915, 927, 933 [2004]) ergab 3,08 Mrd. Basenpaare mit 20.000 bis 30.000 Genen. Der etwa 99% umfassende Rest des menschlichen Genoms besteht aus sogenannter junk-DNA mit bisher weitgehend unbekannter Funktion. Neben dem menschlichen Genom und der vollständigen Zuordnung der Gesamtsequenz zu den menschlichen Chromosomen sind die Sequenzen weiterer Pri1 Zeitgleich entschlüsselte und veröffentlichte Genomsequenz durch ein ,International non-commercial project’ (Leitung: Francis Collins) und durch die Gentechnik-Firma Celera Genomics (Leitung: Craig Venter) in der Zeitschrift Science [Science 300, S. 277 ff, Special Section: Building on the DNA Revolution] zum 50. Jahrestag der Entdeckung der Doppelhelix durch James Watson und Francis Crick im April 2003 und in der Zeitschrift Nature [Nature 421, No. 6921, January 2002, Special Issue: The double helix – 50 years].

matengenome wie beispielsweise die von Schimpanse (99% Übereinstimmung mit dem Menschen) sowie Rhesusaffe und einer Reihe weiterer Säugergenome aufgeklärt, wie die von Maus, Ratte, Rind und Hund. Die Summe dieser Einzelergebnisse ermöglicht durch Sequenzvergleich die Zuordnung definierter Gene zu bestimmten Erkrankungen des Menschen und ist daher wesentlicher Bestandteil der Molekularen Medizin. Interessanterweise unterscheidet sich das menschliche Genom von anderen Säugergenomen trotz einer weitgehend ähnlichen Anzahl von Basenpaaren durch die Zahl von Enzymen mit unterschiedlichen Funktionen. Eine entscheidende Ursache dieser Diversifikation des Transkriptoms ist das alternative Spleißen. Aus einem einzigen Primärtranskript werden auf diese Weise unterschiedliche reife RNAs gebildet, die zur Biosynthese von Proteinen mit unterschiedlichen Funktionen führen. So sind für 23.245 Genorte im menschlichen Genom über 43.000 Transkripte bekannt. Die Anzahl alternativer Transkripte bewegt sich zwischen 2 und 40 (vgl. hierzu das Kapitel ‚Analyse von Biochips: Von der Sequenz zum System‘). Die Entschlüsselung der Gesamtsequenz des Genoms ist nur der erste Schritt bei der weitaus schwierigeren Aufgabe, die funktionelle Bedeutung der Sequenzen zu verstehen. Der Phase der Sequenzermittlung schließt sich daher folgerichtig die funktionelle Entschlüsselung an, die funktionelle Genomik. Dabei geht es um die Zuordnung von Teilen der Gesamtsequenz zu definierten Genstrukturen, was in letzter Zeit zu einem erheblichen Erkenntniszuwachs geführt hat. Dies schließt auch ein die Zuordnung von Sequenzen der Introns zu bisher nur teilweise verstandenen Funktionen im Prozess der Regulation der Genexpression und der Kontrolle nachfolgender Schritte bis zur Umsetzung der genetischen Information in Genprodukte (Enzyme, Eiweiße). Die Aufklärung der Genomsequenz hat für zwei die Molekulare Medizin in besonderem Maße prägende Forschungsfelder die molekularen Grundlagen gelegt: die Pharmakogenetik und die Pharmakogenomik. Mit dieser inhaltlichen Erweiterung wird in der vorliegenden 3. Auflage eine Lücke gegenüber der 2. Auflage geschlossen. Die Duplikation (Replikation) von 3 Mrd. Basenpaaren des menschlichen Genoms verläuft zwar mit außerordentlicher Präzision, aber nicht immer fehlerfrei. Derartige Fehler können spontan durch Basenveränderungen verursacht werden oder aber durch Umweltmutagene zustande kommen. Sie können stumm (Degeneriertheit des Codes oder funktionsneutrale Aminosäuren), d.h. ohne Funktionsstörungen, bleiben oder aber die molekulare Ursache von Krankheiten bzw.

VI

Vorwort

von unerwünschten Nebenwirkungen nach Einnahme bestimmter Arzneimittel sein. Solche vertauschten Basen werden ‚single nucleotide polymorphisms‘ oder auch SNPs genannt und können auf der somatischen Ebene wie auch in der Keimbahn ablaufen. Nach jüngsten Angaben gibt es etwa 10 Mio. solcher SNPs. Gut 1 Mio. sind jetzt von einer internationalen Forschungsgruppe (mehr als 200 Wissenschaftler aus Kanada, China, Japan, Nigeria, Großbritannien und den USA) kartiert worden und liegen als sogenannte HAPMAP (Haploid-Karte) vor. Dabei hat sich ergeben, dass die SNPs nicht statistisch über das Genom verteilt sind, sondern in Clustern (sets) auftreten. Durch diese Kartierung wird die Suche nach krankheitsrelevanten Genveränderungen wesentlich erleichtert, da es nicht mehr erforderlich ist, das gesamte Erbgut zu untersuchen, sondern ein Vergleich des SNP-Musters eines Patienten mit der HAPMAP ergibt bereits weitgehende Aufschlüsse. Allerdings werden bei systematischen Untersuchungen nur solche Genvarianten erfasst, die bei mindestens 5 % der DNA-Spender gefunden werden (vgl. hierzu Kapitel ‚Pharmakogenetik und Pharmakogenomik‘). Im Online Mendelian Inheritance in Man-Katalog (OMIM) gibt es mehr als 17.000 Einträge über menschliche Gene und Gendefekte bei insgesamt etwa 30.000 menschlichen Genen. Die sich hieraus ergebenden diagnostischen Möglichkeiten sind bei Berücksichtigung des Entwicklungstempos bemerkenswert und lassen erwarten, dass diese in relativ kurzer Zeit Eingang in die Routinediagnostik gefunden haben. Die methodischen Möglichkeiten hierzu und ihre klinische Anwendung werden im Kapitel ‚Gendiagnostik‘ im Detail dargestellt. Bereits in den 1990er Jahren wurde in Pflanzen und einfachen Organismen das Phänomen einer Abschaltung von Genen entdeckt, ohne die molekulare Struktur dieser Regulatoren zu kennen. Weiterführende Untersuchungen an Fruchtfliegen ergaben jetzt Einzelheiten der molekularen Struktur dieser Moleküle. Es handelt sich um kurze Abschnitte doppelsträngiger RNA, die aus etwa 20 Bausteinen bestehen. Daraus abgeleitet wurde der Name siRNA für small interfering RNA. Diese siRNA-Moleküle vermögen bestimmte BotenRNA zu blockieren und damit z.B. die Information zur Bildung bestimmter Eiweiße zu unterbinden2. Dieses Forschungsfeld wird gegenwärtig wegen zukunftsfähiger pharmakologisch/therapeutischer Therapieansätze intensiv bearbeitet. Die Arbeitsgruppe um Tuschl fand außerdem, 2 Die beiden Biologen Andrew Z. Fire und Craig C. Mello haben im Jahr 2006 für die Entdeckung der RNA-Interferenz und deren Funktionsanalyse (siRNA) den Nobelpreis für Medizin und Physiologie erhalten ebenso wie Roger Kornfeld (Nobelpreis für Chemie, 2006) für seine Arbeiten zur Struktur und Funktion der an diesen Prozessen beteiligten RNA-Polymerase.

dass in Säugerzellen weitere kurze RNAs gebildet werden, die eine RNA-Interferenz auslösen können. Beim Menschen wurden bisher etwa 500 Gene nachgewiesen, die die Bauanleitung für diese als MikroRNA bezeichneten RNA-Sequenzen enthalten. Diese in die Zukunft gerichteten Probleme werden in verschiedenen Kapiteln aus unterschiedlicher Sicht behandelt (vgl. hierzu das Kapitel ‚Antisense-, Ribozym- und RNA-InterferenzStrategien: Methoden des posttranskriptionellen Gene Silencing in der Molekularen Medizin‘). Ähnlich wie bei der Erforschung der Genomsequenz haben Forscher verschiedener Länder zur Lösung der Frage nach der Bedeutung der durch die Gene codierten Enzyme im Jahre 2001 die Human Proteome Organization (HUPO) gegründet. Proteom ist die Gesamtheit aller Eiweiße in einer Zelle. Bei der Größe der Aufgabe erstaunt es nicht, dass das Gesamtprojekt in 5 kleinere Einzelprojekte untergliedert ist (2003): Human Plasma Proteome Project (HPPP), Sweden, USA; Human Liver Proteome Project (HLPP), Canada, China, France; Proteomics Standard Initiative (PSI), all countries; Human Brain Proteome Project (HBPP), Germany; International Mouse and Rat Proteome Project (MRPP), Canada, Germany. Alle Projekte dienen dem Ziel, das funktionelle Netzwerk der Eiweiße im menschlichen Organismus zu entschlüsseln, um Ansatzpunkte für die Behandlung von entsprechenden Erkrankungen zu finden (vgl. hierzu Kapitel ‚Klinische Proteomik‘). Die in die Gentherapie gesetzten Hoffnungen auf eine Umsetzung der Ergebnisse aus der Grundlagenforschung in neuartige gentherapeutische Behandlungsformen haben sich bisher nicht erfüllt. Zu viele Fragen haben sich trotz anfänglicher Erfolge ergeben und die Notwendigkeit der Intensivierung einschlägiger Grundlagenforschung gezeigt. Ein in die vorliegende 3. Auflage aufgenommenes Kapitel beleuchtet den gegenwärtigen Kenntnisstand und setzt sich mit den weiteren Perspektiven aufgrund der durch die Genom- und Proteomforschung erreichten Ergebnisse und Erkenntnisse auseinander (Kapitel ‚Gentherapie‘). Neben den Forschungen an physiologischerweise vorkommenden Stammzellen mit dem Ziel, Regulations- und Entwicklungsprozesse zu verstehen und für eine therapeutische Anwendung zu nutzen, werden auch Krebsstammzellen (1997 von John Dick [Canada] entdeckt) untersucht. Die zunächst bei Leukämiepatienten gefundenen Stammzellen wurden seither auch in Geweben von Brustkrebs, Gehirntumoren (Glioblastom) und Prostatakrebs nachgewiesen. Ziel der noch am Beginn stehenden Forschungen ist es, aus den molekularen Besonderheiten der Stammzellen möglicherweise neue Therapiestrategien abzuleiten, um die Stammzellen gezielt angreifen zu können (Kapitel ‚Medizinische Perspektiven der kardialen Stammzellforschung‘).

VII Vorwort

Die wissenschaftlichen Grundlagen der Molekularen Medizin beruhen zu einem wesentlichen Teil auf der Aufdeckung zell- und molekularbiologischer Prozesse und Mechanismen, deren Transfer in die klinische Praxis sich über eine Anwendung in der klinischen Diagnostik vollzieht. Eine Darstellung des gegenwärtigen Entwicklungsstandes wäre jedoch lückenhaft, würde sie sich nur auf die unmittelbar in der Klinik genutzten Erkenntnisse beschränken. Durch die Anwendung des Methodenpotentials gentechnischer Verfahren werden große Umwälzungen in der Biotechnologie und in der pharmazeutischen Industrie bewirkt, deren Einführung zu einer erheblichen Rationalisierung von Herstellungsprozessen geführt hat. In einigen Fällen ermöglichte sie überhaupt erst die Gewinnung von bisher nicht zugänglichen therapeutisch anwendbaren Wirkstoffen. Dadurch wurden und werden Arzneimittel für eine therapeutische Verwendung erschlossen, deren Herstellungsaufwand auf chemisch synthetischem Wege eine Anwendung bisher unmöglich gemacht hat (Kapitel ‚Gentechnische Grundlagen für biotechnologische Anwendungen‘). Mit insgesamt 22 Kapiteln liegen die ,Grundlagen der Molekularen Medizin‘ jetzt in überarbeiteter und aktualisierter Form vor – ergänzt durch 4 neue Kapitel gegenüber der 2. Auflage. Dies wurde erreicht durch Streichung, Straffung und Zusammenlegung von Kapiteln, so dass im Ergebnis die Zahl der Kapitel gegenüber der 2. Auflage

bei erheblicher Verringerung des Gesamtumfanges unverändert geblieben ist. Der Dank der Herausgeber gilt daher in erster Linie den Autoren, die sich mit großer Disziplin an den vorgegebenen Rahmen gehalten haben, ohne auf inhaltliche Schwerpunkte zu verzichten. Dadurch wurde es möglich, den Preis des Bandes auf einem Niveau zu halten, der allen Interessierten, insbesondere aber auch Studenten nicht nur der Medizin, sondern aller biowissenschaftlichen Disziplinen, den Erwerb ermöglichen soll. Neben dem Dank an die Autoren ist die Herausgabe eines solchen Buches ohne die konstruktive Mitarbeit des Verlages nicht möglich. Deshalb möchten wir an dieser Stelle herzlich danken für die stets förderliche und verständnisvolle Zusammenarbeit mit dem Verlagsleiter, der verständnisvollen Zusammenarbeit mit dem CopyEditing und dem Hersteller sowie all denen, die am Erscheinen dieses Bandes mitgewirkt haben. Herausgeber und Verlag wünschen auch dieser 3. Auflage der ‚Grundlagen der Molekularen Medizin‘ eine wohlwollende Aufnahme durch die Leser, welche die aktuellen Grenzen der Molekularen Medizin kennen lernen wollen, im Interesse einer weiten Verbreitung der Molekularen Medizin zum Nutzen des medizinischen Fortschritts und zum Wohle der Patienten. Berlin, Sommer 2007

Detlev Ganten Klaus Ruckpaul

IX

Inhaltsverzeichnis Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Autorenverzeichnis . . . . . . . . . . . . . . . . . . . . . Abkürzungen und Erläuterungen . . . . . . . . . . . . 1

Allgemeine Grundlagen . . . . . . . . . . . . . . .

1.1 Molekulare klinische Zellbiologie . . . . . . . . . Kai Breuhahn und Karsten Brand 1.2 Molekulare Mechanismen von Zell-ZellWechselwirkungen . . . . . . . . . . . . . . . . . . Thomas Brümmendorf 1.3 Die zytogenetischen Grundlagen der Molekularen Medizin . . . . . . . . . . . . . . Heidemarie Neitzel und Karl Sperling 1.4 Analyse von Biochips: Von der Sequenz zum System . . . . . . . . . . . . . . . . . . . . . . Ralf Herwig, Johannes Schuchhardt, Lukas Chavez und Hans Lehrach 1.5 Mitochondriale DNA des Menschen . . . . . . . Bernd Wissinger 1.6 Regulationsmechanismen der Transkription in Eukaryonten . . . . . . . . . . . . . . . . . . . . Rainer Renkawitz und Joerg Leers 1.7 Mechanismen der Translationskontrolle in Eukaryonten . . . . . . . . . . . . . . . . . . . . Martina U. Muckenthaler und Thomas Preiss 1.8 Molekulare Grundlagen der Apoptose . . . . . Peter Daniel

2

V XI XV 1

. .

3

. .

21

. .

41

3

4 . .

63

. . 101

. . 120

. . 139 . . 159

Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

2.1 Tiermodelle in der biomedizinischen Forschung . 207 Michael Strehle und Stefan Britsch 2.2 Zellkulturtechniken, Zellmodelle und Tissue Engineering . . . . . . . . . . . . . . . . . 242 Anna M. Wobus und Heike Mertsching 2.3 Molekülmodelle und Modellmoleküle: Strukturanalyse großer biologischer Moleküle für die Medizin . . . . . . . . . . . . . . . . . . . . . . . 275 Yves A. Muller und Udo Heinemann

Diagnostik . . . . . . . . . . . . . . . . . . . . . . . . 295

3.1 Klinische Proteomik . . . . . . . . . . . . . . . . . Birgit Kersten und Erich E. Wanker 3.2 Pharmakogenetik und Pharmakogenomik . . . Ivar Roots, Gabriele Laschinski und Urs A. Meyer 3.3 Bioinformatik . . . . . . . . . . . . . . . . . . . . . Jens G. Reich 3.4 Gendiagnostik . . . . . . . . . . . . . . . . . . . . . Andrea Bauer, Sabina Solinas-Toldo und Jörg D. Hoheisel, Peter Schirmacher und Roland Penzel und Stefan Aretz

. . 297 . . 314 . . 332 . . 346

Therapie . . . . . . . . . . . . . . . . . . . . . . . . . . 377

4.1 Gentherapie . . . . . . . . . . . . . . . . . . . . . . . . Ulrich R. Hengge 4.2 DNA-Reparatur und Mutagenese . . . . . . . . . . . Wolfgang Goedecke und Petra Pfeiffer 4.3 Antisense-, Ribozym- und RNA-InterferenzStrategien: Methoden des posttranskriptionellen Gene Silencing in der Molekularen Medizin . . . . Jens Kurreck, Steffen Schubert und Volker A. Erdmann 4.4 Medizinische Perspektiven der kardialen Stammzellforschung . . . . . . . . . . . . . . . . . . . Marcel Halbach, Michael Reppel, Frank Pillekamp, Jochen Müller-Ehmsen und Jürgen Hescheler 4.5 Monoklonale Antikörper: Grundlagen und ihre Bedeutung in Diagnostik und Therapie . Olaf Behrsing und Burkhard Micheel 4.6 Gentechnische Grundlagen für biotechnologische Anwendungen . . . . . . . . . . . . . . . . Jörg Knäblein 4.7 Ethische Probleme der Molekularen Medizin: Grundlagen und Anwendungen unter Berücksichtigung der rechtlichen Rahmenbedingungen . . . Carl Friedrich Gethmann und Felix Thiele

379 395

410

425

449

476

510

Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . 533

XI

Autorenverzeichnis Dr. Stefan Aretz

Lukas Chavez

Institut für Humangenetik Universität Bonn Wilhelmstraße 31 53111 Bonn [email protected]

Max-Planck-Institut für Molekulare Genetik Ihnestraße 73 14195 Berlin

Dr. Andrea Bauer Abteilung Funktionelle Genomanalyse Deutsches Krebsforschungszentrum Im Neuenheimer Feld 580 69120 Heidelberg [email protected]

Prof. Dr. Peter Daniel Klinische und Molekulare Onkologie Charité – Universitätsmedizin Berlin Campus Berlin-Buch Lindenberger Weg 80 13125 Berlin [email protected] Prof. Dr. Volker A. Erdmann

Dr. Olaf Behrsing Biotechnologie Institut für Biochemie und Biologie Universität Potsdam Karl-Liebknecht-Straße 24-25 14476 Golm [email protected] PD Dr. Karsten Brand Institut für Pathologie AG Invasion und Metastasierung Universitätsklinikum Heidelberg Im Neuenheimer Feld 220/221 69120 Heidelberg [email protected] Dr. Karl Kai Breuhahn Institut für Pathologie AG Molekulare Hepato-Pathologie Universitätsklinikum Heidelberg Im Neuenheimer Feld 220/221 69120 Heidelberg [email protected] Professor Dr. Stefan Britsch Zentrum Anatomie Georg-August-Universität Göttingen Kreuzbergring 36 37075 Göttingen [email protected] Dr. Thomas Brümmendorf Novartis Institutes for Biomedical Research 4002 Basel, Schweiz [email protected]

Institut für Chemie und Biochemie Freie Universität Berlin Thielallee 63 14195 Berlin [email protected] Prof. Dr. Carl Friedrich Gethmann Europäische Akademie zur Erforschung von Folgen wissenschaftlich-technischer Entwicklungen Bad Neuenahr-Ahrweiler GmbH Wilhelmstraße 56 53474 Bad Neuenahr-Ahrweiler [email protected] PD Dr. Wolfgang Goedecke Fachbereich Biologie und Geografie Universität Duisburg-Essen Universitätsstraße 5 45117 Essen [email protected] Dr. Marcel Halbach Klinik III für Innere Medizin /Institut für Neurophysiologie Universität zu Köln Robert-Koch-Straße 39 50931 Köln [email protected] Prof. Dr. Udo Heinemann Forschungsgruppe Kristallographie Max-Delbrück-Centrum für Molekulare Medizin (MDC) Berlin-Buch Robert-Rössle-Straße 10 13125 Berlin [email protected]

XII

Autorenverzeichnis

Prof. Dr. Ulrich R. Hengge

Dr. Joerg Leers

Hautklinik Universitätsklinikum Düsseldorf Moorenstraße 4 40225 Düsseldorf [email protected]

Institut für Genetik Justus-Liebig-Universität Gießen Heinrich-Buff-Ring 58 35392 Gießen [email protected]

Dr. Ralf Herwig

Prof. Dr. Hans Lehrach

Max-Planck-Institut für Molekulare Genetik Ihnestraße 73 14195 Berlin [email protected]

Max-Planck-Institut für Molekulare Genetik Ihnestraße 73 14195 Berlin [email protected]

Prof. Dr. Jürgen Hescheler

Prof. Dr. Heike Mertsching

Institut für Neurophysiologie Universität zu Köln Robert-Koch-Straße 39 50931 Köln [email protected]

Fraunhofer-Institut für Grenzflächenund Bioverfahrenstechnik IGB Nobelstraße 12 70569 Stuttgart [email protected]

Dr. Jörg D. Hoheisel

Prof. Dr. Urs A. Meyer

Abteilung Funktionelle Genomanalyse Deutsches Krebsforschungszentrum Im Neuenheimer Feld 580 69120 Heidelberg [email protected]

Biozentrum der Universität Basel Abteilung Pharmakologie/Neurobiologie Klingelbergstraße 50-–70 4056 Basel, Schweiz [email protected]

Dr. Birgit Kersten

Prof. Dr. Burkhard Micheel

Max-Planck-Institut für Molekulare Pflanzenphysiologie 14424 Potsdam [email protected]

Biotechnologie Institut für Biochemie und Biologie Universität Potsdam Karl-Liebknecht-Straße 24–25 14476 Golm [email protected]

Dr. Jörg Knäblein Mikrobiologische Chemie Bayer Schering Pharma AG Müllerstraße 178 13342 Berlin [email protected] Prof. Dr. Jens Kurreck Institut für Industrielle Genetik Universität Stuttgart Allmandring 31 70569 Stuttgart [email protected] Dr. Gabriele Laschinski Institut für Klinische Pharmakologie und Toxikologie Charité – Universitätsmedizin Berlin Charitéplatz 1 10117 Berlin [email protected]

Prof. Dr. Martina U. Muckenthaler Molekulare Medizin Pädiatrische Onkologie, Hämatologie und Immunologie Universität Heidelberg Im Neuenheimer Feld 153 69120 Heidelberg [email protected] Prof. Dr. Yves A. Muller Lehrstuhl für Biotechnik Institut für Biologie Friedrich-Alexander-Universität – Im IZMP Henkestraße 91 91052 Erlangen [email protected]

XIII Autorenverzeichnis

Dr. Jochen Müller-Ehmsen

Prof. Dr. Rainer Renkawitz

Klinik III für Innere Medizin Universität zu Köln Kerpener Straße 62 50924 Köln [email protected]

Institut für Genetik Justus-Liebig-Universität Gießen Heinrich-Buff-Ring 58 35392 Gießen [email protected]

Prof. Dr. Heidemarie Neitzel

Dr. Michael Reppel

Institut für Humangenetik Charité – Universitätsmedizin Berlin Campus Virchow-Klinikum Augustenburger Platz 1 13353 Berlin [email protected]

Institut für Neurophysiologie Universität zu Köln Robert-Koch-Straße 39 50931 Köln [email protected] Prof. Dr. Ivar Roots

Dr. Roland Penzel Pathologisches Institut Universitätsklinikum Heidelberg Im Neuenheimer Feld 220/221 69120 Heidelberg [email protected]

Institut für Klinische Pharmakologie Charité – Universitätsmedizin Berlin Charité Campus Mitte Charitéplatz 1 10117 Berlin [email protected]

Prof. Dr. Petra Pfeiffer

Prof. Dr. Peter Schirmacher

Institut für Genetik Universität zu Köln Zülpicher Straße 47 50674 Köln [email protected]

Pathologisches Institut Universitätsklinikum Heidelberg Im Neuenheimer Feld 220/221 69120 Heidelberg [email protected]

Dr. Frank Pillekamp

Dr. Steffen Schubert

Institut für Neurophysiologie Universität zu Köln Robert-Koch-Straße 39 50931 Köln [email protected]

Dana-Farber Cancer Institute Department of Cancer Immunology and AIDS 44, Binney St Boston, MA 02115, USA [email protected]

Associate Prof. Thomas Preiss (PhD)

Dr. Johannes Schuchhardt

Molecular Genetics Program Victor Chang Cardiac Research Institute (VCCRI) 384 Victoria Street, Darlinghurst (Sydney) NSW 2010, Australien [email protected]

MicroDiscovery GmbH Marienburger Straße 1 10405 Berlin [email protected] Dr. Sabina Solinas-Toldo

Prof. Dr. Jens G. Reich Max-Delbrück-Centrum für Molekulare Medizin (MDC) Berlin-Buch Robert-Rössle-Straße 10 13125 Berlin [email protected]

Molekulare Genetik Deutsches Krebsforschungszentrum Im Neuenheimer Feld 580 69120 Heidelberg

XIV

Autorenverzeichnis

Prof. Dr. Karl Sperling

Prof. Dr. Erich E. Wanker

Institut für Humangenetik Charité – Universitätsmedizin Berlin Campus Virchow-Klinikum Augustenburger Platz 1 13353 Berlin [email protected]

Max-Delbrück-Centrum für Molekulare Medizin (MDC) Berlin-Buch Robert-Rössle-Straße 10 13125 Berlin-Buch [email protected] Dr. Bernd Wissinger

Dr. Michael Strehle Max-Delbrück-Centrum für Molekulare Medizin (MDC) Berlin-Buch Robert-Rössle-Straße 10 13125 Berlin [email protected]

Molekulargenetisches Labor Forschungsinstitut für Augenheilkunde Universitätsklinikum Tübingen Röntgenweg 11 72076 Tübingen [email protected]

Dr. Felix Thiele

Prof. Dr. Anna M. Wobus

Europäische Akademie zur Erforschung von Folgen wissenschaftlich-technischer Entwicklungen Bad Neuenahr-Ahrweiler GmbH Wilhelmstraße 56 53474 Bad Neuenahr-Ahrweiler [email protected]

Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung (IPK) Corrensstraße 3 06466 Gatersleben [email protected]

XV

Abkürzungen und Erläuterungen A Aβ Amyloid E AAG 3-MeA-DNA-Glykosylase AAV Adenoassoziiertes Virus ABC-Transporter Klasse von Membranproteinen, die

als gemeinsames Strukturelement eine ATP-bindende Kassette („ATP binding cassette“) haben und spezifische Substrate aktiv über die Zellmembran transportieren; zu dieser Familie gehören die meisten Arzneimitteltransporter ABI Format der Firma Applied Bioscience zur Abspeicherung von Daten aus Sequenzmaschinen ACE-Hemmer Hemmstoffe des Angiotensinkonversionsenzyms I, Einsatz zur Therapie des Bluthochdrucks ACT Autologous chondrocyte transplantation, autologe Chondrozytentransplantation: Gewinnung patienteneigener Knorpelzellen und ihre In-vitro-Vermehrung zur Behandlung von Knorpeldefekten (z. B. Arthrose) im erkrankten Gelenk des Patienten ADA-SCID Adenosindeaminase-Immundefektsyndrom (7 SCID) ADCC Antibody-dependent cellular cytotoxicity, 7 antikörperabhängige zelluläre Zytotoxizität ADCT Autologous disc chondrocyte transplantion: Autologe Bandscheiben-Chondrozytentransplantation Adjuvans Substanz, die die Immunantwort gegen ein Antigen erhöht, ohne selbst eine spezifische Immunantwort zu induzieren Aerobier Lebewesen, welches elementaren Sauerstoff zum Leben benötigt Affinität Maß für die Bindungsstärke zwischen einer Antigenbindungsregion eines Antikörpers und einer monovalenten Antigendeterminante; die Gesamtbindungsstärke zwischen einem Antikörper und einem Antigen, an der mehrere Bindungen beteiligt sind, wird als Avidität bezeichnet; der Begriff Affinität wird im Zusammenhang mit allen nichtkovalenten Bindungen zwischen biologischen Molekülen verwendet AFP α-Fetoprotein, 7 Alphafetoprotein Agglutination Aggregation zwischen partikulären Antigenen und Antikörpern, betrifft z. B. Erythrozyten oder Bakterien; Tests, die auf einer Agglutination beruhen, werden als Agglutinationstests bezeichnet Agglutinationstest 7 Agglutination AICD Automatic implantable cardioverter defibrillator AIDS Acquired immune deficiency syndrome: Durch das HIV (human immunodeficiency virus) ausgelöste Erkrankung, die zum Verlust der T-Helfer-Lymphozyten führt, wodurch eine Immunantwort gegen, auch normalerweise harmlose, Mikroorganismen nicht mehr möglich ist

ALL Akute lymphatische Leukämie: Subform der akuten

Leukämie Alphafetoprotein AFP: Glykoprotein, das während der

Embryonalentwicklung und im adulten Organismus von Tumorzellen der Leber exprimiert wird AMA Antikörper-Mikroarray: beschichteter Objektträger, auf dem verschiedene Antikörper unter Verwendung eines Mikroarrays immobilisiert wurden und damit systematisch, in Spots angeordnet, vorliegen; AMAs werden verwendet, um Proteine/Phosphoproteine in komplexen Gemischen zu detektieren und zu quantizifieren AMG Arzneimittelgesetz AML Akute myeloische Leukämie: Subform der akuten Leukämie Ampicillin Antibiotikum aus der Gruppe der Penicilline Amplifikation Gezielte Vermehrung von DNA-Abschnitten Anämie Blutarmut, unterschiedliche Pathogenese Annotation Anmerkung Anoikis Tod durch „Heimatlosigkeit“ infolge eines Verlusts des physiologischen Mikromilieus, z. B. von Kontakten zu Nachbarzellen oder der Extrazellulärmatrix ANOVA Analysis of variance: Statistische Methoden zur Auswertung von linearen Modellen mit qualitativen Einflussfaktoren Anthrax Milzbrand Antidiabetika, orale Alle Wirkstoffe gegen Diabetes mellitus, die eingenommen werden können – im Gegensatz zu den Insulinen, die gespritzt werden müssen Antigen Stoffe, die potenziell in Wirbeltieren die Bildung von Antikörpern anregen; Fremdsubstanz, die spezifisch von einem Antikörper oder Lymphozyten gebunden wird, im weitesten Sinne auch für Substanzen gebraucht, die nach Kontakt zu einer Immunantwort führen und von Komponenten des Immunsystems gebunden werden (ursprünglich abgeleitet von Antikörper-Generator); s. auch 7 Immunogen Antigenbindungsort 7 Antigenbindungsregion Antigenbindungsregion Der Teil eines Antikörpermoleküls (oder eines T-Zell-Rezeptors), der das Antigen spezifisch bindet Antigendeterminante 7 Epitop Antigenpräsentation Präsentation von Antigenen an der Oberfläche von Zellen in Form von Peptidfragmenten, die an MHC-Moleküle gebunden sind; T-Zellen erkennen Antigene nur in dieser Form Antigenrezeptor Der spezifische antigenbindende Rezeptor auf B- oder T-Lymphozyten; auf B-Lymphozyten handelt es sich um zellständige Immunglobulinmoleküle, auf T-Lymphozyten um T-Zell-Rezeptoren

XVI

Abkürzungen und Erläuterungen

(TcR); Antigenrezeptoren werden von Genen kodiert, die durch somatische Rekombination entstanden sind (V,(D),J-Rekombination) Antikörper Proteine, die in Wirbeltieren gebildet werden, angeregt durch bestimmte eingedrungene Fremdstoffe (Antigene) und zu deren Abwehr dienen; Serumprotein, das als Antwort auf eine Immunisierung von B-Lymphozyten synthetisiert wird und das spezifisch mit dem Antigen reagiert, das zu seiner Bildung geführt hat Antikörperabhängige zelluläre Zytotoxizität Antibodydependent cellular cytotoxicity (ADCC): Effekt, bei dem antikörperbeladene Zellen (Zielzellen, target cells) durch zytotoxische Zellen (wie natürliche Killerzellen) zerstört werden, die Rezeptoren für das Fc-Fragment der Antikörper besitzen und die über diese Rezeptoren an die antikörperbeladenen Zielzellen gebunden werden Antikörperrepertoire Gesamtheit an Antikörperspezifitäten, die durch die B-Lymphozyten eines Organismus gegen ein einzelnes Antigen oder die Gesamtheit aller potenziellen Antigene gebildet werden können Antioxidans Wird in Lebensmitteln und in Kunststoffen eingesetzt, um die Reaktion mit dem Luftsauerstoff oder anderen oxidierenden Chemikalien zu verhindern Antirheumatika, nichtsteroidale Entzündungshemmende Arzneimittel, die keine Glukokortikoide enthalten Antiserum 7 Immunserum APAF-1 Apoptosis associated factor-1: Zytosolisches Adapterprotein, das gemeinsam mit Cytochrom c und Procaspase-9 das mitochondriale Apoptosom bildet APC Adenomatous polyposis coli APE1 Enzym, das das Zuckerphosphatrückgrat an einer AP-Stelle hydrolysiert Apoptose Programmierter Zelltod: Form des physiologischen Zelltods, der von einer biologischen Zelle selbst aktiv durchgeführt wird und durch die Aktivierung von endogenen Mechanismen ausgelöst wird, die zur Fragmentierung der DNA führen; Kunstwort gebildet aus „apoptein“ (vorzeitig herabfallen); charakterisiert eine morphologisch definierte Form des Zelltods, die meist über Caspasen ausgelöst wird und mit charakteristischen biochemischen Veränderungen einhergeht APP Amyloid precursor protein AP-Stelle Position einer fehlenden Purin- oder Pyrimidinbase Ataxia teleangiectatica (AT) Genetisch bedingte Krankheit des Menschen, die zu Chromosomenbrüchen führt ATCC „American Type Culture Collection“: Zellbank zur Sammlung, Aufbewahrung und Verteilung von lebenden Kulturen von Mikroorganismen, Viren, DNA-Proben, menschlichen und tierischen Zellen

Bacterial attachment site Attachment site left Phage attachment site Attachment site right Area under the curve: Fläche unter der Plasmakonzentrations-Zeit-Kurve eines Wirkstoffs; Maß für die Arzneimittelexposition eines Organismus Auflösung Experimentelle Genauigkeit, mit der eine Röntgenstrukturanalyse durchgeführt wird; vergleichbar mit der Auflösung eines Lichtmikroskops; ab einer Auflösung von 2.8 Å kann ein atomares Modell erstellt werden; Details über einen Reaktionsmechanismus können erst bei einer Auflösung von 2.2 Å oder besser zuverlässlich beschrieben werden Autolog Das eigene Individuum betreffend, z. B. autologe Transplantation Autologes Gewebe Körpereigenes Gewebe, Spender und Empfänger sind identisch Autophagie 7 Autophagozytose Autophagozytose Distinkte Form des Zelltods, die durch Endophagosomen charakterisiert ist, d. h. Lysosomen, die zelluläre Organellen wie ER und Mitochondrien enthalten können; wird durch Wachstumsfaktor- oder Nährstoffmangel ausgelöst und ist reversibel Avidin Aus dem Ei von Vögeln isoliertes Glykoprotein, das mit extrem hoher Affinität an Biotin bindet; aus diesem Grunde für immunologische Nachweisverfahren eingesetzt; das aus Bakterien isolierte Streptavidin zeigt bei gleicher Bindungsstärke für Avidin eine geringere Tendenz zur unspezifischen Bindung attB attL attP attR AUC

B BAC Bacterial artificial chromosome Bakteriophagen (oder einfach: Phagen), bezeichnet eine

Gruppe von Viren, die sich auf Bakterien als Wirtszellen spezialisiert haben Bax Bcl-2 associated x-protein: Proapoptotisches Bcl-2Homolog, das die BH-Domänen 1 bis 3 trägt Bcl-2 B cell lymphoma-2: Bei follikulären Lymphomen entdecktes apoptosehemmendes Gen; trägt alle 4 BH-Domänen (BH1 bis –4) Bcl-2-Familie Genfamilie mit Homologie zu Bcl-2; enthält Bcl-2-homologe antiapoptotische und Baxhomologe proapoptotische Multi-BH-DomänenUntergruppen, sowie die B3-only Proteine BER Basenexzisionsreparatur Berliner Blau Eisen(III)-chlorid wird mit Kaliumhexacyano-ferrat(II) oder Eisen(II)-nitrat mit Kaliumhexacyano-ferrat(III) in Wasser vermischt; es fällt kolloidales „Berliner Blau“ aus BH-Domäne Bcl-2 Homologiedomäne BH3-only Protein Bcl-2-Familienmitglied, das nur die BH3-Signaturdomäne trägt; minimalistisches Todes-

XVII Abkürzungen und Erläuterungen

modul ist die α-helikale BH3-Domäne; benötigt Bax oder Bac für die Auslösung von Apoptose Biotin Vitamin H: Niedermolekulare Substanz mit weiter Verbreitung in verschiedenen Zellen, die an zahlreichen Carboxylierungsreaktionen beteiligt ist; wird aufgrund der extrem hohen Bindung an Avidin für immunologische Nachweisverfahren eingesetzt Biotransformation Ein Vorgang im Stoffwechsel von Lebewesen, bei welchem nicht ausscheidbare Stoffe durch chemische Prozesse in ausscheidbare Stoffe umgewandelt werden BLAST Basic local alignment search tool: Computeralgorithmus zum Nachweis von evolutionärer Sequenzhomologie durch statistische Ähnlichkeitsanalyse BLM Menschliche, metastasierende Melanomzelllinie Blockbuster Medikament, welches einen Umsatz von mindestens einer Mrd. US-Dollar pro Jahr generiert B-Lymphozyt, B-Zelle Eine der beiden Populationen der Lymphozyten, sie sind Vorläufer der antikörperproduzierenden Plasmazellen; sie tragen Immunglobulin auf ihrer Oberfläche; jeder B-Lymphozyt exprimiert nur Immunglobulin einer einzigen Spezifität; nach Aktivierung differenzieren B-Lymphozyten in Plasmazellen, die Antikörper der gleichen Spezifität produzieren; die Reifung der B-Lymphozyten erfolgt im Knochenmark („bone marrow“, daher „b-lymphocyte“) BMP Bone morphogenetic protein, Knochenwachstumsfaktor Bottleneck-Hypothese Populationsgenetisches Modell zur Erklärung der Fixierung mitochondrialer Mutationen und der raschen Entmischung heteroplasmatischer mtDNA-Genotypen in der Generationsfolge; durch eine Reduktion in der Ausgangszahl der Mitochondrien bzw. mtDNA-Moleküle („bottleneck“) in der weiblichen Keimbahn wird genetischer Drift begünstigt, der dazu führt, dass starke Schwankungen im mtDNA-Genotyp der Nachkommenschaft auftreten bp Basenpaar: Maßeinheit für genomische Sequenzen Brute-Force-Methode Methode der rohen Gewalt: Fachbegriff für eine Lösungsmethode schwerer Probleme, die auf dem Ausprobieren aller oder zumindest eines erheblichen Teils der infrage kommenden Varianten beruht BSE Bovine spongiforme Enzephalopathie bulk Massenware (im Gegensatz zu Feinchemikalien) Bulky adduct DNA-Schaden, bei dem es zu einer Verzerrung der DNA-Helix kommt B-Zelle 7 B-Lymphozyt C Cap 7-Methylguanosin-Cap: Das 5’-Ende der reifen

eukaryoten mRNA besitzt eine „Kappe“, bestehend

aus einem 7-Methylguanosin, das über eine 5’-Triphosphat-Verbindung an die mRNA gebunden ist Cap-Bindekomplex Der eIF4F-Proteinkomplex, bestehend aus den Initiationsfaktoren 4E, 4A und 4G, der die Bindung der kleinen Untereinheit in der Nähe der Capstruktur ermöglicht CARD Caspase recruitment domain Caretaker Gen, das die Mutationsrate herabsetzt, insbesondere von DNA-Reparaturgenen Caspase Cysteinyl-Aspartase: Apoptoseexekutierendes Enzym CAT Committee for Advanced Therapies CDK Cyclin-dependent protein kinase; zyklinabhängige Kinase: Familie der CDKs bildet gemeinsam mit den Zyklinen das Kontrollsystem des Zellzyklus in Eukaryonten CD-Marker Zelloberflächenmoleküle auf Leukozyten und Plättchen, die mithilfe von monoklonalen Antikörpern nachweisbar sind und zur Differenzierung von Zellpopulationen genutzt werden (abgeleitet von der engl. Abk. für „cluster of differentiation“; s. auch 7 Differenzierungsantigen) cDNA Complementary DNA: Stabile klonierte Kopie einer mRNS-Sequenz CDR Complementarity-determining region: 7 hypervariable Regionen CEA Karzinoembryonales Antigen: Glykoprotein, das während der Embryonalentwicklung und im adulten Organismus von Tumorzellen epithelialen Ursprungs exprimiert wird CEAs Cultured epithelial autografts: Kultivierte autologe Hautzellen zur Regeneration von Hautgewebe z. B. bei Verbrennungen CFE Colony forming unit; koloniebildende Einheit: Maß der Reproduktionskapazität kultivierter Zellen, insbesondere von hämatopoetischen Zellen CGD Chronische Granulomatose Chaperone Proteine, die neu synthetisierten Proteinen „helfen“, sich korrekt zu falten Checkpoint-Kontrolle Kontrollmechanismen, die die Integrität der DNA bzw. die korrekte Anordnung der Chromosomen in der Metaphase überprüfen und im Falle eines Fehlers zur Arretierung des Zellzyklus führen, bis der Defekt behoben ist Chimäre Mythisches Mischwesen, das Körperteile verschiedener Tiere besitzt; der Ausdruck wird deshalb für Individuen benutzt, die Zellen anderer Individuen enthalten und für Moleküle, die aus Teilen verschiedener Ursprungsmoleküle bestehen Chimäre Antikörper Durch rekombinante DNA-Technik hergestellte Antikörper, die z. B. die konstante Region eines humanen Immunglobulins und die variable Region eines murinen monoklonalen Antikörpers enthalten

XVIII

Abkürzungen und Erläuterungen

Chip-on-Chip Chromatin Immunopräzipitation: Experi-

mentelle Methode zur Detektion von Protein-DNSInteraktionen Cholinesterase Enzym im Blutplasma, das den Neurotransmitter Acetylcholin und andere Cholinester spaltet CHO-Zellen Chinese hamster ovary-cells Chromatin Der Komplex aus DNA und Histonen, die die Erbsubstanz der Eukaryonten darstellt; Chromatin erlaubt eine kompakte Verpackungsform der DNA, die in der Mitose als Mitosechromosom sichtbar wird; während der Arbeitsphase liegt das Chromatin stark entspiralisiert vor, sodass keine Chromosomen im Lichtmikroskop erkennbar sind Chromatin-Modifikationskomplex Multiproteinkomplexe, die durch DNA-gebundene Regulationsfaktoren gebildet werden und benachbartes Chromatin durch Acetylierung, Methylierung und Phosphorylierung modifizieren Chromatin-Remodeling-Komplex Multiproteinkomplexe, die durch DNA-gebundene Regulationsfaktoren rekrutiert werden und benachbarte Nukleosomen verschieben oder öffnen Chromosom Die Organisationsstruktur der DNA mancher eukaryoter Organismen; Träger des Erbmaterials (Chromatin); beim Menschen ist die gesamte Erbinformation auf 46 Chromosomen untergebracht Chromosomenterritorien Beschreibt die Zellkernarchitektur, die während der Arbeitsphase des Zellzyklus einzelne Chromosomen auf räumlich umgrenzte Bereiche des Zellkerns beschränkt CISS Chromosomal in situ suppression hybridisation, chromosomale In-situ-Suppressions-Hybridisierung: Nichtisotopisches Verfahren zur selektiven Hybridisierung und Identifizierung chromosomaler Abschnitte Clearance Entfernung einer Substanz aus einem gegebenen Körpersystem CLSM Confocal laser scanning microscope, konfokales Laserrastermikroskop Compound-Heterozygotie Patienten mit einer autosomal-rezessiven Krankheit, bei denen die beiden Allele des verantwortlichen Gens zwei verschiedene Mutationen tragen COMT Catechol-O-Methyltransferase: Wichtiges Enzym beim Abbau von Catecholaminen Controlled release Kontrollierte (meistens verzögerte) Freisetzung eines Wirkstoffs CpG-Dinukleotid Eine Nukleotidfolge von Cytosin und Guanosin, die potenziell am Cytosin methylierbar ist und zur Genabschaltung führt CR-Domäne Complement regulatory domain oder complement control protein (CCP) domain: In verschiedenen Zelloberflächenproteinen und Proteinen der

Komplementkaskade vorkommende Proteindomäne; besteht aus mehreren E-Strängen Cre DNA-Rekombinase des Bakteriophagen P1 C-Region 7 konstante Region Crossing-over Reziproker Austausch zwischen Segmenten homologer Chromosomen; wird im Kreuzungsexperiment als Faktorenaustausch nachgewiesen; das zytogenetische Korrelat sind die Chiasmata zwischen den homologen Chromosomen in der Meiose CS Cockayne-Syndrome C-Typ-Lektindomäne Kohlenhydratbindende Domäne, die in verschiedenen Lektinen, z. B. in den Selektinen, vorkommt Cy3 Cyanin-Farbstoff, der Licht im Wellenlängenbereich von 510–550 nm (grün) emittiert Cy5 Cyanin-Farbstoff, der Licht im Wellenlängenbereich von 630–660 nm (rot) emittiert Cytochrom P450 Cytochrom P450-Enzyme: Familie von Hämproteinen mit Monooxygenaseaktivität mit großer Bedeutung für den Arzneimittelstoffwechsel; Vorkommen vor allem in der Leber, aber auch in anderen Organen; Komplex mit Kohlenmonoxid weist eine Absorptionsbande bei 450 nm auf Cytochrom-P450-Reduktase Bestandteil des CytochromP450-Enzymsystems, NADPH-abhängiges Flavoprotein Cytokeratin Bestandteil des Cytoskeletts in der Zelle; bestimmte Cytokeratine sind nur in bestimmten Zellpopulationen, wie z. B. Epithelzellen vorhanden D DALI Ein internetbasierter Server, von dem man Vorher-

sagen der Sekundärstruktur von Proteinen bei gegebener Sequenzinformation ableiten kann Darmflora Mikroorganismen im Verdauungstrakt von Mensch und Tier DD Death domain: Konsensuspeptidsequenz im zytosolischen Anteil von Todesrezeptoren, die zur Rekrutierung von Adapterproteinen wie TRADD oder FADD benötigt wird 2DE 2-dimensionale Polyacrylamid-Gelelektrophorese: Mit dieser Methode werden Proteine aus komplexen Gemischen in zwei Dimensionen aufgetrennt; 1. Auftrennung durch isoelektrische Fokussierung nach dem isoelektrischen Punkt (Ladung), 2. Auftrennung durch eine SDS-Polyacrylamid-Gelelektrophorese nach dem Molekulargewicht (Größe) DED Death effector domain: Konsensuspeptidsequenz in FADD, Procaspase-8 und 10, über die diese Proteine miteinander interagieren und den DISC bilden Deletion Verlust eines DNA- oder Chromosomenabschnitts Depurinierung Verlust einer Purinbase; es entsteht eine AP-Stelle

XIX Abkürzungen und Erläuterungen

Depyrimidierung Verlust einer Pyrimidinbase; es ent-

Disulfidbrücke Eine Atombindung zwischen zwei

steht eine AP-Stelle Desaminierung Hydrolyse einer Aminogruppe Designer-Bugs Ausdruck für biotechnologisch entwickelte Mikroorganismen, die sehr spezielle Aufgaben übernehmen bzw. Produkte herstellen können Desoxyribozym, DNA-Enzym DNA-Molekül mit enzymatischer Aktivität Determinante 7 Antigendeterminante D-Gene Diversity: Antikörper-Gensegmente, die die 3. hypervariable Region der Antigenbindungsregion der schweren Kette der meisten Antikörper kodieren; D-Gene werden als multiple Gensegmente über die Keimbahn weitergegeben; zur Kodierung der gesamten variablen Region eines Antikörpers ist die Rekombination (7 V(D)J-Rekombination) mit einem V-Gen und einem J-Gen erforderlich Dicer Eine RNase, die doppelsträngige RNA in Stücke mit einer Länge von 21 Nukleotiden (siRNA) zerlegt Differenzierungsantigen Oberflächenantigen, das nur in bestimmten Differenzierungsstadien bestimmter Zellpopulationen nachweisbar ist und damit als Differenzierungsmarker genutzt werden kann DIGE Differenzielle Gelelektrophorese (difference gel electrophoresis): Zwei Proteinextrakte aus zwei Geweben oder Zellpopulationen werden mit zwei unterschiedlichen Fluoreszenzfarbstoffen markiert und vor der 2D-Elektrophorese gemischt; die Markierung erfolgt oft mit Cy3 und Cy5 über die primären Amine der Proteine; mit dieser Methode können differenziell exprimierte Proteine aus zwei Zuständen verglichen und quantifiziert werden Dihedralwinkel Beschreibt den Rotationswinkel um eine chemische Bindung; man benötigt vier Atompositionen, um die Rotation um die chemische Bindung zwischen den beiden mittleren Atomen beschreiben zu können Dimer Ein Molekül, das aus zwei Untereinheiten, den Monomeren, besteht Diphtherie Akute, mitunter lebensbedrohliche Infektionskrankheit der oberen Atemwege Dipol Zwei räumlich getrennte entgegengesetzte Ladungen erzeugen einen elektrostatischen Dipol; aufgrund der unterschiedlichen Elektronegativität von Kohlenstoff und Sauerstoff, sowie von Wasserstoff und Stickstoff besitzt die Pepdidbindung zwei parallel ausgerichtete schwache Dipole DISC Death-inducing signaling complex: Wird vorwiegend gebraucht für den Komplex aus Todesrezeptor, FADD und Procaspase 8, der nach Bindung des Todesliganden an den Todesrezeptor gebildet wird Diskontinuierliches Epitop 7 Konformationsepitop

Schwefelatomen, die in Aminosäureseitenketten von zwei Cysteinresten vorkommen 2,5-DKG 2,5-Diketo-D-Gluconsäure DLCL Diffuse large cell lymphoma: DLCL gehört zu einer Gruppe von Krebserkrankungen, die als aggressive Non-Hodgkin-Lymphome zusammengefasst werden. D-Loop Verdrängungsschlaufe, Zwischenprodukt der HRR: Dreisträngige DNA-Struktur, bestehend aus den beiden parentalen mtDNA-Strängen und dem partiell replizierten H-Strang im Bereich der mtDNA; stellt ein stabiles Intermediärprodukt der mtDNA-Replikation dar DMEM Dulbecco’s modified Eagle medium; Dulbeccos modifiziertes Eagle-Medium: häufig verwendetes Kulturmedium, besonders geeignet für Zellen der Maus DMSO Dimethylsulfoxid: Lösungsmittel, das in der Zellkultur als Differenzierungsinduktor und als Bestandteil des Kryokonservierungsmediums Anwendung findet DNA Desoxyribonukleinsäure, die in der Regel als Doppelhelix im Zellkern vorliegt und als Erbsubstanz dient DNA-Glykosylasen Enzyme, die modifizierte Basen der DNA erkennen und hydrolysieren, es entsteht eine AP-Stelle DNA-Methylasen Enzyme, die CpG-Sequenzen erkennen und am Cytosin methylieren können Domäne Kompaktes Segment einer Immunglobulinkette DSB Doppelstrangbrüche DSBR-Modell Double-Strang-Break-Repair-Model dsRNA Doppelstrang-RNA DTH Delayed-type hypersensitivity-reaction Dysplasie Atypische Zellproliferation im Sinne einer Krebsvorstufe, enthält noch nicht alle Kriterien einer Neoplasie E ECACC European Collection of Animal Cell Cultures:

Europäische Zellbank zur Aufbewahrung, Sammlung und Verteilung von Zellkulturen (Protein Dawn, U. K.) ECC Embryonic carcinoma cells, embryonale Karzinomzellen, EC-Zellen: Permanente Linien pluripotenter maligner Stammzellen aus Teratokarzinomen, bei der Maus experimentell induziert durch Transplantation embryonaler Zellen an extrauterine Orte ECM Extrazellulärmatrix: Netzwerk hochmolekularer Polysaccharide (z. B. Glykosaminoglykane) und Proteine (z. B. Kollagene); dient als Strukturelement der Gewebe; reguliert die Entwicklung und Funktion

XX

Abkürzungen und Erläuterungen

vieler Zelltypen; komplexes Gemisch von Proteinen (z. B. Kollagenen, Fibronektin, Laminin, Proteoglykane), welches die meisten Zellen vielzelliger Tiere umgibt; die ECM bildet ein geordnetes azelluläres Gerüst, in dem Zellen migrieren und kommunizieren können; die ECM zwischen Epithelzellen und Bindegewebe wird als Basalmembran bezeichnet Effektorcaspase Durch Initiatorcaspasen proteolytisch in p10 und p20-Untereinheiten gespaltene und hierdurch aktivierte Caspasen mit typischer kurzer Prodomäne Effektormoleküle Moleküle (in erster Linie Komplement), die eine Zerstörung bzw. Inaktivierung von Pathogenen oder Antigenen bewirken und Antikörpern diese Funktion vermitteln Effektorzellen Zellen, die eine Entfernung von Pathogenen oder Antigenen aus dem Organismus bewirken und Antikörpern diese Funktion vermitteln EGC Embryonic germ cells, embryonale Keimzellen, EG-Zellen: Permanente Linien pluripotenter/totipotenter undifferenzierter Zellen, die aus primordialen Keimzellen von Embryonen isoliert und kultiviert werden können EGF Epithelial growth factor, epithelialer Wachstumsfaktor EGF-Domäne Proteindomäne mit Ähnlichkeit zum epidermalen Wachstumsfaktor, kommt in verschiedenen Zelloberflächenproteinen und ECM-Proteinen vor und enthält 6 konservierte Cysteinreste EHS Engelbreth-Holm-Swarm: Tumor mit einem hohen Gehalt an ECM-Proteinen und Wachstumsfaktoren Einzelkettenantikörper ScAb, single chain antibody, auch scFv, single chain antigen binding fragment: Rekombinante Antikörperfragmente, die aus den variablen Bereichen der leichten und der schweren Kette bestehen und die über ein Peptidfragment zu einer Kette verknüpft sind ELISA Enzyme-linked immunosorbent assay: Variante eines Enzymimmuntests; 7 Enzymimmuntest EM Extensive metabolizer: Individuum mit erhöhter Metabolisierungskapazität (zwei Wildtypallele) in Bezug auf ein Cytochrom-P450-Enzym (z. B. CYP2E6 oder CYP2C19) Emmerweizen Eine alte Kulturform des Weizens emMLV Ekotrope murine Moloney-Leukämie-Viren Enabling-Technologien Sammelbegriff für neue Technologien wie z. B. kombinatorische Chemie, Bioinformatik, Nanotechnologie etc. Endosymbiontenhypothese Erklärungsmodell zur Herkunft der Mitochondrien (und der Chloroplasten); demnach stammen die Zellorganellen von ursprünglich autonomen Bakterien (bzw. Blaualgen) ab; über die Zwischenstufen einer intrazellulären Symbiose (Endosymbiose) haben sich diese Prokaryonten zu ab-

hängigen Bestandteilen der Eukaryontenzelle entwickelt Enhancer Regulatorische Sequenzen, die zum Teil weit entfernt vom regulierenden Gen vorliegen und nach Bindung von Regulationsfaktoren mit dem Promotor interagieren Entzündung Akute oder chronische Antwort auf eine Infektion oder Gewebsschädigung, gekennzeichnet durch Ansammlung von Leukozyten, Plasmaproteinen und Flüssigkeit Enzymimmuntest Immunologischer Test zum Nachweis von Antigenen oder Antikörpern, bei dem einer der Reaktionspartner mit einem Enzym markiert ist und das Produkt der Enzymreaktion gemessen wird Epidemie Eine unübliche Häufung einer Krankheit innerhalb einer Population Epitop-Antigendeterminante Der Teil eines Antigens, der von einer Antigenbindungsregion spezifisch gebunden wird; s. auch 7 Konformationsepitop und Sequenzepitop Epstein-Barr-Virus Humanes DNA-Virus der Herpesgruppe, das B-Lymphozyten infiziert und eine Proliferation der Zellen (in einigen Fällen auch eine maligne Transformation) hervorruft ER Endoplasmatisches Retikulum Eradikationstherpaie Medikamentöse Therapie zur Beseitigung von Helicobacter pylori, die aus einer Kombination von einem Protonenpumpenhemmer und mindestens zwei Antibiotika besteht ErbB Familie von Rezeptortyrosinkinasen ESC Embryonic stem cells, embryonale Stammzellen, ES-Zellen: Permanente Linien pluripotenter/totipotenter embryonaler undifferenzierter Stammzellen; ES-Zellen bilden die methodische Grundlage für das Gene targeting zur Schaffung von Mäusen mit spezifischen genetischen Defekten Escherichia coli (E. coli) Gramnegatives, stäbchenförmiges und peritrich begeißeltes Colibakterium, das im menschlichen und tierischen Darm vorkommt EschG Embryonenschutzgesetz ESI Elektrospray-Ionisierung: Methode zur Ionisierung von Peptiden in der Massenspektroskopie; durch Anwendung einer hohen Spannung an einen Flüssigkeitsstrom aus einer Kapillare kommt es zum Schrumpfen der hoch geladenen Tropfen, die resultierenden Peptidfragmente werden aufgetrennt und können mit verschiedenen Methoden detektiert werden ESKM Aus embryonalen Stammzellen differenzierte Kardiomyozyten EST Expressed sequence tags: Kurze Sequenzabschnitte, aus Primärtranskripten von Genen gewonnen, die Aussagen erlauben, welche Gene in funktionellen oder pathologischen Zuständen einer Zelle abgerufen werden

XXI Abkürzungen und Erläuterungen

ES-Zellen Embryonale Stammzellen Eukaryot Bezeichnung für Lebewesen mit Zellkern und

Zytoskelett Exo Exonukleasen Exon Bestandteil von Primärtranskripten, der bei deren Prozessierung in der RNA erhalten bleibt; kodierender Abschnitt eines DNS-Sequenzabschnitts im Genom; Sequenzabschnitte der Vorläufer-RNA, die nach erfolgter Prozessierung in der fertigen mRNA wieder zu finden sind Experimentus crucis Schlüsselexperiment, hier zur Erarbeitung „Gentechnischer Grundlagen für biotechnologische Anwendungen“ Extrinsischer Apoptoseweg Der über Todesrezeptoren und deren Todesliganden aktivierte Apoptosesignalweg Ex vivo Bedeutet „aus dem Lebenden“ und charakterisiert Reaktionen bzw. Abläufe, bei denen aus dem Organismus entnommene, lebende Gewebe isoliert unter Laborbedingungen getestet bzw. manipuliert werden F FA Fanconi-Anämie: Kongenital bei Kindern Fab Fragment antigen-binding: Antikörperfragment,

das nur eine Antigenbindungsregion enthält; entsteht durch Spaltung mit Papain F(ab’)2 Antikörperfragment, das zwei Antigenbindungsregionen enthält; entsteht durch Spaltung mit Pepsin; s. auch 7 Fab FACS Fluorescence activated cell sorter, fluoreszenzaktivierter Zellsorter: Gerät zur Zellsortierung mittels Fluoreszenzmarkierung FADD Fas-associated death domain: Zytosolisches Adapterprotein, das gemeinsam mit z. B. dem CD95/FasRezeptor und der Procaspase-8 den DISC bildet; enthält sowohl eine DD als auch eine DED (s. dort) FASTA Algorithmus und Computerprogramm für die Analyse von Protein- und DNS-Sequenzen, zum Auffinden von Homologen und anderen Verwandten Fc Fragment crystallizable: Antikörperfragment ohne Antigenbindungsregion, das die C-terminalen Domänen enthält; entsteht durch Spaltung mit Papain; Fc-Rezeptor FDA Food and Drug Administration: US-amerikanische Genehmigungsbehörde FDG-PET 2-[18F]-fluoro-2’desoxy-glucose, quantitative positron emission tomography FDR False discovery rate: Erwartete Anzahl korrekter Testablehnungen bei statistischen Testentscheidungen Feedback-Hemmung Entsteht, wenn das Produkt einer Reaktionskette auf das Enzym am Anfang dieser Kette hemmend wirkt; dadurch entsteht automatisch ein Regelkreis

Fibrinolyse Bezeichnung für die körpereigene Auflösung

eines Blutgerinnsels (Thrombus) durch das Enzym Plasmin FISH Fluorescence in situ hybridization, Fluoreszenzin-situ-Hybridisierung: Methode zur chromosomalen Lokalisierung von DNA-Proben FITC 7 Fluoresceinisothiocyanat FIV Felines Immundefizienzvirus FKS Fötales Kälberserum: Wichtiger Bestandteil des Mediums zur Kultivierung tierischer Zellen und Gewebe Flp DNA-Rekombinase von S. cerevisiae Fluoresceinisothiocyanat FITC: Fluoreszenzfarbstoff mit gelb-grüner Fluoreszenz, der häufig für die Markierung von Antikörpern und anderen Proteinen genutzt wird Fluoreszenzaktivierter Zellsortierer Fluorescence-activated cell sorter (FACS): Gerät zur Identifizierung und Sortierung von Zellen, an die fluoreszenzfarbstoffmarkierte Antikörper gebunden werden Flybase Datenbank des Genoms der Taufliege Drosophila FNIII-Domäne Fibronektin-Typ-III-Domäne: In Zelladhäsionsmolekülen häufig vorkommende Proteindomäne, die aus zwei E-Faltblättern besteht Fos- und Jun-Proteine Wichtige Transkriptionsfaktoren, die über ihre „Zipper“-Domäne dimerisieren und mit ihrer basischen Domäne an die DNA binden; sie regulieren die Expression einer Vielzahl von Genen, die in Differenzierung, Apoptose und Zellproliferation eingreifen Frameshift Das Einfügen oder Deletieren von Nukleotiden in der kodierenden Region führt zur Verschiebung des Leserasters; dies führt zum Einbau von falschen Aminosäuren und zum Abbruch der Translation, sobald das Ribosom im veränderten Leseraster auf ein Stoppkodon trifft Freundsches komplettes Adjuvans Adjuvans auf Ölbasis, das abgetötete Mykobakterien enthält; nach Mischen mit einem Antigen wird eine Wasser-in-Öl-Emulsion gewonnen, die nach Injektion eine starke Immunreaktion gegen das Antigen hervorruft FRT Erkennungssequenz der Flp-Rekombinase Fusionstranskript Chimäres Transkriptionsprodukt FWER Family wise error rate: Globales Signifikanzniveau bei statistischer Korrektur gegen multiples Testen G β-Gal E-Galaktosidase ist ein Markergen, das immun-

histochemisch, luminometrisch und via FACS-Messung eine qualitative und quantitative Bestimmung der Genexpression auf zellulärer und Gewebeebene erlaubt Gatekeeper Gene, die das Tumorwachstum positiv beeinflussen, insbesondere Protoonkogene und Tumorsuppressorgene

XXII

Abkürzungen und Erläuterungen

GCCP Good cell culture practice: Richtlinien einer guten

Zellkulturpraxis Gelbes Blutlaugensalz Anderer Name für Kaliumhexa-

cyanoferrat Gelenkregion Hinge region: Flexible Region des Anti-

körpermoleküls, die eine Beweglichkeit der Antigenbindungsregionen ermöglicht Genamplifikation Vermehrte Kopienzahl eines Gens innerhalb einer Zelle (häufig bei Onkogenen) Genetische Transformation Umwandlung vom Genotyp eines Mikroorganismus durch den Transfer von Genen aus einem anderen Mikroorganismus in dessen Genotyp bzw. Phänotyp Genkonversion Somatische Genkonversion Genom Gesamtheit der genetischen Information einer Spezies Genomische Marker Spezifische Nukleotidsequenzabschnitte, die das Auffinden eines Gens oder anderer genomischer Elemente in einer Datenbank ermöglichen, ebenso Sequenzabschnitte, die als Startsequenzen in der PCR-Reaktion dienen können Genomkartierung Lineare Darstellung der auf einem Chromosom vorhandenen genomischen Abschnitte Genotyp Erbbild eines Organismus repräsentiert seine exakte genetische Ausstattung (den individuellen Satz von Genen, den er im Zellkern in sich trägt); Kombination der beiden Allele eines Gens GFAP Glial fibrillary acidic protein, gliafibrilläres saures Protein: Bestandteil der Intermediärfilamentproteine des Zytoskeletts von Gliazellen GFP Green fluorescent protein GFR GDNF Family Receptor GGR Global Genome Repair GLP Good laboratory practice: Grundsätze guter experimenteller (Labor-)Praxis Glukagon Blutzuckerhebendes Hormon Glukose-6-Phosphat-Dehydrogenase Enzym im Glukosestoffwechsel, das für die Menge an reduziertem Glutathion in der Zelle mitbestimmend ist; reduziertes Glutathion wirkt als Antioxidans; Mangel an Glukose-6-Phosphat-Dehydrogenase führt zu einer vermehrten Hämolyse GMP Good manufacturing practice: Zertifikat für geprüfte gute Herstellungspraxis GO Gene ontology: Internationales Konsortium zur Annotation und Klassifizierung von Proteinsequenzen GPCR G-protein coupled receptor GPI-Anker Glykosylphosphatidylinositol-Anker: Posttranslationale Modifikation vieler Zelloberflächenproteine, die als Plasmamembrananker dienen; enthält u. a. Mannose, Glucosamin, Myoinositol und Diacylglycerin GPS Global Pharma Specialists GSK Glykogensynthasekinase

H HAART Highly active antiretrovial therapy, hochaktive

antiretrovirale Therapie Halbsynthetische Antibiotika Die natürlichen Bausteine

der Antibiotika werden gewonnen und modifiziert, um die antibiotische Wirksamkeit zu erhöhen und die Resistenzausbildung bei den Krankheitserregern zu verhindern Halophile Proteine Proteine, welche bei hohen Salzkonzentrationen biologisch aktiv sind Hämophilie A Erbkrankheit, bei der die Blutgerinnung gestört ist durch Fehlen des Gerinnungsfaktors VIII; das Blut aus Wunden gerinnt nicht oder nur langsam (es gibt weitere 5 Arten) Haplotyp Kombination von Allelen gekoppelter Genloci auf demselben Chromosom, die unverändert vererbt werden, falls keine Rekombination in der betreffenden Region stattfindet HBV Hepatitis-B-Virus HCV Hepatitis-C-Virus Hdm-2 Humanes Homolog des murinen double-minute-2-(mdm-2-) Gens, das durch seine Bindung an p53 und Aktivität als E3-Ubiquitinligase dessen Aktivität hemmt und proteasomalen Abbau fördert HeLa-Zellen Menschliche Epithelzellen eines Gebärmutterhalskrebses; die ersten menschlichen Zellen, von denen eine permanente Zellkultur etabliert wurde Helicobacter pylori Gramnegatives Bakterium, das im Magen vorkommt und heute für eine Reihe von Magenkrankheiten verantwortlich gemacht wird, bei denen eine verstärkte Sekretion von Magensäure auftritt (Magengeschwüre, Zwölffingerdarmgeschwüre); disponiert für Magenkrebs Helikase Enzymatische Aktivität, die bei der Entwindung doppelsträngiger Nukleinsäuren wichtig ist Hemimethyliert Nur an einem Strang methylierte DNA HER-2 Humaner epidermaler Wachstumsfaktorrezeptor-2 hES Humane embryonale Stammzellen Heterochromatin Dauerhaft inaktive Chromatinbereiche, die kompakt in der Arbeitsphase des Zellzyklus vorliegen und lichtmikroskopisch erkennbar sind; unter „konstitutivem Heterochromatin“ versteht man eine (vermutlich inaktive) Chromatinfraktion, die in allen Zellen eines Individuums gefunden wird, aus überwiegend oder ausschließlich repetitiver DNS besteht und bei den homologen Chromosomen an identischen Stellen vorkommt; das „fakultative Heterochromatin“ kennzeichnet einen nur vorübergehend inaktiven, stärker färbbaren Chromatinzustand Heterogenie Ein bestimmter Phänotyp kann durch eine Mutation bzw. zwei Mutationen in jeweils einem von insgesamt mehreren möglichen Genen bedingt sein (Locus-Heterogenie); davon unterschieden werden

XXIII Abkürzungen und Erläuterungen

unterschiedliche Mutationen auf den beiden Allelen eines Gens (allelische Heterogenie) Hetero-/Homoplasmie Gemischt-/Reinerbigkeit der mitochondrialen DNA; im Gegensatz zum Kerngenom existieren keine ausgeprägten Regelmechanismen für die Kopienzahl der mtDNA und deren Verteilung auf die Tochtermitochondrien; daher kommt es bei verschiedenen mtDNA-Genotypen (i. e. bei Mutation in einem mtDNA-Molekül) zu graduierten Verhältnisanteilen zwischen den Genotypen Heterozygotentest Untersuchung einer klinisch gesunden Person hinsichtlich einer heterozygoten Anlageträgerschaft für eine autosomal-rezessive oder X-chromosomal-rezessive Erkrankung HGF Hepatocyte growth factor, Hepatozyten-Wachstumsfaktor Histokompatibilität In der Immunologie: Identität in allen Transplantationsantigenen; die entsprechenden Antigene werden vom MHC-Locus kodiert Histon Eine Klasse kleiner, basischer Proteine, die an die saure DNA binden und zum Aufbau der Nukleosomen und des Chromatins beitragen Histonacetyltransferase Eine enzymatische Aktivität der Chromatinmodifikationskomplexe, die zur Acetylierung von Histonen führt Histondeacetylase Eine enzymatische Aktivität der Chromatinmodifikationskomplexe, die zur Deacetylierung von Histonen führt und damit zu einer Inaktivierung des betreffenden Gens Histonkode Beschreibt spezifische Modifikationsmuster der Histone, die zu einer An- oder zu einer Abschaltung von Genaktivität führen Histonmethylase Eine enzymatische Aktivität der Chromatinmodifikationskomplexe, die zu Methylierungen der Histone führt HIV Human immunodeficiency virus, humanes Immunschwächevirus HIV-1 Human immunodeficiency virus type 1 H-Kette 7 schwere Kette HLA Human leukocyte antigens: Der MHC-Komplex des Menschen; 7 MHC HMBA Hexamethylenbisacetimid, wird in der Zellkultur neben Retinsäure und DMSO als Differenzierungsinduktor verwendet HMG-CoA-Reduktase-Hemmer Hydroxymethylglutaryl-CoA-Reduktasehemmer: Schlüsselenzym der Cholesterolsynthese HNPCC Heriditary nonpolyposis colon cancer Holliday-Struktur Überkreuzte Struktur, Zwischenprodukt der HRR Homeobox- (Hox-)Gene Gene mit regulatorischer Funktion, besonders in den frühen Entwicklungsabschnitten mehrzelliger Organismen; die Genprodukte enthalten eine DNA-Bindedomäne (Homeobox), die

über eine helikale Struktur an DNA-Sequenzen binden Homologe Rekombination Strangtausch zwischen homologen DNA-Molekülen Housekeeping-Gen Gen mit relativ konstanter Transkriptionsaktivität in verschiedenen Geweben HRR Homologe Rekombinationsreparatur HSC Hematopoietic stem cells, hämatopoetische Stammzellen HSP/LSP Heavy-/light strand promotor der mitochondrialen DNA im Bereich der mtDNA-Kontrollregion H-Strang/L-Strang Die beiden komplementären DNAStränge der mtDNA werden auch als „heavy“- bzw. „light“-Strang bezeichnet; die Differenzierung ergibt sich aus der unterschiedlichen Dichte der beiden Stränge bei der denaturierenden CäsiumchloridDichtezentrifugation aufgrund der Basenzusammensetzung HSV-TK Herpes-simplex-Thymidinkinase: Enzym, das Prodrugs in transfizierten Zellen und deren Nachbarzellen (sog. Bystander-Effekt) phosphoryliert und dabei in zytotoxische Metabolite überführt; wird in der Suicide-Gentherapie eingesetzt 5-HT3-Antagonisten Hemmstoffe des Serotoninrezeptors, die durch Blockade des Rezeptors antiemetisch wirken HTS High-throughput-Screening Humanisierung Gentechnisches Verfahren, mit dem die Gensegmente, die die hypervariablen Regionen eines spezifischen murinen Antikörpers kodieren, mit humanen Genen kombiniert werden, die den gesamten anderen Teil des Immunglobulinmoleküls kodieren; dadurch entsteht ein Antikörper mit humanen Effektorfunktionen, dessen Spezifität identisch mit der des ursprünglichen Mausantikörpers ist; die Immunogenität des Antikörpers nach Injektion in Menschen ist im Vergleich zum ursprünglichen Mausantikörper reduziert Hybridisierung Identifizierung von DNS- oder RNSAbschnitten durch Bindung an eine vorgefertigte spezifische komplementäre Sequenzstruktur Hybridom Immortalisierte Hybridzelle, die durch Fusion von antikörperproduzierenden B-Lymphozyten mit Myelomzellen entstanden ist; Hybridomzellen vermehren sich unbegrenzt und produzieren kontinuierlich Antikörper ohne zusätzliche Antigenstimulation; sie werden in der Hybridomtechnik zur Produktion monoklonaler Antikörper eingesetzt Hybridomtechnik 7 Hybridom und monoklonale Antikörper Hybris Im aktuellen Sprachgebrauch wird „Hybris“ als ein bildungssprachlicher Ausdruck für Vermessenheit und Selbstüberhebung verwendet, die zu einem schlimmen Ende führen

XXIV

Abkürzungen und Erläuterungen

Hydrophober Kern Das Innere von Proteinen besteht

hauptsächlich aus Aminosäuren mit hydrophoben Seitenketten; die Überführung dieser Aminosäuren aus der wässrigen Phase in eine hydrophobe Umgebung wird als treibende Kraft bei der Proteinfaltung angesehen 8-Hydroxyguanin Oxidationsprodukt des Guanins Hype Unter Medienrummel (engl. „hype“) werden meist kurzlebige, in den Medien aufgebauschte oder übertriebene Nachrichten verstanden Hyperimmunisierung Mehrmalige Immunisierung, in der Regel unter Zusatz von Adjuvanzien, mit dem Ziel einer starken Immunreaktion, z. B. zur Gewinnung großer Mengen von Antikörpern bzw. B-Lymphozyten Hypervariable Regionen CDR, complementarity-determining regions: Teile der leichten und schweren Ketten der Immunglobuline, die bei Vergleich verschiedener Antikörper in ihrer Aminosäuresequenz hochvariabel sind; die hypervariablen Regionen bilden die Antigenbindungsregion des Antikörpermoleküls (und auch der T-Zell-Rezeptoren) I IAP Inhibitor of apoptosis protein: Genfamilie deren

Produkte Caspaseaktivität hemmen; RING-Fingerdomänen-tragende IAPS wirken zudem als E3-Ubiquitin-Ligasen und vermitteln den Abbau aktivierter Caspasen IBC International Bioethics Committee i.c. intrakoronar ICAM-1 Intercellular adhesion molecule-1: Zelladhäsionsmolekül der IgSF, das an der Leukozyten-Endothel-Interaktion beteiligt ist Ig 7 Immunglobulin Ig-Domäne Proteindomäne aus zwei E-Faltblättern, die häufig durch eine Disulfidbrücke stabilisiert werden; wurde ursprünglich in Antikörpermolekülen gefunden, kommt aber in mehreren Varianten in vielen Zelladhäsionsmolekülen vor IgSF Immunglobulin-Superfamilie: Zelloberflächenproteine, die mindestens eine Ig-Domäne enthalten IHF Integration host factor IM Intermediate metabolizer: Individuum mit einem Wildtypallel und einem mutierten Allel in Bezug auf ein Cytochrom-P450-Enzym und einer daraus resultierenden mäßiggradid reduzierten Enzymaktivität, die zwischen der eines homozygoten Wildtypallelträgers und einem Träger zweier defizienter Allele liegt i.m. intramyokardial Immun-Blotting Immunologische Technik zur Identifizierung von Antigenen in einem Gemisch; Antigene, die mit einer Gelelektrophorese getrennt wurden, werden auf einen Flächenträger (z. B. Nitrozellulose)

übertragen, mithilfe markierter spezifischer Antikörper werden die entsprechenden Antigene identifiziert Immundefizienz Immundefekt: Verminderte Immunreaktivität, die aus dem Fehlen bzw. der Inaktivierung bestimmter Komponenten des Immunsystems resultiert Immunglobulin Bezeichnung für die Gesamtheit aller Antikörpermoleküle; jedes Immunglobulinmolekül ist in seiner Grundstruktur aus zwei identischen schweren und zwei identischen leichten Ketten aufgebaut und hat zwei Antigenbindungsregionen Immunglobulinklasse Isotyp: Antikörper, die sich in der Aminosäuresequenz der konstanten Regionen der schweren Klasse voneinander unterscheiden; entscheidend für die Effektorfunktion der Antikörper; den Stopp der Produktion von Antikörpern einer Klasse durch einen B-Lymphozyten und den Beginn der Produktion von Antikörpern einer anderen Klasse mit identischer Antigenbindungsregion bezeichnet man als Klassen-Switch oder Isotyp-Switch; beim Menschen und bei der Maus findet man die Immunglobulinklassen IgM, IgD, IgG, IgE und IgA, einige Klassen werden noch in Subklassen unterteilt Immunglobulinsuperfamilie Proteine, die Funktionen in der zellulären Erkennung und in Zell-Zell-Wechselwirkungen haben und die strukturell und genetisch mit Immunglobulinen verwandt sind Immunität Generelle Bezeichnung für Schutz; in der Biologie Resistenz gegenüber einem Krankheitserreger Immunogen Substanz, die in der Lage ist, eine Immunantwort zu induzieren und dann auch mit Komponenten des Immunsystems (wie Antikörpern) zu reagieren; nicht alle Substanzen, die mit Komponenten des Immunsystems reagieren, müssen selbst auch immunogen sein, der Begriff Immunogen wird deshalb oft vom Begriff Antigen unterschieden (s. auch 7 Antigen und Hapten) Immunserum Die flüssige Komponente des Bluts eines immunisierten Individuums, die Antikörper gegen das Antigen enthält, das für die Immunisierung benutzt wurde Imprinting Beschreibt eine genomische Prägung, die darin besteht, dass väterliche und mütterliche Allele unterschiedlich exprimiert werden; wird häufig durch elternspezifische DNA-Methylierung verursacht; Modifikation des Erbguts, die z. B. für die unterschiedliche genetische Aktivität mütterlicher oder väterlicher Erbanlagen in der frühen Embryogenese verantwortlich ist Indexpatient Die betroffene bzw. erkrankte Person, durch die eine Familie mit einer erblichen Krankheit identifiziert wird Individualized medicine Auf eine bestimmte Patientenpopulation maßgeschneidertes Medikament

XXV Abkürzungen und Erläuterungen

Induktion Steigerung der Synthese eines Enzymproteins

und damit Steigerung der Enzymaktivität Inhibition Hemmung der Enzymaktivität Initiatorcaspase In Signalkomplexen aktivierte Caspase, die nachgeschaltete Effektorcaspasen aktiviert (s. dort); typischerweise tragen Initiatorcaspasen lange Prodomänen (DED oder CARD-Domäne), über die eine Bindung an den Signalkomplex erfolgt Initiator-Methionyl-tRNA Met-tRNA: Transfer-RNA, die das Startkodon AUG der kodierenden Region erkennt Insert Gen- oder „Fremd-DNA“ in einem Plasmid (meistens zur Expression eines Proteins) Insertion Einfügen von Nukleotiden oder Chromosomenabschnitten ins Genom Insulin Blutzuckersenkendes Peptidhormon und der Gegenspieler des Glukagons Int Integrase Interleukin Zytokine, die von Zellen sezerniert werden und an Rezeptoren auf der Oberfläche von Zellen binden; sie induzieren eine Signalkaskade, die unter Umständen im Zellkern spezifische Zielgene reguliert Intrabody Intrazellulär exprimiertes rekombinantes Antikörperkonstrukt (s. auch 7 Einzelkettenantikörper) Intrinsisch Von innen her kommend: Intrinsische Eigenschaften gehören zum Gegenstand selbst und machen ihn zu dem, was er ist Intrinsischer Apoptoseweg Der in der Zelle aktivierte Signalweg, der über den mitochondrialen, den ER- und auch einen lysosomalen Weg intrazellulär reguliert und verstärkt wird Intron Bestandteil von Primärtranskripten, der bei deren Prozessierung aus der RNA entfernt wird; nichtkodierender Sequenzabschnitt im Genom; die Sequenzabschnitte von Vorläufer-RNA-Molekülen, die in der fertigen Messenger-RNA fehlen Invertebraten Tiere ohne Wirbelsäule In vitro Lateinisch für „im Glas“; bezeichnet Vorgänge, die außerhalb des lebenden Organismus stattfinden In vivo Lateinisch für „im Lebenden“; bezeichnet Prozesse, die im lebenden Organismus ablaufen Inzuchtlinie 7 Inzuchtstamm Inzuchtstamm Inzuchtlinie: Versuchstiere, in erster Linie Mäuse, die durch kontinuierliche BruderSchwester-Kreuzung gezüchtet werden, genetisch einheitlich sind und die demzufolge Haut- und Organtransplantate aufgrund der identischen MHC-Moleküle nicht abstoßen IRES Internal ribosomal entry site: Ein RNA-Element, welches die direkte Bindung von Ribosomen an interne Bereiche der mRNA erlaubt; in IRES-enthaltenden mRNAs beginnt die Translation unabhängig von der Cap-Struktur IRS Insulin receptor substrate

ISH In-situ-Hybridisierung: Experimentelle Methode

zur Lokalisierung der Genexpression Isolator Regulationselemente im Chromatin, die be-

nachbarte Gene in ihrer Regulation voneinander abgrenzen Isotyp 7 Immunoglobulinklasse J JAM-1 Junctional adhesion molecule: IgSF-Protein der

Tight junctions endothelialer und epithelialer Zellen J-Gene Joining Gene: Antikörper-Gensegmente, die die

J-Segmente in der Antigenbindungsregion der Antikörper kodieren; J-Gene werden als multiple Gensegmente über die Keimbahn weitergegeben K Kartierung Genomische Marker ermöglichen eine Kar-

tierung Keimbahn 7 Keimbahngene Keimbahngene Die Gene der Keimzellen, als Gegensatz

zu den Genen der somatischen Zellen; die für die Synthese der Antikörper (und T-Zell-Rezeptoren) erforderlichen V-, D- und J-Gene werden über die Keimbahn als multiple, nicht rekombinierte Gensegmente an die Nachkommen weitergegeben; sie rekombinieren in somatischen Zellen nach dem Zufallsprinzip zu funktionellen Genen, die die Antikörper und T-ZellRezeptoren kodieren (7 V(D)J-Rekombination) Keimzellmosaik Nur ein Teil der Ei- oder Samenzellen einer Person trägt eine Mutation Kern-Hormonrezeptor Binden lipophile Liganden, wie z. B. Steroide, und wirken im Zellkern als Transkriptionsfaktoren, die direkt an die DNA binden können Killer-T-Zelle T-Lymphozyten mit zytotoxischer Aktivität 2-KLG 2-Keto-L-Gluconsäure KLH Keyhole limpet hemocyanin, ein immunologisches Adjuvans Klonale Selektion Selektion immunologisch reaktiver Zellen aus dem Repertoir vorgebildeter Lymphozyten; durch Antigenkontakt werden Zellen mit den entsprechenden Antigenrezeptoren zur Teilung und Differenzierung angeregt und wachsen zu Klonen aus; das Prinzip wurde als klonale Selektionstheorie zuerst durch Burnet formuliert Klonale Selektionstheorie 7 klonale Selektion Klonalitätsanalyse Bestimmung des klonalen Ursprungs einer Zellpopulation K-means Methode zur statistischen Clusteranalyse, die Daten anhand eines Kriteriums für eine optimale Partition des Datensatzes errechnet Knochenmark Bone marrow: Ort der Hämatopoese; hier werden Erythrozyten, Monozyten, Granulozyten, Plättchen und in Säugern auch B-Lymphozyten gebil-

XXVI

Abkürzungen und Erläuterungen

det; ist in Säugern neben dem Thymus das zweite primäre lymphatische Organ; das Knochenmark enthält pluripotente Stammzellen, aus denen nach ihrer Wanderung in den Thymus auch T-Lymphozyten gebildet werden; das Knochenmark kann demzufolge zur Wiederherstellung sämtlicher Blutzellen, einschließlich der Zellen des Immunsystems, dienen Knockout-Mäuse Mauslinien, bei denen mithilfe transgener Techniken bestimmte Gene inaktiviert werden Koaktivator Faktoren innerhalb der Chromatin-Modifikationskomplexe, die über enzymatische Funktionen benachbarte Nukleosomen so modifizieren, dass eine Genaktivierung möglich ist Kodon Kleinste genetische Informationseinheit, die drei miteinander verbundene Nukleotide bilden Kompartimente Durch Biomembranen abgegrenzte Teilbereiche eukaryoter Zellen Komplement Eine Reihe von Serumproteinen, die an Immunreaktionen als Effektormoleküle beteiligt sind; eine Komplementkaskade, die zur Lyse von Zellen führen kann, wird durch Bakterien bzw. durch Antigen-Antikörper-Komplexe ausgelöst Konditionelle Mutagenese Mutagenese durch die DNARekombinasen Cre und Flp Konduktorin Heterozygote Überträgerin (Anlageträgerin) einer X-chromosomal rezessiven Erkrankung Konformationelle Freiheitsgrade Beschreibt die Summe der möglichen räumlichen Anordnungen einer Polypeptid- oder Nukleinsäurekette; da die Bindungsabstände und Bindungswinkel von chemischen Bindungen feste Werte besitzen, beziehen sich die konformationellen Freiheitsgrade ausschließlich auf die Rotationsmöglichkeiten um Einfachbindungen entlang der Hauptkette und Seitenketten Konformationsepitop Diskontinuierliches Epitop: Epitop auf einem Proteinmolekül, das nur in der Sekundär- bzw. Tertiärstruktur vorhanden ist und von Aminosäuren gebildet wird, die in der Primärstruktur nicht aufeinanderfolgen; Konformationsepitope sind demzufolge nicht auf denaturierten Proteinen nachweisbar Konstante Region Konstanter Teil, C-Region vom engl. „constant region“: Der C-terminale Teil eines Antikörpermoleküls, der innerhalb einer Immunglobulinklasse bzw. -subklasse einer Spezies identisch in seiner Aminosäuresequenz ist Kontinuierliches Epitop 7 Sequenzepitop (vgl. Konformationsepitop) Kopplungsanalyse Indirekte Genotypdiagnostik: Hierbei wird die Vererbung nahe am verantwortlichen Gen liegender polymorpher genetischer Marker untersucht, um Anlageträger für eine bestimmte monogene Erkrankung auch ohne direkten Mutationsnachweis zu identifizieren; die Kopplungsanalyse ist an mehrere Voraussetzungen gebunden (eindeutiger Phänotyp,

keine Locus-Heterogenie, eindeutige Vaterschaft), ihre Interpretation bedarf deshalb einer besonderen Umsicht Kopplungsungleichgewicht Linkage disequilibrium: Marker oder Allele befinden sich im Kopplungsungleichgewicht, wenn sie statistisch häufiger oder seltener als durch den Zufall bei freier Kopplung erklärbar auf einem Chromosom gemeinsam vererbt werden; der Begriff bezieht sich auf eine Population von Chromosomen bzw. Individuen Korepressor Bestandteil von Chromatin-Modifikationskomplexen mit enzymatischer Aktivität; die Modifikation benachbarter Nukleosomen führt zur Abschaltung des betreffenden Gens Kosegregation Vererbung einer Mutation zusammen mit einem definierten Merkmal/Phänotyp innerhalb einer Familie; hilfreich zur Einschätzung der pathogenen Relevanz einer genetischen Variante, deren funktionelle Bedeutung unbekannt ist (vor allem MissenseVarianten) Kraftfeld Ein detailliertes Kraftfeld ermöglicht es, die potenzielle und kinetische Energie jedes einzelnen Atoms innerhalb eines Atomverbandes zu beschreiben; Kraftfelder ermöglichen z.B. Vorhersagen über die energetischen Auswirkungen von Punktmutationen auf die Proteinstruktur Kreuzreaktivität Reaktion eines Antikörpers mit mehreren Antigenen; die Kreuzreaktivität kann ein Maß für die strukturelle Verwandtschaft zwischen Antigenen sein Ku70/Ku80 DNA-Reparaturproteine, bezeichnet nach Autoimmunantikörpern, mit denen diese Proteine bei Säugern entdeckt wurden L LAD-1 Leukozyten-Adhäsionsdefizienz Typ 1: Erb-

krankheit, bei der zelluläre Wechselwirkungen von Leukozyten beeinträchtigt sind; verursacht durch Mutationen in E2-Integrinen (McKusick 116920) LAD-II Leukozyten-Adhäsionsdefizienz Typ II: Seltene Erbkrankheit, bei der zelluläre Wechselwirkungen von Leukozyten beeinträchtigt sind; Ursache ist ein Fehler in der Biosynthese fukosehaltiger Kohlenhydratstrukturen (McKusick 266265) Langsamacetylierer Individuen mit phänotypisch geringer enzymatischer Aktivität von NAT2 (s. dort) L1-CAM Neural cell recognition molecule L1: Zelladhäsionsmolekül der IgSF, das an der Entwicklung des Nervensystems beteiligt ist Leichte Kette L-Kette, light chain: Die kleinere der beiden Ketten, aus denen ein Antikörpermolekül aufgebaut ist Leukämie Unkontrollierte Vermehrung eines maligne transformierten Leukozyten

XXVII Abkürzungen und Erläuterungen

Leukozyten Weiße Blutzellen: Bestehen aus Lympho-

zyten, Monozyten bzw. Makrophagen und polymorphkernigen Leukozyten oder Granulozyten (Neutrophile, Basophile, Eosinophile) LFA-1 Leukozytenintegrin DLE2 (CD11a/CD18): Vermittelt zelluläre Wechselwirkungen von Leukozyten LIF Leukemia inhibitory factor Ligand Ein Molekül oder Teil eines Moleküls, das an einen Rezeptor bindet Lineare Epitope 7 Sequenzepitope Linkage disequilibrium 7 Kopplungsungleichgewicht L-Kette 7 leichte Kette Long-patch Reparaturzweig der BER (s. dort), bei der bis zu 8 Nukleotide eingebaut werden Loss-of-imprinting (LOI) Der Verlust der DNA-Methylierung an Genen mit genetischer Prägung kann bei der Entwicklung erhebliche pathologische Auswirkungen haben LoxP Erkennungssequenz der Cre-Rekombinase LTR Long terminal repeat: Sequenz am 5c- bzw. 3c-Ende des retroviralen Genoms, das den Promoter enthält LVEF Linksventrikuläre Ejektionsfraktion Lymphknoten Sekundäre lymphatische Organe, in denen reife B- und T-Lymphozyten mit freien Antigenen oder mit Antigenen reagieren, die über antigenpräsentierende Zellen mit den Lymphozyten in Kontakt gebracht werden Lymphom Unkontrollierte Vermehrung eines maligne transformierten Lymphozyten Lymphozyten Zelluläre Bestandteile des Bluts, sie gehören zu den sog. „weißen Blutkörperchen“ (Leukozyten); kleine Leukozyten, die spezifische Antigenrezeptoren auf ihrer Oberfläche tragen; sie sind für die spezifische Immunantwort verantwortlich, die durch Unterscheidung von „fremd“ und „selbst“, Spezifität, Diversität, Adaptivität und das immunologische Gedächtnis charakterisiert ist Lyse Der Zerfall einer Zelle durch Schädigung oder Auflösung der äußeren Zellmembran (Zelltod) M Mac-1 Leukozytenintegrin DME2 (CD11b/CD18): Ver-

mittelt zelluläre Wechselwirkungen von Leukozyten MACS Magnetic cell separation, magnetische Zellsortie-

rung MAdCAM-1 Mucosal addressin cell adhesion mole-

cule-1: Zelladhäsionsmolekül der IgSF, das an der Leukozyten-Endothel-Interaktion beteiligt ist MAGE Melanomassoziiertes Antigen aus der CancerTestes-Familie Magnetischer Zellsortierer 7 MACS: Magnetvermittelte Zellsortierung, in Anlehnung an den FACS (7 fluoreszenzaktivierter Zellsortierer) gewählte Bezeichnung für ein Gerät zur Sortierung von Zellen, an die Anti-

körper gebunden wurden, die an magnetisierbare Kügelchen gekoppelt sind Major histocompatibility complex 7 MHC Makrophagen Große phagozytierende Leukozyten aus dem Gewebe; Vorläuferzellen sind Monozyten aus dem Blut MALDI Matrix-assisted laser desorption ionisation: Prozess, bei dem die Ionenformation durch einen kurzen Laserimpuls ausgelöst wird; dazu wird die Probe auf eine spezielle Probenplatte aufgebracht; die Masse des jeweiligen Moleküls wird über die Flugzeit im elektrischen Feld von der Matrix bis zum Detektor bestimmt („time of flight“, TOF) MAPC Multipotent adult progenitor cells: Multipotente adulte Vorläuferzellen aus dem Knochenmark MART Melanomassoziiertes und melanozytenassoziiertes Antigen Maternale Vererbung Ausschließlich über die Keimbahn der Mutter vererbte Merkmale (z. B. mitochondriale DNA) 3MeA 3-Methyladenin Mediator Ein Multiproteinkomplex, der eine Verbindung zwischen DNA-gebundenen Regulationsfaktoren und dem Präinitiationskomplex des Promotors darstellt MEL Mouse erythroleukemia, Maus-ErythroleukämieZellen Melanocortin-I-Rezeptor Rezeptorprotein auf der Oberfläche der Melanozyten, das beim Menschen die Melanogenese und damit die Haut- und Haarfarbe reguliert Mesopotamien Zweistromland zwischen Euphrat und Tigris, der heutige Irak Metabolic engineering Z. B. das Einschleusen eines kompletten Genclusters in einen Mikroorganismus, damit er einen bestimmten Stoff produziert 5-Methylcytosin Methylierungsprodukt des Cytosins MGMT O6-Methylguanin-DNA-Methyltransferase m7GPPP-Cap Struktur Ein an der Base methyliertes GTP, das durch eine „verdrehte“ 5c-5c-Bindung am Kopfende der mRNA angefügt ist; die Cap-Struktur beeinflusst den Transport der mRNA aus dem Zellkern, die Stabilität und die Translation der mRNA MHC Major histocompatibility complex, Haupthistokompatibilitätskomplex: Komplex von Genen, die polymorphe Oberflächenmoleküle kodieren, die für eine Wechselwirkung mit T-Lymphozyten verantwortlich sind; die T-Zell-Rezeptoren der T-Lymphozyten binden an einen Komplex aus MHC-Molekülen und Fremdpeptiden; MHC-Moleküle sind die wichtigsten Transplantationsantigene, die zur Abstoßung transplantierter Gewebe von genetisch differenten Spendern führen

XXVIII Abkürzungen und Erläuterungen

MHC-Moleküle 7 MHC MIA Melanozyteninhibitorische Aktivität Michaelis-Menten-Konstante Konstante in der Enzym-

kinetik, gibt Substratkonzentration an, die bei Halbsättigung vorliegt Milz Größtes sekundäres lymphatisches Organ; enthält neben reifen T- und B-Lymphozyten auch Erythrozyten und Makrophagen Min Multiple intestinal neoplasia Minimal-invasiv Typischer Begriff, um die geringen Unannehmlichkeiten und Risiken bestimmter Verfahren zu kennzeichnen miRNA MikroRNA: Kleine, regulatorische RNA-Moleküle, die mRNA-Moleküle in der Translation blockieren können; MikroRNAs sind nichtkodierende regulatorische RNAs von etwa 21 Nukleotiden Länge; abhängig von der Komplementarität der miRNAs zu ihren spezifischen Ziel-mRNAs ist ihr Wirkmechanismus entweder endonukleolytische Spaltung der ZielmRNA oder Hemmung der Translation Mismatch-Bindungen Nukleotidfehlpaarung Mitochondriales Retikulum Neuere Vorstellung über die Struktur von Mitochondrien als verzweigtes Netzwerk, welches dynamischen Fusions- und Aufspaltungsprozessen unterliegt Mitochondriopathien Durch Mutationen in der mtDNA bzw. in Genen für kernkodierte, mitochondriale Funktionen verursachte Erkrankungen Mitotische Katastrophe Aus der Mitose durch mitotische Checkpunktkontrollgene aktivierter nichtapoptotischer Zelltodsignalweg Mitotische Segregation Verteilung der Mitochondrien bzw. mtDNA bei mitotischen Zellteilungen; die Verteilung erfolgt dabei ungeregelt und weitgehend stochastisch MLH Steht für Mismatch Reparatur Homologes Gen des Menschen, da es Ähnlichkeit zu Mut-Genen von E. coli aufweist MMR Mismatch repair MODY Maturity onset of diabetes in the young Molekulares Mimikry Identität oder Ähnlichkeit von Epitopen unterschiedlichen Ursprungs oder unterschiedlicher chemischer Struktur; kann bei Ähnlichkeit von Antigenen des menschlichen Organismus und Antigenen von Infektionserregern zu immunologischen Reaktionen gegen eigenes Gewebe und damit zu Autoimmunerkrankungen führen Monoklonal Antikörper, bei denen jedes Molekül gleich aufgebaut ist und die gleiche Spezifität für Antigene hat; von einem einzigen Klon, d. h. von einer einzigen biologischen Einheit (z. B. einer Zelle) ausgehend Monoklonale Antikörper Antikörper, die von einem B-Lymphozyten-Klon produziert werden; sie sind demzufolge in ihrer Aminosäuresequenz und damit in

ihren Bindungseigenschaften identisch; da B-Lymphozyten unter natürlichen Bedingungen nur begrenzt lebensfähig sind, können monoklonale Antikörper in größeren Mengen nur nach Immortalisierung der produzierenden Zellen (z. B. mithilfe der Hybridomtechnik) gewonnen werden Monomer Niedermolekulare, reaktionsfähige Einzelmoleküle, die sich zu molekularen Ketten oder Netzen, zu unverzweigten oder verzweigten Polymeren, zusammenschließen können MPG Medizinproduktgesetz MRE Ursprünglich in Hefe isolierte Mutante; MRE bedeutet meiotische Rekombination, da die Zellen einen Defekt in der Meiose aufweisen mRNA Messenger-RNA: Wird als Vorläufer-RNA synthetisiert, nach Prozessierung zu fertigen mRNA ins Zytoplasma transportiert (Messenger-RNA) und dort an den Ribosomen translatiert MRX-Komplex Proteinkomplex aus MRE11, RAD50, XRS2 (bzw. NBS1) MS Massenspektroskopie: Analyse von Peptiden, die aus Protein-Protein-Gemischen gewonnen wurden, oder anderer Proben in Massenspektrometern; aus den gewonnenen Massenspektren lassen sich Aussagen zur Zusammensetzung der Proben machen; das wird normalerweise durch die Ionisierung der Probe und die anschließende Trennung der Ionen verschiedener Massen erreicht; ein typisches Massenspektrometer enthält 3 Hauptteile: eine Ionenquelle, einen Massenanalysator und einen Detektor MSC Mesenchymal stem cells, mesenchymale Stammzellen MSH MutS-homologe Proteine mtDNA Mitochondriale DNA mTERF Mitochondrialer Terminationsfaktor, kernkodiert: Ist für die spezifische Termination der rRNaVorläufertranskripte verantwortlich mtRNAse P Mitochondriale Ribonuklease P, kernkodierter Ribonukleoproteinkomplex: Prozessierung der mitochondrialen Vorläufertranskripte durch Spaltung am 5c-Ende der tRNAs mtTFA Mitochondrialer Transkriptionsfaktor A, kernkodiert: Essenziell für die Transkription der mtDNA und die Initiation der H-Strang-Replikation; Mutationen im Gen für mtTFA führen zu einem Verlust an mtDNA MudPIT Multidimensionale Protein-Identifikationstechnologie (multidimensional protein identification technology): Kombination aus einer Peptidtrennung mittels multidimensionaler Flüssigchromatographie und anschließender Massenspektroskopie; hierbei werden aufeinanderfolgend verschiedene Chromatographiemethoden genutzt; die erste Chromatographie kann z. B. Ionenaustauschchromatographie sein, der

XXIX Abkürzungen und Erläuterungen

eine Auftrennung an einer reversen Phase folgt; die Peptide werden dann von der zweiten Säule direkt in ein Ionenfallen-Massenspektrometer (ion trap mass spectrometer) eluiert, in welchem sie voll automatisch gemessen und identifiziert werden; MudPIT ist eine hervorragende Technik zur Auftrennung komplexer Gemische mit Tausenden von Peptiden Muller’s ratchet Erstmals von Hermann Muller formulierte Hypothese über die schleichende Degeneration von Organismen, die sich rein ungeschlechtlich (asexuell) fortpflanzen; aufgrund von Mutationen kommt es zur Anreicherung „negativer Eigenschaften“, die wegen der fehlenden Rekombination nicht eliminiert werden können Mut Ursprünglich in E. coli isolierte Mutante; Mut weist auf den Mutatorphänotyp der Zellen hin Mutation Vererbbare Änderung der DNA-Sequenz MutHLS-System Mechanismus zur Erkennung und Eliminierung von Basenfehlpaarungen Myelom Plasmozytom: Entstanden aus der unkontrollierten Proliferation einer maligne transformierten Plasmazelle, produziert im Allgemeinen Antikörper einer einzigen Spezifität; Myelomzellen werden in der Hybridomtechnik zur Immortalisierung von B-Lymphozyten eingesetzt N NAT2 Arylamin-N-Acetyltransferase: Fremdstoffmeta-

bolisierendes Enzym der Phase II, koppelt einen Essigsäurerest an das Substrat Natürliche Killerzellen NK-Zellen, abgeleitet vom engl. „natural killer cells“: Große granulozytenähnliche Lymphozyten, die verschiedene virusinfizierte Zellen und Tumorzellen lysieren können; sie spielen eine Rolle als Effektorzellen in der antikörperabhängigen zellulären Zytotoxizität (s. dort); sie stammen, wie B- und T-Lymphozyten, von lymphoiden Vorläuferzellen, reagieren aber im Gegensatz zu B- und T-Lymphozyten nicht antigenspezifisch NBS Nijmwegen-breakage-Syndrom, eine Erbkrankheit des Menschen NCAM Neural cell adhesion molecule: Zelladhäsionsmolekül der IgSF, das an der Entwicklung des Nervensystems beteiligt ist Neo Neomycintransferase-Gen NER Nukleotidexzisionsreparatur Neumutation Beim erstmaligen Auftreten einer autosomal-dominanten Erkrankung in einer Familie ist eine neu aufgetretene Mutation wahrscheinlich; meistens ist die Mutation dann allerdings nicht bei dem Patienten selbst, sondern in den Keimzellen einer seiner gesunden Eltern aufgetreten

Neutralisation Fähigkeit eines Antikörpers, die patho-

genen Effekte eines Virus oder eines Toxins zu inhibieren NFκB Ein DNA-bindender Transkriptionsfaktor mit wichtigen regulatorischen Funktionen in der Abwehr von Infektionskrankheiten und zellulärem Stress; ursprünglich in B-Lymphozyten als Regulator der N-Immunglobulin-Leichtkette identifizierter, nukleärer heterodimerer Transkriptionsfaktor NGF Nerve growth factor, Nervenwachstumsfaktor NHEJ Nonhomologes End-joining Nichtkodierende RNA Eine große Klasse von RNA-Molekülen, die nicht zur Gruppe der mRNA gerechnet werden kann; nichtkodierende RNA wird nicht translatiert und dient wahrscheinlich regulatorischen Funktionen NK-Zelle 7 natürliche Killerzellen NOD Non obese diabetic Nondisjunction Fehlverteilung von Chromosomen in der Meiose bzw. von Schwesterchromatiden in der Meiose Nonresponder Ein Mensch, der auf ein bestimmtes Medikament keine oder nicht die erwartete Wirkung zeigt NRRL Northern Regional Research Laboratory nt Nukleotid: Maßeinheit für Oligonukleotidsequenzen Nu Nude, nackt (haarlos) Nucleosome remodeling and histone deacetylase (NuRD)

Ein Chromatin-Modifikationskomplex mit reprimierender Wirkung auf die Transkription Nukleasen Nukleinsäurespaltende Enzyme Nukleinsäure Biochemische Makromoleküle im Zellkern und Bestandteil des Erbguts Nukleoid Kernäquivalente Struktur des Genoms von Prokaryonten, hier auch: Distinkte mtDNA/ProteinKomplexe in Mitochondrien Nukleosom Die Grundeinheit der DNA-Verpackung bei Eukaryonten; aufgebaut aus zwei Kopien jedes der vier Histon-Typen; um diesen Histon-Oktamer ist die DNA herumgewunden Nukleotid Grundbaustein des genetischen Codes Nukleus Als Zellkern (lat. nucleus, Kern) bezeichnet man ein im Zytoplasma gelegenes, meist rundlich geformtes Organell der eukaryoten Zelle O OATP Organisches anionentransportierendes Poly-

peptid Oberflächenverfahren Mikroorganismen werden auf

der Oberfläche kultiviert und nicht als Flüssig- oder Submerskultur ODN Oligodeoxynukleotide OH/OL Initiationsorte der Replikationssynthese für H- bzw. L-Strang der mtDNA

XXX

Abkürzungen und Erläuterungen

OMIM Online Mendelian Inheritance in Man: Ausführ-

Pharmakokinetik Teilgebiet der Pharmakologie, das

lich annotierte Datenbank von monogen vererbten Merkmalen, Syndromen oder Krankheiten Operon Eine Funktionseinheit auf der DNA, bestehend aus Promotor, Operator und (Struktur-)Genen, die ein oder mehrere Protein(e) kodieren Opioidrezeptor Membranproteine, die endogene und exogene Opioide binden ORFs Open reading frames Organogenese Die Entwicklung bzw. Herstellung ganzer Organe aus Zellen 8-OxoG 8-Hydroxyguanin

sich mit der Kinetik von Prozessen beschäftigt, denen Arzneistoffe im Organismus unterliegen Phasenproblem Zum Berechnen der Elektronendichte aus den einzelnen Streuwellen des Diffraktionsexperimentes benötigt man zuzüglich zu den Amplituden der Streuwellen auch deren Phasen; jedoch im einzelnen Beugungsexperiment können die Phasen nicht direkt gemessen werden; das Phasenproblem muss durch weitere Experimente gelöst werden Phase-I-Reaktionen Enzymvermittelte Reaktionen wie Oxidationen, Reduktionen, Hydrolysen, Dehalogenierungen, Decarboxylierungen im Arzneistoffwechsel, die meist eine polare Gruppe in das Fremdstoffmolekül einführen und überwiegend durch Cytochrom P450 katalysiert werden Phase-II-Reaktionen Konjugationsreaktionen (z. B. mit Essigsäure, Glucuronsäure, Glycin, Glutaminsäure oder Sulfat) Pixel Picture element: Kleinste Einheit zur digitalen Quantifizierung von Farbelementen PLA Polylactat: Trägermaterial im Tissue engineering Plasmid-DNA Nichtviraler Vektor, der die Genexpression unter der Kontrolle eines Promotors steuert Plasmide Kleine, ringförmige DNA-Moleküle, die neben der DNA des „Bakterienchromosoms“ (Kernäquivalent) innerhalb einer Bakterienzelle vorliegen können Plasmozytom 7 Myelom Pluripotent Zellen, die sich zu jedem Zelltyp eines erwachsenen Organismus entwickeln können PM Poor metabolizer: Individuum mit zwei mutierten Allelen in Bezug auf ein Cytochrom-P450-Enzym und einer daraus resultierenden fehlenden Enzymaktivität (z. B. bei CYP2D6 oder CYP2C19) PMA Protein-Mikroarray: Beschichteter Objektträger, auf dem Proteine unter Verwendung eines Mikroarrays immobilisiert wurden und damit systematisch, in Spots angeordnet, vorliegen; oft werden gereinigte rekombinante Proteine zur Herstellung der PMAs verwendet; PMAs mit Proteinantigenen können z. B. zur Detektion bestimmter Antikörper wie Autoantikörper in Patientenseren verwendet werden; PMAs, die gereinigte Proteine in nativer Form enthalten, sind für funktionelle Studien geeignet (z. B. Analyse von Protein-Protein- oder Protein-DNA Wechselwirkungen, Phosphorylierungsstudien mit Proteinkinasen) PMS Ursprünglich in Hefe isolierte Mutante; postmeiotic segregation (PMS) aufgrund des in Hefe gefundenen Phänotyps PNS Peripheres Nervensysten Pol II/Pol III RNA-Polymerasen II und III: Die RNA-Polymerase II transkribiert lange, proteinkodierende Gene, die RNA-Polymerase III synthetisiert kurze RNA-Spezies wie tRNAs und die 5S-rRNA

P p53 Tumorsuppressorgen p53: Homotetramerer Trans-

kriptionsfaktor, der Aktivität zelltodfördernder bzw. zellzyklushemmender Gene induziert Pandemie Länderübergreifende oder sogar weltweite Verbreitung einer Krankheit; eine Pandemie kann die ganze Weltpopulation betreffen und macht nicht an den Grenzen eines Landes oder eines Kontinents Halt Paradigma Beispiel, Vorbild, Muster oder Grundsatz Pathogen Bezeichnet die Eigenschaft eines belebten Agens, als Krankheitserreger zu fungieren PCNA Proliferating-cell-nuclear-Antigen PCR Polymerase chain reaction, Polymerasekettenreaktion: Methode zur enzymatischen Amplifizierung von Nukleotidsequenzen PDB Protein Data Bank: Sammlung von kristallographisch oder durch NMR aufgeklärte physikalische Strukturen von Proteinen PDGF Platelet-derived growth factor, Plättchenwachstumsfaktor PE Plating efficiency, Plattierungseffizienz: Maß für das klonale Wachstum einer Zellpopulation Penetranz Anteil der Mutationsträger, bei denen sich eine Mutation phänotypisch auswirkt Penicillin Erstes entdecktes Antibiotikum PEPT Peptidtransporter Peptidpräsentation 7 Antigenpräsentation Periphere Blutlymphozyten Lymphozyten, die aus dem Blut isoliert werden können PGA Polyglycolsäure: Trägermaterial im Tissue engineering PGLA Poly(lactide-co-glycolide): Trägermaterial im Tissue engineering P-Glykoprotein Membranständiger Arzneimitteltransporter, Effluxtransporter: Ist u. a. für die sich in Krebszellen entwickelnde Resistenz gegen Zytostatika verantwortlich Phänokopie Simulation einer genetisch bedingten Krankheit durch exogene Einflüsse Phänotyp Erscheinungsbild: Summe aller äußerlich feststellbaren Merkmale eines Individuums

XXXI Abkürzungen und Erläuterungen

Polkörperdiagnostik Form der Präimplantations- bzw.

Präzipitation Bindungen von löslichen Antigenen und

präkonzeptionellen Diagnostik, bei der die Polkörper von entnommenen Eizellen mit dem gleichen Metzogen (steuert die Chromosomenverteilung bei der Zellteilung) wie bei der PID auf Keimbahnmutationen und/oder Chromosomenstörungen untersucht werden; die beiden Polkörper einer Eizelle entstehen durch die Halbierung des Chromosomensatzes während der Eizellreifung Poly(A)-Schwanz Der Poly(A)-Schwanz wird im Nukleus posttranskriptionell am 3c-Ende der mRNA synthetisiert; wichtig dafür ist die Erkennung des Hexanukleotidmotivs AAUAAA durch Poly(A)-Polymerase; im Zytoplasma kann der Poly(A)-Schwanz durch enzymatische Aktivitäten verkürzt oder verlängert werden Polyadenylierung Der Vorgang beschreibt die Anheftung von mehr als 250 Adenosin-Nukleotiden an das freie 3c-Ende der Vorläufer-RNA Polyklonal Eine Mischung verschiedener Antikörpermoleküle mit unterschiedlicher Spezifität/Affinität Polymerasekettenreaktion Polymerase chain reaction: Methode, die die Amplifikation von definierten DNASequenzen in großen Mengen durch wiederholte Synthesezyklen erlaubt Polymorphismus Auftreten einer Genvariation in einer Population mit einer Häufigkeit t1% Präimplantationsdiagnostik PID oder PGD (prenatal genetic diagnosis): Bei der Präimplantationsdiagnostik (PID) werden ein oder zwei Zellen eines mehrere Tage alten Embryos (meist im 8-Zell-Stadium) vor dessen Implantation in die Gebärmutter hinsichtlich einer bestimmten Mutation (mittels PCR) oder einer Chromosomenstörung (mittels Fluoreszenz-in-situHybridisierung) untersucht; es handelt sich dem Charakter nach um eine prädiktive Diagnostik mit dem Ziel, nur nicht betroffene Embryonen zu übertragen; Voraussetzung ist eine extrakorporale (assistierte) Befruchtung, d. h. die In-vitro-Fertilisation (IVF) oder bevorzugt die intrazytoplasmatische Spermieninjektion (ICSI) Präinitiationskomplex Besteht aus mehreren Proteinen, die für die Erkennung des Promotorbereichs auf der DNA zuständig sind; ermöglicht die Initiation der Transkription durch die RNA-Polymerase; vor der Bindung an die mRNA bildet die 40S-ribosomale Untereinheit einen Komplex mit dem Initiationsfaktor 3 und dem ternären Komplex, welcher aus der InitiatorMethionyl-tRNA (tRNAMet), eIF2 und GTP besteht Pränatal Vor der Geburt Prävalenz Ist eine epidemiologische Kennzahl und sagt aus, wie viele Individuen einer bestimmten Population an einer bestimmten Krankheit erkrankt sind; sie ist eine absolute Größe

Antikörpern, die zur Entstehung von unlöslichen Antigen-Antikörper-Komplexen führen und demzufolge als Präzipitate ausfallen; Tests, die auf einer Präzipitation beruhen, werden als Präzipitationstests bezeichnet Präzipitationstest 7 Präzipitation Precursor (inaktives) Vorläufermolekül Primer Ein aus wenigen Nukleotiden aufgebautes Molekül, komplementär zu einer Zielsequenz Procaspase Zymogen, d. h. inaktive Vorstufe der enzymatisch aktiven, durch Proteolyse gereiften Caspase Pro-Drug Wirkstoff, der erst durch Biotransformation im Körper in den aktiven Arzneistoff überführt wird Prokaryonten Auch Monera genannt, sind zelluläre Lebewesen, welche keinen Zellkern besitzen Promotor Eine spezifische DNA-Sequenz, die die Startstelle der Transkription an einem Gen festlegt Proof-reading 3c-5c-Exonukleaseaktivität, die mit DNAPolymerasen assoziiert ist Protein-Engineering Ein Teilgebiet der Biotechnologie, das sich mit der Konstruktion und Herstellung von nutzbaren Proteinen, darunter Enzymen, beschäftigt Proteinfamilie Gruppe von Proteinen mit mindestens 50% Sequenzidentität Proteinsuperfamilie Gruppe von Proteinen mit signifikanter Ähnlichkeit untereinander, aber weniger als 50% Sequenzidentität Proteomik Analyse der Proteinzusammensetzung von Zellen und Geweben in verschiedenen funktionalen oder pathologischen Zuständen Protonenpumpenhemmer Arzneimittelgruppe, die die Produktion von Magensäure durch Hemmung der H+/K+-ATPase in den Belegzellen des Magens hemmt PSA Polysialinsäure: Lineares Polymer aus D2,8-verknüpften Sialinsäureeinheiten; überwiegend beschränkt auf das NCAM-Protein Pseudogen 7 somatische Genkonversion P-Wert Wahrscheinlichkeit, mit der die Signifikanz einer statistischen Testentscheidung bewertet wird R RA Retinoic acid, Retinsäure: Oxidationsprodukt im

Metabolismus von Vitamin A; wird in der Zellkultur als Differenzierungsinduktor verwendet Racemat Optisch inaktives Gemisch, d. h. es dreht die Polarisationsebene von polarisiertem Licht nicht RAD Ursprünglich in Hefe isolierte Mutante; RAD bedeutet Radiation, weil die Zellen sensitiv gegenüber ionisierenden Strahlen sind Radiation-Hybridkarten Radiation hybrid maps: Genomische Karten, die durch Analyse der physikalischen Nachbarschaft von Markern auf durch Bestrah-

XXXII

Abkürzungen und Erläuterungen

lung gewonnenen DNS-Bruchstücken gewonnen werden Radioimmuntest Immunologischer Test zum Nachweis von Antigenen oder Antikörpern, bei dem einer der Reaktionspartner mit einem radioaktiven Isotop markiert ist, wodurch eine Messung der Reaktion möglich wird RB Retinoblastom: Tumor in neuralen Vorläuferzellen der unausgereiften Retina; das Retinoblastomgen wirkt als Tumorsuppressorgen Recombineering Klonierung durch homologe Rekombination in E. coli Reinkulturen Phänotypisch einheitliche Bakterienkulturen Rekombination Bei der Meiose entstehender Austausch von Chromosomenabschnitten zwischen väterlichen und mütterlichen Erbmerkmalen 7 V(D)J-Rekombination Rekombinationswahrscheinlichkeit Häufigkeit des Auftretens einer Rekombination in einem Stammbaum oder in einer Population Repertoire Die Gesamtheit an Antikörper- und T-ZellRezeptor-Spezifitäten, die durch B- und T-Lymphozyten eines Organismus gegen ein einzelnes Antigen oder die Gesamtheit aller potenziellen Antigene gebildet werden können Repressor Ein Protein, das sich an einen bestimmten Bereich der DNA, den Enhancer, anlagert und so den Start der Transkription, also das Ablesen dieses Bereichs hemmt oder vollständig verhindert Responder Patient, der auf ein bestimmtes Arzneimittel wie erwartet anspricht Restriktionsenzyme Enzyme, welche DNA sequenzspezifisch schneiden können Retroviren Enthalten eine einsträngige Virus-RNA, die von einer reversen Transkriptase in eine doppelsträngige DNA-Zwischenstufe transkribiert und als Provirus in das Wirtszellgenom eingebaut wird; vom Provirus aus wird durch reguläre Transkription die Bildung RNA-haltiger Virusnachkommen eingeleitet; Isolierung des ersten infektiösen Retrovirus gelang 1978: HTLV 1 (human T-cell lymphotropic virus type 1); Retroviren verursachen u. a. auch die Immunschwächeerkrankung HIV Rev HIV-Strukturgen, das RNA bindet und dem Export von mRNA aus dem Kern dient Reverse Transkriptase (RT) Auch RNA-abhängige DNAPolymerasen: Enzyme, die die Umschreibung von RNA in DNA katalysieren Rezeptor Transmembranmolekül an der Zelloberfläche, das einen Liganden binden kann; die Bindung führt zu biochemischen Veränderungen in der Zelle, wie z. B. zur Aktivierung bestimmter zellulärer Gene, Proteinoder Proteinkomplexe mit einer spezifischen Bin-

dungsstelle, an die der Agonist (z. B. Arzneistoff) bindet und damit einen biochemischen Signalprozess auslöst Rezeptortyrosinkinase Oberflächenrezeptoren mit enzymatischer Funktion: Binden auf der Außenseite der Zelle einen Liganden und starten auf der Innenseite im Zytoplasma durch Tyrosinphosphorylierung von Zielproteinen eine Signalkaskade R-Faktor Qualitätskriterium für das erhaltene Modell: Beschreibt die Übereinstimmung zwischen dem Modell und den gemessenen Diffraktionsdaten; bei biologischen Makromolekülen sollte dieser Wert unter 20% liegen RF-C Replikationsfaktor C; nötig für die Bildung des PCNA-DNA-Komplexes RFLP Restriction fragment length polymorphism, Restriktionslängenpolymorphismus RGD Tripeptid (Arg-Gly-Asp), das an Integrine (v. a. alphav-Integrin) bindet und zum Vektortargeting eingesetzt wird Ribosom Protein-RNA-Komplexe, die im Zytoplasma der Zellen vorkommen: Komplexe biologische Maschine, die den genetischen Kode der mRNA in Protein übersetzt; ein Ribosom besteht aus einer kleinen (40S) Untereinheit und einer großen (60S) Untereinheit; diese Untereinheiten setzen sich zusammen aus über 50 ribosomalen Proteinen und vier verschiedenen ribosomalen RNA- (rRNA-)Molekülen Ribozym RNA-Molekül mit enzymatischer Aktivität RISC RNA-induced silencing complex: Effektor der RNA-Interferenz, bestehend aus der siRNA sowie mehreren Proteinen; bindet kurze doppelsträngige siRNA und führt zum Abbau von mRNA-Molekülen mit komplementären Sequenzen RITS-Komplex RNA induced transcriptional silencing complex: Proteinkomplex, der repetitive und doppelsträngige RNA bindet und zur Heterochromatisierung von Chromatin führt R-Loop DNA-RNA-Hybridstruktur: bezeichnet in tierischen Mitochondrien die Ausbildung eines spezifischen DNA-RNA-Komplexes im Bereich der mtDNA-Kontrollregion; er ist das Substrat für die RNA-Primer Prozessierung durch die RNAse MRP bei der Initiation der H-Strang-Replikation RNA Ribonukleinsäure, mit vielfältigen Funktionen bei der Proteinsynthese und bei der Regulation der RNA-Mengen RNAi RNS-Interferenz: Experimentelle Methode zur spezifischen Ausschaltung von Genen RNA-Interferenz Ein Regulationsvorgang, der durch doppelsträngige RNA ausgelöst wird und zum Abbau bestimmter mRNA-Moleküle bzw. zur Translationshemmung und auch zur Heterochromatisierung führt

XXXIII Abkürzungen und Erläuterungen

RNA-Polymerase Ein Enzymkomplex, der anhand einer

DNA-Matrize eine RNA-Kopie synthetisiert; die Syntheserichtung erfolgt vom 5c-Ende der RNA zum 3c-Ende RNAse MRP Ribonuklease MRP (mitochondrial RNA processing): Kernkodierter Ribonukleoproteinkomplex, spaltet den RNA-Primer bei der Initiation der H-Strang-Replikation der mtDNA ROC Receiver operating characteristic: Graphische Methode zur Bewertung statistischer Testentscheidungen RPA Replikationsprotein A: Komplex aus mehreren Proteinen zur Stabilisierung einzelsträngiger DNA während der Replikation und Reparatur RPMA Reverser Protein-Mikroarray: Beschichteter Objektträger, auf dem komplexe biologische Proben (Lysate, Serumverdünnung) oder deren Fraktionen immobilisiert wurden; RPMAs werden verwendet, um parallel in vielen Proben, Proteine und deren Modifikationen (bisher Phosphorylierungen) vergleichend zu untersuchen und zu quantifizieren rRNA Eine Klasse von RNA-Molekülen, die für den Aufbau und die Funktion der Ribosomen zuständig sind (ribosomale RNA) RT Reverse Transkriptase RTK Rezeptortyrosinkinase RT-PCR Reverse transcriptase-PCR, Reverse-Transkriptase-PCR: Methode zur Amplifikation von spezifischen RNA-Sequenzen mithilfe reverser Transkriptase zur Messung der Genexpression einzelner Gene S Scanning Laterale Bewegung der 40S-ribosomalen

Untereinheit entlang der 5c-UTR, von der Cap-Struktur zum Initiationskodon Schnellacetylierer Individuen mit phänotypisch hoher enzymatischer Aktivität von NAT2 Schwere Kette H-Kette; heavy chain: Die größere der beiden Ketten, aus denen ein Antikörpermolekül aufgebaut ist SCID Severe combined immune deficiency, schwere kombinierte Immundefizienz: Erkrankung, die auf eine Hemmung der frühen Differenzierung der B- und T-Lymphozyten zurückzuführen ist und zur Areaktivität der spezifischen Immunabwehr führt; SCID-Mäuse werden zu immunologischen Modellversuchen genutzt SCNT Somatic cell nuclear transfer SDSA-Modell Synthesis-dependent-strand-annealingModell SELDI Surface-enhanced laser desorption ionization time of flight: Diese Methode ist eine Kombination aus Chromatographie an einer Oberfläche mit anschließender Analyse des Massenspektrums („timeof-flight“, TOF); hiermit lassen sich sehr gut Proteinprofile komplexer Proben bestimmen und verglei-

chen, was zur Identifizierung von Markerproteinen führen kann Seneszenz Zellalterung: Unterschieden wird die replikative Seneszenz infolge einer Verkürzung der Chromosomentelomere und eine prämature Seneszenz, die z. B. durch Onkogene oder DNA-Schädigung induziert werden kann Sequenzanalyse Aufklärung der Basenabfolge in einem DNS-Abschnitt Sequenzepitop Kontinuierliches Epitop: Epitop auf einem Proteinmolekül, das von Aminosäuren gebildet wird, die in der Primärstruktur aufeinander folgen; Sequenzepitope sind demzufolge auch auf denaturierten Proteinen nachweisbar Sequenzhomologie Ähnlichkeit von DNS-Sequenzen, soweit sie durch evolutionäre Verwandtschaft entstanden ist Serinproteasen Unterform der Peptidasen (Enzyme, welche Proteine und Peptide spalten) Serum Die nach der Blutgerinnung gewonnene, u. a. Antikörper enthaltende Flüssigkeit Short hairpin RNA (shRNA) Selbstkomplementäres RNAMolekül: Besteht aus einer ca. 19 Nucleotide langen Duplex und einem Loop; Short hairpin RNAs können intrazellulär exprimiert werden; sie werden dann zu small interfering RNAs prozessiert und lösen RNAInterferenz aus Short-patch Reparaturzweig der BER, bei der Nukleotide eingebaut werden Shuffling Techniken zur Beschleunigung der genetischen Evolution; dabei werden Gene oder deren Abschnitte mutiert und in neuer Reihenfolge zusammengesetzt Signaltransduktion Signalübertragung: Prozesse, mithilfe derer Zellen extrazelluläre Signale zu ihren zellulären Effektorstrukturen weiterleiten Signaltransduktionskaskade Beschreibt den Signalweg extrazellulärer Signale, die an Oberflächenrezeptoren binden und zu einer Aktivierungskaskade von zytoplasmatischen und von nukleären Proteinen führt; Ziel der Signaltransduktionskaskaden sind häufig regulatorische Faktoren der Genaktivität Signalübertragungskaskade 7 Signaltransduktionskaskade Signifikanz Statistischer Begriff: Ablehnung einer Nullhypothese Silencer Eine regulatorische DNA-Sequenz, die auch aus größerer Entfernung ein Gen abschalten kann Single nucleotide polymorphisms Variationen von einzelnen Basenpaaren in einem DNA-Strang, die bei bestimmten Individuen oder Populationen vorkommen (7 SNP) siRNA Small interfering RNA (short interfering RNA): 21 Nukleotide lange RNA-Abschnitte doppelsträngi-

XXXIV Abkürzungen und Erläuterungen

ger RNA, siRNA führt den RISC-Komplex zu komplementären Sequenzen in mRNA-Molekülen und führt zu deren Abbau bzw. Hemmung Skorbut Infektionskrankheit, hervorgerufen durch Mangel an Vitamin C Smac Second mitochondrial activator of caspases: Neben Cytochrom c (erster identifizierter mitochondrialer Caspaseaktivator) das zweite identifizierte Protein mit dieser Funktion SNP Single nucleotide polymorphism: Variation in einem Basenpaar in einen DNS-Strang snRNP Eine Klasse von Ribonukleoproteinpartikeln, die aus Proteinen und einer oder mehreren kleinen RNAMolekülen (snRNA) bestehen und Funktionen in der Prozessierung von Vorläufer-RNA besitzen SOM Self-organizing maps: Methode zur statistischen Clusteranalyse, die in der Theorie der neuronalen Netze entwickelt wurde Somatische Genkonversion Nichtreziproker Genaustausch: Mechanismus, der unter Nutzung von normalerweise nicht aktiven Pseudogenen in Hühnern zur Entstehung der Antikörpervariabilität auf somatischer Ebene führt; bei Mäusen und Menschen führt die V(D)JRekombination (s. dort) zur Antikörpervariabilität Somatische Hypermutation Nach Antigenstimulation in den variablen Regionen von Antikörpern auftretende Mutationen, die zur Erhöhung der Affinität führen Somatische Rekombination 7 V(D)J-Rekombination SP1 Wichtiger, ubiquitärer Transkriptionsfaktor, der an GC-reiche DNA-Sequenzen bindet Spezifität Grad der Einzigartigkeit einer Bindungsreaktion zwischen zwei Molekülen z. B. einer Antigen-Antikörper-Reaktion Spleißen Beschreibt den Vorgang der Prozessierung von Vorläufer-RNA-Molekülen, deren Intronsequenzen herausgeschnitten werden; alternatives Spleißen ermöglicht das regulierte Herausschneiden von Intronsequenzen oder ihren Verbleib in der fertigen mRNA Startkodon Die kodierende Region der meisten eukaryoten mRNAs beginnt mit einem Kodon der Basenfolge AUG (Startkodon); es wird von der an die 40S-ribosomale Untereinheit gebundenen Initiator r-RNAMet durch Kodon-Antikodon-Basenpaarung erkannt und in ein Methionin translatiert Stoppkodon Treffen Ribosomen auf die Basentripletts UAG, UAA oder UGA (Stoppkodons), dann führt dies zur Dissoziation des Ribosoms in die beiden Untereinheiten und der Freisetzung des fertigen Polypeptids; dieser Vorgang wird katalysiert durch sog. „Releasefaktoren“ Strukturgen Generelle Bezeichnung für Gene, deren Genprodukte keine regulatorischen Aufgaben bei der Genexpression haben

STSGs Split-thickness skin grafts: Künstliche Hautsub-

stitute aus Fibroblasten, extrazellulärer Matrix und Epithelzellen zur Geweberegeneration StZG Stammzellgesetz Subcutan Verabreichung (z. B. von Medikamenten) unter die Haut Submers Als submers (abgetaucht) bezeichnet man Mikroorganismen, die unter der Oberfläche des Mediums wachsen; im Gegensatz zum Oberflächenverfahren Super wobble Erweiterte Kodon-Antikodon-Erkennung bei der Translation in tierischen Mitochondrien; im Gegensatz zur Translation an zytoplasmatischen Ribosomen können alle Kodons eines einheitlichen Kodonquartetts von einer einzelnen Aminoacyl-tRNA erkannt werden Swi/Snf-Komplex Ein Multiproteinkomplex mit Eigenschaften zum Remodeling von Chromatin Syngen Betrifft den Ursprung aus einem genetisch identischen Individuum, z. B. syngene Transplantation zwischen Individuen einer identischen Inzuchtlinie T Tat HIV-Regulatorprotein mit transaktivierender Wir-

kung auf die Virusreplikation TATA-Box Eine TATA-reiche Sequenz im Promotorbe-

reich, die festlegt, dass ca. 30 Nukleotide unterhalb dieser Sequenz ein Transkriptionsstart vorliegt Tautomerie Beschreibung der chemischen Eigenschaften von funktionellen Gruppen anhand von elektronischen Grenzstrukturen; die tautomeren Grenzstrukturen der Peptidbindung erklären deren Doppelbindungscharakter; die freie Rotation um die C-N-Bindung ist nicht möglich T-Body Rekombinantes Antikörperfragment, das auf zytotoxischen T-Lymphozyten exprimiert wird und damit T-Lymphozyten über eine Antigen-AntikörperBindung aktiviert, ohne dass die durch diese Zellen unter natürlichen Bedingungen erforderliche Erkennung eines MHC-Peptid-Komplexes erforderlich ist (7 T-Zell-Rezeptor) TBP TATA-Bindeprotein: Ein zentraler Faktor für die Erkennung von Promotorsequenzen; zusammen mit weiteren Faktoren organisiert TBP den Präinitiationskomplex der Transkription TCR T cell receptor: Der Antigenrezeptor der T-Lymphozyten, der in seiner Struktur dem Fab-Fragment eines Antikörpers ähnelt; T-Zell-Rezeptoren werden von Genen kodiert, die, wie im Falle von Antikörpern, durch somatische Rekombination von V-, D- und J-Gensegmenten entstehen; T-Zell-Rezeptoren erkennen Antigenfragmente (Peptide), die an der Zelloberfläche von MHC-Molekülen präsentiert werden

XXXV Abkürzungen und Erläuterungen

Tc-Zellen Zytotoxische T-Lymphozyten: Die meisten

TNF Tumornekrosefaktor: Zytokin mit einer Vielzahl

zytotoxischen T-Lymphozyten tragen den Oberflächenmarker CD8 Tetanus Wundstarrkrampf Tetracyclin Ein Antibiotikum aus der Gruppe der Tetracycline TF Transkriptionsfaktor TFBS Transkriptionsfaktorbindungsstellen: Kurze Sequenzmotive, an denen spezifisch TF-Proteine an die genomische DNS binden, um die Transkription des dahinter liegenden Gens zu regulieren TFG Transfusionsgesetz TFIID-Komplex Enthält TBP und organisiert den Präinitiationskomplex TFIIH Transkriptionsfaktor, der an der DNA-Reparatur beteiligt ist TGFβ Transforming growth factor E transformierender Wachstumsfaktor E T-Helfer-Lymphozyten TH-Zellen: T-Lymphozyten, die B-Lymphozyten bei der Antikörpersynthese unterstützen (TH2-Zellen) bzw. Makrophagen aktivieren (TH2-Zellen); sie produzieren bestimmte Zytokine, die für die jeweilige Funktion erforderlich sind; tragen den Oberflächenmarker CD4 Therapeutisches Klonen Der Embryo wird nach wenigen Zellteilungen zerstört und die einzelnen Zellen werden in eine Kultur zum weiteren Wachstum gebracht; mithilfe geeigneter chemischer und biologischer Wachstumsfaktoren lässt sich aus diesen Stammzellen möglicherweise jede Gewebeart (vielleicht sogar ganze Organe) züchten, oder die Stammzellen werden direkt in den Körper des Patienten eingebracht Thermostabile Proteine Proteine, welche bei Temperaturen von mehr als 80°C noch biologisch aktiv sind Thymozyten Lymphoide Zellen des Thymus: es handelt sich in erster Linie um verschiedene Reifungsstadien von T-Lymphozyten TK Thymidinkinase TLR Toll-like Rezeptoren sind in der Evolution konservierte intrazelluläre Rezeptoren, die auf Makrophagen und dendritischen Zellen zur Erkennung häufiger Lipoprotein-, Lipopolysaccharid- oder GlykoproteinMuster (sog. Pattern) dienen, die auf gramnegativen und grampositiven Bakterien sowie Viren vorkommen und zur Aktivierung des angeborenen Immunsystems führen TLS Transläsionssynthese: Überspringen eines Schadens einer Replikationsgabel, keine Reparatur T-Lymphozyten T-Zellen: Eine der beiden Populationen der Lymphozyten; sie spielen eine Rolle bei der Regulation der Immunantwort (T-Helfer-Lymphozyten) sowie als zytotoxische Zellen (Tc-Zellen); ihre Reifung erfolgt im Thymus (daher ihre Bezeichnung)

von Funktionen (Aktivierung von Immunzellen, Zerstörung einiger Tumorzellen) Todesligand Mitglied der Familie der TNF-D und CD95/Fas-Ligand-ähnlichen Liganden für Todesrezeptoren Todesrezeptor Mitglied der Supergenfamilie der TNFhomologen Rezeptoren, das durch die Anwesenheit einer Todesdomäne (death domain) charakterisiert ist Toleranz Antigenspezifische Areaktivität von B- oder T-Lymphozyten Totipotent Zellen, die sich zu einem kompletten Organismus entwickeln können TPA Gewebe-Plasminogenaktivator TPG Transplantationsgesetz Trägerprotein Carrier Protein: Immunogenes Protein, an das nichtimmunogene Substanzen (wie z. B. Haptene oder Peptide) gebunden werden, um Antikörper gegen diese nichtimmunogenen Substanzen zu induzieren Transfer- (-t)RNA Adaptermolekül für die Übersetzung eines Nukleotidtripletts in eine Aminosäure; t-RNAs bilden eine typische kleeblattähnliche Sekundärstruktur aus; der Antikodonarm erkennt über Basenpaarung den genetischen Kode der mRNA; an den Aminoacylarm ist diejenige Aminosäure kovalent gekoppelt, die dem Antikodon entspricht Transgene Mäuse Mäuse, in deren Keimbahn eingeschleuste Fremd-DNA stabil integriert ist Transkription Die Übersetzung eines DNA-Strangs in eine RNA-Sequenz; die RNA-Synthese erfolgt vom 5c-Ende der RNA zum 3c-Ende Transkriptionsfaktor DNA-bindende Proteine, die über die Bildung von weiteren Faktoren die RNA-Polymerase zur Transkription anregen oder in der Transkription hemmen und dadurch für die Regulation der Genaktivität (Transkription) mitverantwortlich sind Translation Vorgang, bei dem in der lebenden Zelle aus der durch eine Abfolge von RNA-Nukleotiden kodierten Information ein Protein gebildet wird Translationsfaktoren Darunter versteht man Proteine, die an den drei Abschnitten der Translation beteiligt sind; man unterscheidet Translationsinitiationsfaktoren („eucaryotic initiation factor“, eIF), die eine Rolle bei der Bindung des Ribosoms an die mRNA spielen, Translationselongationsfaktoren (eEF), die für die Ausbildung der Peptidbindungen zuständig sind und Releasefaktoren (eRF), die die Freisetzung des fertigen Peptids katalysieren Translokation Austausch von Chromosomenabschnitten zwischen nichthomologen Chromosomen Transplantation Gewebe- oder Organübertragung von einem Individuum auf ein anderes; führt in der Regel zur Abstoßung aufgrund der immunologischen Reak-

XXXVI Abkürzungen und Erläuterungen

tion gegen Fremdantigene auf den übertragenen Zellen, die durch Immunsuppressiva verhindert werden kann; nur im autologen und syngenen System bzw. zwischen eineiigen Zwillingen ist eine Transplantation ohne Abstoßungsreaktionen möglich Transposon Mobiles genetisches Element, ein DNA-Abschnitt bestimmter Länge auf einem Chromosom, welcher die Möglichkeit hat, seinen Ort im Genom zu verändern (Transposition) tRNA 7 Transfer- (t-)RNA TSE Transmissible spongiforme Enzephalopathie TSS Transcription start site: Spezifisches Sequenzmotiv, das den Start der Transkription anzeigt TTD Trichothiodystrophie Tumorantigene Antigene von Tumorzellen, die vom autologen Immunsystem erkannt werden bzw. mithilfe monoklonaler Antikörper anderer Spezies nachweisbar sind U UM Ultrafast metabolizer: Individuum mit mindestens

drei Wildtypallelen von CYP2D6 und damit stark erhöhter Metabolisierungsaktivität; es liegt eine Genduplikation vor UPD Uniparentale Disomie: Ein Chromosomenverteilungsfehler, der dazu führt, dass ein homologes Chromosomenpaar ersetzt ist durch zwei identische Chromosomen; führt häufig zu einem Loss-of-imprinting USSC Unrestricted somatic stem cells; multipotente Vorläuferzellen im Nabelschnurblut UTR Untranslated region: Die mRNA enthält sowohl 5c- als auch 3c-Sequenzen ihrer kodierenden Region, die nicht translatiert werden; diese Sequenzen enthalten häufig regulatorische Elemente, die die mRNAStabilität, -Lokalisierung oder -Translation beeinflussen

J-Gensegmenten kodiert und unterscheidet sich in ihrer Aminosäuresequenz von einem Antikörper VCAM-1 Vascular cell adhesion molecule-1: Zelladhäsionsmolekül der IgSF, das an der Leukozyten-Endothel-Interaktion beteiligt ist Vektor Gentaxi oder Genfähre, bezeichnet virale oder nichtvirale Nukleinsäuren, die zur Klonierung bzw. Expression des gewünschten therapeutischen Gens benutzt werden V-Gene Vom engl. variable: Gensegmente, die in etwa die ersten 95 Aminosäuren eines Antikörpers kodieren; V-Gene werden als multiple Gensegmente über die Keimbahn weitergegeben; zur Kodierung der gesamten variablen Region eines Antikörpers ist die Rekombination (7 V(D)J-Rekombination) mit einem J-Gen bzw. mit einem J- und einem D-Gen erforderlich Vitamin-K-Epoxidreduktase Schlüsselenzym in der Bildung Vitamin-K-abhängiger Gerinnungsfaktoren und pharmakologischer Rezeptor für Coumarine von-Willebrand-Faktor Ein Protein, das eine wichtige Rolle bei der Blutgerinnung spielt Vorläufer-B-Zellen Zellen der B-Lymphozyten-Reihe, die schon rekombinierte Gene für die schweren Ketten, aber noch keine rekombinierten Gene für die leichten Ketten enthalten und damit noch keinen funktionsfähigen antigenbindenden Rezeptor exprimieren V-Region 7 variable Region W Western blotting 7 Immunblotting WISH Whole-mount in situ hybridisation: Experimen-

telle Methode zur Lokalisierung der Genexpression WNT Signalmolekül X Xenogen Betrifft den Ursprung aus einer anderen Spe-

zies, z. B. xenogene Transplantation

V V(D)J-Rekombination Somatischer Rekombinations-

XenoMaus Transgene Mauslinie mit humanen Immun-

mechanismus, der zur Entstehung der Antigenrezeptoren (Immunglobuline) auf B-Lymphozyten (und auch der T-Zell-Rezeptoren auf T-Lymphozyten) führt; hierbei werden nach dem Zufallsprinzip V-, Dund J-Gensegmente zu einem neuen Gensegment verknüpft, das die variable Region des jeweiligen Antikörpers kodiert Vakzinierung Immunisierung, die zu einem aktiven Schutz gegen einen Infektionserreger führt; abgeleitet von der Pockenimmunisierung mithilfe des weniger virulenten Kuhpockenvirus (Vacciniavirus) Variable Region Variabler Teil, V-Region, variable region: Der N-terminale Teil eines Antikörpermoleküls, der die Antigenbindungsregion enthält; die variable Region wird von den rekombinierten V-, (D-) und

globulingenen, die demzufolge zur Gewinnung humaner Antikörper genutzt werden können Xenotransplantation Die Übertragung von lebens- und funktionstüchtigen Zellen oder Zellverbänden (einschließlich ganzer Organe oder Körperteile) zwischen verschiedenen Spezies XFP Spektrale GFP-Varianten: CFP, GFP, RFP, YFP XistRNA Eine nichtkodierende RNA des X-Chromosoms der Säuger und des Menschen; in weiblichen Individuen führt die Expression dieses Gens dazu, dass ein X-Chromosom inaktiviert wird XML eXtensible Markup Language: Format zur Speicherung und zum Austausch von Informationen; XMLFormate existieren für die meisten experimentellen Datentypen und spezifische Anwendungen

XXXVII Abkürzungen und Erläuterungen

XP Xeroderma pigmentosum XRS Ursprünglich in Hefe isolierte Mutante; XRS be-

deutet X-ray-sensitiv, weil die Zellen empfindlich gegenüber Röntgenstrahlen sind Y YAC Yeast artifical chromosome Y2H Hefe-2-Hybrid-System (Yeast two-hybrid system):

Es handelt sich um eine genetische Methode in Hefen zur Identifizierung von Protein-Protein-Wechselwirkungen; es wird die Wechselwirkung von zwei Hybridproteinen untersucht: einem „bait“ (Fusionsprotein bestehend aus Testprotein 1 und der DNA-bindenden Domäne eines Transkriptionsfaktors) und einem „prey“ (Fusionsprotein bestehend aus Testprotein 2 und der Aktivierungsdomäne eines Transkriptionsfaktors); bei Wechselwirkung zwischen beiden Proteinen wird ein aktiver Transkriptionsfaktor rekonstruiert; dieser führt zur Transkription eines Repor-

tergens, welches es den Hefen erlaubt, auf selektiven Medien zu wachsen, und/oder zu einem detektierbaren Phänotyp führt, wie z. B. zu einer Blaufärbung auf Indikatormedium Z Zentromer Ansatzstelle für die Spindelfasern in der

Mitose und der Meiose; die zentromerische DNA besteht aus bestimmten repetitiven Sequenzen, an die sich ein Proteinkomplex, das Kinetochor, anlagert, der der Verankerung der Spindelfasern dient Zymogen Sammelbezeichnung für inaktive Enzymvorstufen Zytoplasma Die lebende Substanz der Zelle Zytostatika Medikamente gegen Krebs Zytotoxische Zellen In erster Linie zytotoxische T-Lymphozyten (Tc-Zellen) und natürliche Killerzellen, die andere Zellen zerstören können

1

1 Allgemeine Grundlagen 1.1 Molekulare klinische Zellbiologie Kai Breuhahn und Karsten Brand

1.2 Molekulare Mechanismen von Zell-Zell-Wechselwirkungen Thomas Brümmendorf

1.3 Die zytogenetischen Grundlagen der Molekularen Medizin Heidemarie Neitzel und Karl Sperling

1.4 Analyse von Biochips: Von der Sequenz zum System Ralf Herwig, Johannes Schuchhardt, Lukas Chavez und Hans Lehrach

1.5 Mitochondriale DNA des Menschen Bernd Wissinger

1.6 Regulationsmechanismen der Transkription in Eukaryonten Rainer Renkawitz und Joerg Leers

1.7 Mechanismen der Translationskontrolle in Eukaryonten Martina U. Muckenthaler und Thomas Preiss

1.8 Molekulare Grundlagen der Apoptose Peter Daniel

1.1 1.1 Molekulare klinische Zellbiologie Kai Breuhahn und Karsten Brand

1.1.1

Einleitung

–4

1.1.2

Subzelluläre Prozesse

1.1.2.1 1.1.2.2 1.1.2.3 1.1.2.4

Synthese und Abbau – 4 Energie – 9 Transport – 10 Kommunikation – 12

1.1.3

Zelluläre Prozesse

1.1.3.1 1.1.3.2 1.1.3.3 1.1.3.4 1.1.3.5

Zelluläre Homöostase – 15 Proliferation (Zellteilung/Zellzyklus) – 15 Zelltod (Apoptose/Nekrose) – 16 Positionierung (Adhäsion/Migration) – 16 Spezialfunktionen und Funktionsdifferenzierung

1.1.4

Ausblick

– 17

1.1.5

Literatur

– 18

1.1.6

Zeittafel

– 19

–4

– 14

Literatur zur Zeittafel

– 17

– 20

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

4

Sektion 1 · Allgemeine Grundlagen

1.1.1 Einleitung Klinisch relevante Vorgänge im menschlichen Körper haben eine Entsprechung auf zellbiologischer und molekularer Ebene. Die zelluläre Reaktion kann dabei direkt oder auf den ersten Blick nur lose mit der klinischen Situation assoziiert sein. Beim Herzinfarkt beispielsweise kann man das unmittelbar auslösende thromboembolische Ereignis (Verschluss eines Blutgefäßes durch Gerinnsel) auch ohne zellbiologisches Wissen verstehen, aber bereits die Entstehung des Embolus sowie die arteriosklerotische Vorschädigung (Gefäßverkalkung) und die Reaktion des Organismus sind zytopathologisch erklärbar. Der Zytopathologie liegen wiederum subzelluläre, molekulare Prozesse zugrunde, die mehr und mehr bekannt werden. Molekularbiologie und Medizin bewegen sich seit längerem aufeinander zu. In den Lehrbüchern der klassischen molekularen Zellbiologie bemüht man sich zunehmend um die Herstellung klinischer Bezüge; in den entsprechenden klinischen und pathologischen Werken werden vermehrt die molekularen Ursachen von Krankheiten aufgeführt. Im ersten Abschnitt (1.1.2) knüpfen wir an diese Tradition an, indem die molekularen und biochemischen subzellulären Prozesse einführend und übersichtsartig dargestellt werden und beispielhaft klinische Bezügen aufgezeigt werden. Zur Vertiefung verweisen wir auf die großen Standardwerke der (molekularen) Zellbiologie (z. B. Alberts et al. 2002; Lodish et al. 2004; Karp 2005). Im zweiten Abschnitt (1.1.3) beschreiben wir das, was eine einzelne Zelle tun kann – nämlich, mittels ihrer ‚Housekeeping’-Funktionen die zelluläre Homöostase aufrechtzuerhalten, im Rahmen der Differenzierung zelluläre Spezialfunktionen zu entwickeln, sich zu teilen, ihre Position durch Migration gegebenenfalls zu verändern sowie im Extremfall mit Zelltod zu reagieren. Wir haben in diesen beiden Unterkapiteln Wert auf systematische Geschlossenheit gelegt. Jeder Abschnitt beschreibt die jeweilige hierarchische Ebene (subzellulär bzw. zellulär) möglichst vollständig und mit geringer Überlappung innerhalb einer hierarchischen Ebene bzw. zu anderen hierarchischen Ebenen. Ziel dieser einführenden Abhandlung kann im Rahmen des verfügbaren Raumes naturgemäß nicht die inhaltliche Vollständigkeit sein. Wir möchten dem Studierenden vielmehr das grundlegende Rüstzeug zum Verständnis der nachfolgenden Kapitel und ihrer konzeptionellen Einordnung an die Hand geben.

1.1.2 Subzelluläre Prozesse Zellen bilden die kleinste, lebende Funktionseinheit höher entwickelter Organismen. Trotz ihrer genetisch iden-

tischen Ausstattung können Zellen jedoch unterschiedlichste biologische Funktionen ausüben. Alle Zellen sind von einer flexiblen Phospholipidmembran umschlossen, in die Proteine eingelagert sind. Diese Proteine vermitteln sowohl Stofftransport (durch Transporter oder Kanäle) als auch die Signalweiterleitung (via Rezeptoren) und Zell-Zell-Kontakte (z. B. mittels Adherens junctions). Im Zytoplasma einer Zelle befinden sich die Organellen, welche für Energiegewinnung (Mitochondrien), Stoffsynthese (endoplasmatisches Retikulum, ER), intrazellulären Transport (Golgi-Apparat) und Stoffabbau (Lysosomen und Peroxisomen) verantwortlich sind. Ferner durchziehen die Zelle verschiedene Strukturelemente des Zytoskeletts, die von zentraler Bedeutung für Bewegung (Aktinfilamente), Morphologie (Intermediärfilamente) und Zellteilung (Mikrotubuli) sind. In dem von zwei Membranschichten umspannten Zellkern (Nukleus) liegt die genetische Information in Form von Chromosomen vor. Basierend auf diesem essenziellen Bauplan aller eukaryoten Zellen, können diese eine definierte Funktion ausüben, mit anderen Zellen interagieren und gegebenenfalls auf exogene Stimuli und Umwelteinflüsse reagieren. Häufig kommt es jedoch zur Störungen der zellulären Homöostase, was mit der Entstehung pathologischer Erscheinungsbilder einhergeht.

1.1.2.1 Synthese und Abbau DNA, Replikation und DNA-Reparatur Die genetische Information ist in Form von Chromosomen im Zellkern organisiert (> Abb. 1.1.1). Jedes Chromosom stellt ein fadenförmiges Makromolekül (Desoxyribonukleinsäure, DNS, engl. DNA) dar, auf dem die Erbanlagen (Gene) durch eine Abfolge unterschiedlicher Desoxyribonukleotide kodiert vorliegen. Komplementäre Wasserstoffbrückenbindungenzwischen den Basenanteilen der Nukleotide zweier DNA-Einzelstränge (Adenin mit Thymin, Guanin mit Cytosin) führen zur Ausbildung der äußerst stabilen Doppelhelix. Durch die Komplexierung der DNA mit basischen Proteinen, den Histonen, entstehen hochgradig kondensierte Chromatinstrukturen, die Nukleosomen. In Abhängigkeit von Modifikationen dieser DNA-assoziierten Histone (z. B. Acetylierung) können unterschiedlich dichte Chromatinabschnitte entstehen, deren Struktur maßgeblichen Einfluss auf die Ablesbarkeit der in dieser Region kodierten Gene hat. So ist die Bildung des hoch kondensierten Heterochromatins mit inaktiven DNARegionen und des weniger kompakten Euchromatins mit aktiven DNA-Regionen verbunden. Das menschliche Genom ist diploid und besteht aus 23 Chromosomenpaaren (einschließlich zweier Geschlechtschromosomen). Bevor sich jedoch eine Zelle

5 1.1 · Molekulare klinische Zellbiologie

1.1

teilen kann (Mitose), muss diese gesamte genetische Information exakt kopiert werden. Dieser Prozess der Replikation beginnt mit der Öffnung der DNA-Doppelhelix an tausenden von Stellen innerhalb des Genoms. Zahlreiche Proteine sind hierbei an der kurzfristigen Entspiralisierung und Öffnung der DNA beteiligt (z. B. Helikasen) und ermöglichen so die Bindung einer DNA-abhängigen DNA-Polymerase, welche entsprechend der als Matrize dienenden einzelsträngigen DNA je zwei neue Gegenstränge synthetisiert. Durch die nunmehr rasch fortlaufende Polymerisation der neuen DNA-Hälften an die DNA-Vorlage entstehen aus einer Doppelhelix zwei Doppelhelices. Während des Vorgangs der DNA-Synthese können durch schädigende Umwelteinflüsse (z. B. UV-Strahlung und chemische Substanzen) in den für Gene kodierenden Bereichen der DNA Veränderungen in der NukleotidSequenzabfolge entstehen. Damit sich diese Fehler nicht in den somatischen Körperzellen oder den Keimbahnzellen in Form von Mutationen manifestieren, existieren verschiedene zelluläre Reparaturmechanismen. Im Rahmen dieser DNA-Reparaturvorgänge wird der betroffene Sequenzabschnitt erkannt (z. B. Nukleotid-Dimere), der

fehlerhafte DNA-Einzelstrang vom unveränderten DNAStrang separiert, ausgeschnitten und fehlerfrei neu synthetisiert. An diesen Prozessen sind zahlreiche Proteine beteiligt, von denen einige auch in die DNA-Replikation involviert sind (z. B. Polymerasen und Ligasen). Grundsätzlich wird zwischen verschiedenen Mechanismen unterschieden: der „Nukleotidexzisionsreparatur“ (NER) und der „Basenexzisionsreparatur“ (BER). Die zentrale Bedeutung der DNA-Reparaturmechanismen wird deutlich, wenn eben diese Prozesse in einer eukaryoten Zelle nicht mehr ausreichend funktionieren. Im Falle des Cockayne-Syndroms führt eine Mutation im den Genen CSA oder CSB dazu, dass ein eng an die Transkription gekoppelter Reparaturprozess der NER genomische Fehler in besonders aktiv transkribierten Genen nicht erkennt. Andererseits führen verschiedene Mutationen im XPD-Gen (eine Helikase im sog. globalen NER-Reparaturweg) zur Entwicklung der Hautkrankheiten Xeroderma pigmentosum oder Trichothiodystrophie. Es ist interessant, dass beide Erkrankungen auf der Fehlfunktion desselben Proteins beruhen, sich jedoch hinsichtlich ihres pathologischen Phänotyps gravierend voneinander unterscheiden (> Tabelle 1.1.1).

. Abb. 1.1.1. Schematische Darstellung der in Synthese und Abbau eingebundenen subzellulären Prozesse. Nur die komplexen und hochgradig regulierten Prozesse der Synthese (DNA-Replikation, RNA-Transkription, Protein-Translation) und des Abbaus (durch Enzyme [Proteasen, Nukleasen], das Proteasom und Zellorganellen [Lysosomen]) von

Biomolekülen ermöglicht es der eukaryoten Zelle als kleinster lebender Funktionseinheit, auf unterschiedlichste Anforderungen und Stimuli zu reagieren. Letztendlich antworten Zellen somit durch eine adaptive Synthese (bzw. den adaptiven Abbau) von zellulären und sezernierten Biomolekülen auf Umweltreize (ausführliche Erläuterungen 7 Text)

6

Sektion 1 · Allgemeine Grundlagen

. Tabelle 1.1.1. Molekularbiologie und Pathologie ausgewählter Erkrankungen Erkrankung

Betroffener subzellulärer Prozess

Zielstruktur

Pathologie

Cockayne-Syndrom

DNA-Reparatur

CSA, CSB

Zwergwuchs, abnormale Entwicklung des Nervensystems, erhöhte Sensitivität gegenüber Licht

Xeroderma pigmentosum

DNA-Reparatur

XPD (Untereinheit von THIIH)

erhöhtes Hautkrebs-Risiko

Trichothiodystrophie

DNA-Reparatur

XPD (Untereinheit von THIIH)

erhöhte Sensitivität gegenüber Licht, schuppige Haut, spröde Haare

Alzheimer-Erkrankung

Proteinfaltung

Mutationen in APP (amyloid precursor protein), PS-1 und PS-2 (Presenilin) führt zur Anreicherung von Amyloid-βPeptid (Aβ)

Demenz

Creutzfeld-Jacob-Erkrankung

Proteinfaltung

PrPc (zelluläres Prion-Protein)

Demenz

Tay-Sachs-Krankheit

Abbau von Biomolekülen

Verlust von β-Hexosaminidase

Erblindung, Demenz, körperlicher Abbau

Glucozerebrosidose (Gaucher-Syndrom)

Abbau von Biomolekülen

Verlust von Ceramid-βGlukosidase

Vergrößerung der Leber und Milz, Demenz, Skelettveränderungen

MERRF- (Myoklonusepilepsie mit Ragged-redFasern-)Syndrom

mtDNA/Proteinbiosynthese

tRNA-Lysin

Muskeldegeneration, epileptische Anfälle, Koordinations- und Hörstörung

Kearns-Sayre-Syndrom

mtDNA/Proteinbiosynthese/ Energiegewinnung

diverse

Lähmungen, Muskelschwäche, Demenz

Mukoviszidose

Transport

CFTR (cystic fibrosis transmembrane conductance regulator)

Schleimsekretionsstörung, Lungeninfektionen und Lungenentzündungen

Liddle-Syndrom

Transport

Natriumkanal

Bluthochdruck

Retinitis pigmentosa

Kommunikation

Proteine der Phototransduktion (z. B. Rhodopsin)

Blindheit

Lungenkrebs, Lymphome

Transkriptionskontrolle

NF-κB

Maligne Transformation

Burkitt-Lymphom

Transkriptionskontrolle

MYC (Translokation des Gens)

Maligne Transformation

Verschiedene Tumorerkrankungen

Kommunikation

E-Cadherin

Metastasierung

mRNA und Transkription Die in Form von DNA gespeicherte Information muss in Botenmoleküle (Ribonukleinsäure, RNS, engl. RNA, oder Messenger-RNA, mRNA) umgeschrieben werden, damit sie für weitere Prozesse zugänglich ist (> Abb. 1.1.1). Auch in diesem Makromolekül kodiert die Abfolge von Nukleotiden die relevante Information; allerdings findet man nicht Thymin, sondern Uracil in den Sequenzen wieder. Darüber hinaus wird mRNA nicht in Form einer Doppelhelix, sondern als einzelsträngiges Polymer aus dem Zellkern in das Zytoplasma transportiert. Typischer-

weise ist der Aufbau einer mRNA in seinen Grundzügen immer gleich. Am „Anfang“ des Moleküls, dem sog. 5‘-Ende, gibt es die „Cap“-Struktur (Triphosphat mit 7-Methylguanosin) und am „Ende“ der mRNA, dem 3‘-Ende, den Poly-A-Anhang (50–250 Adenin-Nukleotide). Die „Cap“-Struktur schützt die mRNA vor dem Abbau durch zelleigene Nukleasen, unterstützt den Export aus dem Zellkern und ist an der Initiation der Proteinbiosynthese (s. Translation) beteiligt. Auch der PolyA-Anhang schützt, zusammen mit gebundenen Proteinen, vor dem frühzeitigen und unkontrollierten

7 1.1 · Molekulare klinische Zellbiologie

Abbau der mRNA. Neben diesen terminalen Strukturen existieren noch weitere nichtkodierende Abschnitte im 5‘- und 3‘-Bereich einer mRNA. Diese Regionen rahmen die für ein Protein kodierende Nukleotid-Sequenz ein und umfassen vorwiegend regulatorische Elemente (z. B. die Konsensus-Sequenz AAUAAA zur Polyadenylisierung). Der Vorgang der mRNA-Synthese wird Transkription genannt. Diese ist hoch komplex, strikt reguliert und beinhaltet eine sequentielle Abfolge von proteinabhängigen Schritten. Zuerst bildet sich in definierten DNA-Promotorbereichen eines Gens (TATA-Box) ein sog. Präinitiations-Komplex, bestehend aus zahlreichen „generellen“ Transkriptionsfaktoren und einer RNA-Polymerase II. Das Entwinden der DNA durch eine Helikase ermöglicht der RNA-Polymerase dann entsprechend der Sequenz des „anti-sense“-DNA-Einzelstrangs, die komplementäre mRNA-„sense“-Sequenz zu synthetisieren. Die mRNA entsteht dabei vom 5‘-Ende in Richtung des 3‘-Endes. Spezifische Terminations-Sequenzen (u. a. auch die Polyadenylisierungs-Sequenz) können den Syntheseprozess durch die Polymerase beenden. Das durch die Transkription entstandene Primärtranskript erfährt abschließend zahlreiche enzymatische Modifikationen, bevor es in das Zytoplasma exportiert wird. So werden einige nichtkodierende Bestandteile, die Introns, entfernt (Spleißen) oder aber einzelne Basen modifiziert (RNA-Editing). Insbesondere in Eukaryonten erhöht der Prozess des sog. alternativen Spleißens bei gegebener Anzahl von Exons die Zahl möglicher Proteine. Eine große Zahl solcher sog. Protein-Isoformen entsteht durch häufig zelltypspezifische Exklusion oder Inklusion bestimmter Exone in die kodierende mRNA. Interessanterweise ist alternatives Spleißen auch eine von Viren viel genutzte Methode, bei beschränktem Platz für kodierende DNA oder RNA die Zahl möglicher Proteine zu erhöhen. Die Herstellung eines spezifischen Gen-Transkripts kann auf unterschiedliche Art und Weise reguliert werden. Neben der Kontrolle durch posttranskriptionelle Mechanismen (z. B. alternatives Spleißen) wird die hergestellte Menge einer mRNA, entsprechend der jeweiligen zellulären Situation, moduliert. Hierbei sind es vor allem „sequenzspezifische“ Transkriptionsfaktoren (TF), die durch Bindung an definierte TF-Bindungstellen in Gen-Promotorregionen für eine differenzielle Transkription verantwortlich sind. Diese können als transkriptionelle Aktivatoren oder auch als Repressoren wirken. Da die meisten Gen-Promotoren unterschiedliche Bindungsstellen für mehrere TFs aufweisen, und darüber hinaus ein TF unterschiedliche Gene in ihrer Expression beeinflussen kann, entsteht ein komplexes regulatorisches Netzwerk. Jeder Zelltyp besitzt eine charakteristische Auswahl und Quantität an TFs, welche

1.1

dem Expressionsprofil dieser Zelle (dem Transkriptom) zugrunde liegt. Welche Transkriptionsfaktoren in einem bestimmten Zelltyp exprimiert werden, wird durch eine Vielzahl regulatorischer Interaktionen bestimmt, die sich während der Entwicklung und Differenzierung der speziellen Zelltypen manifestieren. Muss die Zelle auf Reize ihrer Umwelt reagieren, wird die Anzahl und Aktivität der TFs moduliert (z. B. durch Reduktion der Menge oder Phosphorylierung, d. h. das Anhängen von Phosphatresten) oder aber die subzelluläre Lokalisation von existierenden Faktoren verändert (z. B. Translokation aus dem Zytoplasma in den Zellkern). Transkriptionsfaktoren können die Chromatinstruktur verändern, was häufig als indirekter Effekt bezeichnet wird, oder sie können direkt auf die RNA-Polymerase II und die generellen Transkriptionsfaktoren einwirken. Ebenso scheint hierbei der Interaktion reprimierender TFs mit HistonDeacetylase-Komplexen eine zentrale Bedeutung zuzukommen. Diese führt zu einer Deacetylierung der Histone, was mit einer Hemmung der Transkriptionsinitiation assoziiert ist. Insbesondere die veränderte Aktivität vieler TFs (z. B. durch Überexpression) wird für die Entstehung zahlreicher Tumorerkrankungen diskutiert. Ein gutes Beispiel für solch einen TF stellt der „nuclear factor κB“ (NF-κB) dar, ein Heterodimer, welches aus 5 verschiedenen Protein-Untereinheiten zusammengesetzt sein kann (RelA, NF-κB1, NF-κB2, c-Rel und RelB). Die erhöhte Aktivität dieser Faktoren wird unter anderem gehäuft in Lungentumoren und Plattenepithelkarzinomen beobachtet. Ein anderer onkogen wirkender TF ist MYC, welches an die Promotoren von 15% aller im Genom kodierten Gene bindet. Aufgrund dieser zentralen Stellung von MYC wird diskutiert, ob schon geringste Veränderungen der MYC-Expression unter Umständen dazu führen, dass ehemals „normale“ Zellen entarten. Hierbei können unterschiedliche molekulare Mechanismen für die Dysregulation verantwortlich sein. Sowohl genomische Translokationen des MYC-Gens (z. B. beim Burkitt-Lymphom) oder Amplifikationen des Lokus (z. B. beim Neuroblastom) können der erhöhten Expression des TF zugrunde liegen. Hohe MYC-Mengen führen dann durch Aktivierung von protumorigenen Zielgenen zu dem Prozess der malignen Transformation. Transkriptionelle Dysregulation ist aber nicht nur an der Krebsentstehung beteiligt. So scheint für die Pathogenese der angeborenen Pylorusstenose (Einengung des Magenausgangs) die transkriptionelle Dysregulation der neuronalen Stickoxid-Synthetase verantwortlich zu sein. Die Tatsache, dass genregulatorische Elemente ein hohes Maß an Promiskuität aufweisen, d. h. auch Gene, die sie nicht natürlicherweise regulieren, steuern können, wird in Forschung und Therapie ausgenutzt. So kann

8

Sektion 1 · Allgemeine Grundlagen

man gentherapeutisch relevante Gene in den Körper einbringen, die nur am gewünschten Ort aktiv sind, nämlich dort, wo ein Satz an Transkriptionsfaktoren existiert, welcher exakt den verwendeten Promotor und damit das nachgeschaltete therapeutisch wirksame Gen aktiviert. Neben der bisher besprochenen Transkription von mRNA durch RNA-Polymerase II gibt es in Eukaryonten noch die Transkription von rRNA und srRNA durch die RNA-Polymerase I und von tRNA und 5S-rRNA durch RNA-Polymerase III. Diese Polymerasen benötigen unterschiedliche generelle und spezifische TFs. Proteine und Translation Die in Form der mRNA gespeicherte Information wird im Zytoplasma in Proteine „umgeschrieben“ (> Abb. 1.1.1). Proteine bestehen aus einer unterschiedlich langen Sequenz von bis zu 20 verschiedenen Aminosäuren (AS), deren Seitenketten chemische Gruppen mit differierenden chemischen und physikalischen Eigenschaften tragen. So gibt es hydrophobe und hydrophile Seitenketten, die saure, basische, ungeladen polare und nichtpolare Eigenschaften aufweisen. Einzelne AS werden über Peptidbindungen zu langkettigen Polymeren miteinander verbunden. Entsprechend der Reihenfolge der AS entstehen unter physiologischen Bedingungen Proteine einer Konformation mit definierten Eigenschaften. Es gibt unterschiedlichste Proteingruppen und Funktionen; so sorgen Strukturproteine unter anderem für den regelrechten Aufbau einer Zelle (z. B. Aktin), sezernierte Faktoren ermöglichen den Informationsaustausch zwischen Zellen (z. B. Zytokine) und Enzyme dienen als Katalysatoren für die chemische Umsetzung von Biomolekülen (z. B. Proteasen). Die Regel, nach der die mRNA-Nukleotidsequenz in ein Protein umgeschrieben wird, ist der evolutionär hochgradig konservierte genetische Code. Hierbei kodieren je 3 Nukleotide (insgesamt 61 Tripletts, syn. Kodons) der jeweiligen mRNA eine definierte AS. Drei weitere Tripletts entsprechen sog. Stoppkodons und bestimmen das Ende einer zur translatierenden Sequenz. Viele AS können durch mehrere Kodons dargestellt werden; man sagt, der genetische Code ist ‚degeneriert’. Der eigentliche Vorgang der Proteinsynthese wird auch Translation genannt. Hierbei lagert sich zuerst eine Reihe von Initiationsfaktoren an die Cap-Struktur einer mRNA an. Das Ribosom, bestehend aus 2 unterschiedlich großen Untereinheiten, erkennt ein für die AS Methionin kodierendes Startkodon (Sequenz: Adenin/ Uracil/Guanin) und verlängert, durch kontinuierliche Wanderung über die mRNA, das zu synthetisierende Protein (Elongation). Hierbei ist es notwendig, dass ständig einzelne AS für den Einbau in das neu entstehende Polymer zur Verfügung stehen. Dies erfolgt durch tRNA- (Transfer-)Moleküle, welche entsprechend dem

auf der mRNA kodierenden Kodon die geforderte AS transportieren. tRNAs tragen die hierzu komplementären Antikodon-Sequenzen und verknüpfen somit die in den Nukleinsäuren kodierte Information mit den funktionellen Eigenschaften eines Proteins. Erreicht das Ribosom eines der 3 Stoppkodons (für das keine AS-tragende tRNA existiert), so vermitteln „Releasing“-Faktoren die Freisetzung der ribosomalen Untereinheiten und des neu synthetisierten Proteins von der mRNA (Termination). Abschließend erfahren Proteine noch posttranslationale Modifikationen, welche ihre Stabilität beeinflussen und ihre Funktion innerhalb und außerhalb der Zelle weiter spezialisieren. Die korrekte Faltung von Proteinen benötigt die Assistenz molekularer Chaperone (z. B. Hitzeschock 70 Proteine), welche an die am Ribosom entstehenden Polypeptide binden und ihre Fehlfaltung verhindern. Eine weitere Gruppe assistierender Proteine, die Chaperonine binden teil- oder fehlgefaltete Proteine und geben damit Zeit für eine korrekte Faltung. Nach ihrer Synthese werden die meisten Proteine noch durch das Anhängen verschiedener chemischer Gruppen an Aminosäurereste modifiziert. Modifikationen wie Acetylierung, Hydroxylierung, Glykosylierung und Phosphorylierung können dabei sowohl die Struktur als auch die Funktion des einzelnen Proteins maßgeblich verändern. Wie wichtig eine korrekte Sequenz bzw. Faltung für die Funktion eines Proteins ist, zeigt sich an zwei neurodegenerativen Erkrankungen. Bei der Alzheimer-Erkrankung führen wahrscheinlich Mutationen in unterschiedlichen Proteinen dazu, dass es zu einer Anreicherung einer Amyloid-β-Peptid Variante kommt. Diese alternative Variante tendiert zur Oligomerisierung und führt zu den typischen Aggregaten, welche in den Nervenzellen zu beobachten sind. Im Falle der erworbenen Creutzfeld-Jacob-Erkrankung sind es keine genetischen Veränderungen, die das Krankheitsbild hervorrufen. Das PRNP-Gen kodiert für „normales“ PrPc (zelluläres Prion-Protein), das in Nervenzellen exprimiert vorliegt. Die AS-Sequenz des Krankheits-assoziierten PrPsc (Prion-Protein scrapie) ist dazu identisch, das Protein liegt jedoch in einer anderen Konformation vor. Diese modifizierte Version akkumuliert in Nervenzellen und führt zu deren Untergang. Dieser Vorgang ist deshalb so gefährlich, weil wahrscheinlich das pathogene Protein an das normale PrPc bindet und dieses in PrPsc konvertiert. Diese Hypothese würde den infektiösen Charakter von Prionen erklären helfen (> Tabelle 1.1.1). Synthese weiterer Makromoleküle Neben Nukleinsäuren und Proteinen spielen für Zellstruktur und -funktion Fette und insbesondere im extrazellulären Milieu auch Zucker eine zentrale Rolle. Phospholipide, Sphingolipide und Triglyceride, welche die

9 1.1 · Molekulare klinische Zellbiologie

Hauptkomponenten von Biomembranen darstellen, sind aus gesättigten und ungesättigten Fettsäuren unterschiedlicher Kettenlängen aufgebaut. Fettsäuren werden von wasserlöslichen Enzymen synthetisiert und im ER modifiziert. Die letzten Schritte der Lipidsynthese und Modifikation erfolgen auf dem Weg zur Plasmamembran ähnlich wie in Abschnitt 1.1.2.3 für Proteine beschrieben. Unter den polymeren Zuckern sind v. a. die Proteoglykane zu nennen. Sie besitzen einen membranassoziierten oder sezernierten Proteinkern, der kovalent an eine oder mehrere Glykosaminoglykanketten angehängt ist. Dies sind lineare Polymere bzw. sulfatierte Disaccharide, deren Synthese und Kopplung ähnlich, wie für die Proteine beschrieben, im sekretorischen Weg erfolgt. Abbau Für die Bioverfügbarkeit eines Proteins in einer Zelle sind neben der Expression (via Transkription und Translation) dessen Stabilität und der zielgerichtete Abbau von zentraler Bedeutung (> Abb. 1.1.1). Hierbei ist die Proteasom-vermittelte Degradation der wichtigste zielgerichtete Prozess zum Abbau von unnötigen oder sogar schädlichen Genprodukten. Zuerst müssen dafür die abzubauenden Zielproteine für das Proteasom markiert werden. Dies geschieht durch die enzymatische Bindung von kurzen Protein- (Ubiquitin-)Polymeren an LysinSeitenketten eines Zielproteins durch E1-aktivierende Enzyme, E2-konjugierende Enzyme und E3-UbiquitinLigasen. Das aus zahlreichen Untereinheiten bestehende Proteasom erkennt die so markierten Proteine und katalysiert deren Abbau; das dabei frei werdende Ubiquitin kann anschließend erneut für Markierungsprozesse genutzt werden. Ubiquitin- abhängige Proteindegradation erfüllt zwei wesentliche Aufgaben: 1. die engmaschige Kontrolle der Aktivität vitaler zytosolischer Proteine: Zykline beispielsweise sind Zellzyklusproteine, die nur über einen bestimmten Zeitraum während der Zellteilung aktiv sein sollen. Zu einem bestimmten Zeitpunkt werden sie phosphoryliert, was ihre Konformation so verändert, dass sie für die ubiquitinierenden Enzyme erkennbar werden und abgebaut werden können. 2. die Entfernung von Proteinen, die während ihrer Entstehung im ER nicht korrekt gefaltet wurden. Hier werden durch die Fehlkonfiguration hydrophobe Sequenzen exponiert, die sowohl zur Ausschleusung ins Zytoplasma als auch zur Erkennung durch Ubiquitin-Ligasen führen. Während Proteasomen zytosolisch lokalisierte sog. molekulare Maschinen sind, handelt es sich bei Lysosomen um spezialisierte membranbegrenzte Vesikel, welche unterschiedlichste saure Hydrolasen (z. B. Proteasen, Nukleasen, Lipasen) enthalten. Verschmelzen diese Ve-

1.1

sikel mit z. B. endozytotischen Vesikeln, werden die darin enthaltenen Biomoleküle (z. B. Proteine, Nukleinsäuren und Fette) komplett und ungerichtet abgebaut. Aus diesem Grund werden Lysosomen auch als die „Verdauungsorgane“ einer Zelle bezeichnet. Peroxisomen sind ebenfalls membranbegrenzte Vesikel, die jedoch oxidative Enzyme enthalten (z. B. Katalase). Neben dem Abbau von Fettsäuren katalysieren die in ihnen enthaltenen Enzyme auch Entgiftungsreaktionen (z. B. Oxidation von Alkohol zu Acetaldehyd). Dass ein unzureichender Abbau von Biomolekülen mit der Entwicklung von pathologischen Phänotypen assoziiert ist, wird deutlich, wenn man die mehr als 40 erblichen Erkrankungen betrachtet, die allein auf einer Störung des lysosomalen Metabolismus beruhen. Hierbei führt das Fehlen einer spezifischen Hydrolase zur intralysosomalen Anhäufung von Substraten. Beispiele für solche Erkrankungen sind die Tay-SachsKrankheit und die Glucozerebrosidose (> Tabelle 1.1.1).

1.1.2.2 Energie Die meisten Prozesse innerhalb einer Zelle sind energieabhängig. Somit ist die Zelle auf eine fortwährende Versorgung durch Energie angewiesen (> Abb. 1.1.2). Diese Energie steht für die einzelnen Reaktionen in Form einer chemischen Substanz, dem Adenosintriphosphat (ATP) zur Verfügung. Die Synthese dieses Energieäquivalents ist sehr komplex und verteilt sich über verschiedene zelluläre Kompartimente. Typischerweise wird Glucose von einer Zelle aufgenommen und im Zytoplasma zu Pyruvat umgebaut (Prozess: Glykolyse). In den Mitochondrien erfolgt die oxidative Decarboxylierung von Pyruvat unter Bildung von Acetyl-CoA. Unter bestimmten Bedingungen können aber auch Fette (β-Oxidation) und Proteine (Aminosäureabbau) zur Synthese von Acetyl-CoA und somit zur Energiegewinnung beitragen; ATP kann auch direkt hergestellt werden (anaerobe Glykolyse unter Bildung von Milchsäure). Das Acetyl-CoA wird dann im Zitronensäurezyklus vollständig zu CO2 oxidiert und ein sog. energiereiches Reduktionsäquivalent (NADH+H+) hergestellt. Abschließend wird bei der oxidativen Phosphorylierung an der Mitochondrienmembran durch den Übertrag von Elektronen vom Reduktionsäquivalent auf molekularen Sauerstoff Energie frei, die zur Synthese von ATP verwendet wird (Atmungskette). ATP steht nun nach Bedarf den verschiedenen zellulären Prozessen als universeller Energielieferant zur Verfügung. Unter Spaltung des Moleküls in Adenosindiphosphat (ADP) und ein Orthophosphat (-P) kann die frei werdende Energie z. B. für Synthese-, Markierungs- oder Abbauprozesse Verwendung finden.

10

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.1.2. Schematische Darstellung weiterer subzellulärer Prozesse. Neben Synthese und Abbau stellen Kommunikation bzw. Signaltransduktion, Transport und Energiegewinnung zelluläre Prozesse dar,

welche eng miteinander verknüpft vorliegen. Beispielhaft werden hier einige mögliche Interaktionen dargestellt (ausführliche Erläuterungen 7 Text)

Die zentrale Schaltstelle der Energiegewinnung, das Mitochondrium, besitzt extrachromosomale DNA (mitochondriale DNA, mtDNA). Ein wichtiger Unterschied zwischen nukleärer DNA und mtDNA ist, dass im Mitochondrium die DNA-Reparaturmechanismen wahrscheinlich weniger effizient sind bzw. in geringerem Ausmaß existieren. Aus diesem Grund ist die Mutationsrate in den Mitochondrien um den Faktor 10 höher als im Zellkern. Es ist deshalb nicht verwunderlich, das eine Reihe von mtDNA-assoziierten Erkrankungen (Mitochondriopathien) beschrieben wurden. So führen z. B. Punktmutationen in der für Lysin kodierenden tRNA zum MERRF-Syndrom und Deletionen zur Ausbildung des Kearns-Sayre-Syndroms (> Tabelle 1.1.1). Eine mögliche Beteiligung von mtDNA-Mutationen an neurodegenerativen Erkrankungen (Parkinson-Syndrom) wird zurzeit diskutiert.

1.1.2.3 Transport Der Transport von Biomolekülen, Nährstoffen, Ionen und Abfallprodukten ist für das Überleben einer Zelle essenziell (> Abb. 1.1.2). Zum einen muss ein wechselseitiger Austausch zwischen intra- und extrazellulärem Milieu erfolgen; zum anderen ist ein gerichteter Transport zwischen subzellulären Kompartimenten erforderlich. Pumpen und Kanäle Der Phospholipid-Bilayer ist die grundlegende Struktureinheit der Biomembranen. Einige wenige Moleküle können diese Membranen durch einfache passive Diffusion durchqueren. Hierzu gehören Gase wie Sauerstoff und Kohlendioxid sowie kleine polare ungeladene Moleküle wie Ethylalkohol und in geringerem Maße auch Harnstoff und Wasser. Diese passive Diffusion verbraucht keine Energie und läuft entsprechend dem Konzentrationsgefälle spontan ab. In Gegensatz dazu sind Phospholipid-Bilayer für große polare ungeladene Moleküle wie Glucose oder Fructose, für polare geladene Moleküle wie Aminosäuren, ATP und Nukleinsäuren

11 1.1 · Molekulare klinische Zellbiologie

und für Ionen wie K+, Na+ oder Ca2+ nicht durchlässig. Solche Substanzen können durch drei Klassen transmembranöser Proteine transportiert werden: ATP-abhängige Pumpen, Ionenkanäle und Transporter. ATP-abhängige Pumpen transportieren Ionen und verschiedene kleine Moleküle aktiv gegen den jeweiligen Konzentrationsgradienten. Es handelt sich um Transmembranproteine mit einer oder mehreren ATP-Bindungsstellen auf der zytosolischen Membranseite. Sie sind u. a. verantwortlich für das allgemeine Ionenmilieu tierischer Zellen und für das saure Milieu in Lysosomen. Die ABC- Unterfamilie hat mit ihrem Mitglied MDR1 (multiple drug resistance 1) besondere medizinische Bedeutung, da dieser Transporter für einen Teil der Resistenzentwicklung maligner Tumoren gegen Chemotherapeutika verantwortlich gemacht wird. ABC-Transporter sind neben speziellen Fettsäuretransportern auch für den Lipidtransport durch Zellmembranen verantwortlich. Zusätzlich zu den ATP-abhängigen Pumpen gibt es noch Ionenkanäle, die es den wichtigsten zellulären Ionen wie K+, Na+ oder Ca2+ und Cl– erlauben, entsprechend ihrem Konzentrationsgradienten die Zellmembran zu durchqueren. Die Fehlfunktion von Transportvorgängen kann zu zahlreichen, schwerwiegenden Erkrankungsbildern führen. So wurden für die autosomal-rezessiv vererbte Mukoviszidose bisher über 150 Mutationen in einem Gen beschrieben, welches für einen Chlorid-Kanal kodiert. Im Falle des Liddle-Syndroms führen Mutationen in einem Natrium-Kanal dazu, dass dieser nicht durch hohe Ionenkonzentrationen geschlossen wird (> Tabelle 1.1.1). Die dritte Hauptklasse von Transportmolekülen sind solche, die ihre Energie aus elektrochemischen Gradienten generieren. Auf diese Weise transportieren sie als Uniporter z. B. Glucose entlang des Konzentrationsgradienten und als Kotransporter Ionen entgegen ihres Konzentrationsgradienten. Wie oben bereits erwähnt besitzen Membranen eine gewisse Permeabilität für Wasser, und dieses folgt dem Konzentrationsgradienten aller löslichen Substanzen (Osmose). Zusätzlich gibt es aber Wasserkanäle, Aquaporine, die die Permeabilität für Wasser selektiv erhöhen können, ein Vorgang, der in der Niere bei der Wasserresorption aus dem Primärharn eine Rolle spielt. Membrantransportproteine haben große Bedeutung in der Medizin. Auch heutzutage stellen spezifische Inhibitoren oder Aktivatoren von Kanälen, Pumpen und Transportern die größte Klasse von Medikamenten, darunter Säurehemmer bei Magengeschwüren, Blutdrucksenker oder Antidepressiva. Ebenso werden diesen Transportproteinen krankheitsverursachende Eigenschaften zugeschrieben. Eine bestimmte Form von Herzrhythmusstörungen konnte kürzlich auf eine Mutation in einem Natriumkanal-Gen zurückgeführt wer-

1.1

den, und eine ebensolche Mutation scheint eine Form der Epilepsie zu bedingen. Transport neu gebildeter Proteine Eine typische Säugetierzelle besitzt bis zu 10.000 verschiedene Proteinsorten. Ein großer Teil der Proteine wird an zytosolischen Ribosomen gebildet und verbleibt im Zytosol. Viele Proteine müssen ihre Aufgaben aber in Organellen, in der Zellmembran oder sogar außerhalb der Zelle erfüllen. Wir wissen inzwischen, dass die Information, die ein Protein zu einem bestimmten Ort bringt, in der Aminosäurenabfolge des Proteins selbst liegt, und zwar gewöhnlich innerhalb eines Abschnittes von etwa 20–50 Aminosäuren, der als Signalsequenz bezeichnet wird. Die einzelnen Organellen tragen einen Satz an Rezeptorproteinen, welche nur an die entsprechenden Signalsequenzen binden. Sobald ein Protein mit seiner Signalsequenz mit seinem korrespondierenden Rezeptor interagiert, wird es über einen translozierenden Kanal in die Organelle eingeschleust. Am längsten und vielleicht am besten bekannt sind die Mechanismen, die Proteine zunächst ins ER einschleusen, bevor sie entweder sezerniert werden oder in den Golgi-Apparat, die Lysosomen oder die Zellmembran als letzten Bestimmungsort gelangen. Hierbei können zwei Mechanismen unterschieden werden: Im Rahmen der kotranslationalen Translokation ins ER wird noch während der Translation die Signalsequenz von einem Signalerkennungspartikel (SRP) detektiert und der Komplex aus Protein und SRP nach Anlagerung an einen SRP-Rezeptor durch einen speziellen Kanal, das Translocon, geschleust. Von geringerer Bedeutung scheint in höheren Tieren die posttranslationale Translokation zu sein, die ohne SRP auskommt. In beiden Fällen wird nach der Translokation die Signalsequenz durch eine Signalpeptidase abgespalten. Durch welche Transportmechanismen gelangen nun die im ER-Lumen befindlichen Proteine zu ihrem finalen Bestimmungsort? Das eine Prinzip des Proteintransports im sekretorischen Weg besteht darin, dass sich aus der Membran eines Kompartiments Membranvesikel abschnüren, die dann mit dem nächsten Kompartiment fusionieren. Die Proteine können so von Organelle zu Organelle wandern, ohne jedes Mal erneut durch eine Membran translozieren zu müssen. Die Exozytose von Proteinen verläuft in Abhängigkeit neuronaler oder hormoneller Signale. Lipide werden gewöhnlich im Komplex mit speziellen Proteinen als Lipoproteinkomplexe exportiert. Nicht sezernierte Membranproteine können im Golgi-Netzwerk je nach Bestimmungsort in unterschiedliche Vesikel aufgenommen werden. Parallel läuft auf diesen Ebenen auch ein retrograder Vesikeltransport, sodass Membranmaterial wieder Richtung ER ersetzt wird. Die Transportvesikel werden nach den

12

Sektion 1 · Allgemeine Grundlagen

wesentlichen beteiligten Proteinen COPI I-, COPI IIund Clathrin-Vesikel benannt. Endozytose Alle eukaryoten Zellen betreiben kontinuierlich Endozytose – ein Prozess, bei dem eine kleine Region der Plasmamembran invaginiert, um bis zu 0,1 µm große Vesikel zu bilden. Neben einer unspezifischen Aufnahme extrazellulären Materials (Pinozytose) gibt es die rezeptorvermittelte Endozytose, bei der ein spezifischer Rezeptor auf der Zelloberfläche einen extrazellulären makromolekularen Liganden erkennt. An der Entstehung der endozytotischen Vesikel sind das bereits angesprochene Clathrin sowie das AP2-Molekül beteiligt. Der überwiegende Teil der endozytotischen Vesikel wird zu Endosomen umgewandelt und fusioniert dann mit Lysosomen. Auf diesem Weg dissoziieren die Rezeptoren von den Liganden; erstere können unter anderem zur Membran zurücktransportiert werden, letztere werden weitgehend abgebaut und dem Metabolismus zugeführt. Eine häufige Störung endozytotischer Internalisierung findet sich bei der familiären Hypercholesterinämie: Aufgrund einer Mutation im LDL- („low densitiy lipoprotein“-)Rezeptor kann das cholesterinhaltige LDL zwar gebunden, nicht aber internalisiert und abgebaut werden, sodass es zu erhöhten Blutcholesterinwerten kommt. Transzellulärer Transport Die Spezialfunktion vieler differenzierter Zellen, z. B. der Darmepithelien, besteht in der Aufnahme von extrazellulärem Material und der unmodifizierten Weitergabe in den Blutkreislauf. Dieser als Transzytose bezeichnete Prozess bedient sich ähnlicher Mechanismen wie Endozytose und Exozytose. Damit der Prozess gerichtet (z. B. vom Darmlumen ins Blut) ablaufen kann, wird die unterschiedliche Affinität membranöser Rezeptoren zu ihren Liganden z. B. in Abhängigkeit von unterschiedlichen pH-Werten auf den beiden Seiten der Zelle ausgenutzt. So findet z. B. der Transport von Immunglobulinen aus dem Darmlumen ins Blut gerichtet statt, da der pH Wert im Darmlumen bei 6, im Blut aber über 7 liegt. Vesikuläre Transportproteine Vesikel werden entlang den Mikrotubuli, einer Komponente des Zytoskeletts, transportiert. Mikrotubuli bestehen aus Tubulinen, die zu Hohlzylindern von 25 µm Durchmesser polymerisieren. Sie gehen üblicherweise von Mikrotubuli organisierenden Zentren (MTOC) aus und können über eine MTOC-nahes (–) Ende und ein MTOC-fernes (+) Ende orientiert werden. Mikrotubuli sind ein prinzipiell dynamisches System, was z. B. beim Aufbau der mitotischen Spindeln von zentraler Bedeutung ist. Colchicin, ein wichtiges Medikament zur Behandlung der Gicht, und Taxol, ein Krebsmedikament,

greifen beide an der Mikrotubilidynamik an. Im Rahmen des vesikulären Transports werden Mikrotubuli eher als stationär angesehen und scheinen als eine Art Leitschiene zu dienen, an der die Vesikel entlanggeführt werden. Die für diese Bewegung verantwortlichen Moleküle (Motorproteine) sind Kinesine, die für den anterograden Transport in (+)-Richtung verantwortlich sind, und Dyneine, die den retrograden Transport in (–)-Richtung bewerkstelligen. In Mikrotubuli-armen zellulären Regionen können Vesikel auch entlang von Mikrofilamenten transportiert werden. Mikrofilamente bestehen aus monomeren Aktinuntereinheiten, sind vor allem submembranös lokalisiert und haben ihre Hauptaufgabe in der Gestaltbildung und Migration der Gesamtzelle. Im Rahmen des intrazellulären Vesikeltransports dienen sie als Leitschiene für Myosin-Motorproteine. Die dritte Gruppe von Zytoskelettproteinen, die Intermediärfilamente (Zytokeratine, Spectrine, Vimentin, Lamine) dient vor allem der Zelladhäsion. Diese Proteine haben große diagnostische Relevanz, da sie dem Histopathologen eine Differenzierung epithelialer Tumoren (Karzinome), welche Zytokeratine, nicht aber Vimentin exprimieren, von mesenchymalen Tumoren (Sarkomen), die Vimentinpositiv und Zytokeratin-negativ sind, erlauben. Nukleärer Transport Die Kernhülle besitzt eine große Zahl von Kernporen – große komplexe Strukturen, die überwiegend aus Nukleoporinen bestehen. Proteine, die zum nukleären Import oder Export anstehen, besitzen nukleäre Lokalisationssignale (NLS) oder nukleäre Exportsignale (NES), die mit entsprechenden Rezeptoren, Importinen oder Exportinen interagieren. Zur Ausschleusung von mRNA aus dem Nukleus in das Zytoplasma verwendet die Zelle bisher noch unvollständig charakterisierte mRNA-Exporter.

1.1.2.4 Kommunikation Liganden Rezeptoren und Signalkaskaden Auf zellulärer bzw. subzellulärer Ebene gibt es einen Austausch von Information, der mit Strukturänderungen der beteiligten Informationsträger einhergeht (> Abb. 1.1.2). Dies bezeichnen wir als intrazelluläre oder extrazelluläre Kommunikation. Ihr wesentlicher Sinn besteht darin, Zellen in ihren Gewebsverband oder organismischen Zusammenhang sinnvoll einzubinden. Man kann formal das initiale Ereignis der Signalaufnahme durch die Zielzelle und die Signalweitergabe unterscheiden. Mittlerweile sind etwa 10 wesentliche Mechanismen der Signalaufnahme beschrieben, denen eine größere Zahl intrazellulärer Signalwege gegenüber-

13 1.1 · Molekulare klinische Zellbiologie

steht, die sich aber nach einigen wenigen Prinzipien ordnen lassen. Zwar werden bestimmte initiale LigandRezeptor-Interaktionen bevorzugt durch bestimmte Signalwege intrazellulär weitergeleitet, aber es gibt reichlich Überschneidungen. Der Besprechung einiger spezieller Rezeptor-LigandInteraktionen und der entsprechenden intrazellulären Signalwege wollen wir einige generelle Bemerkungen voranstellen: Unter den Liganden finden sich membranverankerte und sezernierte Proteine und Peptide, kleine lipophile Moleküle (z. B. Steroidhormone und Schilddrüsenhormone), kleine hydrophile Moleküle (z. B. Adrenalin), Gase (z. B. Stickstoffmonoxid) oder auch physikalische Stimuli (z. B. Licht). Die Rezeptor-Liganden-Interaktion ist von hoher Spezifität und Affinität. Die Zahl der Rezeptoren pro Zelle ist mit 2000 bis 20.000 relativ gering. Dies wird aber durch eine massive Signalamplifikation der mehrstufigen Signaltransduktionskaskade kompensiert, in der ein hierarchisch übergeordnetes Molekül zahlreiche stromabwärts gelegene Moleküle aktivieren kann. Signaltransduktionswege werden gewöhnlich nach einem prominenten Vertreter entweder eines beteiligten Liganden (z. B TGF-β), eines Rezeptors bzw. rezeptorassoziierten Proteins (z. B. G-Protein) oder eines intrazellulären Signaltransduktors (NF-κB) benannt. Am Ende der Signaltransduktionskaskade stehen zwei wesentliche zelluläre Antworten: 1. eine Änderung in der Aktivität oder Funktion spezifischer präexistenter Moleküle oder 2. eine Änderung in der Menge spezifischer zellulär produzierter Proteine, üblicherweise als Resultat einer Modifikation von Transkriptionsfaktoren, die zu einer Aktivierung oder Modifikation der Transkriptionsrate führen. Im Allgemeinen ist die erstbeschriebene Reaktion die schnellere, da auf bereits synthetisierte Proteine Einfluss genommen wird. Die größte Gruppe von Oberflächenrezeptoren sind G-Protein-gekoppelte Rezeptoren (GPCR). Viele Hormone, wie Adrenalin, Glukagon oder Serotonin, sind GPCR-Liganden. GPCRs haben sieben transmembranöse Domänen und interagieren mit einigen ihrer zytosolischen Domänen mit trimeren G-Proteinen, die unter Umwandlung von GDP in GTP einen ebenfalls transmembranös gelegenen Effektor aktivieren. Der klassische Effektor ist die Adenylat-Cyclase, die dann zyklisches AMP (cAMP), einen sog. Second Messenger aktiviert. GPCRs können auch Ionenkanäle aktivieren. Sehr wichtig ist auch die Inaktivierung des GPCR-Signalweges durch Hydrolyse des GTP zu GDP. Das Choleratoxin z. B. verändert das G-Protein dergestalt, dass gebundenes GTP nicht mehr zu GDP inaktiviert werden kann, so dass die entsprechende Signalkaskade dauerhaft aktiviert ist. Dies führt im Falle der Cholera zu einer andauernden Sekretion von Wasser und Elektrolyten in das Darmlumen und verursacht massive Durchfälle.

1.1

Über einen ähnlichen Mechanismus führt das Toxin des Keuchhustenerregers Bordetella pertussis zu erhöhten cAMP Spiegeln in den Epithelien des Respirationstrakts mit der Folge von Flüssigkeits- und Elektrolytverlust. GPCRs können über G-Proteine und GTP auch die Durchlässigkeit von Ionenkanälen beeinflussen, was bei so unterschiedlichen Mechanismen wie der Herzmuskelkontraktion oder der Lichterkennung in der Netzhaut von Bedeutung ist. Letzterer Mechanismus kann interessanterweise durch spezielle Inhibitormoleküle, die in die Signaltransduktion eingreifen (Arrestine), modifiziert werden, was uns die Adaptation an unterschiedlich helle Lichtbedingungen ermöglicht. Ein weiteres wichtiges Effektorprotein der GPCRs ist die Phospholipase C mit ihrem Second Messenger Inositoltriphosphat (IP3). Dieses System beeinflusst maßgeblich die Blutdruckregulation: Der Ligand Acetylcholin aktiviert GPCRs auf Gefäßendothelien, die über Phospholipase C, IP3 und verschiedene weitere Schritte Stickstoffmonoxid (NO) synthetisieren. NO diffundiert in die benachbarten glatten Muskelzellen und setzt seinerseits als intrazellulärer Ligand eine Signalkaskade in Gang, die zur Erschlaffung der Gefäßmuskulatur und somit sekundär zur Blutdrucksenkung führt. Wie oben erwähnt kann eine Rezeptor-LigandenInteraktion auch zur Aktivierung von Transkriptionsfaktoren führen, was längerfristige Effekte auf das Transkriptom hat. So wird z. B. die GPCR-vermittelte Aktivierung der sog. MAP-Kinase-Kaskade mit konsekutiver Aktivierung von proliferationsinduzierenden Transkriptionsfaktoren für die Herzhypertrophie nach dauerhafter Adrenalinbehandlung verantwortlich gemacht. Eine weitere große Gruppe von Rezeptoren sind die Rezeptor-Tyrosinkinasen (RTK). RTKs sind vor allem in Proliferation und Wachstum aktiv und werden durch Liganden wie den epidermalen Wachstumsfaktor (EGF), den Nervenwachstumsfaktor (NGF), den Fibroblastenwachstumsfaktor (FGF) und auch Insulin aktiviert. RTKs haben große Bedeutung bei der Krebsentstehung. Anders als bei den GPCRs geht deren Aktivierung mit einer aktivierenden Phosphorylierung der zytosolisch gelegenen Aminosäuren des Rezeptors nach Ligandenbindung und Dimerisierung von RTK-Monomeren einher. Die Phosphorylierung erfolgt durch die intrinsische Tyrosinkinaseaktivität des Rezeptors selbst (Autophosphorylierung). Es folgt dann eine Bindung an Adaptorproteine und membranständige Proteine mit GTPaseAktivität. Ein solches ist Ras, ein membranverankertes Protein, welches wie die G-Proteine mit gebundenem GTP im aktiven Zustand ist. Ras kann auch durch den RTKs eng verwandte Rezeptoren, die Zytokinrezeptoren, aktiviert werden. Alle RTKs, die meisten Zytokinrezeptoren und einige GPCRs aktivieren eine Kinase-Kaskade, die in höheren Eukaryonten in mehreren eng verwand-

14

Sektion 1 · Allgemeine Grundlagen

ten Formen zu finden ist und nach dem zentralen Enzym als MAP-Kinase-Signalweg bezeichnet wird: Vereinfacht dargestellt führt die Aktivierung von Ras zunächst im Zytosol zu einer sequenziellen Phosphorylierung von Raf, MEK und MAP-Kinase. Diese aktivierte MAP Kinase dimerisiert und transloziert in den Zellkern. Dort werden dann zwei Transkriptionsfaktoren, TCF und SRF, phosphoryliert und aktiviert, was zu ihrer Assoziation in einem trimeren Komplex führt und zur Transkription verschiedener Gene führt. Die beispielhafte Aufzählung einiger Rezeptortypen und deren mögliche Interaktionen verdeutlichen die Komplexität des zellulären Signaltransduktionssystems. Diese Komplexität wird noch dadurch erhöht, dass auch zwischen verschiedenen Zelltypen in einem Organismus gravierende Unterschiede hinsichtlich Einflussnahme und Redundanz der Signalwegskomponenten existieren. Dies bedeutet, dass die Aktivierung eines spezifischen Rezeptors in Zelltyp A nicht dieselben biologischen Effekte induzieren muss wie in Zelltyp B. Kommunikation und Adhäsion Eine besondere Form interzellulärer Kommunikation ist die Zell-Zell-Adhäsion. Je nach Art der beteiligten Moleküle ist die Komponente der Strukturgebung oder die des Informationsaustauschs stärker ausgeprägt (> Abb. 1.1.2). Zelladhäsionsmoleküle können homotypisch (zwischen gleichen Molekülen) oder heterotypisch (zwischen verschiedenen Molekülen) interagieren. Mehrere Adhäsionsmolekülfamilien sind bekannt: Die Cadherine konstituieren die Adherens junctions, welche bandförmig auf der Zellmembran verlaufen und insbesondere epitheliale Zellen verbinden sowie mit Bestandteilen von Desmosomen, die äußerst stabile Kontakt- und Klebepunkte zwischen Zellen herstellen. An der zytoplasmatischen Seite der transmembranös gelegenen Cadherine bindet eine Vielzahl von intrazellulären Molekülen, die teils zum Zytoskelett gehören und die adhäsive strukturgebende Funktion intrazellulär fortsetzen, teils aber auch bedeutende kommunikative Aufgaben wahrnehmen. So wird z. B. über die Interaktion bestimmter Cadherine mit dem intrazellulären β-Catenin-Protein, welches in die Zellproliferation eingreift, eine Beziehung zwischen Adhäsion und Zellteilung hergestellt. Eine weitere große Gruppe unter den Adhäsionsmolekülen sind die Integrine, die neben einigen Zell-Zell-Interaktionen viele Zell-Matrix-Interaktionen ausbilden. Es handelt sich um aus zwei verschiedenen Untereinheiten aufgebaute (heterodimere) Proteinkomplexe, die vor allem mit Molekülen der extrazellulären Matrix wie Fibronektin oder Laminin interagieren. Die kommunikative Funktion der Integrine betrifft Signalwege, die in Prozesse wie Zelladhäsion, Zelltod und Zellproliferation eingreifen. Ein angeborener Defekt z. B. im β2-Integrin führt zu einer unzureichenden

Adhäsion von Leukozyten an Gefäßwänden, ungenügendem Einwandern aus den Gefäßen in das Gewebe und damit zu erhöhter Infektanfälligkeit. Eine dritte Gruppe von Zelladhäsionsmolekülen ist die Immunglobulinfamilie (Ig-CAMs). Zu den IgCAMs gehören die Junktions-Adhäsionsmoleküle (JAMs), die zusammen mit den Occludinen und Claudinen die Tight junctions bilden, welche Zellzwischenräume abdichten und so unkontrollierten parazellulären Stofftransport verhindern. Weitere IgCAMs sind neurale Adäsionsmoleküle (NCAMs) und interzelluläre Adhäsionsmoleküle (ICAMs). Letztere sind zusammen mit Molekülen der vierten großen Gruppe, den Selektinen, für die Migration von Leukozyten in die Gewebe verantwortlich. Eine ganz besondere Form interzellulärer Kommunikation wird durch Gap junctions vermittelt. Diese sind aus vielen Connexin-Molekülen aufgebaute transmembranöse Kanäle, die das Zytoplasma benachbarter Zellen direkt verbinden und kleine Moleküle und Ionen passieren lassen. Unterschiedliche Connexintypen führen zu selektiver Permeabilität der Kanäle, sodass zelltypabhängig eine ganz unterschiedliche metabolische oder elektrische Kopplung von Zellen aufgebaut werden kann. Störungen der Zellkommunikation sind sehr häufig an der Entstehung von Erkrankungen beteiligt. So ist die Dysregulation von Rezeptoren und Liganden, und somit eine veränderte Signaltransduktion/Genexpression bei fast allen menschlichen Erkrankungen nachweisbar, wobei diese Veränderung nicht immer die Ursache der Erkrankung ist. Ein Beispiel für direkte Zusammenhänge zwischen defekter Kommunikation und Krankheit ist der Metastasierungsprozess bei Tumorerkrankungen. Zahlreiche Studien konnten zeigen, dass die Metastasierung einiger Tumorzellarten mit der Expression von E-Cadherin korreliert. Je weniger E-Cadherin vorhanden ist, desto eher kann sich die entartete Zelle aus dem Zellverband lösen und an andere Stellen des Körpers gelangen. Eine Schwächung der E-Cadherin-vermittelten Zell-Zell-Interaktion scheint somit den Vorgang der Metastasierung zu unterstützen (> Tabelle 1.1.1).

1.1.3 Zelluläre Prozesse Diese Prozesse setzen sich aus einem oder mehreren der einzelnen subzellulären Prozesse (7 Abschnitt 1.1.2) der Zelle zusammen (> Abb. 1.1.3). So ist für jeden der zellulären Prozesse die Energiegewinnung von zentraler Bedeutung. Im Gegensatz dazu ist für die Migration der Vorgang der Replikation primär von untergeordneter Relevanz. Die zellulären Prozesse greifen also in unterschiedlichem Maße auf die subzellulären Prozesse der Zelle zurück.

15 1.1 · Molekulare klinische Zellbiologie

1.1

. Abb. 1.1.3. Schematische Darstellung zentraler zellulärer Prozesse. Eine eukaryote Zelle kann innerhalb gewisser Grenzen auf exogene Stimuli reagieren und somit ein konstantes „Existenzmilieu“ schaffen (Homöostase). Entsprechende Reize können jedoch dazu

führen, dass die Zelle sich teilt (Proliferation), bewegt (Migration), stirbt (Apoptose) oder Sonderfunktionen im Zellverband bzw. Organismus ausübt (Differenzierung; ausführliche Erläuterungen 7 Text)

1.1.3.1 Zelluläre Homöostase

fische Funktionen ausgeübt (G0/G1-Phase), die Replikation durchgeführt (Synthese-Phase, S-Phase) und der eigentliche Zellteilungsprozess vorbereitet (G2-Phase). Dieser Teilungsprozess (Mitose) unterteilt sich in Prophase [Kondensation der Chromosomen, Ausbildung der bipolaren Mitosespindel], Prometaphase [Auflösung der Kernhülle; ausgehend von den Polkörperchen (Centriolen) werden die Chromosomen an definierten Stellen (Kinetochor) durch Mikrotubulifasern kontaktiert], Metaphase [Anordnung der Chromosomen in einer Ebene (Metaphaseplatte)], Anaphase [durch Kürzung der Mikrotubulifasern werden die Chromosomen zu beiden Polen gezogen (Chromosomen-Segregation)], Telophase [Kinetochorfasern lösen sich auf, und eine neue Kernhülle entsteht] und Zytokinese [die Membran in der Mitte der Zelle schnürt sich ein (Teilungsfurche), bis zwei Tochterzellen mit je einem Zellkern entstanden sind]. Die Geschwindigkeit, mit welcher der Zellzyklus durchlaufen werden kann, variiert von 30 Minuten (im Froschembryo) bis hin zu mehreren Monaten in Geweben mit geringer Proliferationsrate (z. B. adulte Leber). Das Durchschreiten der Interphase und der Eintritt in die Mitose werden unter anderem durch Zykline und „zyklinabhängige Kinasen“ (cdks) reguliert. Zu bestimmten Zeitpunkten innerhalb des Zellzyklus interagieren definierte Zykline und Cdks, um ihrerseits weitere Proteine zu aktivieren. Eine der bekanntesten Zielstrukturen für dieses System ist das Retinoblastom- (Rb-)Protein, welches den Übergang aus der G1-Phase in die S-Phase kontrolliert. Die Phosphorylierung von Rb-Protein führt

Eine eukaryote Zelle ist kein statisches System. Unablässig werden Substanzen synthetisiert und abgebaut. Diese dynamischen Vorgänge auf subzellulärer Ebene sind aber in einem Gleichgewicht, d. h., sie führen nicht notwendigerweise zu mikroskopisch fassbaren Zustandsänderungen auf zellulärer Ebene. Die Zelle erscheint also statisch, ohne es tatsächlich zu sein. So kann sie ökonomisch auf wechselnde Reize und Umweltstimuli reagieren.

1.1.3.2 Proliferation (Zellteilung/Zellzyklus) Die Zellen eines Organismus entstehen durch fortwährende Zellteilung. Diese findet auch dann noch statt, wenn das Größenwachstum des Individuums beendet ist. Ständige Regeneration (z. B. während der Haut-, Wundheilung) und Zellersatz sind Charakteristika höherer Organismen. Von entscheidender Bedeutung für die Erhaltung eines multizellulären Systems ist jedoch, dass die Vermehrung von Gewebe (Proliferation) strikt kontrolliert wird. Zellteilung muss zu einem definierten Zeitpunkt beginnen (z. B. nach Stimulierung durch Zytokine) und wieder enden (z. B. Wegfall des Stimulus). Dabei müssen die sich im Rahmen der Replikation verdoppelten Chromosomen gleichmäßig auf neu entstehende Tochterzellen verteilen. Eine sich teilende Zelle durchläuft verschiedene, gut charakterisierte Stadien. Den größten Teil der Zeit verbringt sie in der Interphase; hier werden zelltypspezi-

16

Sektion 1 · Allgemeine Grundlagen

zur Freisetzung von TFs (E2F-Familienmitglieder), welche wiederum die Expression von Genen induzieren, die ein Fortschreiten des Zellzyklus ermöglichen (z. B. weitere Zykline und DNA-Polymerasen). Es ist erwähnenswert, dass einige Zellen die Fähigkeit besitzen, sich unendlich oft zu teilen (Stammzellen), während deren Abkömmlinge nur eine definierte Anzahl an Teilungen durchlaufen können.

1.1.3.3 Zelltod (Apoptose/Nekrose) Ein Organismus kann nur existieren, wenn zu bestimmten Zeitpunkten in der Entwicklung definierte Zellgruppen absterben. Ebenso ist es notwendig, dass geschädigte und maligne transformierte Zellen aus dem Körper entfernt werden. Dieser Prozess des programmierten Zelltods ist die Apoptose. Zytologisch ist Apoptose durch eine Volumenabnahme der Zelle und des Zellkerns, den Verlust der Zell-Zell-Interaktion, eine Blasenbildung an der Zellmembran und die Fragmentierung des genetischen Materials charakterisiert. Die Induktion der Apoptose kann sowohl durch exogene Faktoren (z. B. die Familie der Todesrezeptoren, „extrinsic pathway“) oder aber durch endogene Faktoren erfolgen (z. B. durch Aktivierung des Proteins p53 nach DNA-Schädigungen, „intrinsic pathway“). Der Prozess der Apoptose ist hoch komplex, stark vernetzt und, aufgrund seiner essenziellen Bedeutung für die einzelne Zelle, strikt reguliert. Sehr vereinfacht dargestellt treten im Falle der rezeptorvermittelten Apoptose durch Bindung von Zytokinen (z. B. „tumor necrosis factor“, TNF) an die entsprechenden Rezeptoren (z. B. TNF-Rezeptor) Konformationsänderungen in den zytoplasmatischen Domänen der Rezeptoren auf. An diese „death domains“ binden dann weitere Adapter-Proteine (TRADD und FADD), aber auch die Procaspase-8, welche durch proteolytische Spaltung in die aktive Caspase-8 überführt wird. Caspase-8 wird auch als Initiator-Caspase bezeichnet, da sie weitere Procaspasen (z. B. Procaspase-3) durch Spaltung aktiviert. Diese Effektor-Caspasen besitzen vorwiegend Substrate, deren Abbau direkt oder indirekt die strukturelle Integrität einer Zelle destabilisieren (z. B. DNA-Reparaturenzyme). Endogene Stimuli (z. B. oxidativer Stress) verändern das Verhältnis von Bcl-2-Familienmitgliedern in der mitochondrialen Membran. In dieser Familie gibt es proapoptotische (z. B. Bax, Bad) und antiapoptotische (z. B. Bcl-xL, Bcl-w) Mitglieder. Entsprechend ihrer Mengenverhältnisse in der Membran regulieren diese Faktoren die Freisetzung von z. B. Cytochrom C (Cyt-C) aus dem Intermembranraum der Mitochondrien. Cyt-C, Apaf-1 und ATP bilden zusammen das Apoptosom,

welches Procaspasen (Effektor-Caspasen) aktiviert. Letztendlich führen sowohl endogene als auch exogene Faktoren dazu, dass die Zielzelle zerstört wird. Von der physiologisch „beabsichtigten“ Apoptose zu trennen ist der Vorgang der Nekrose, welcher den Tod einer Zelle durch eine nicht kompensierbare Schädigung der Homöostase bezeichnet. Hierbei sind es vor allem Gifte, Hypoxie (Sauerstoffarmut), Hypothermie und Krankheitserreger, die zu einer Zerstörung der Zelle führen. Die Folge ist anders als bei der Apoptose eine Entzündungsreaktion in der betroffenen Gewebsregion.

1.1.3.4 Positionierung (Adhäsion/Migration) Die Funktion einer Zelle ist maßgeblich von ihrer Positionierung innerhalb des Mikromilieus abhängig. Wenn sich einzelne Zellen zu großen Funktionseinheiten organisieren, bilden sich Gewebe und Organe. Hier sind es sowohl die Zell-Zell-Kontakte als auch die Zell-Matrix-Kontakte, welche unter anderem die Struktur und Funktion des entsprechenden Gewebes definieren. So sind es z. B. die Tight junctions, die im Wesentlichen für die Aufrechterhaltung der Barrierefunktion von Epithelien verantwortlich sind. Ein Transport durch diese Barriere kann nur aktiv, d. h. unter Energieverbrauch, stattfinden. Positionsänderungen der Zellen sind in diesem Fall nicht erwünscht bzw. kontraproduktiv, da nur die kontrollierte Aufnahme von Nährstoffen durch das Darmepithel eine Kontamination des Körpers mit toxischen Substanzen verhindert. Im Gegensatz dazu sind andere Zellpopulationen (z. B. immunkompetente Zellen wie neutrophile Granulozyten) sehr an hoher Mobilität interessiert, da sie im Organismus ständig nach Pathogenen (hervorgerufen durch z. B. Bakterieninfektionen) suchen. Normalerweise bewegen sich die Neutrophilen im Blutstrom ohne distinkten Zellkontakt; erst auf stimulierten Endothelzellen (z. B. nach Infektion) werden Selektine exprimiert, die eine transiente Adhäsion des Leukozyten ermöglichen. Diese „rollen“ dann unter Verwendung von Integrin-Kontakten über die Gefäßwand, um an der richtigen Stelle in das geschädigte Gewebe einzudringen. Erst hier beginnen die Neutrophilen mit der Bekämpfung von Pathogenen. Ein interessantes Beispiel für wechselnde Anforderungen hinsichtlich der Positionierung einer Zelle stellt die kutane Wundheilung dar. Normalerweise bilden Hautzellen der Epidermis (Keratinozyten) eine Barrierefunktionen gegen exogene Noxen. Wird diese Barriere im Falle einer Verwundung jedoch durchbrochen, muss in kurzer Zeit ein neuer Schutzwall gegen Pathogene

17 1.1 · Molekulare klinische Zellbiologie

geschaffen werden. Hierfür ist es notwendig, dass sich die relativ fest verankerten Keratinozyten lösen (z. B. aus desmosomalen Verbindungen) und durch die Neoexpression von Oberflächenmolekülen (z. B. Integrine, die mit Fibronektin interagieren) ihre Mobilität wiedergewinnen. Gleichzeitig formen sich im Zytoplasma der Keratinozyten kontraktile Elemente (Aktin), welche eine gerichtete Bewegung der Zelle in das Wundmilieu hinein erlauben (Migration). Ist die Wunde geschlossen, verlieren die Keratinozyten ihre Fähigkeit zur Migration und tragen somit zur Ausbildung einer neuen Epidermis bei.

1.1.3.5 Spezialfunktionen und Funktionsdifferenzierung Während der Embryogenese entstehen aus totipotenten Zellen alle für den Organismus relevanten Zellarten (über 200 Typen). Diese unterscheiden sich jedoch hinsichtlich ihres Aufbaus und ihrer Funktion maßgeblich voneinander. Dies bedeutet, dass im Rahmen der Entwicklung einzelner Gewebe und Organe Differenzierungsprozesse vollzogen werden müssen. Ebenso werden ständig neue Zellen aus den pluripotenten Stammzellen eines Organismus heraus generiert, um den Verlust von Zellen innerhalb eines Gewebes zu kompensieren. Diese Spezialisierungsprozesse spiegeln sich im Expressionsprofil (mRNA und Protein) und in der Morphologie der differenzierten Zellen wider. Auf molekularer Ebene sind es vor allem die unterschiedlichsten Kombinationen regulatorischer Elemente (z. B. TFs), welche im Verlauf von Zellteilungsprozessen hin zur differenzierten Zelle die dauerhafte Existenz verschiedener Zelltypen hervorrufen. Ein gutes Beispiel für Differenzierungsprozesse stellen abermals die Keratinozyten der Epidermis dar. Aus Stammzellen entstehen die sog. transient amplifizierenden Keratinozyten des Stratum basale (der untersten Schicht in der Epidermis) mit eingeschränktem Teilungspotential. Nach einer definierten Anzahl an Zellteilungen verlassen die Keratinozyten die Basalschicht und „wandern“ durch die „suprabasalen“ Schichten (Stratum spinosum, Stratum granulosum und Stratum corneum). Im Rahmen dieses Differenzierungsprozesses ändert sich die Expression zahlreicher zellulärer Filamente (z. B. Zytokeratin-1 und Zytokeratin-10 werden ab dem Stratum spinosum exprimiert) und die Morphologie (Stachelzelle, Körnerzelle, Hornzelle). Die Turnover-Zeit vom Stratum basale bis hin zum Stratum corneum beträgt 4–5 Wochen. Letztendlich schilfern abgestorbene Zellen von der Hautoberfläche ab, und müssen durch sich differenzierende Zellen der tiefer gelegenen Epidermisschichten ersetzt werden.

1.1

1.1.4 Ausblick Die molekulare Zellbiologie hat sich zu einer sehr wichtigen medizinischen Basiswissenschaft entwickelt. Als eine der entscheidenden Disziplinen zum Verständnis und zur Weiterentwicklung der medikamentösen Therapie spielt sie in Diagnostik und Prävention eine zentrale Rolle. Naturwissenschaftliche Erkenntnis bedarf adäquater Methodik, und methodische Neuerungen waren es, die der molekularen Zellbiologie in den letzten 30 Jahren die bedeutenden Durchbrüche ermöglicht haben. Im Wesentlichen sind es gentechnische und biochemische Methoden gewesen, die uns bis etwa zur Jahrtausendwende halfen, die grundlegenden subzellulären Mechanismen zu entschlüsseln. Auch wenn die Anzahl der großen zellulären Neuentdeckungen langsam zurückgeht: Überraschungen und revolutionäre Neuentdeckungen sind in der Molekularbiologie immer noch möglich, wie zuletzt an der Entdeckung der Rolle natürlicherweise vorkommender microRNAs (miRNA) in Säugetierzellen und ihrer bahnbrechenden methodischen Nutzung in Form von small interfering RNAs (siRNAs) gezeigt wurde (Methode: RNA-Interferenz). Unter den noch bestehenden großen aktuellen Themen ist der Einfluss der Chromatinstruktur auf die Transkriptionskontrolle (Methode: Chromatinimmunpräzipitation) zu nennen, die dreidimensionale Auflösung größerer Multiproteinkomplexe (Methode: Massenspektrometrie) und die Messung von Proteininteraktionen in lebenden Zellen (Methode: Fluoreszenz-Energietransfer). Ein weiteres zukunftsträchtiges Forschungsgebiet ist die Stammzellbiologie. Die wichtigsten diesbezüglichen molekularen Fragen sind die nach den essenziellen Proteinen für die Stammzellfunktion und die Zellliniendeterminierung sowie die nach den Mechanismen des Stammzelltodes. Auch im Bereich der zellbiologischen Grundlagenforschung sind es vor allem die komplexen und weiterreichenden Beziehungen (Netzwerke), die noch am wenigsten erforscht sind. Hierzu gehört insbesondere die Thematik der Einordnung der Zelle in ihrem dreidimensionalen bzw. multizellulären Kontext. Eine Pionierrolle nimmt hierbei die Neurobiologie ein, da hier die Zell-Zell-Kommunikation natürlicherweise zentraler Forschungsgegenstand sein muss. Aber auch in der Krebsforschung ist nach der weitgehenden Entschlüsselung der zellulären Mechanismen von Zellteilung und Zelltod zunehmend die interzelluläre Kommunikation Gegenstand der Forschung, um herauszufinden, wie Krebszellen von ihrer Umgebung bekämpft werden oder aber diese für ihre Zwecke rekrutieren. Trotz des großen Wissenszuwachses der zurückliegenden Jahre sind die Herausforderungen aber nicht geringer geworden. Die Tatsache allein, dass wir von den

18

Sektion 1 · Allgemeine Grundlagen

grundlegenden subzellulären Mechanismen ein grobes Bild haben, bringt uns letztlich noch nicht zu einer molekularen Medizin. Dies wird daran deutlich, dass erst in den letzten Jahren Medikamente auf den Markt gekommen sind, die rational nach molekularen Erkenntnissen entwickelt wurden. Um zu einer flächendeckenden molekularen Medizin zu kommen, brauchen wir erstens eine wesentlich höhere Detailkenntnis, als wir sie derzeit haben, und wir müssen zweitens dem hohen Vernetzungsgrad subzellulärer Prozesse Rechnung tragen. Um die notwendige Detailkenntnis zu erweitern, sind letztlich Arbeiten auf der Ebene von Einzelmechanismen und der fein verästelten molekularen Prozesse notwendig. Dabei gilt es, kaum bekannte Gene in ihrer Funktion zu bestimmen (grob geschätzt noch etwa die Hälfte aller Gene). Wir werden aber auch nicht um die Knochenarbeit herumkommen, auch Gene, die schon „ancharakterisiert“ wurden oder deren wichtigste Vertreter bereits funktionell bekannt sind, in immer wieder neuen Zusammenhängen zu beschreiben. Erst ein wirklich umfassendes Verständnis auf molekularer Ebene kann nebenwirkungsarme und auf die spezifische Erkrankung und vielleicht sogar das spezifische Individuum ausgerichtete Medikamente hervorbringen. Neben der Fortsetzung der Arbeiten mit etablierter Methodik werden es auch erneut methodische Weiterentwicklungen sein, die uns näher zu einer medizinischen Umsetzung molekularer Erkenntnisse führen. Zu den wohl bedeutendsten methodischen Neuerungen gehören die Array-Technologien, die Datenmengen in bis dato nicht gekannter Größenordnung produzieren. Am etabliertesten sind DNA/RNA-Arrays, welche das Expressionsprofil in großem Maßstab darstellen können. Das Pendant auf Proteinebene sind Proteinarrays. Eine andere Form der Array-Technologie wird auch angewandt, um Hunderte von Gewebsproben gleichzeitig zu analysieren (sog. Tissue Arrays). Um diese Datenmengen adäquat nutzen zu können, sind bioinformatische Werkzeuge notwendig. Wenn es gelingt, die generierten Datenmengen zellbiologisch auszuwerten und nicht nur wie bisher einen verschwindend geringen Teil davon, könnte man dem Ziel einer umfassenden und detaillierten Darstellung der subzellulären Mechanismen schnell näher kommen. Bioinformatische Methoden sind v. a. auch nötig, um der zweiten großen Herausforderung zu begegnen, der Darstellung subzellulärer Prozesse in ihrem hoch komplexen regulatorischen Netzwerk. Ziel muss die Erstellung eines umfassenden Beziehungsnetzwerkes molekularer Prozesse sein, wie es z. B. für den Stoffwechsel in den illustrativen „Biochemical Pathways“ (Boehringer) der 1980er Jahre angedeutet wurde. Das Problem scheint nicht bei den Kapazitäten aufseiten der EDV zu liegen, aber es fehlt noch an intelligenten Strategien, wie die Datenmengen in die zu generierenden Netzwerke ein-

zubinden sind. Somit braucht es Köpfe mit einem informatischen wie auch biologischen Grundverständnis, oder aber entsprechende enge Kooperationen der Disziplinen. Es gibt durchaus bereits vielversprechende Ansätze in dieser Richtung, aber noch sind es die Wissenschaftler selbst, die in großer Zahl Literatur auswerten, manuell vernetzen und in Programme einspeisen. Die immensen Datenmengen, die z. B. von Array-Technologien generiert werden, können aber nicht mehr manuell ausgewertet werden. Damit der Großteil dieser Daten nicht verloren geht, sind groß angelegte intelligente bioinformatische Lösungen gefragt. Noch komplexer wird die Situation, wenn wir uns vor Augen halten, dass in der herkömmlichen molekularbiologischen Forschung quantitative Überlegungen kaum eine Rolle spielen. Die zehnfache Induktion eines Gens wird gewöhnlich als bedeutsamer erachtet als die zweifache Regulation, aber welche der beiden nun im jeweiligen zellbiologischen Kontext wirklich relevant ist, kann meist nur empirisch geprüft werden. Hier greift eine Disziplin an, die im Allgemeinen Systembiologie genannt wird. Hier versuchen Mathematiker zusammen mit Biologen, biologische Prozesse mathematisch zu modellieren und zu quantifizieren. Die Modelle werden experimentell überprüft, überarbeitet und erneut geprüft. Aus diesem Wechselspiel, so die Hoffnung, ergeben sich dann Modelle, die prädiktiven Charakter haben und im Idealfall der experimentellen Überprüfung letztlich nicht mehr bedürfen. Die molekulare Zellbiologie hat als zentrale medizinische Grundlagenwissenschaft zum Verständnis humanbiologischer Zusammenhänge extrem viel geleistet. Die Umsetzung ihrer Erkenntnisse in die medizinische Therapie wird die Medizin aber nach allgemeiner Einschätzung revolutionieren.

1.1.5 Literatur Alberts B, Johnson A, Lewis J, Raff M, Roberts K, Walter P (eds) (2002) Molecular Biology of the Cell, 4th edn. Garland Science Publishing, New York Böcker W, Denk H, Heitz Ph. U (eds) (2004). Pathologie, 3. Aufl. Urban & Fischer, München Karp G (2005) Cell and Molecular Biology, 4th edn. John Wiley & Sons, New York KumarV, Abbas AK, Fausto N (eds) (2005) Robbins and Cotran: Pathologic basis of disease, 7th edn. Elsevier Saunders, Philadelphia Lodish et al. (eds) (2004) Molecular Cell Biology, 5th edn. Freeman and company, New York

19 1.1 · Molekulare klinische Zellbiologie

1.1.6 Zeittafel Die angegebenen Zitate beziehen sich nur auf die Zeittafel. 1833

R. Brown

Beschreibung des Zellkerns in Epidermiszellen von Pflanzen

1839

T. Schwann, M. J. Schleiden

Entwicklung der Zelltheorie als kleinste lebende Einheit eines Organismus

1855

R. Virchow

Das Zellteilungsprinzip wird beschrieben; Theorie der Cellular-Pathologie

1857

A. v. Kölliker

Beschreibung von Mitochondrien in Muskelzellen

1882

W. Flemming

Bezeichnung des Kernmaterials in der Interphase als Chromatin; Flemming prägt auch den Begriff„Mitose“.

1898

C. Golgi

Beschreibung des Golgi-Apparats in Nervenzellen

1923

T. S. Painter

Der diploide Satz von Chromosomen wird beschrieben.

1933

T. H. Morgan

Nobelpreis für Entdeckungen zur Bedeutung von Chromosomen als Träger von Erbinformation

1934

T. O. Caspersson, E. Hammersten

Beschreibung der DNA als polymeres Makromolekül

1944

O. T. Avery, C. M. MacLeod, M. McCarty

Identifizierung der DNA als Träger der Erbinformationen

1951

E. Chargaff

Die Chargaff-Regel beschreibt, dass die Basen A:T und C:G in gleichen Verhältnissen existieren.

1953

J. D. Watson, F. H. C. Crick

Modell für die Doppelhelixstruktur der DNA

1961

M. W. Nirenberg

Entschlüsselung des genetischen Codes

1962

F. H. C. Crick, J. D. Watson, M. H. F. Wilkins

Nobelpreis für die Beschreibung der Molekularstruktur der DNA

1963

C. de Duve

Lysosomen werden beschrieben.

1964

R. B. Setlow, W. L. Carrier

Beschreibung der Excisionsreparatur von DNA

1968

R. W. Holley, H. G. Khorana, M. W. Nirenberg

Nobelpreis für die Interpretation des genetischen Codes und dessen Funktion in der Proteinbiosynthese

1972

S. J. Singer, G. L. Nicholson

Entwicklung des Flüssig-Mosaik Modell einer Biomembran

1972

J. F. Kerr, A. H. Wyllie, A. R. Currie

Definition des Begriffs„Apoptose“

1974

A. Claude, G. E. Palade, C. de Duve

Nobelpreis für Untersuchungen zur strukturellen und funktionellen Organisation der Zelle

1988

D. C. Wallace et al.

Beschreibung einer Krankheit, die durch Mutationen in mtDNA verursacht wird

1990

E. R. Fearon, B. Vogelstein

Mehrschrittmodell der Karzinogenese (am Beispiel des Kolonkarzinoms)

1992

E. H. Fischer, E. G. Krebs

Nobelpreis für die Entdeckung der Steuerungsmechanismen des Stoffwechsels

1994

A. Goodman Gilmann, M. Rodbell

Nobelpreis für die Entdeckung der Zellkommunikation (speziell G-Proteine)

1995

E. B. Lewis, C. Nüsslein-Volhard, E. F. Wieschaus

Nobelpreis für Erkenntnisse über die genetische Kontrolle der frühen Embryoentwicklung

1997

S. B. Prusiner

Nobelpreis für die Beschreibung der Prionen

1999

G. Blobel

Nobelpreis für die Entdeckung der Signale, welche Transport und Lokalisation in der Zelle steuern

2000

A. Carlsson, P. Greengard, E. R. Kandel

Nobelpreis für die Entdeckung zur Signalübertragung im Nervensystem

2001

L. H. Hartwell, R. T. Hunt, P. M. Nurse

Nobelpreis für die Analyse von Schlüsselregulatoren im Zellzyklus

2001

J. C. Venter, M. D. Adams, E. W. Myers et al.

Entschlüsselung des gesamten menschlichen Genoms

1.1

20

Sektion 1 · Allgemeine Grundlagen

Literatur zur Zeittafel Avery OT, MacLeod CM, McCarty M (9944) Studies on the chemical nature of the substance inducing transformation of pneumococcal types. J Exp Med 79: 137–158 Brockhaus Nobelpreise Brown R (1833) Trans. Linn. Soc., London, I6: 685–745 Chargaff E (1951) Structure and function of nucleic acids as cell constituents. Fed Proc 10:654–659 de Duve C (1963) The lysosome. Am Sci 208: 64–72 Fearon ER, Vogelstein B (1990) A genetic model for colorectal tumorigenesis. Cell 61: 759-767 Flemming W (1882) Zellsubstanz, Kern und Zelltheilung. Leipzig, Verlag von F. C. W. Vogel; 424 Kerr JF, Wyllie AH, Currie AR. (1972) Apoptosis: a basic biological phenomenon with wide-ranging implications in tissue kinetics. Br J Cancer 26: 239–257 Nirenberg MW, Matthaei JH (1961) The dependence of cell-free protein synthesis in E. coli upon naturally occurring or synthetic polyribonucleotides. Proc Natl Acad Sci U S A 47: 1588–602 Painter TS (1923) Studies in mammalian spermatogenesis, II. The spermatogenesis of man. J. Exp. Zool. 37: 291–321

Schleiden MJ (1838) Beiträge zur Phytogenesis. Arch Anat Physiol Wiss Med 5: 137–176 Schwann T (1839) Mikroskopische Untersuchungen über die Übereinstimmung in der Struktur und dem Wachstum der Tiere und Pflanzen. Sander, Berlin Setlow RB, Carrier WL (1964) The disappearance of thymine dimers from DNA: an error-correcting mechanism. Proc Natl Acad Sci USA 51: 226–231 Singer SJ, Nicholson GL (1972) The fluid mosaic model of the structure of cell membranes. Science 175: 720–731 Venter JC, Adams MD, Myers EW et al., (2001) The sequence of the human genome. Science 291: 1304–51 Wallace DC, Singh G, Lott MT, Hodge JA, Schurr TG, Lezza AMS, Elsas LJ II, et al (1988) Mitochondrial DNA mutation associated with Leber‘s hereditary optic neuropathy. Science 242: 1427– 1430 Watson JD, Crick FHC (1953) Molecular structure of nucleic acids: a structure of deoxyribose nucleic acids. Nature 171: 737–738

1.2 1.2 Molekulare Mechanismen von Zell-Zell-Wechselwirkungen Thomas Brümmendorf

1.2.1

Bedeutung zellulärer Wechselwirkungen – 22

1.2.2

Zelladhäsionsmoleküle

1.2.2.1 1.2.2.2 1.2.2.3 1.2.2.4

Cadherine – 23 Integrine – 25 Proteine der Immunglobulin-Superfamilie (IgSF) – 28 Selektine und die Rekrutierung von Leukozyten – 33

1.2.3

Connexine und die Gap junctions – 34

1.2.4

Claudine, Occludin und Tight junctions – 35

1.2.5

Ausblick

– 36

1.2.6

Literatur

– 36

1.2.7

Zeittafel

– 39

Literatur zur Zeittafel

– 22

– 40

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

22

Sektion 1 · Allgemeine Grundlagen

1.2.1 Bedeutung zellulärer Wechselwirkungen Molekulare Mechanismen für spezifische Wechselwirkungen zwischen Zellen entstanden schon früh in der Evolution, beim Übergang von einzelligen zu vielzelligen Eukaryonten. Während der Embryonalentwicklung der Wirbeltiere spielen Zell-Zell-Wechselwirkungen in der Histogenese und Organogenese eine Rolle, im adulten Organismus stabilisieren sie das ausdifferenzierte Gewebe. Viele zelluläre Interaktionen in der Ontogenese sind überwiegend dynamisch, dagegen sind die meisten ZellZell-Wechselwirkungen im adulten Gewebe weitgehend statisch. Viele Zellen des Immunsystems gehen besonders dynamische, teilweise kurzlebige, zelluläre Interaktionen ein (Alberts et al. 1994; Karp 1999; Lodish et al. 2000; Wolpert et al. 1999). In der Embryonalentwicklung sind Zelladhäsionsprozesse schon bei der Kompaktion des Embryos und später bei allen morphogenetischen Prozessen beteiligt. Zellen interagieren hierbei einerseits mit anderen Zellen, andererseits mit Komponenten der Extrazellulärmatrix (ECM). Ersteres spielt beispielsweise bei der Faltung von Zellverbänden oder bei der Reaggregation wandernder Zellen zu Zielstrukturen eine Rolle, letzteres bei der Zellwanderung oder beim axonalen Wachstum in der Entwicklung des Nervensystems. Im adulten Organismus sind die meisten Zellen in stabile Gewebeverbände integriert, aus denen wiederum die Organe aufgebaut sind. Verschiedene Gewebe unterscheiden sich dabei im Hinblick auf die relative Bedeutung direkter Zell-Zell-Interaktionen im Vergleich zu Zell-Matrix-Wechselwirkungen. Im Bindegewebe mit seinem hohen Anteil an ECM überwiegen Zell-MatrixInteraktionen, und die mechanische Gewebeintegrität basiert hier überwiegend auf der Matrix, zum Beispiel auf den Kollagenfasern. Im Gegensatz dazu überwiegen im Epithelgewebe die direkten Zell-Zell-Wechselwirkungen, und die ECM ist auf die Basallamina beschränkt. Die mechanische Stabilität beruht hier unter anderem auf Zytoskelettnetzwerken, die über sog. Verankerungsverbindungen („anchoring junctions“) mit gleichartigen Netzwerken in Nachbarzellen verbunden sind (> Abb. 1.2.1). Im Epithelgewebe kennt man zwei Arten solcher intrazellulären Verankerungsverbindungen: die mit Aktinfilamenten assoziierten Adherens junctions und die mit Intermediärfilamenten assoziierten Desmosomen. Neben diesen Verankerungsverbindungen finden sich in Epithelzellen zwei weitere Arten von ZellZell-Kontaktstrukturen, die Tight junctions und die Gap junctions (> Abb. 1.2.1). Die meisten Zellen des Immunsystems sind beweglich und interagieren dynamisch mit anderen Zellen. Solche Wechselwirkungen sind für ihre Funktion von

. Abb. 1.2.1. Zellkontaktstrukturen einer Epithelzelle des Dünndarms. Zu Details 7 Text. Aus: Molecular Cell Biology, H. Lodish et al., Copyright 2000, W.H.Freeman and Company, New York. Mit Erlaubnis des Verlags

zentraler Bedeutung, beispielsweise für die Erkennung virusinfizierter Zellen durch zytotoxische T-Zellen, für die Aktivierung von Helfer-T-Zellen durch antigenpräsentierende Zellen, für die Aktivierung von B-Zellen durch Helfer-T-Zellen oder für die Transmigration von Leukozyten durch das Kapillarendothel. Viele der genannten Prozesse werden von Molekülen auf Zelloberflächen vermittelt, die als Zelladhäsionsproteine bezeichnet werden. In diesem Kapitel werden gut charakterisierte Familien solcher Proteine, sowie Proteine der Tight junctions und Gap junctions beschrieben.

1.2.2 Zelladhäsionsmoleküle Die meisten Zelladhäsionsmoleküle sind membranständige Glykoproteine, die aufgrund ihrer Primärstruktur (Aminosäuresequenz) in Proteinfamilien eingeteilt werden. Einen Schwerpunkt dieses Kapitels bilden: x Die Cadherin-Superfamilie (> Abb. 1.2.2b) x Die Integrine-Superfamilie (> Abb. 1.2.2d) x Die Immunglobulin-Superfamilie (> Abb. 1.2.2a) x Die Familie der Selektine (> Abb. 1.2.2c) Daneben gibt es weitere Adhäsionsmoleküle auf Zelloberflächen, die aufgrund ihrer Kohlenhydratanteile klassifiziert werden können. Hierzu zählen beispielsweise die membranständigen Proteoglykane (> Abb. 1.2.2e) und die Sialomuzine (> Abb. 1.2.2f), auf die hier nicht näher eingegangen werden kann. Die meisten Zelladhäsionsproteine haben eine einzige Transmembrandomäne und eine Typ I-Topologie, d. h., sie haben einen zytoplasmatischen Carboxy-

23 1.2 · Molekulare Mechanismen von Zell-Zell-Wechselwirkungen

terminus und einen extrazellulären Aminoterminus (> Abb. 1.2.2g). Membranproteine vom Typ II, die einen intrazellulären Aminoterminus haben, sind wesentlich seltener (> Abb. 1.2.2h). Sogenannte polytopische Adhäsionsproteine haben mehrere Transmembrandomänen (> Abb. 1.2.2k,l). Viele Zelloberflächenproteine sind über einen posttranslational angebrachten Glykosylphosphatidylinositol-Rest (GPI-Rest) in der Zellmembran verankert (> Abb. 1.2.2j). Proteine der Cadherin- und Immunglobulin-Superfamilie sowie die Selektine haben einen erkennbar modularen Aufbau, d. h., sie sind im extrazellulären Abschnitt aus Ketten einzelner Proteindomänen aufgebaut (> Abb. 1.2.2a–c). Cadherine enthalten in der Regel mehrere Domänen des gleichen Typs, sog. Cadherin-typische Domänen. Bei der Immunglobulin-Superfamilie variiert die Zahl der Domänen von Protein zu Protein stark, und es kommen häufig Kombinationen mit ganz anderen Domänentypen vor. Die Integrine sind Heterodimere aus zwei Untereinheiten, die ebenfalls modular aufgebaut sind und repetitive Strukturen enthalten. Wenn zwei gleichartige Moleküle aneinander binden, spricht man von homophiler Interaktion (> Abb. 1.2.2m,p). Bei einer heterophilen Wechselwirkung interagieren unterschiedliche Proteine miteinander (> Abb. 1.2.2n,o). Eine Wechselwirkung von Proteinen auf gegenüberliegenden Zellmembranen wird als trans-Interaktion bezeichnet (> Abb. 1.2.2m,n), bei einer cis-Wechselwirkung dagegen interagieren sie in der gleichen Membran (> Abb. 1.2.2o,p). Ein typisches Beispiel transinteragierender homophiler Adhäsionsproteine sind die Cadherine, die unter anderem an der Aggregation gleichartiger Zellen in der Histogenese beteiligt sind. Heterophile trans-Interaktionen finden sich häufig im Immunsystem, beispielsweise bei der Interaktion des B7-Proteins auf B-Zellen mit dem CD28-Protein auf T-Zellen. Homophile cis-Interaktionen gibt es beispielsweise beim P0-Protein, einem Hauptbestandteil des Myelins im peripheren Nervensystem. Die genannten Interaktionen sind relativ dynamisch, d. h., die beteiligten Proteine sind auch als Monomere stabil, und es liegt ein Gleichgewicht zwischen Monomer und Di- bzw. Oligomer vor. Hiervon zu unterscheiden sind konstitutive Rezeptorkomplexe, deren Untereinheiten als Monomere weitgehend instabil sind. Hierzu zählen die Integrine, die als Heterodimere aus zwei Untereinheiten bestehen. Andere Zell-Zell-Wechselwirkungen (> Abb. 1.2.2q) werden über zwischengeschaltete Linkerproteine vermittelt (Alberts et al. 1994; Karp 1999; Lodish et al. 2000). In den folgenden Abschnitten wird im Einzelnen auf die oben angesprochenen Familien von Zelladhäsionsproteinen eingegangen. Dabei wurden aus jeder Familie solche Proteine für eine eingehende Beschreibung aus-

1.2

. Abb. 1.2.2. MerkmalevonZelladhäsionsmolekülen.Zelladhäsionsmoleküle werden aufgrund struktureller Merkmale (A–F) klassifiziert, können unterschiedlich in der Zellmembran (Doppellinie) verankert sein (G–L) und auf verschiedene Weise miteinander interagieren (M–Q). Für Details 7Text

gewählt, die entweder in einen auf molekularer Ebene im Ansatz verstandenen Krankheitsprozess involviert sind, deren Tertiärstruktur aufgeklärt wurde oder die geeignet sind, allgemeingültige Prinzipien der Zelladhäsion zu erläutern.

1.2.2.1 Cadherine Die Proteine dieser Superfamilie bilden eine große Gruppe von mehr als 80 Zelladhäsionsmolekülen. Sie befinden sich auf den meisten Zelltypen, wobei einzelne dieser Proteine oft spezifische Expressionsmuster im Gewebe zeigen. Die Expression der Cadherine wird im Verlauf der Entwicklung des Organismus dynamisch reguliert. Sie interagieren überwiegend homophil, d. h., ein Cadherin eines bestimmten Typs bindet präferenziell an ein Cadherin des gleichen Typs. Diese Eigenschaften sind die Grundlage dafür, dass Cadherine während der Entwicklung des Organismus an morphogenetischen Prozessen beteiligt sind. Dazu zählen Aggregations- und Umordnungsprozesse von Zellen oder das axonale Wachstum in der Entwicklung des Nervensystems.

24

Sektion 1 · Allgemeine Grundlagen

Im Verlauf der Histogenese, mit zunehmender Stabilisierung von Zell-Zell-Wechselwirkungen, tragen Cadherine dann auch zur stabilen Verankerung von Zellen untereinander bei (> Abb. 1.2.1), beispielsweise an den Adherens junctions und in den Desmosomen der Epithelgewebe. Im Zentralnervensystem finden sich Cadherine auch im Bereich von Synapsen, die als eine spezialisierte Variante von Adherens junctions interpretiert werden können. Die meisten Proteine der Cadherin-Superfamilie sind Zellmembranproteine vom Typ I (> Abb. 1.2.2g) und lassen sich aufgrund struktureller Merkmale in mehrere Subgruppen einteilen, die „klassischen“ Cadherine (>25 Vertreter), die desmosomalen Cadherine (6 Vertreter), die Protocadherine (>60 Vertreter) und die atypischen Cadherine. Der zytoplasmatische Abschnitt divergiert von Subgruppe zu Subgruppe, was zu unterschiedlichen intrazellulären Wechselwirkungen führt (Gumbiner 2005; Takeichi u. Abe 2005; Wolpert et al. 1999). „Klassische“ Cadherine Zu dieser Subgruppe zählen unter anderem E-Cadherin (uvomorulin, „epitheliales Cadherin“), sowie N-, M-, P- und R-Cadherin. Da die Eigenschaften des E-Cadherins am besten untersucht sind, beziehen sich die meisten der folgenden Aussagen auf dieses Protein. Die aminoterminale Domäne der „klassischen“ Cadherine trägt maßgeblich zu deren Bindungsspezifität bei. Daher wurde die Tertiärstruktur dieser Domäne aufge-

b

klärt, und zwar für N-Cadherin und E-Cadherin. Cadherintypische Domänen bestehen aus 7 E-Strängen, die zwei in der Art eines Sandwichs angeordnete E-Faltblätter bilden (> Abb. 1.2.3a). Diese Domänen sind daher ähnlich aufgebaut wie Immunglobulindomänen. Ein Charakteristikum der Cadherine sind ihre calciumabhängigen homophilen trans-Interaktionen (> Abb. 1.2.2m). Daneben können sie auch homophile cis-Interaktionen eingehen, wobei zwei Moleküle parallel und lateral miteinander interagieren (> Abb. 1.2.3b) und dabei eine durch Calciumionen stabilisierte X-förmige Anordnung (> Abb. 1.2.3c) ihrer beiden aminoproximalen Domänen ausbilden (> Abb. 1.2.3d,e). Vieles spricht dafür, dass die Ausbildung dieses cis-Homodimers eine Voraussetzung für die trans-Interaktion zwischen benachbarten Zellen ist. Klassische Cadherine wie E-Cadherin bilden in der Zellmembran vieler Zelltypen spezialisierte Multiproteinkomplexe aus, die als Adherens junctions bezeichnet werden (> Abb. 1.2.1). Man geht davon aus, dass Kontraktionen dieser Aktinfilamente im Zusammenwirken mit transzellulären Wechselwirkungen der beteiligten Cadherine an Faltungsprozessen von Epithelien in der Embryonalentwicklung beteiligt sind. Ein Sequenzabschnitt am Carboyxterminus von E-Cadherin enthält eine Bindungsstelle für E-Catenin, ein Vertreter der Armadillo-Proteinfamilie. Dieses wiederum interagiert mit dem strukturell nicht verwandten D-Catenin, welches die Verbindung zum Aktinzytoskelett herstellt. Experimentell konnte gezeigt werden, dass

d

a

c e

. Abb. 1.2.3a–e. Struktur und Interaktionen der Cadherine. a Aminoterminale Domäne des N-Cadherin. Der Aminoterminus der Domäne ist mit „N“ markiert, E-Stränge sind als grüne Pfeile wiedergegeben, und ein kurzes helikales Element ist in rot dargestellt (Shapiro et al. 1995). b Calciumionen (rot) stabilisieren die Cadherin-Struktur und begünstigen die Bildung von cis-Dimeren. c Calciumionen (rot)

in einem Komplex der beiden aminoproximalen Domänen zweier E-Cadherin-Moleküle (Pertz et al. 1999). Parallele Interaktion der beiden aminoproximalen Domänen zweier E-Cadherin-Moleküle in einem cis-Dimer, dargestellt mit Blick auf die Aminotermini d und von der Seite e. Die Domänen des einen Moleküls sind in rot und magenta, die des anderen in blau und grün dargestellt

25 1.2 · Molekulare Mechanismen von Zell-Zell-Wechselwirkungen

diese durch Catenin vermittelte Verbindung zum Zytoskelett für die Zelladhäsion wichtig ist. Dagegen ist die Bedeutung einer Vielzahl weiterer in Adherens junctions nachgewiesener oder mit dem Cadherin-Catenin-Komplex assoziierter Proteine noch wenig verstanden. Neben seiner Rolle in Adherens junctions bindet das E-Catenin an Transkriptionsfaktoren und ist am Wnt-Signaltransduktionsweg beteiligt. E-Cadherin kann als Tumorsuppressorprotein interpretiert werden. Am Ende des vielstufigen Prozesses der Onkogenese steht häufig der Verlust von Zelladhäsion, einhergehend mit invasivem Wachstum des Tumors und Metastasierung. E-Cadherin ist hierbei häufig betroffen, sowohl durch somatische Mutationen als auch durch Mutationen auf Keimbahnebene. Somatische Mutationen im E-Cadherin Gen wurden beispielsweise in Subtypen von Magen- und Mammakarzinomen gefunden, und Keimbahnmutationen können für familiäre Formen des Magenkarzinoms prädisponieren. Ein Verlust der E-Cadherin-abhängigen Zelladhäsion spielt sehr wahrscheinlich auch bei der Metastasierung von Ösophagus-, Kolon-, Prostata-, Leber-, Nieren- und Lungenkarzinomen eine Rolle. Darüber hinaus wurden in verschiedenen Karzinomen, darunter Kolon-, Magen- und Prostatakarzinomen, auch Mutationen in intrazellulären Interaktionspartnern des E-Cadherin, wie E-Catenin, gefunden (Brembeck et al. 2006; Hajra u. Fearon 2002; Nelson u. Nusse 2004; Pertz et al. 1999; Shapiro et al. 1995; Troyanovsky 2005). Desmosomale Cadherine Sechs Vertreter der Cadherine finden sich überwiegend in Desmosomen, genannt Desmoglein-1, -2 und -3 sowie Desmocollin-1, -2 und -3. Die Desmosomen (Maculae adhaerentes) sind scheibenförmige Zellkontaktstrukturen (Durchmesser bis 100 nm), die in verschiedenen Zelltypen vorkommen. Desmosomen einer Zelle interagieren mit gegenüberliegenden Desmosomen der Nachbarzellen, vermittelt über trans-Interaktionen der Desmocolline und Desmogleine, die ihrerseits in desmosomalen Plaques intrazellulär verankert sind (> Abb. 1.2.1). Dort befinden sich unter anderem die Proteine Plakoglobin, ein Vertreter der Armadillo-Genfamilie, und Desmoplakin, ein Vertreter der Plakin-Genfamilie. Mit dem desmosomalen Plaque sind Intermediärfilamente verbunden, wodurch eine mechanische Kopplung des Zytoskeletts benachbarter Zellen erreicht und der Gewebeverband stabilisiert wird. Autoantikörper gegen Desmoglein-1 führen zum Pemphigus foliaceus, Autoantikörper gegen Desmoglein-3 zum Pemphigus vulgaris – beides Krankheitsbilder, bei denen die epidermale Zell-Zell-Adhäsion beeinträchtigt ist. Mutationen im Desmoglein und im Desmoplakin wurden mit einer Form von Palmoplantarkerato-

1.2

se in Zusammenhang gebracht, der Keratosis palmoplantaris striata (Cheng et al. 2005; Johnson u. Takeichi 1999; Karp 1999; Küster 2000; Lodish et al. 2000). Protocadherine und „atypische“ Cadherine Die mehr als 60, ursprünglich im Zentralnervensystem identifizierten Protocadherine haben eine für Zelladhäsionsmoleküle ungewöhnliche Genorganisation, ähnlich der von Antikörpergenen und T-Zell-Rezeptor-Genen. Dies führt dazu, dass variable extrazelluläre Bereiche mit konstanten zytoplasmatischen Bereichen kombiniert werden können. Eine Subgruppe der Protocadherine, die auch als „cadherin-related neuronal receptors“ (CNRs) bezeichnet wurde, wird in verschiedenen Subpopulationen von Neuronen exprimiert und wurde mit der Funktion von Synapsen in Zusammenhang gebracht (Takeichi u. Abe 2005; Yagi 2003).

1.2.2.2 Integrine Die Integrine bilden eine Familie heterodimerer Transmembranproteine, die als zelluläre Rezeptoren für Komponenten der extrazellulären Matrix fungieren, aber auch an direkten Zell-Zell-Kontakten beteiligt sein können. Integrinabhängige Wechselwirkungen von Zellen kontrollieren eine Vielzahl zellulärer Prozesse, wie Zellproliferation, Zelldifferenzierung, Zellwanderung und Apoptose. Integrinabhängige zelluläre Wechselwirkungen sind während der Embryonalentwicklung an dynamischen Prozessen wie zum Beispiel der Wanderung von Mesodermzellen oder der Wanderung von Neuralleistenzellen beteiligt. Im adulten Organismus tragen sie zur Stabilisierung des ausdifferenzierten Gewebeverbands bei, z. B. bei der Anhaftung von Epithelzellen an die darunterliegende Basalmembran (> Abb. 1.2.1). Auch bei sehr dynamischen Zell-Zell-Interaktionen wie der Adhäsion von Thrombozyten an die Gefäßwand und ihrer Aggregation im Zusammenhang mit der Blutgerinnung ist ein Integrin beteiligt (Alberts et al. 1994; Hemler 1999; Karp 1999; Lodish et al. 2000; Wolpert et al. 1999). Integrine bestehen aus zwei Untereinheiten, genannt D-Kette und E-Kette (> Abb. 1.2.2d). Bisher wurden 18 D-Ketten und 8 E-Ketten beschrieben, die 24 unterschiedliche Heterodimere ausbilden können (> Abb. 1.2.4). Die aminoproximale Hälfte der D-Ketten enthält sieben sog. E-Propellermotive, die bei einem Teil der DKetten von einem zusätzlichen Abschnitt, genannt I-Domäne (> Abb. 1.2.5a,b) unterbrochen sind. In der aminoproximalen Hälfte aller E-Ketten befindet sich eine konservierte Region mit Ähnlichkeit zur I-Domäne. Die Propellerdomäne der D-Ketten bildet gemeinsam mit der I-ähnlichen Domäne der E-Ketten die Ligandenbin-

26

Sektion 1 · Allgemeine Grundlagen

dungsstelle (Xiong et al. 2001). Integrine können komplexe Konformationsänderungen vollziehen, die eine Aktivierung oder Inaktivierung dieser Rezeptoren erlauben, da sie einen starken Einfluss auf Ligandeninteraktionen haben (ffrench-Constant u. Colognato 2004; Hynes 2002; Shimaoka u. Springer 2003). Fokale Adhäsionen („focal adhesions“/„focal contacts“) sind Multiproteinkomplexe, die eine Verbindung zwischen Aktinfilamenten und der ECM herstellen und an Signaltransduktionsprozessen beteiligt sind. Sie enthalten neben Integrinen verschiedene Linkerproteine, darunter Vinculin, Filamin, D-Actinin und Talin. Letzteres bildet antiparallel orientierte Homodimere aus, die an die zytoplasmatische Domäne der E-Ketten bestimmter Integrine binden und eine Verbindung zu Aktinfilamenten herstellen. Außerdem interagiert es mit der „focal adhesion kinase“ (FAK), eine hochkonservierte Nichtrezeptor-Proteintyrosinkinase, die mit der Regulation der Zellmigration, der Zellproliferation, des Turnovers von fokalen Adhäsionen und mit dem Transfer zelladhäsionsabhängiger antiapoptotischer Signale in Zusammenhang gebracht wurde. Analysen FAK-defizienter Mäuse, die im Lauf der Embryonalentwicklung sterben, bestätigen eine zentrale Bedeutung dieser Kinase. Ein weiteres wichtiges Protein im Zusammenhang mit fokalen Adhäsionen ist das Protein Rho, ein Vertreter einer Gruppe kleiner Guanosintriphosphatasen, die unter anderem die Struktur verschiedener Spezialisierungen des Aktinzytoskeletts regulieren. Während Rho an der Regulation fokaler Adhäsionen beteiligt ist, beeinflusst das Rho-verwandte Cdc42 die Entstehung von Filopodien und das Protein Rac die Entstehung von Lamellipodien (Brakebusch u. Fässler 2003; Grashoff et al. 2004; Hannigan et al. 2005; Miranti u. Brugge 2002; van der Flier u. Sonnenberg 2001). Im Folgenden wird auf solche Integrine beispielhaft eingegangen, die entweder einen Phänotyp in MausKnockout-Modellen zeigen und/oder für die eine Krank-

. Abb. 1.2.4. Integrine: funktionelle Vielfalt durch Kombinatorik. Schematische und vereinfachte Darstellung der strukturellen Vielfalt der Integrine (Hemler 1999). I-Domäne: rot, E-Propellermotife: grün, I-Domänen-ähnlicher Bereich: orange, Cystein-reiche Regionen: blau,

heitsassoziation nachgewiesen wurde. Dabei wurde weitgehend die von Hemler vorgeschlagene Subgruppeneinteilung übernommen (Hemler 1999). Die Kollagenrezeptoren α1β1, α2β1, α10β1 und α11β1 Die Integrine dieser Subgruppe (> Abb. 1.2.4a) sind in erster Linie Rezeptoren für verschiedene Kollagene. Das Integrin DE (CD49a/CD29) spielt eine Rolle bei der Entstehung des Knorpels und wurde – im Mausmodell – mit Osteoarthritis in Zusammenhang gebracht. Das Integrin DE (CD49b/CD29) findet sich vorwiegend auf Thrombozyten und ist am Prozess der Hämostase beteiligt, indem es an Kollagen bindet, das bei Verletzungen der Gefäßwand exponiert wird (White et al. 2004; Zemmyo et al. 2003). Die Lamininrezeptoren α3β1, α6β1 und α7β1 Die in vielen Geweben verbreiteten Integrine DE (CD49c/CD29), DE (CD49e/CD29) und DE sind in erster Linie Rezeptoren für Laminin (> Abb. 1.2.4b). Analysen entsprechender Knockout-Mäuse sprechen dafür, dass DE für die Entwicklung der Epidermis und DE für die Gehirnhistogenese wichtig ist. Die Bindung des Muskelfaser-Integrins DE an das Laminin der Basallamina spielt bei der Muskelfunktion eine Rolle. Daher werden Mutationen im Gen der D-Kette dieses Integrins mit einer vererblichen Form von Muskelschwäche in Zusammenhang gebracht. Auch Mutationen in einem Liganden, nämlich der Laminin-D-Kette, führen zu einer Form vererblicher Muskelschwäche (ffrench-Constant u. Colognato 2004; Hemler 1999; Hynes 2002; van der Flier u. Sonnenberg 2001; Wehrle-Haller u. Imhof 2003). Integrin α6β4 und die Hemidesmosomen Auch das Integrin DE (CD49e/CD104) ist ein Lamininrezeptor, und es ist ein zentraler Bestandteil des

FNIII-Domänen: gelb. Bindungsstellen für Ca2+/Mg2+ sind als Punkte, Cysteinbrücken als Klammern und die Zellmembran als Doppellinie dargestellt

27 1.2 · Molekulare Mechanismen von Zell-Zell-Wechselwirkungen

Hemidesmosoms. Diese subzellulären Strukturen verankern Epithelzellen auf der darunterliegenden Basalmembran, indem sie eine Verbindung zu Keratinfilamenten des Zytoskeletts herstellen (> Abb. 1.2.1). Der ungewöhnlich lange intrazelluläre Bereich des Integrins (> Abb. 1.2.4c) interagiert dabei mit Komponenten des hemidesmosomalen Plaques und der extrazelluläre Abschnitt des Integrins mit Laminin-5 in der Basalmembran. Dementsprechend fehlen die Hemidesmosomen bei E4-defizienten Mäusen, was zu einer Ablösung der Epithelzellen von der Basalmembran führt. Mäuse mit genetisch inaktivierter D6-Untereinheit zeigen ähnliche Symptome, wie z. B. ausgeprägte Blasenbildung der Haut, und sterben etwa zum Zeitpunkt der Geburt. Beim Menschen wurde eine Korrelation der DE-Expression mit der Prognose bestimmter Karzinome nachgewiesen. Neben dem Integrin DE enthalten die Hemidesmosomen ein weiteres prominentes Transmembranprotein, genannt BP180 (bullöses Pemphigoid-Antigen-2). Die Basalmembran ist im Bereich des Hemidesmosoms über Fibrillen aus Kollagen VII mit der darunterliegenden Dermis verbunden. Der zytoplasmatische Plaque des Hemidesmosoms, in dem Keratinfilamente verankert sind, enthält u. a. Proteine der Plakin-Genfamilie, beispielsweise das BP230 (bullöses PemphigoidAntigen-1) und das Plektin. Eine Reihe von Autoimmunkrankheiten sind auf Autoantikörper gegen BP180, BP230, Laminin-5 oder Kollagen VII zurückzuführen. Mutationen in den Genen für Plektin oder Laminin-5Untereinheiten führen zu Formen der Epidermolysis bullosa (ffrench-Constant u. Colognato 2004; Guo u. Giancotti 2004; Hynes 2002; Janes u. Watt 2006; Küster 2000; van der Flier u. Sonnenberg 2001; Watt 2002; Wehrle-Haller u. Imhof 2003). Die Leukozytenintegrine αLβ2, αMβ2, αXβ2 und αDβ2 Die E-Integrine (> Abb. 1.2.4d) kommen nur auf Leukozyten vor. Integrin DLE wird auch als LFA-1 (CD11a/ CD18) bezeichnet, DME2 als Mac-1 (CD11b/CD18), DXE als CD11c/CD18 und DDE als CD11d/CD18. Während DLE von fast allen Leukozyten exprimiert wird, sind die anderen auf Subpopulationen beschränkt. Die E-Integrine vermitteln die Wechselwirkung von Leukozyten mit Endotheloberflächen und sind an deren transendothelialer Wanderung in das umgebende Gewebe beteiligt. Dabei binden sie an endotheliale Vertreter der IgSF, und zwar über die in den α-Ketten enthaltene I-Domäne (> Abb. 1.2.5a,b). Das weitverbreitete DLE spielt eine wichtige Rolle bei der T-Zell-abhängigen Zytotoxizität und bei der T-Zell/B-Zell-Interaktion im Kontext der Antikörperproduktion. Mäuse mit inaktiviertem E-Gen, denen also alle E-Integrine auf Leukozyten fehlen, zeigen De-

a

1.2

b

c

. Abb. 1.2.5a–c. Die I-Domäne der Integrine. Die I-Domäne der D-Kette des Leukozytenintegrins DME2 (Lee et al. 1995). Dargestellt ist die mit dem Liganden interagierende Seite a sowie eine seitliche Ansicht b. Das für die Ligandenbindung wichtige Magnesiumion ist blau dargestellt, die D-Helices rot und die E-Stränge grün. c Bindung der I-Domäne des DLE2-Integrins (rechts) an die aminoterminale Domäne des ICAM-1 (links). Das vom Integrin gebundene zweiwertige Kation (grauer Punkt) stabilisiert die Struktur (Bella et al. 1998). Mit Erlaubnis der National Academy of Sciences, USA

fekte im Adhäsionsverhalten von Leukozyten und eine beeinträchtigte Infektabwehr. Beim Menschen führen Mutationen im Gen der E-Kette zum Typ I der „leukocyte adhesion deficiency“ (LAD-I), einer seltenen autosomal-rezessiven Erbkrankheit, bei der eine verminderte Einwanderung von Leukozyten in entzündetes Gewebe vorliegt, einhergehend mit beeinträchtigter Infektabwehr. Die Mutationen können die Stabilität der E-Kette, die Assoziation der D- und E-Ketten oder die Ligandeninteraktionen des Integrins beeinträchtigen (ffrench-Constant u. Colognato 2004; Hemler 1999; Hogg et al. 2002; Hynes 2002; van der Flier u. Sonnenberg 2001; Weber 2003; Wehrle-Haller u. Imhof 2003). Die α4-Integrine und das αEβ7 Die Integrine DEE (CD49d/CD29), DE und DE (> Abb. 1.2.4e–g) finden sich überwiegend auf Leukozyten und teilweise auch auf nichthämatopoetischen Zellen. Die D-Integrine sind, ebenso wie die E-Integrine, an der Leukozyteninteraktion mit Kapillarendothel beteiligt, beispielsweise bei der Rekrutierung in Entzündungsgebiet. Das Integrin DE bindet dabei an das VCAM-1, ein endotheliales Mitglied der IgSF. Die Analyse von D-defizienten Mäusen legt jedoch nahe, dass DE auch für Funktionen nichthämatopoetischer Zel-

28

Sektion 1 · Allgemeine Grundlagen

len wichtig ist, da eine Deletion von D zu Herzentwicklungsstörungen führt und letal ist. Das zweite D-Integrin, nämlich DE, trägt zur Lokalisierung von Lymphozyten in Peyersche Plaques bei, durch Bindung an das dort exprimierte MAdCAM-1. Im Einklang damit haben D-defiziente Mäuse eine verminderte T-ZellLokalisierung in Peyersche Plaques, und E-defiziente Mäuse zeigen eine Verkleinerung der Peyerschen Plaques. Integrin DEE findet sich auf der Mehrzahl der intraepithelialen Lymphozyten und vermittelt deren Wechselwirkung mit Epithelzellen. Daher haben Knockout-Mäuse, denen die DE-Kette oder die E-Kette fehlt, eine reduzierte Zahl intraepithelialer Lymphozyten (ffrench-Constant u. Colognato 2004; Hemler 1999; Hynes 2002; Rice et al. 2005; Rose et al. 2002; van der Flier u. Sonnenberg 2001; Weber 2003). Die Integrine α5β1, α8β1 und αVβ1 Die Integrine DE (CD49e/CD29), DE und DVE (CD51/CD29) bilden eine Fibronektin bindende Subgruppe mit nahe verwandten D-Ketten (> Abb. 1.2.4k). Neben Fibronektin werden teilweise auch andere modular aufgebaute Komponenten der extrazellulären Matrix erkannt, wie Tenascin und Vitronektin. Knockout-Mäuse, denen die D- oder die DV-Kette fehlen, sterben in utero und haben unter anderem Gefäßdefekte. Analysen D-defizienter Mäuse sprechen dafür, das dieses Integrin u. a. an induktiven Wechselwirkungen zwischen Epithelund Mesenchymgewebe während der Histogenese der Nieren beteiligt ist und zur Entwicklung mechanosensorischer Haarzellen im Innenohr beiträgt (ffrench-Constant u. Colognato 2004; Hemler 1999; Hynes 2002; Littlewood u. Müller 2000; Müller et al. 1997; van der Flier u. Sonnenberg 2001). Integrin αIIbβ3 und die αV-Integrine Die DV-Integrine DVE (CD51/CD61), DVE, DVE und DVE sowie das Integrin DIIbE3 (GP IIb/IIIa oder CD41/CD61) bilden eine Subgruppe von Rezeptoren (> Abb. 1.2.4h,j), die überwiegend modular aufgebaute Proteine der extrazellulären Matrix erkennen, u. a. Fibronektin und Vitronektin. Während DIIbE3 weitgehend auf Thrombozyten beschränkt ist, findet sich DVE auf verschiedenen Zelltypen, darunter Makrophagen, Endothelzellen und Osteoklasten. Knockout-Mäuse, denen die E-Kette fehlt, exprimieren weder DIIbE3 noch DVE. Sie haben Defekte in der Hämostase und können daher als Modell für die Erbkrankheit GlanzmannThrombasthenie (s. u.) dienen. Bei Knockout-Mäusen, denen die DV-Kette fehlt und die daher über keines der fünf DV-Integrine verfügen, treten Plazentamissbildungen auf, und sie sterben größtenteils in utero. Beim Menschen wird eine Beteiligung von DVE bei der Proliferation des Glioblastoms diskutiert (ffrench-Constant

u. Colognato 2004; Guo u. Giancotti 2004; Hemler 1999; Hynes 2002; van der Flier u. Sonnenberg 2001). Das Integrin DIIbE3 (> Abb. 1.2.4h) ist der Thrombozytenrezeptor für Fibrinogen sowie den v.-Willebrand-Faktor und spielt eine zentrale Rolle bei der Hämostase. Thrombozyten haben einen weiteren Rezeptor für den v.-Willebrand-Faktor, nämlich den Glykoproteinkomplex GPIb-IX-V, der strukturell nicht mit Integrinen verwandt ist. Nach einer Gewebsverletzung binden Thrombozyten zunächst über den GPIb-IX-V-Komplex an den v.-Willebrand-Faktor, der an die Gefäßwand gebunden ist. Dann wird das Integrin DIIbE3 durch eine komplexe Folge von Prozessen aktiviert, bei denen u. a. Kollagen aus der Gefäßwand beteiligt ist. Das aktivierte DIIbE3 bindet nun ebenfalls an den v.-Willebrand-Faktor und verstärkt dadurch die Bindung der Thrombozyten an die Gefäßwand. Außerdem bindet das aktivierte Integrin nun lösliches Fibrinogen und trägt dadurch indirekt zur Rekrutierung weiterer Thrombozyten bei. Die Glanzmann-Thrombasthenie ist ein relativ seltener vererblicher Blutgerinnungsdefekt, der auf Mutationen in der DIIb-Kette oder der E-Kette zurückgeführt wird. Bei Patienten mit Defekten in der E-Kette ist nicht nur die Funktion von DIIbE, sondern auch die von DvE beeinträchtigt (Clemetson 1999; Hynes 2002; Parise 1999; van der Flier u. Sonnenberg 2001).

1.2.2.3 Proteine der Immunglobulin-Superfamilie (IgSF) Proteine mit mindestens einer Immunglobulin-(Ig-) Domäne werden der Immunglobulin-Superfamilie (IgSF) zugeordnet. Diese Domäne, die ursprünglich in Antikörpermolekülen entdeckt wurde, zählt zu den im Lauf der Evolution erfolgreichsten Proteindomänen (Amzel u. Poljak 1979; Williams u. Barclay 1988). Sie findet sich in mehreren hundert verschiedenen Zelloberflächenrezeptoren, in denen sie mit anderen Domänentypen kombiniert vorkommen kann > Abb. 1.2.6a). Ig-Domänen haben eine Ausdehnung von etwa 4u2,5u2,5 nm und können relativ flexibel oder weitgehend starr miteinander verknüpft sein (> Abb. 1.2.6b,c). Sie bestehen aus einer Serie von 7 oder 9 β-Strängen die in zwei E-Faltblättern angeordnet sind. Die Ig-Domänen haben also eine ähnliche Struktur wie die oben beschriebenen cadherintypischen Domänen (> Abb. 1.2.3a). Im Gegensatz zu den Cadherin-Domänen werden die meisten Ig-Domänen durch eine interne Disulfidbrücke stabilisiert. Ig-Domänen gehen intermolekulare (> Abb. 1.2.6D), aber auch intramolekulare (> Abb. 1.2.6c) Wechselwirkungen ein. Aus mehreren hundert Mitgliedern der IgSF werden hier Vertreter aus dem Nervensystem und dem Immun-

29 1.2 · Molekulare Mechanismen von Zell-Zell-Wechselwirkungen

a

b

c

1.2

d

. Abb. 1.2.6a–d. Strukturelle Vielfalt der Immunglobulin-Superfamilie (IgSF). a Proteine der IgSF können unterschiedlich viele Ig-Domänen haben (dunkle Ellipsen), kombiniert mit anderen Domänen (helle Ellipsen, lange Ellipse). Die meisten haben Transmembrandomänen, manche sind GPI-verankert (Dreiecke). b Der CD4-Corezeptor, der von T-Zell-Subpopulationen exprimiert wird und deren Interaktion mit antigenpräsentierenden Zellen unterstützt, enthält vier Ig-Domänen im extrazellulären Abschnitt, der eine längliche Form

hat (Wu et al. 1997). c Dagegen bilden die vier aminoproximalen Domänen des Axonin-1, einem an der Entwicklung des Nervensystem beteiligten Protein, eine funktionell wichtige U-förmige Domänenanordnung aus (Freigang et al. 2000). d Endotheliale Proteine der IgSF, die Leukozytenintegrine binden und dadurch Wechselwirkungen von Leukozyten mit Endothelzellen vermitteln. Eine Muzinähnliche Domäne ist als Wellenlinie dargestellt

system exemplarisch vorgestellt. Dabei wurden Beispiele ausgewählt, für die ein Zusammenhang mit Erbkrankheiten belegt und/oder anhand deren Strukturaspekte sowie die Bedeutung posttranslationaler Modifikationen erläutert werden können.

durch trägt ICAM-1 zur Adhäsion von Leukozyten an das Endothel bei und spielt so eine wichtige Rolle bei der Rekrutierung von Leukozyten, beispielsweise neutrophiler Granulozyten, in Entzündungsherde. Hierbei bindet es an E-Integrine (> Abb. 1.2.4d), vor allem an DLE2 (> Abb. 1.2.5c) und an DME2 auf der Oberfläche der Leukozyten. Analysen ICAM-1-defizienter Mäuse bestätigen eine Rolle des Proteins bei der Leukozytenwanderung. Pathophysiologisch wichtig ist, dass ICAM-1 verschiedenen Rhinoviren (>80% aller Serotypen) und Coxsackieviren als Zelloberflächenrezeptor dient. Außerdem interagiert es mit Proteinen nichtviraler Pathogene. Es bindet Erythrozyten, die mit dem Erreger der Malaria tropica (Plasmodium falciparum) infiziert sind. Dies spielt sehr wahrscheinlich eine Rolle bei deren Bindung an Gefäßendothel. Das VCAM-1 („vascular cell adhesion molecule-1“), auch CD106 genannt, erfüllt ähnliche Funktionen wie ICAM-1 indem es zur Rekrutierung von Leukozyten aus der Blutbahn in Entzündungsgebiete beiträgt. Im Gegensatz zu ICAM-1 bindet VCAM-1 aber nicht an Esondern an D-Integrine, primär an DE (> Abb. 1.2.4g), aber auch schwach an DE (> Abb. 1.2.4f). Da DE von fast allen Leukozyten, außer von neutrophilen Granulozyten, exprimiert wird, bleibt bei Patienten mit Leukozyten-Adhäsions-Defizienz Typ I, denen funktionelle E-Integrine fehlen, die Leukozytenrekrutierung teilweise erhalten. Analysen VCAM-1-defizienter Mäuse legen eine weitere Funktion der Wechselwirkung von D-Integrinen mit VCAM-1 nahe, und zwar in der Embryonalentwicklung. Beeinträchtigungen spezifischer Zell-Zell-Wechselwirkungen, an denen diese Proteine beteiligt sind, führen zu Störungen in der Histogenese der Plazenta und des Herzens. Ein kleiner Anteil dieser

Endothelzell-Rezeptoren für Leukozyten: ICAMs, VCAM-1 und MAdCAM-1 Eine Reihe von integrinbindenden Mitgliedern der IgSF (> Abb. 1.2.6d) werden auf Endothelzellen exprimiert und vermitteln die Rekrutierung von Leukozyten aus der Blutbahn ins Gewebe. Hierzu zählen x die „interzellulären Adhäsionsmoleküle“ (ICAMs), x das VCAM-1 („vascular cell adhesion molecule-1“) und x das MAdCAM-1 („mucosal adressin cell adhesion molecule-1“). Diese Rezeptoren unterscheiden sich in ihrer Ligandenbindungsspezifität: Die ICAMs binden an E-Integrine (> Abb. 1.2.4d), während VCAM-1 und MAdCAM-1 mit D-Integrinen (> Abb. 1.2.4f,g) interagieren (AfsharKharghan u. Thiagarajan 2006; Bella et al. 1998; Kakkar u. Lefer 2004; Kannagi et al. 2004; Smith et al. 2000; Wang u. Springer 1998; Weber 2003). Das ICAM-1 („intercellular adhesion molecule-1“, CD54) ist der Prototyp einer Subgruppe endothelialer integrinbindender IgSF-Rezeptoren, zu denen auch ICAM-2 (CD102), ICAM-3 (CD50) und ICAM-4 zählen. ICAM-1 wird primär von Endothelzellen, aber auch von anderen Zelltypen exprimiert. Die Expression ist auf Transkriptionsebene regulierbar und wird bei Entzündungsprozessen durch verschiedene Mediatoren, darunter TNFD, Interleukin-1 und Interferon-J induziert. Da-

30

Sektion 1 · Allgemeine Grundlagen

Tiere überlebt jedoch und zeigt, im Einklang mit der oben erwähnten Funktion bei der Leukozytenrekrutierung, eine erhöhte Zahl zirkulierender Leukozyten. Das MAdCAM-1 („mucosal addressin cell adhesion molecule-1“) wird konstitutiv von spezialisiertem Kapillarendothel exprimiert, beispielsweise in den Peyerschen Plaques. Durch Interaktion mit dem Leukozytenintegrin DE (> Abb. 1.2.4f) trägt es zur Rekrutierung von Lymphozytensubpopulationen bei. Das CD2-Protein, ein Korezeptor für T-Zell-Interaktionen Für die Funktion des Immunsystems sind spezifische und kontrollierte Zell-Zell-Kontakte essenziell, beispielsweise die Wechselwirkung des T-Zell-Rezeptors auf T-Lymphozyten mit Molekülen des MHC auf anderen Zellen. Zellen, die mit Viren infiziert sind, präsentieren an MHC-Klasse-I-Proteine gebundene virale Polypeptidfragmente auf ihrer Zelloberfläche. Sie können dann von zytotoxischen T-Lymphozyten identifiziert werden, vermittelt durch deren T-Zell-Rezeptor. Dies leitet eine komplexe Kaskade biochemischer Prozesse ein, die letztendlich zur Zytolyse der virusinfizierten Zellen führen. In vergleichbarer Weise exponieren antigenpräsentierende Zellen Antigenfragmente, in diesem Fall gebunden an MHC-Klasse-II-Moleküle, auf ihrer Oberfläche. Die antigenpräsentierenden Zellen interagieren mit Helfer-T-Zellen, die dadurch aktiviert werden und letztendlich B-Zellen zur Antikörperproduktion veranlassen oder Makrophagen stimulieren können. Solche für die Funktion des Immunsystems kritischen zellulären Wechselwirkungen der T-Lymphozyten werden von verschiedenen Zelladhäsionsmolekülen vermittelt, wie zum Beispiel dem Adhäsionsrezeptorpaar CD2 und LFA-3 (Clark u. Ledbetter 1994; Davis u. van der Merwe PA 1996; Karp 1999; Lodish et al. 2000). Das CD2 bindet an das strukturell ähnliche LFA-3 (CD58), das u. a. von antigenpräsentierenden Zellen exprimiert wird. Beide Proteine haben zwei Ig-Domänen und gehören zu einer Subgruppe strukturell verwandter Proteine der IgSF (> Abb. 1.2.7a), die mit ihren aminoterminalen Domänen interagieren. Die Kontaktoberflächen von CD2 und LFA-3 sind relativ klein, ungewöhnlich hydrophil, enthalten relativ viele geladene Aminosäureseitenketten und wenig komplementäre Oberflächenkonturen (> Abb. 1.2.7b). CD2 und LFA-3 bilden wahrscheinlich im Kontaktbereich der interagierenden Zellen dynamische Cluster aus kurzlebigen Rezeptor-Liganden-Paaren (Wang et al. 1999). Dadurch wird ein Abstand zwischen den Zellmembranen hergestellt, der optimal für die Interaktion des T-Zell-Rezeptors mit dem MHC-Molekül ist (> Abb. 1.2.7a). Schätzungen gehen davon aus, dass dadurch die Effizienz der T-Zell-Interaktionen um mindestens eine Größenord-

a

b

. Abb. 1.2.7a,b. Die Interaktion von CD2 mit LFA-3. a Eine T-Zelle (unten) wird durch Interaktion mit einer antigenpräsentierenden Zelle (oben) stimuliert. Der schwarze Punkt stellt ein Antigenfragment dar und das Dreieck einen GPI-Anker. Der T-Zell-Rezeptor ist stark vereinfacht dargestellt, ohne assoziierte Proteine. b Die aminoterminale Domäne des CD2 (grün) interagiert lateral mit der aminoterminalen Domäne des LFA-3 (gelb). Dabei interagieren negativ geladene Aminosäureseitenketten (rot) der einen Domäne mit positiv geladenen (blau) der anderen Domäne (Wang et al. 1999). Teil b mit Erlaubnis von Elsevier Science, Oxford

nung gesteigert wird. Die zytoplasmatische Domäne des CD2-Proteins wurde im Lauf der Evolution wenig verändert und ist wahrscheinlich an Signaltransduktionsprozessen in T-Lymphozyten beteiligt. Das „neurale Zelladhäsionsmolekül“ (NCAM) und die Polysialinsäure Das NCAM (CD56) ist der erste identifizierte Vertreter von Proteinen der IgSF im Nervensystem. Während der

31 1.2 · Molekulare Mechanismen von Zell-Zell-Wechselwirkungen

Embryonalentwicklung ist es an dynamischen Zell-ZellWechselwirkungen beteiligt, wie der Wanderung von Zellen oder der Faszikulation und Wegfindung wachsender Axone. Im adulten Nervensystem wird es mit der Regulation synaptischer Plastizität in Zusammenhang gebracht. NCAM vermittelt Zell-Zell-Wechselwirkungen über homophile trans-Interaktionen (> Abb. 1.2.8c). Diese Funktion des NCAM wird durch eine besondere posttranslationale Modifikation reguliert, die Polysialinsäure (PSA). Dieses negativ geladene Kohlenhydrat (> Abb. 1.2.8b) wird von zwei ähnlichen D2,8-Polysialyltransfera sen synthetisiert, und zwar spezifisch an der fünften Ig-Domäne des NCAM (> Abb. 1.2.8a). Bemerkenswert ist, dass diese Polysialylierung des NCAM im Lauf der Embryonalentwicklung stark reguliert wird, unter anderem durch die Menge an vorhandener Transferase. Da PSA stark negativ geladen ist, interagiert das „embryonale“ NCAM-PSA wesentlich schwächer homophil als das „adulte“. Dies führt dazu, dass die Wechselwirkungen

a

b

c

d

. Abb. 1.2.8a–d. NCAM und die Polysialinsäure. a Biosynthese der Polysialinsäure (PSA) an der fünften Ig-Domäne des NCAM durch die D-Polysialyltransferase (PST). Dunkle Ellipsen repräsentieren IgDomänen, helle Ellipsen FNIII-Domänen und schwarze Punkte potenzielle N-Glykosylierungsstellen. b PSA ist über N-glykosidisch verknüpfte Kohlenhydrate an das NCAM-Protein gebunden. GlcNAc: NAcetylglucosamin. c In Abwesenheit von PSA bindet NCAM (dunkle Symbole) homophil in trans-Orientierung, und die Zelloberflächen liegen nahe beieinander. Andere Zelloberflächenrezeptoren (helle Symbole) interagieren ebenfalls. d Die Synthese von PSA (graue Ellipsen) vermindert nicht nur die homophile NCAM-Interaktion, sondern interferiert indirekt auch mit den Wechselwirkungen anderer Rezeptoren (Bruses und Rutishauser 2001)

1.2

benachbarter NCAM-tragender Zelloberflächen im embryonalen Gehirn (> Abb. 1.2.8d) schwächer sind als im adulten (> Abb. 1.2.8c) was teilweise die im Vergleich zum adulten Gehirn größere strukturelle Plastizität während der Entwicklung erklären kann. Im Einklang damit findet sich NCAM-PSA im adulten Gehirn vorwiegend in Bereichen, in denen Zellwanderungen (olfaktorisches System) oder synaptische Plastizität (Hippocampus) beobachtet werden. Mäuse, deren NCAM-Gen mit genetischen Verfahren inaktiviert wurde, zeigen Defekte im Wanderungsverhalten bestimmter Zelltypen und in der Faszikulation bestimmter Axone. Außerdem haben sie eine beeinträchtigte Langzeitpotenzierung und zeigen Lerndefizite bei Orientierungstests (Bruses u. Rutishauser 2001; Doherty et al. 2000; Durbec u. Cremer 2001; Sandi 2004; Walmod et al. 2004; Zhou et al. 2003). Das Zelladhäsionsmolekül L1 und vererbliche Entwicklungsstörungen des Gehirns Das Zelladhäsionsmolekül L1 ist ein vorwiegend, aber nicht ausschließlich, im zentralen und peripheren Nervensystem exprimiertes Protein der IgSF. Es findet sich vorwiegend auf Axonen des sich entwickelnden und adulten Nervensystems, wird aber auch von Gliazellen, wie Schwann-Zellen exprimiert. Zellkulturexperimente und Analysen L1-defizienter Mäuse sprechen dafür, dass L1 an einer Vielzahl von Prozessen, die von Zell-ZellWechselwirkungen abhängen, beteiligt ist. Hierzu gehören die Wanderung von Zellen, das Auswachsen und die Faszikulation von Axonen sowie deren Interaktion mit Schwann-Zellen. Im Einklang mit der Komplexität der histogenetischen Prozesse, an denen L1 beteiligt ist, bindet es an eine Vielzahl verschiedener Interaktionspartner wie Mitglieder der IgSF, Integrine und Komponenten der extrazellulären Matrix. Mäuse, bei denen das L1-Gen inaktiviert wurde, zeigen teilweise vergrößerte Ventrikel, Hydrozephalus, Defekte des Kortikospinaltrakts und des Corpus callosum. Sie haben Schwierigkeiten, die Hinterbeine zu koordinieren, eine verminderte Schmerzsensibilität und ein beeinträchtigtes Explorationsverhalten. Die anatomischen Veränderungen der L1-defizienten Mäusen sind in Teilaspekten denen ähnlich, die bei L1-assoziierten Erbkrankheiten beim Menschen auftreten. Beim Menschen führen Mutationen im L1-Gen (Region X28 des X-Chromosoms) zu rezessiv vererblichen Gehirnmissbildungen, genannt „L1 disease“ (> Abb. 1.2.9). Diese Erbkrankheit, die mit einer Häufigkeit von 1:30.000 bei männlichen Neugeborenen auftritt, zeigt ein breites phänotypisches Spektrum, darunter Hydrozephalus (> Abb. 1.2.9d) und Missbildungen des Kortikospinaltrakts (> Abb. 1.2.9b). Die krankheitsverursachenden Mutationen können die Oberflächeneigenschaften des L1 verändern, das Protein destabilisieren

32

Sektion 1 · Allgemeine Grundlagen

a

c

b

d

. Abb. 1.2.9a–d. L1-assoziierte Erbkrankheit. Mutationen im L1 können zu Missbildungen des kortikospinalen Axontraktes führen (Kamiguchi et al. 1998, Wong et al. 1995). Der Kortikospinaltrakt (CST) ist in einem Querschnitt auf der Höhe der Medulla gut zu erkennen a. Bei einem Patienten mit einer Mutation im L1-Gen ist der Kortikospinaltrakt missgebildet b. Mit Erlaubnis von Elsevier Science, Oxford. Aufgrund der großen Variabilität der Symptome gibt es sowohl Patienten ohne Hydrozephalus c als auch Patienten mit stark ausgeprägtem Hydrozephalus d. Mit Erlaubnis von Academic Press, Orlando

oder zur Expression von Fragmenten führen. Die Symptome variieren unter Patienten mit verschiedenen Mutationen, aber auch unter verwandten Patienten mit derselben Mutation beträchtlich. Trotz dieser Variabilität besteht teilweise ein Zusammenhang zwischen der Art der Veränderungen im L1-Protein und der Art und Schwere der auftretenden Symptome. Patienten, bei denen das L1-Protein im extrazellulären Bereich vorzeitig terminiert wird, haben das höchste Risiko für Hydrozephalus (> Abb. 1.2.9d) und für schwere geistige Behinderungen sowie eine hohe Mortalität. Gegenwärtig sind die molekularen und zellbiologischen Einzelheiten der zugrunde liegenden histopathogenetischen Prozesse noch wenig erforscht. Es konnte jedoch gezeigt werden, dass krankheitsassoziierte Mutationen im L1-Protein die Wechselwirkungen mit Interaktionspartnern verändern und den Transport des Proteins an die Zelloberfläche beeinträchtigen können (Brümmendorf u. Lemmon 2001; Doherty et al. 2000; Haspel u. Grumet 2003; Itoh et al. 2004; Kamiguchi et al. 1998; Runker et al. 2003; Sandi 2004; Weller u. Gartner 2001; Wong et al. 1995). Protein P0 und das Myelin Viele Axone im zentralen und peripheren Nervensystem sind von einem mehrlagigen Membransystem umgeben, dem Myelin. Es dient der elektrischen Isolierung der Axone und erhöht ihre Reizleitungsgeschwindigkeit

(saltatorische Erregungsleitung). Das Myelin der peripheren Axone wird von spezialisierten Gliazellen gebildet, den Schwann-Zellen. In der Entwicklung des Nervensystems interagieren diese Zellen mit Axonen und bilden dabei Zytoplasmafortsätze aus, die das Axon sukzessive spiralförmig umschließen. In einem komplexen Prozess („Kompaktion“) zieht sich das Zytoplasma aus den Fortsätzen zurück, sodass letztendlich ein System aufeinanderfolgender Lamellen aus jeweils zwei Schwann-Zellmembranen entsteht. Das häufigste Protein im peripheren Myelin ist das von den Schwann-Zellen synthetisierte P0-Protein. Dieses Transmembranprotein enthält eine extrazellulär gelegene Ig-Domäne und einen basischen zytoplasmatischen Abschnitt. Die extrazellulären Ig-Domänen interagieren homophil in trans-Orientierung, und der positiv geladene intrazelluläre Abschnitt bindet an die negativ geladene zytoplasmatische Oberfläche der gegenüberliegenden Schwann-Zellmembran. Verschiedene Analysen sprechen dafür, dass vier P0-Moleküle ein Homotetramer mit einem Durchmesser von etwa 7 nm und einer großen zentralen Öffnung ausbilden (> Abb. 1.2.10a). Die P0-Tetramere einer Schwann-Zellmembran interagieren wiederum mit P0-Tetrameren (> Abb. 1.2.10b) der gegenüberliegenden Membran (> Abb. 1.2.10c). Analysen P0-defizienter Mäuse zeigen, dass diese weniger kompaktes Myelin und elektrophysiologisch nachweisbare Reizleitungsdefizite aufweisen. Beim Menschen a

b

c

. Abb. 1.2.10a–c. Interaktionen des P0-Proteins im Myelin. Modell für die Anordnung der extrazellulären Domänen des P0 im Myelin (Shapiro et al. 1996). Vier zu einer Schwann-Zellmembran gehörende P0-Moleküle bilden ein cis-Tetramer a. Tetramere einer Schwann-Zellmembran (blau) binden in trans-Orientierung an Tetramere (orange) der gegenüberliegenden Membran b,c. Mit Genehmigung von Cell Press, Cambridge (USA)

33 1.2 · Molekulare Mechanismen von Zell-Zell-Wechselwirkungen

führen Mutationen im P0-Gen zu einer Reihe vererblicher Myelinisierungsdefekte peripherer Nerven. Darunter fällt die Chromosom-1-gekoppelte Form der Charcot-Marie-Tooth-Krankheit (CMT Typ Ib), bei der eine Demyelinisierung peripherer Nerven auftritt, verbunden mit beeinträchtigter Reizleitungsgeschwindigkeit. Bei bestimmten Formen des Dejerine-Sottas-Syndroms, bei dem unter anderem auch Mutationen in P0 gefunden wurden, treten qualitativ ähnliche, aber stärker ausgeprägte Symptome auf. Ähnlich wie bei L1-assoziierten Erbkrankheiten gehen hier mehrere Krankheiten mit teilweise überlappender Symptomatik auf Mutationen in einem einzigen Gen zurück. Einige der krankheitsassoziierten Mutationen im P0-Protein stören sehr wahrscheinlich die Tetramerisierung des P0 (> Abb. 1.2.10a), andere die Interaktion der Tetramere untereinander (> Abb. 1.2.10b). Im Zentralnervensystem gehen Myelinisierungsstörungen auf andere Ursachen zurück, da das P0-Protein hier nicht vorkommt (Kandel et al. 2000; Martini et al. 1995; Shapiro et al. 1996; Shy et al. 2004; Warner et al. 1996).

1.2.2.4 Selektine und die Rekrutierung von Leukozyten Die transendotheliale Wanderung von Leukozyten ist ein für die Funktionen des Immunsystems wichtiger Prozess. T-Lymphozyten können die Blutgefäße verlassen, ins umgebende Gewebe einwandern und über das Lymphsystem wieder in das Blut zurückgeführt werden. Sie zirkulieren dabei präferenziell durch gerade den Gewebetyp, in dem sie zum ersten Mal mit Antigen konfrontiert wurden („lymphocyte homing“). Auch Monozyten und Granulozyten können Blutgefäße verlassen, und zwar spezifisch in Endothelbereichen, die durch Entzündungsprozesse aktiviert wurden. Die bemerkenswerte Spezifität, die dem „homing“ der Lymphozyten und der Einwanderung anderer Leukozyten in Entzündungsgebiete zugrunde liegt, geht auf ähnliche molekulare Mechanismen zurück. Diese Spezifität kommt durch einen obligat sequenziellen Prozess zustande, bei dem drei verschiedene Rezeptor-Liganden-Paare beteiligt sind: die Selektine und ihre Liganden, die Chemokine und ihre Rezeptoren sowie endotheliale Proteine der IgSF, die an Leukozytenintegrine binden (Afshar-Kharghan u. Thiagarajan 2006; Bunting et al. 2002; Cambien u. Wagner 2004; Kakkar u. Lefer 2004; Kannagi et al. 2004; Ley 2003; Ley u. Kansas 2004; Melchers et al. 1999; Rice et al. 2005; Rose et al. 2002; Rosen 2004; Weber 2003; Wehrle-Haller u. Imhof 2003). In einem ersten Aktivierungsschritt werden Selektine (> Abb. 1.2.11f) auf der Oberfläche der Kapillarendothels exprimiert (> Abb. 1.2.11b), und zwar über

1.2

verschiedene Mechanismen (s. unten). Diese Selektine interagieren mit proteingebundenen Kohlenhydratstrukturen auf den Leukozyten. Da diese Wechselwirkung relativ schwach ist, erlaubt sie ein „Rollen“ der Leukozyten über die Endotheloberfläche. Unter diesen Bedingungen können Chemokine, die vom aktivierten Endothel gebildet werden, an entsprechende ChemokinRezeptoren der Leukozyten binden (> Abb. 1.2.11c). Dies wiederum bewirkt unter anderem eine Aktivierung von E-Integrinen der Leukozyten (> Abb. 1.2.11d), die dann mit Endothelzell-Rezeptoren, beispielsweise ICAM-1, interagieren (> Abb. 1.2.6d). Hierdurch wird letztendlich die Wanderung der Leukozyten durch das Endothel eingeleitet. Dies ist ein noch wenig verstandener Prozess, bei dem neben einer Interaktion des Leukozytenintegrins DLE mit dem Endothelrezeptor JAM-1 (> Abb. 1.2.6a) auch die Endothelproteine PECAM-1 und CD99 eine Rolle spielen. Der erste Schritt in diesem Prozess, nämlich die Bindung eines sich im strömenden Blut verhältnismäßig schnell bewegenden Leukozyten an die Oberfläche des Endothels, stellt spezielle Anforderungen an die dabei beteiligten Selektine. Bemerkenswert ist, dass sie nicht wie die meisten anderen Zelladhäsionsmoleküle mit Proteinliganden interagieren, sondern mit einer Tetrasaccharidstruktur, genannt Sialyl-LewisX (sLex), die auf einer Reihe von Zelloberflächenproteinen vorkommt (> Abb. 1.2.11g). Diese Struktur wird von einer konservierten Domäne am Aminoterminus der Selektine gebunden (> Abb. 1.2.11f), die Ähnlichkeit zu calciumabhängigen (C-Typ) Lektinen hat. Das E-Selektin (ELAM-1) findet sich auf aktiviertem Kapillarendothel, wo seine Expression dynamisch reguliert wird: Zytokine wie IL-1 bewirken eine schnelle (ca. 1 h) Heraufregulierung auf Transkriptionsebene. Das E-Selektin bindet an mindestens drei Liganden auf Leukozyten, nämlich an PSGL-1, an ESL-1 und an ein anderes Selektin, das L-Selektin. Da metastasierende Tumorzellen häufig Sialyl-LewisX-ähnliche Strukturen exprimieren, wird E-Selektin mit dem Prozess der Metastasierung in Zusammenhang gebracht. Auch P-Selektin (GMP-140, PADGEM) wird vom Kapillarendothel exprimiert, findet sich aber auch auf Thrombozyten. P-Selektin liegt in intrazellulären Vesikeln gespeichert vor, aus denen es sehr schnell mobilisiert werden kann, beispielsweise als Reaktion auf Histamin oder Thrombin. Ein wichtiger Interaktionspartner auf Leukozyten ist das PSGL-1, ein homodimeres Transmembranprotein mit einem hohen Anteil O-glykosidisch gebundenen, sialinsäurereichen Kohlenhydrats. Auch in Thrombozyten liegt P-Selektin in intrazellulären Vesikeln gespeichert vor, aus denen es schnell mobilisierbar ist. Man geht davon aus, dass es zur Rekrutierung von Leukozyten in Thromben beiträgt. Ein Ver-

34 a

d

Sektion 1 · Allgemeine Grundlagen b

. Abb. 1.2.11a–g. Selektine und die Leukozyten-Endothel-Interaktion. a–e Vereinfachtes Schema der Leukozyten-Endothel-Interaktion (zu Details 7 Text). f Die Selektine haben eine aminoterminale Lektin-ähnliche Domäne (U-förmig), ein EGF-ähnliches Motiv (Kreis) und unterschiedlich viele CR-Domänen (Quadrate). g Die Sialyl-LewisX-Struktur (sLex) ist ein verzweigtes Tetrasaccharid

c

e

f

g

gleich von Knockout-Mäusen, denen E-Selektin oder P-Selektin fehlt, spricht für eine begrenzte funktionelle Redundanz dieser beiden endothelialen Selektine. Das L-Selektin (LAM-1, LECAM-1) wird von Leukozyten exprimiert und ist das einzige konstitutiv exprimierte Selektin. N-glykosidisch gebundene Kohlenhydrate machen mehr als 40% der Molekülmasse aus, wobei Unterschiede zwischen verschiedenen Leukozytensubpopulationen bestehen. Das L-Selektin auf neutrophilen Granulozyten trägt die sLeX-Struktur, sodass es hier als Ligand der endothelialen P- und E-Selektine fungieren kann. Ursprünglich wurde L-Selektin in erster Linie als „lymph node homing receptor“ interpretiert, der für die Rekrutierung von Lymphozyten in die Lymphknoten wichtig ist. Analysen L-Selektin-defizienter Mäuse sowie die weite Verbreitung auf verschiedenen Subklassen von Leukozyten sprechen dafür, dass es zusätzlich auch bei der Rekrutierung von Leukozyten in Entzündungsherde eine Rolle spielt.

Bei Patienten mit „leukocyte adhesion deficiency type II“ (LAD-II), einer sehr seltenen Erbkrankheit, liegt ein Defekt in der Biosynthese von GDP-Fukose vor. Da die sLex-Struktur Fukose enthält (> Abb. 1.2.11g), fehlen diese Selektinliganden bei den betroffenen Patienten. Sie haben unter anderem eine Leukozytose und eine erhöhte Anfälligkeit für Infektionen.

1.2.3 Connexine und die Gap junctions Die Connexine bilden eine Multigenfamilie aus mindestens 20 integralen Membranproteinen (> Abb. 1.2.12a). Jeweils sechs dieser Moleküle bilden ein ringförmiges Hexamer, genannt Connexon, mit einer zentralen Öffnung, die für Moleküle Abb. 1.2.12b). Ansammlungen von mehreren hundert Gap-junctionKanälen werden Gap junctions genannt (Herve 2004, Herve 2005, Sohl et al. 2005). Gap junctions finden sich in den meisten Geweben. Allerdings können in verschiedenen Geweben unterschiedliche Connexine exprimiert werden, die dann Gap junction-Kanäle mit unterschiedlichen physiologischen Eigenschaften (Permeabilität, Regulierbarkeit) bilden. In Zellen, die gleichzeitig mehrere Connexine exprimieren, entstehen gemischt zusammengesetzte Connexone. Außerdem können Gap-Junktion-Kanäle aus unterschiedlich zusammengesetzten Connexonen gebildet werden (> Abb. 1.2.12b). Da die Gap junctions die Zytoplasmata verschiedener Zellen miteinander verbinden, ermöglichen sie die elektrische und metabolische Kopplung großer Zellpopulationen. Beispielsweise kann der hormoninduzierte Anstieg der cAMP-Konzentration in einer Zelle so zu einer Reaktion in benachbarten Zellen führen. Die calciumabhängige Kontraktion glatter Muskelzellen wird durch Gap junctions synchronisiert. Außerdem

1.2

finden sich Gap junctions in elektrischen Synapsen des Nervensystems. Die Permeabilität von Gap-junctionKanälen wird über Konformationsänderungen der Connexine reguliert, und zwar u. a. durch Calciumionen. Wird die Zellmembran beispielsweise einer Epithelzelle verletzt, so strömt Calcium in die Zelle ein. Dies induziert den Verschluss der Gap junctions der geschädigten Zelle und schützt so ihre Nachbarn. Mindestens 8 Connexine wurden mit Erbkrankheiten in Zusammenhang gebracht. Mutationen im Connexin-32-Gen verursachen eine X-Chromosom-gekoppelte Form der Charcot-Marie-Tooth-Krankheit, die mit Myelindefekten und Axondegeneration im peripheren Nervensystem einhergeht. Man kennt bereits mehr als 90 verschiedene Mutationen im Connexin-32, darunter solche, die die Stabilität des Moleküls betreffen, und andere, die die Kanaleigenschaften verändern. Mutationen im Gen des Connexin-26 führen u. a. zu Formen erblicher Taubheit und Mutationen im Connexin-46 oder im Connexin-50 zu bestimmten Ausprägungen vererblicher Linsenkatarakte (Gerido u. White 2004; Rabionet et al. 2002; Wei et al. 2004).

1.2.4 Claudine, Occludin und Tight junctions Die Claudine und das Occludin sind polytopische Membranproteine, die in den Tight junctions vorkommen. Die Claudine bilden eine Molekülfamilie mit mindestens 23 Mitgliedern, die zum Teil ubiquitär, zum Teil aber auch gewebespezifisch exprimiert werden. Tight junctions unterschiedlicher Gewebe enthalten daher wahrscheinlich verschiedene Repertoires an Claudinen. Occludin war das erste in Tight junctions identifizierte Protein. Es hat zwar keine Sequenzähnlichkeit mit den Claudinen, zeigt aber eine ähnliche Domänenorganisation (> Abb. 1.2.13a, b). Der lange carboxyproximale Bereich bindet an ZO-1, eines von mehreren Adapterproteinen, die indirekt die Verbindung zu Aktinfilamenten herstellen. Daneben enthalten Tight junctions eine Vielzahl anderer Moleküle, darunter das IgSF-Protein JAM-1 (> Abb. 1.2.6a) welches bei der Transmigration von Leukozyten durch das Kapillarendothel beteiligt ist (> Abb. 1.2.11e). Die Tight junctions (Zonulae occludentes) befinden sich im apikalen Bereich von Epithel- und Endothelzellen und umschließen diese als ringförmiges Band, das einen festen Kontakt zur Nachbarzelle herstellt (> Abb. 1.2.1). Im Elektronenmikroskop ist dieses Band als netzförmige Struktur, aufgebaut aus aneinandergereihten 3–4 nm großen Partikeln, darstellbar (> Abb. 1.2.13c). Tight junctions haben zwei wichtige Funktionen. Einerseits schränken sie die Lateralmobilität von

36 a

Sektion 1 · Allgemeine Grundlagen b

c

. Abb. 1.2.13a–c. Proteine und Funktionen der Tight junctions. Die Claudine a und das Occludin b haben vier Transmembrandomänen und intrazelluläre Amino- und Carboxytermini. EM-Aufnahme (Gefrierbruchmethode) von Dünndarmepithelzellen eines Frosches c. Im oberen Teil (*) fehlt die Membran der obenliegenden Zelle, und netzförmig angeordnete Proteinaggregate werden sichtbar. Im mittleren Bereich (#) blieb ein Teil der obenliegenden Zellmembran erhalten (Staehelin und Hull 1978). Mit Genehmigung von Scientific American, New York

1.2.5 Ausblick Wechselwirkungen von Zellen untereinander und mit Komponenten der Extrazellulärmatrix spielen eine zentrale Rolle beim Aufbau aller mehrzelligen Organismen. Zelluläre Interaktionen werden überwiegend von speziellen Zelloberflächenproteinen vermittelt, die als Zelladhäsionsmoleküle bezeichnet werden. Die gegenwärtig am besten untersuchten Klassen solcher Proteine sind die Cadherine, die Integrine, die Selektine und die Moleküle der Immunglobulin-Superfamilie. Viele Erbkrankheiten, die auf fehlende oder veränderte Zelladhäsionsmoleküle zurückgehen, werden wahrscheinlich auf absehbare Zeit kaum für therapeutische Interventionen zugänglich sein. Dagegen ist zu erwarten, dass die dynamischen zellulären Interaktionen, die im Immunsystem vorkommen, für Therapieansätze besser zugänglich sind. Zelladhäsionsmoleküle können hier als therapeutische Zielstrukturen infrage kommen, zum Beispiel, um die Bindung pathogener Viren oder Mikroorganismen an ihre Rezeptoren zu supprimieren oder um die Rekrutierung von Leukozyten aus der Blutbahn in das umgebende Gewebe gezielt zu beeinflussen. Danksagung Ich bedanke mich besonders bei Frau Gabriele Kronmüller für die Anfertigung der Abbildungen. Meinen ehemaligen und gegenwärtigen Kollegen, die zu diesem Kapitel beigetragen haben, danke ich für Diskussionen und Unterstützung. Dieses Kapitel gibt ausschließlich die Meinung des Autors wieder und nicht notwendigerweise auch die Auffassung der Novartis Pharma AG.

Membranproteinen ein und teilen dadurch die Plasmamembran in zwei getrennte Domänen auf, den apikalen und den basolateralen Bereich. Andererseits regulieren sie die parazelluläre Diffusion löslicher Substanzen zwischen den Epithelzellen hindurch. Tight junctions isolieren daher Körperhöhlen vom umgebenden Gewebe, beispielsweise in exokrinen Drüsen, sowie im Magen-, Darm- oder Nierenepithel. Diese Funktion ist bei einer Reihe von Krankheiten beeinträchtigt. Beispielsweise führen Mutationen im Gen des Claudin-16 (Paracellin-1) zu einem rezessiven Nierendefekt, der mit verminderter parazellulärer Rückresorption von Magnesium einhergeht und daher zu Magnesiumverlust in den Urin führt (Brümmendorf u. Lemmon 2001; Feldman et al. 2005; Gonzalez-Mariscal et al. 2003; Lee et al. 2006; Matter u. Balda 2003; Weber 2003).

1.2.6 Literatur Afshar-Kharghan V, Thiagarajan P (2006) Leukocyte adhesion and thrombosis. Curr.Opin.Hematol. 13: 34–39 Alberts B, Bray D, Lewis J, Raff M, Roberts K, Watson JD (1994) Molecular Biology of the Cell. Garland Publishing, Inc., New York Amzel LM, Poljak RJ (1979) Three-dimensional structure of immunoglobulins. Annu.Rev.Biochem. 48: 961–997 Bella J, Kolatkar PR, Marlor CW, Greve JM, Rossmann MG (1998) The structure of the two amino-terminal domains of human ICAM-1 suggests how it functions as a rhinovirus receptor and as an LFA-1 integrin ligand. Proc. Natl. Acad. Sci. U.S.A. 95: 4140–4145 Brakebusch C, Fässler R (2003) The integrin-actin connection, an eternal love affair. EMBO J. 22: 2324–2333 Brembeck FH, Rosario M, Birchmeier W (2006) Balancing cell adhesion and Wnt signaling, the key role of beta-catenin. Curr. Opin. Genet.Dev. 16: 51–59 Brümmendorf T, Lemmon V (2001) Immunoglobulin superfamily receptors: cis-interactions, intracellular adapters and alternative splicing regulate adhesion. Curr.Opin.Cell Biol. 13: 611 618

37 1.2 · Molekulare Mechanismen von Zell-Zell-Wechselwirkungen Bruses JL, Rutishauser U (2001) Roles, regulation, and mechanism of polysialic acid function during neural development. Biochimie. 83: 635–643 Bunting M, Harris ES, McIntyre TM, Prescott SM, Zimmerman GA (2002) Leukocyte adhesion deficiency syndromes: adhesion and tethering defects involving E2 integrins and selectin ligands. Curr.Opin.Hematol. 9: 30–35 Cambien B, Wagner DD (2004) A new role in hemostasis for the adhesion receptor P-selectin. Trends Mol.Med. 10: 179–186 Cheng X, Den Z, Koch PJ (2005) Desmosomal cell adhesion in mammalian development. Eur.J.Cell Biol. 84: 215–223 Clark EA, Ledbetter JA (1994) How B and T cells talk to each other. Nature. 367: 425–428 Clemetson KJ (1999) Primary haemostasis: sticky fingers cement the relationship. Curr.Biol. 9: R110–R112 Davis SJ, van der Merwe PA (1996) The structure and ligand interactions of CD2: implications for T-cell function. Immunol. Today 17: 177–187 Doherty P, Williams G, Williams EJ (2000) CAMs and axonal growth: a critical evaluation of the role of calcium and the MAPK cascade. Mol.Cell Neurosci. 16: 283–295 Durbec P, Cremer H (2001) Revisiting the function of PSA-NCAM in the nervous system. Mol.Neurobiol. 24: 53–64 Feldman GJ, Mullin JM, Ryan MP (2005) Occludin: structure, function and regulation. Adv.Drug Deliv.Rev. 57: 883–917 ffrench-Constant C, Colognato H (2004) Integrins: versatile integrators of extracellular signals. Trends Cell Biol. 14: 678–686 Freigang J, Proba K, Leder L, Diederichs K, Sonderegger P, Welte W (2000) The crystal structure of the ligand binding module of axonin-1/TAG-1 suggests a zipper mechanism for neural cell adhesion. Cell. 101: 425–433 Gerido DA, White TW (2004) Connexin disorders of the ear, skin, and lens. Biochim.Biophys.Acta. 1662: 159–170 Gonzalez-Mariscal L, Betanzos A, Nava P, Jaramillo BE (2003) Tight junction proteins. Prog.Biophys.Mol.Biol. 81: 1–44 Grashoff C, Thievessen I, Lorenz K, Ussar S, Fässler R (2004) Integrinlinked kinase: integrin's mysterious partner. Curr.Opin.Cell Biol. 16: 565–571 Gumbiner BM (2005) Regulation of cadherin-mediated adhesion in morphogenesis. Nat.Rev.Mol.Cell Biol. 6: 622–634 Guo W, Giancotti FG (2004) Integrin signalling during tumour progression. Nat.Rev.Mol.Cell Biol. 5: 816–826 Hajra KM, Fearon ER (2002) Cadherin and catenin alterations in human cancer. Genes Chromosomes.Cancer. 34: 255–268 Hannigan G, Troussard AA, Dedhar S (2005) Integrin-linked kinase: a cancer therapeutic target unique among its ILK. Nat.Rev.Cancer. 5: 51–63 Haspel J, Grumet M (2003) The L1CAM extracellular region: a multidomain protein with modular and cooperative binding modes. Front Biosci. 8: s1210–25.: s1210–s1225 Hemler ME (1999) Integrins. In: Kreis T, Vale R (Hrsg.) Guidebook to the Extracellular Matrix, Anchor, and Adhesion Proteins. Oxford University Press, Oxford, S. 196–212 Herve JC (2004) The connexins. Biochim. Biophys. Acta. 1662: 1–2 Herve JC (2005) The connexins, Part III. Biochim.Biophys.Acta. 1719: 1–2 Hogg N, Henderson R, Leitinger B, McDowall A, Porter J, Stanley P (2002) Mechanisms contributing to the activity of integrins on leukocytes. Immunol.Rev. 186: 164–71.: 164–171 Hynes RO (2002) Integrins: bidirectional, allosteric signaling machines. Cell. %20;110: 673–687 Itoh K, Cheng L, Kamei Y, Fushiki S, Kamiguchi H, Gutwein P, Stoeck A, Arnold B, Altevogt P, Lemmon V (2004) Brain development in

1.2

mice lacking L1-L1 homophilic adhesion. Journal of Cell Biology 165: 145–154 Janes SM, Watt FM (2006) New roles for integrins in squamous-cell carcinoma. Nat.Rev.Cancer. 6: 175–183 Johnson KR, Takeichi M (1999) Cadherins. In: Kreis T, Vale R (Hrsg.) Guidebook to the Extracellular Matrix and Adhesion Molecules. Oxford University Press, Oxford, S. 141– 150 Kakkar AK, Lefer DJ (2004) Leukocyte and endothelial adhesion molecule studies in knockout mice. Curr.Opin.Pharmacol. 4: 154–158 Kamiguchi H, Hlavin ML, Lemmon V (1998) Role of L1 in neural development: what the knockouts tell us. Mol.Cell.Neurosci. 12: 48–55 Kandel ER, Schwartz JH, Jessel TM (2000) Principles of Neural Science. McGraw-Hill, New York Kannagi R, Izawa M, Koike T, Miyazaki K, Kimura N (2004) Carbohydrate-mediated cell adhesion in cancer metastasis and angiogenesis. Cancer Sci. 95: 377–384 Karp G (1999) Cell and Molecular Biology: Concepts and Experiments. John Wiley and Sons, New York Küster W (2000) Erbliche Hauterkrankungen. In: Ganten D, Ruckpaul K (Hrsg.) Handbuch der Molekularen Medizin, Band 7, Monogen bedingte Erbkrankheiten, Teil 2. Springer Verlag, Berlin, S. 216–248 Lee DB, Huang E, Ward HJ (2006) Tight junction biology and kidney dysfunction. Am.J.Physiol Renal Physiol. 290: F20–F34 Lee JO, Rieu P, Arnaout MA, Liddington R (1995) Crystal structure of the A domain from the D-subunit of integrin CR3 (CD11b/ CD18). Cell. 80: 631–638 Ley K (2003) The role of selectins in inflammation and disease. Trends Mol.Med. 9: 263–268 Ley K, Kansas GS (2004) Selectins in T-cell recruitment to non-lymphoid tissues and sites of inflammation. Nat.Rev.Immunol. 4: 325–335 Littlewood EA, Müller U (2000) Stereocilia defects in the sensory hair cells of the inner ear in mice deficient in integrin D8E1. Nat. Genet. 24: 424–428 Lodish H, Berk A, Zipursky SL, Matsudaira P, Baltimore D, Darnell J (2000) Molecular Cell Biology. W.H. Freeman and Company, New York Makowski L, Caspar DL, Phillips WC, Goodenough DA (1977) Gap junction structures. II. Analysis of the X-ray diffraction data. J.Cell Biol. 74: 629–645 Martini R, Zielasek J, Toyka KV, Giese KP, Schachner M (1995) Protein zero (p0)-deficient mice show myelin degeneration in peripheral nerves characteristic of inherited human neuropathies. Nat.Genet. 11: 281–286 Matter K, Balda MS (2003) Signalling to and from tight junctions. Nat.Rev.Mol.Cell Biol. 4: 225–236 Melchers F, Rolink AG, Schaniel C (1999) The role of chemokines in regulating cell migration during humoral immune responses. Cell. 99: 351–354 Miranti CK, Brugge JS (2002) Sensing the environment: a historical perspective on integrin signal transduction. Nat.Cell Biol. 4: E83–E90 Müller U, Wang D, Denda S, Meneses JJ, Pedersen RA, Reichardt LF (1997) Integrin DE1 is critically important for epithelial-mesenchymal interactions during kidney morphogenesis. Cell. 88: 603–613 Nelson WJ, Nusse R (2004) Convergence of Wnt, beta-catenin, and cadherin pathways. Science. 303: 1483–1487 Parise LV (1999) Integrin DIIbE3 signaling in platelet adhesion and aggregation. Curr.Opin.Cell Biol. 11: 597–601

38

Sektion 1 · Allgemeine Grundlagen

Pertz O, Bozic D, Koch AW, Fauser C, Brancaccio A, Engel J (1999) A new crystal structure, Ca2+ dependence and mutational analysis reveal molecular details of E-cadherin homoassociation. EMBO J. 18: 1738–1747 Rabionet R, Lopez-Bigas N, Arbones ML, Estivill X (2002) Connexin mutations in hearing loss, dermatological and neurological disorders. Trends Mol.Med. 8: 205–212 Rice GP, Hartung HP, Calabresi PA (2005) Anti-D4 integrin therapy for multiple sclerosis: mechanisms and rationale. Neurology. 64: 1336–1342 Rose DM, Han J, Ginsberg MH (2002) D4 integrins and the immune response. Immunol.Rev. 186: 118–24.: 118–124 Rosen SD (2004) Ligands for L-selectin: homing, inflammation, and beyond. Annu.Rev.Immunol. 22: 129–56.: 129–156 Runker AE, Bartsch U, Nave KA, Schachner M (2003) The C264Y missense mutation in the extracellular domain of L1 impairs protein trafficking in vitro and in vivo. J.Neurosci. 23: 277– 286 Sandi C (2004) Stress, cognitive impairment and cell adhesion molecules. Nat.Rev.Neurosci. 5: 917–930 Shapiro L, Doyle JP, Hensley P, Colman DR, Hendrickson WA (1996) Crystal structure of the extracellular domain from P0, the major structural protein of peripheral nerve myelin. Neuron. 17: 435– 449 Shapiro L, Fannon AM, Kwong PD, Thompson A, Lehmann MS, Grubel G, Legrand JF, Als-Nielsen J, Colman DR, Hendrickson WA (1995) Structural basis of cell-cell adhesion by cadherins. Nature. 374: 327–337 Shimaoka M, Springer TA (2003) Therapeutic antagonists and conformational regulation of integrin function. Nat.Rev.Drug Discov. 2: 703–716 Shy ME, Jani A, Krajewski K, Grandis M, Lewis RA, Li J, Shy RR, Balsamo J, Lilien J, Garbern JY, Kamholz J (2004) Phenotypic clustering in MPZ mutations. Brain. 127: 371–384 Smith JD, Craig AG, Kriek N, Hudson-Taylor D, Kyes S, Fagen T, Pinches R, Baruch DI, Newbold CI, Miller LH (2000) Identification of a Plasmodium falciparum intercellular adhesion molecule-1 binding domain: a parasite adhesion trait implicated in cerebral malaria. Proc.Natl.Acad.Sci.U.S.A. 97: 1766– 1771 Sohl G, Maxeiner S, Willecke K (2005) Expression and functions of neuronal gap junctions. Nat.Rev.Neurosci. 6: 191–200 Staehelin LA, Hull BE (1978) junctions between living cells. Sci.Am. 238: 140–152 Takeichi M, Abe K (2005) Synaptic contact dynamics controlled by cadherin and catenins. Trends Cell Biol. 15: 216–221 Troyanovsky S (2005) Cadherin dimers in cell-cell adhesion. Eur. J.Cell Biol. 84: 225–233 van der Flier A, Sonnenberg A (2001) Function and interactions of integrins. Cell Tissue Res. 305: 285–298 Walmod PS, Kolkova K, Berezin V, Bock E (2004) Zippers make signals: NCAM-mediated molecular interactions and signal transduction. Neurochem.Res. 29: 2015–2035

Wang J, Springer TA (1998) Structural specializations of immunoglobulin superfamily members for adhesion to integrins and viruses. Immunol.Rev. 163: 197–215 Wang JH, Smolyar A, Tan K, Liu JH, Kim M, Sun ZY, Wagner G, Reinherz EL (1999) Structure of a heterophilic adhesion complex between the human CD2 and CD58 (LFA-3) counterreceptors. Cell. 97: 791–803 Warner LE, Hilz MJ, Appel SH, Killian JM, Kolodry EH, Karpati G, Carpenter S, Watters GV, Wheeler C, Witt D, Bodell A, Nelis E, Van BC, Lupski JR (1996) Clinical phenotypes of different MPZ (P0) mutations may include Charcot-Marie-Tooth type 1B, Dejerine-Sottas, and congenital hypomyelination. Neuron. 17: 451–460 Watt FM (2002) Role of integrins in regulating epidermal adhesion, growth and differentiation. EMBO J. 21: 3919–3926 Weber C (2003) Novel mechanistic concepts for the control of leukocyte transmigration: specialization of integrins, chemokines, and junctional molecules. J.Mol.Med. 81: 4–19 Wehrle-Haller B, Imhof BA (2003) Integrin-dependent pathologies. J.Pathol. 200: 481–487 Wei CJ, Xu X, Lo CW (2004) Connexins and cell signaling in development and disease. Annu.Rev.Cell Dev.Biol. 20: 811–38.: 811 838 Weller S, Gartner J (2001) Genetic and clinical aspects of X-linked hydrocephalus (L1 disease): Mutations in the L1CAM gene. Human Mutation 18: 1–12 White DJ, Puranen S, Johnson MS, Heino J (2004) The collagen receptor subfamily of the integrins. Int.J.Biochem.Cell Biol. 36: 1405–1410 Williams AF, Barclay AN (1988) The immunoglobulin superfamily – domains for cell surface recognition. Annu.Rev.Immunol. 6: 381–405 Wolpert L, Beddington R, Brockes J, Jessel T, Lawrence P, Meyerowitz E (1999) Entwicklungsbiologie. Spektrum Akademischer Verlag, Heidelberg Wong EV, Kenwrick S, Willems PJ, Lemmon V (1995) Mutations in the cell adhesion molecule L1 cause mental retardation. Trends. Neurosci. 18: 168–172 Wu H, Kwong PD, Hendrickson WA (1997) Dimeric association and segmental variability in the structure of human CD4. Nature. 387: 527–530 Xiong JP, Stehle T, Diefenbach B, Zhang R, Dunker R, Scott DL, Joachimiak A, Goodman SL, Arnaout MA (2001) Crystal structure of the extracellular segment of integrin DVE3. Science. 294: 339–345 Yagi T (2003) Diversity of the cadherin-related neuronal receptor/ protocadherin family and possible DNA rearrangement in the brain. Genes Cells. 8: 1–8 Zemmyo M, Meharra EJ, Kuhn K, Creighton-Achermann L, Lotz M (2003) Accelerated, aging-dependent development of osteoarthritis in D1 integrin-deficient mice. Arthritis Rheum. 48: 2873–2880 Zhou FQ, Zhong J, Snider WD (2003) Extracellular crosstalk: when GDNF meets N-CAM. Cell. 113: 814–815

39 1.2 · Molekulare Mechanismen von Zell-Zell-Wechselwirkungen

1.2.7 Zeittafel 1838/1839

M. J. Schleiden und T. Schwann entdecken, dass Organismen sind aus Zellen aufgebaut sind.

(Schleiden 1838, Schwann 1839)

1907

Schwämme können aus vereinzelten Zellen reaggregieren.

(Wilson 1907)

1955

Townes und Holtfreter beschreiben die Reaggregation unterschiedlicher Zelltypen zu geschichteten Gewebeaggregaten („sorting out“).

(Townes und Holtfreter 1955)

1958–1962

Entdeckung humaner Leukozyten-Antigene durch verschiedene Arbeitsgruppen

(Klein 1982)

1959

Beschreibung der Lymphozyten-Zirkulation durch J. L. Gowans

(Klein 1982)

1971

M. S. Bretcher charakterisiert ein integrales Membranprotein (Glykophorin).

(Barclay et al. 1993)

1972

D. Allan entwickelt die Lektin-Affinitätschromatographie zur Isolierung von Glykoproteinen. Singer und Nicolson beschreiben das„fluid mosaic model“ der Zellmembran.

(Barclay et al. 1993, Singer und Nicolson 1972)

1975

A. Helenius und K. Simons solubilisieren Membranproteine mit Detergenzien. M. M. Letarte isoliert Leukozyten-Antigene über Immunaffinitätschromatographie.

(Barclay et al. 1993)

1979

Identifikation des N-Glykosylierungsmotivs durch Bause und Hettkamp. C. A. Sunderland und P. Parham verwenden monoklonale Antikörper zur Analyse von Zelloberflächenproteinen.

(Barclay et al. 1993, Bause und Hettkamp 1979)

1982

Williams und Gagnon stellen das Konzept der Immunglobulin-Superfamilie vor.

(Williams und Gagnon 1982)

1986–1987

Klonierung der ersten Integrin-Untereinheiten durch verschiedene Arbeitsgruppen

(Hynes 1992)

1987

Expressionsklonierung von Leukozyten-Antigenen in COS-Zellen durch Seed und Aruffo; Klonierung des „neuralen Zelladhäsionsmoleküls“ NCAM

(Cunningham et al. 1987, Seed und Aruffo 1987)

1987–1988

Klonierung der ersten Cadherine durch verschiedene Arbeitsgruppen

(Geiger und Ayalon 1992)

1989

Klonierung der drei Selektine durch verschiedene Arbeitsgruppen

(Bevilacqua und Nelson 1993)

1990

Strukturaufklärung der ersten beiden Domänen des CD4

(Ryu et al. 1990, Wang et al. 1990)

1995

Strukturaufklärung der aminoterminalen Domäne des E-Cadherin und der I-Domäne der Integrine

(Lee et al. 1995, Overduin et al. 1995, Qu und Leahy 1995)

Entdeckung verschiedener Arbeitsgruppen, dass E-Catenin an Transkriptionsfaktoren bindet

(Nelson und Nusse 2004)

1999

Genomorganisation der Protocadherine

(Wu und Maniatis 1999)

1.2

40

Sektion 1 · Allgemeine Grundlagen

Literatur zur Zeittafel Barclay AN, Birkeland ML, Brown MH, Beyers AD, Davis SJ, Somoza C, Williams AF (1993) The Leucocyte Antigen FactsBook. Academic Press, London Bause E, Hettkamp H (1979) Primary structural requirements for N-glycosylation of peptides in rat liver. FEBS Lett. 108: 341–344 Bevilacqua MP, Nelson RM (1993) Selectins. J.Clin.Invest. 91: 379–387 Cunningham BA, Hemperly JJ, Murray BA, Prediger EA, Brackenbury R, Edelman GM (1987) Neural cell adhesion molecule: structure, immunoglobulin-like domains, cell surface modulation, and alternative RNA splicing. Science. 236: 799–806 Geiger B, Ayalon O (1992) Cadherins. Annu.Rev.Cell Biol. 8: 307–332 Hynes RO (1992) Integrins: versatility, modulation, and signaling in cell adhesion. Cell. 69: 11–25 Klein J (1982) Immunology, the Science of Self-Nonself-Discrimination. John Wiley & Sons, New York Lee JO, Rieu P, Arnaout MA, Liddington R (1995) Crystal structure of the A domain from the alpha subunit of integrin CR3 (CD11b/ CD18). Cell. 80: 631–638 Nelson WJ, Nusse R (2004) Convergence of Wnt, beta-catenin, and cadherin pathways. Science. 303: 1483–1487 Overduin M, Harvey TS, Bagby S, Tong KI, Yau P, Takeichi M, Ikura M (1995) Solution structure of the epithelial cadherin domain responsible for selective cell adhesion. Science. 267: 386–389 Qu A, Leahy DJ (1995) Crystal structure of the I-domain from the CD11a/CD18 (LFA-1, alpha L beta 2) integrin. Proc.Natl.Acad. Sci.U.S.A. 92: 10277–10281

Ryu SE, Kwong PD, Truneh A, Porter TG, Arthos J, Rosenberg M, Dai XP, Xuong NH, Axel R, Sweet RW, Hendrickson WA (1990) Crystal structure of an HIV-binding recombinant fragment of human CD4 [see comments]. Nature. 348: 419–426 Schleiden MJ (1838) Beiträge zur Phytogenesis. Archiv für Anatomie, Physiologie und wissenschaftliche Medizin 5: 137–176 Schwann T (1839) Mikroskopische Untersuchungen über die Übereinstimmung in der Struktur und dem Wachstum der Tiere und Pflanzen. Sander‘sche Buchhandlung, Berlin Seed B, Aruffo A (1987) Molecular cloning of the CD2 antigen, the T-cell erythrocyte receptor, by a rapid immunoselection procedure. Proc.Natl.Acad.Sci.U.S.A. 84: 3365–3369 Singer SJ, Nicolson GL (1972) The fluid mosaic model of the structure of cell membranes. Science. 175: 720–731 Townes P, Holtfreter J (1955) Directed movements and selected adhesion of embryonic amphibian cells. J.Exp.Zool. 128: 53– 120 Wang J, Yan Y, Garrett TPJ, Liu J, Rodgers DW, Garlick RL, Tarr GE, Husain Y, Reinherz EL, Harrison SC (1990) Atomic structure of a fragment of human CD4 containing two immunoglobulin-like domains. Nature. 348: 411–418 Williams AF, Gagnon J (1982) Neuronal cell Thy-1 glycoprotein: homology with immunoglobulin. Science. 216: 696–703 Wilson HV (1907) On some phenomena of coalescence and regeneration in sponges. J.Exp.Zool. 5: 245–258 Wu Q, Maniatis T (1999) A striking organization of a large family of human neural cadherin-like cell adhesion genes. Cell. 97: 779– 790

1.3 1.3 Die zytogenetischen Grundlagen der Molekularen Medizin Heidemarie Neitzel und Karl Sperling

1.3.1

Einleitung

– 42

1.3.2

Chromosomentheorie der Vererbung – 43

1.3.3

Grundlagen der Chromosomenphysiologie

1.3.3.1 1.3.3.2

Strukturen der Chromosomen und des Chromatins – 46 Funktionelle Gliederung der Chromosomen und Genkartierung

1.3.4

Zellzyklus und Checkpoint-Kontrolle – 49

1.3.5

Chromosomopathien

1.3.5.1 1.3.5.2 1.3.5.3

Aneuploidien – 51 Imprinting – 52 Strukturelle Chromosomenmutationen

1.3.6

Somatische Chromosomenmutationen – 54

1.3.6.1 1.3.6.2 1.3.6.3

Somatische Rekombination – 54 Chromosomeninstabilität – 55 Chromosomenmutationen in der Tumorgenese

1.3.7

Ausblick

– 57

1.3.8

Literatur

– 58

1.3.9

Zeittafel

– 62

– 46 – 47

– 51

– 53

– 56

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

42

Sektion 1 · Allgemeine Grundlagen

1.3.1 Einleitung Die Molekulare Medizin ist eine analytische Wissenschaft mit dem Ziel, einen medizinischen Sachverhalt bis hin zu seinen molekularen Ursachen aufzuklären. Die Zytogenetik hingegen stellt die Verbindung zytologischer, speziell chromosomaler Beobachtungen mit genetischen Sachverhalten dar und wird daher als eine deskriptive Disziplin angesehen. Diese Sichtweise ist aus mehrfachen Gründen zu einfach: Zum einen ist die Zytogenetik nicht rein deskriptiv, da sie auf einem höheren Niveau biologischer Organisation als der DNA entscheidende biologisch-medizinische Sachverhalte in einem logischen Zusammenhang darzustellen vermag. Sie relativiert damit zugleich eine weit verbreitete Ansicht, dass ein zellbiologisches Phänomen dann aufgeklärt und verstanden ist, wenn man die beteiligten Moleküle identifiziert und benannt hat. Zum anderen hat sie durch ihren neuen Zweig, die molekulare Zytogenetik, unmittelbar Anschluss an die molekulare Genetik und damit auch die Molekulare Medizin gefunden. So basieren einige der größten Erfolge der Molekularen Medizin auf zytogenetischen Beobachtungen, wie die folgenden drei Beispiele aus der Entwicklungsgenetik, der medizinischen Genetik und der Tumorgenetik belegen sollen. 1. Der erste Fall betrifft einen Befund aus dem Jahr 1959, wonach Individuen mit der Chromosomenkonstitution 47,XXY männlich und solche mit der Konstitution 45,X weiblich sind. Dies sprach dafür, dass beim Vorliegen eines Y-Chromosoms die ontogenetische Entwicklung in männliche Richtung verläuft. Später konnte gezeigt werden, dass nur ein kleiner Bereich im kurzen Arm des Y-Chromosoms hierfür verantwortlich ist. Dies führte zur Identifizierung des SRY-Gens („sex determining region on Y“), dem Schalter-Gen, das beim Menschen und beim Säuger die Entwicklung des undifferenzierten Embryos in männliche Richtung bestimmt. Die Mutation nur eines einzigen Basenpaares in diesem Gen, die dessen Funktionsverlust bedingt, führt zur Entstehung weiblicher Individuen mit einem männlichen Chromosomensatz, die aufgrund fehlender Gonaden steril sind. Die molekulare Analyse hat dabei nicht nur diese besondere Form von Sterilität aufklären können, sondern zugleich dasjenige Gen beim Säuger identifiziert, das für die Geschlechtsbestimmung verantwortlich ist (Übersicht bei Wolf 1995). 2. Eine zytogenetische Auffälligkeit war es auch, die mit einer der häufigsten genetisch bedingten Ursachen geistiger Behinderung einhergeht, dem sog. Fragilen-X-Syndrom. Zytogenetisch auffällig war eine brüchige (fragile) Stelle im terminalen Bereich des

langen Armes des X-Chromosoms. Gestützt auf die Lokalisation konnte das Gen identifiziert und zugleich ein vollkommen neuer Mutationsmechanismus beschrieben werden. Es handelt sich um eine Vermehrung von Basentripletts der Folge (CCG)n im nichtkodierenden Bereich des FMR1-Gens („fragile X mental retardation-1“). Es kommt aber nur dann zu klinischen Konsequenzen, wenn bereits eine sog. Prämutation, also eine geringfügigere Vermehrung des Basentripletts, vorliegt. Durchlaufen diese so veränderten Sequenzen die Oogenese, nicht die Spermatogenese, so kann es zur erneuten Vermehrung des Basentripletts und damit zur Ausprägung klinischer Symptome kommen. Mit der Aufdeckung dieses Mechanismus wurde zugleich die Erklärung für ein bislang vollkommen rätselhaftes Phänomen geliefert, die Antizipation. Gemeint ist damit, dass bei bestimmten genetisch bedingten Erkrankungen das Erkrankungsrisiko und die Schwere der Erkrankung von Generation zu Generation zunehmen. Das gleiche Phänomen konnte inzwischen für mehr als ein Dutzend weiterer neurologischer Erkrankungen belegt werden (Übersicht bei Kaufmann u. Reiss 1999; O’Donovan et al 2003), bei denen die Schwere der Erkrankung und das Manifestationsalter mit der zunehmenden Länge der Basentripletts korreliert. 3. Ein letztes Beispiel soll den Stellenwert zytogenetischer Beobachtungen für das Verständnis der Tumorgenese illustrieren. Kennzeichnend für das Burkitt-Lymphom, eine in Deutschland seltene Krebserkrankung, sind charakteristische Translokationen der Krebszellen zwischen einem Chromosom 8 und einem Chromosom 2, 14 oder 22, die jeweils die gleichen Bruchstellen betreffen. Es bedeutete einen wissenschaftlichen Durchbruch auf dem Gebiet der Tumorgenetik, als im Oktober 1982 zwei Arbeitsgruppen unabhängig voneinander zeigen konnten, dass als Folge dieser Translokationen das C-MYC-Gen auf Chromosom 8 in Nachbarschaft zu den Genen der schweren (Chromosom 14) oder der leichten Ketten der Immunglobulingene (Chromosom 2 und 22) gelangt, die gerade in diesen Zellen besonders aktiv sind. Als Folge der Translokation kommt es zu einer gesteigerten Expression des C-MYC-Gens als entscheidendem frühen Schritt in der Genese dieser Tumoren. Zum ersten Mal konnte damit für die Kanzerogenese ein Zusammenhang zwischen einer strukturellen Chromosomenveränderung und der Expression der davon betroffenen Gene hergestellt werden. Im Gegensatz zu den beiden vorausgegangenen Beispielen handelt es sich hier nicht um Veränderungen in der Keimbahn, sondern um Mutationen in somatischen Zellen (Übersicht bei Look 1998).

43 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin

Diese drei speziellen Beispiele illustrieren einen allgemeinen Sachverhalt: die Zytogenetik ist schon deshalb eine wesentliche Grundlage der Molekularen Medizin, weil die Gene auf den Chromosomen angeordnet sind. Die Genkarte stellt das entscheidende Ordnungsprinzip in der Genetik dar, durchaus vergleichbar mit der Orientierungshilfe mittels Landkarten im täglichen Leben. So können strukturelle Veränderungen der Chromosomen, die die Keimbahn betreffen und mit klinischen Auffälligkeiten einhergehen oder die maligne Zellen auszeichnen, den Weg zu den jeweils betroffenen Genen weisen. Der Lageort des Gens lässt zudem Hinweise auf die Genexpression zu, da die Chromosomen selbst funktionell untergliedert sind. Hier soll der Versuch unternommen werden, gestützt auf die allgemeinen Grundlagen der Chromosomentheorie der Vererbung und der Chromosomenphysiologie, die molekularen Grundlagen zytogenetischer Phänomene darzustellen und ihre Bedeutung für das Verständnis medizinischer Sachverhalte aufzuzeigen, ganz im Sinne der einleitend gebrachten Beispiele.

1.3.2 Chromosomentheorie der Vererbung Die etwa 25 000 Gene des Menschen verteilen sich auf 23 Chromosomenpaare. Jeweils ein einfacher, haploider Chromosomensatz, wird von der Mutter und vom Vater an die Nachkommen vererbt. Die befruchtete Eizelle, die Zygote, weist danach in der Regel einen normalen diploiden Satz aus 46 Chromosomen auf. Sämtliche Körperzellen gehen durch Zellteilung, Mitose, aus der befruchteten Eizelle hervor. Sie enthalten daher ebenfalls 46 Chromosomen und im Prinzip auch sämtliche Erbanlagen. Dass sich die verschiedenen Gewebe in morphologischer und physiologischer Hinsicht unterscheiden, beruht darauf, dass in den verschiedenen Geweben jeweils nur bestimmte Gene aktiv sind. Diese entwicklungs- und gewebsspezifische Regulation der Genaktivität ist Grundlage jeden Entwicklungs- und Differenzierungsgeschehens. Die Bedeutung der Chromosomen als Träger der Erbanlagen liegt einmal darin, die korrekte Verteilung der Gene auf die Tochterzellen zu gewährleisten und zum anderen die korrekte Weitergabe der Gene bei der Keimzellbildung, der Meiose, zu sichern. Zugleich sind die Chromosomen der Interphase (das Chromatin) aber auch das Substrat der Genregulation. Diese Erkenntnisse haben Anfang des letzten Jahrhunderts ihren Niederschlag in der „Chromosomentheorie der Vererbung“ gefunden, die zugleich die Geburtsstunde der Zytogenetik markiert. Dabei ergab sich eine vollständige Korrelation zwischen den im Kreuzungs-

1.3

experiment ermittelten Befunden und den zytogenetischen Beobachtungen (> Abb. 1.3.1). Das paarweise Vorhandensein der Erbanlagen in den Körperzellen entsprach dem paarweisen Vorliegen der Chromosomen, das einfache Vorhandensein in den Keimzellen der Reduktion der diploiden auf die haploide Chromosomenzahl während der Meiose. Die lichtmikroskopisch sichtbaren Chiasmata der Prophase der Meiose stellen das Korrelat für den im Kreuzungsexperiment ermittelten Austausch von Genen zwischen homologen Chromosomen (Crossing-over) dar. Diese genetischen Austauschereignisse waren es, die T. H. Morgan und seine Schüler in den 1920er Jahren des letzten Jahrhunderts die Erstellung der ersten Genkarten bei der Taufliege Drosophila ermöglichten. Die so ermittelte Entfernung der Gene wird in cM (centiMorgan) angegeben. Hierbei entspricht die genetische Distanz von 1 cM einer Rekombinationsrate zwischen zwei Genen von 1%. Es war ein fast einmaliger Zufall in der Wissenschaft, als Heitz und Bauer 1933 in Berlin (und unabhängig von ihnen Painter in den USA) zeigen konnten, dass das damals genetisch am besten analysierte Objekt, die Drosophila, sich zugleich auch zytogenetisch in besonderer Weise auszeichnet. In den Speicheldrüsen der Larven finden sich sog. Riesenchromosomen. Es handelt sich dabei um Interphasechromosomen, die aus mehr als 1.000 gepaarten Chromatiden bestehen, was ihre große Länge und Dicke erklärt. Sie weisen eine spezifische Bandenstruktur auf, wobei ein bestimmtes Gen einer distinkten Bande zugeordnet und damit die lineare Anordnung der Gene auf den Chromosomen sichtbar gemacht werden konnte. Damals schien es ausgeschlossen, jemals die Reihenfolge der Gene auch auf den menschlichen Mitosechromosomen oder die Expression der Gene lichtmikroskopisch nachweisen zu können. Heute ist dies dank des Fortschrittes auf dem Gebiet der molekularen Zytogenetik möglich. Mittels der Technik der Fluoreszenz-insitu-Hybridisierung (FISH) können die Gene beim Menschen rasch kartiert und ihr Verlust bei bestimmten Erkrankungen lichtmikroskopisch nachgewiesen werden (> Abb. 1.3.2). Einzelheiten zu diesen Verfahren finden sich im Kapitel „Chromosomopathien“ im Band „Monogen bedingte Erbkrankheiten 2“ (Ganten u. Ruckpaul 2000). Die FISH-Analyse kann mit Einzelsonden geschehen, aber auch mit einem Gemisch von Proben, die repräsentativ für ein einzelnes Chromosom („chromosome painting“) oder einzelne Chromosomenabschnitte sind. Verwendet man hierfür unterschiedliche Fluorochrome, ergibt sich ein chromosomales Bandenmuster, das der Kodierung durch ein Strichmuster entspricht und als „chromosomal bar code“ bezeichnet wird. Dieser Nachweis kann auch in Zellkernen vorgenommen

44

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.3.1. Gegenüberstellung von zytogenetischen Beobachtungen mit den entsprechenden genetischen Befunden, die durch das

Kreuzungsexperiment erschlossen wurden, die zusammen dann die „Chromosomentheorie der Vererbung“ begründet haben

werden, sodass man dank der FISH-Technik nicht mehr auf Metaphasechromosomen und damit auf proliferierende Zellen für eine zytogenetische Untersuchung angewiesen ist (Interphase-Zytogenetik). Mittels der komparativen genomischen Hybridisierung („comparative genomic hybridization“, CGH) kann man sogar sämtliche chromosomale Aneuploidien an DNA bis zu einer

Größe von ca. 3Mbp nachweisen (> Abb. 1.3.2). Durch die Chip-basierte Array-CGH kann die Auflösung noch einmal wesentlich gesteigert werden (Übersicht bei Pinkel u. Albertson 2005; Lockwood et al. 2006; Ylstra et al. 2006). Ebenso kann heute für jedes Gen die entwicklungsund gewebsspezifische Expression auf RNA-Ebene

45 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin

a

b

c

1.3

. Abb. 1.3.2a–d. a Schematische Darstellung der Fluoreszenz-in-situ-Hybridisierung (FISH). Hierzu wird eine DNA-Probe, die mit einem Fluorochrom markiert ist, auf menschliche Metaphasechromosomen hybridisiert. Deren DNA wurde zuvor in den einzelsträngigen Zustand überführt. b Ausschnitt aus einer Metaphase nach FISH mit zwei Sonden von Chromosom 7, der für Williams-Beuren-Syndrom (WBS) kritischen Region in 7q11.2 (rot) und der Kontrollregion in der Zentromerregion von Chromosom 7 (grün): Beide Fluoreszenz-Signale sind auf beiden Chromosomen 7 nachweisbar. c Metaphase einer WBS-Patientin, die eine Deletion für die beim Williams-BeurenSyndrom kritische Region in 7q11.2 aufweist: Das rote FISH-Signal ist nur auf einem der beiden Chromosomen 3 nachweisbar; das zweite, deletierte Chromosom 3 ist durch den Pfeil markiert. d Prinzip der komparativen genomischen Hybridisierung (CGH) und der Array-CGH: Die DNA wird mit unterschiedlichen Fluorochromen markiert: Testperson (grün), Normalperson (rot). Anschließend werden beide DNAs auf normale Metaphasechromosomen hybridisiert und die Ratioprofile von grüner zu roter Fluoreszenz bestimmt. Bei einer Verminderung (dim = diminished) in der TestDNA kommt es zu einer Abweichung des Ratioprofils nach rot, bei Vorliegen von zusätzlichem Material (enh = enhanced) in der Test-DNA zu einer Abweichung nach grün. Das Prinzip der Array-CGH ist praktisch identisch, die beiden DNAs (Test-DNA: grün, Kontroll-DNA: rot) werden aber hier auf ein Panel von gespotteten DNA-Proben hybridisiert, deren genomische Lokalisation bekannt ist und die das Genom in gleichmäßigen Abständen abdecken. Damit ist die Sensitivität der Array-CGH deutlich höher als die der konventionellen CGH

d

durch In-situ-Hybridisierung ermittelt werden. Hierzu wird z. B. an Gewebsschnitten der Maus die betreffende mRNA durch Hybridisierung mit der betreffenden Gensonde erfasst. Mittels DNA-RNA-Hybridisierung können sogar die Transkripte an den (Meiose-)

Chromosomen nachgewiesen und damit auch beim Säuger aktive Gene lichtmikroskopisch dargestellt werden. Damit hat auch die Säugerzytogenetik unmittelbaren Anschluss an die molekulare Genetik gefunden.

46

Sektion 1 · Allgemeine Grundlagen

1.3.3 Grundlagen der Chromosomenphysiologie 1.3.3.1 Strukturen der Chromosomen und des Chromatins Das Erbgut einer normalen Körperzelle des Menschen besteht aus ca. 6 u109 Basenpaaren (Bp), die aneinandergereiht einen DNA-Faden von etwa 2 m Länge und 2 nm Durchmesser ergeben würden. Tatsächlich ist dieser nicht durchgehend, sondern in die 46 Chromosomen des diploiden Satzes aufgeteilt. Das lichtmikroskopisch sichtbare Chromosom besteht aus zwei identischen Spalthälften, den Chromatiden, die jeweils eine durchgehende DNA-Doppelhelix aufweisen. Im Metaphasechromosom ist die DNA um das mehr als 10.000-Fache kondensiert (> Abb. 1.3.3). Diese Verkürzung geschieht in mehreren Stufen. Die erste Organisationseinheit der Chromatinstruktur sind die Nukleosomen, die aus zweifach um ein Oktamer aus den Histonen H2A, H2B, H3 und H4 gewickelter DNA bestehen. Der Nukleosomenfaden von 10 nm ist fast immer zu der 30-nm-Faser verpackt, die sich wahrscheinlich nicht durch ein helikales Supercoiling sondern durch eine Zickzack-Anordnung unter Einbeziehung des Linker-Histons H1 bildet (Bednar et al. 1998), wobei eine weitere Verdichtung des Genoms um das 6- bis 7-Fache erreicht wird. Zur Bildung der Metaphasechromosomen muss diese 30-nm-Faser noch weiter verdichtet werden (Swedlow u. Hirano 2003). Dieser letzte Schritt der Packung eines Chromatinfadens ist noch nicht endgültig geklärt. Es spricht jedoch vieles

dafür, dass die Chromatinfibrille im Interphasekern Schleifen von 50 bis mehr als 100 Kilobasenpaare (Kb) DNA ausbildet, deren Basis aus einem mehrere 100 Bp AT-reichen Abschnitt besteht, der mit einem schwer löslichen Proteinkomplex verbunden ist, der Kernmatrix oder SAR („scaffold-associated region“). Deren Hauptkomponente sind Topoisomerase IIα und das SMC2-Protein („structural maintenance of chromosomes 2“, SMC2, Untereinheit des Condensin-I-Komplexes) (Übersicht bei Earnshaw 1988; Koshland u. Strunnikov 1996; Hart u. Laemmli 1998; Losada und Hirano 2005). Beim Übergang in die Mitose kommt es zum Zusammentreten einzelner dieser Proteinkomplexe unter Ausbildung einer durchgehenden Achse, dem eigentlichen „scaffold“. Durch anschließende helikale Faltung kommt es dann zur Ausbildung der Chromatiden mit etwa 700 nm Durchmesser. In dem kompakten Zustand der Metaphasechromosomen, der Transportform, ist das genetische Material inaktiv. In der Interphase liegt das Chromatin in dekondensierter Form vor, die einzelnen Chromosomen sind nicht mehr sichtbar. Sie können jedoch nach In-situ-Hybridisierung als distinkte Bereiche im Interphasekern nachgewiesen werden. Der Begriff „Chromosomenterritorium“ wurde hierfür bereits 1909 von Boveri geprägt (Übersicht bei Cremer et al. 1982; Marshall et al. 1997; Bridger u. Bickmore 1998; Belmont et al. 1999). Die Chromosomen können ihre Position im Interphasekern verändern; wenn die Zelle jedoch ausdifferenziert ist, scheint ihre Anordnung stabil zu sein (Übersicht bei Zink u. Cremer 1998). . Abb. 1.3.3. Schematische Darstellung der Chromosomenorganisation, ausgehend von der DNA bis hin zum lichtmikroskopisch sichtbaren Chromosom. Nähere Einzelheiten 7 Text (nach Hart u. Laemmli 1998)

47 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin

In Zellen mit stark reduzierter genetischer Aktivität liegt auch das Chromatin in kompakter Form vor, wie z. B. in den Spermien oder in den Zellkernen der Lymphozyten des peripheren Bluts. Die Regel aber ist, dass das Chromatin der Zellkerne aus stärker und schwächer anfärbbaren Anteilen, d. h. unterschiedlich kondensierten Bereichen, besteht. Hierfür hat Gutherz (1907) den Begriff Heteropyknosis vorgeschlagen. Durchgesetzt hat sich hingegen die von Heitz (1928, 1929) eingeführte Bezeichnung Heterochromatin für die gegenüber dem Euchromatin stärker angefärbten Bereiche.

1.3.3.2 Funktionelle Gliederung der Chromosomen und Genkartierung Weitere Einsichten in die funktionelle Gliederung des Genoms haben verschiedene Verfahren der differenziellen Anfärbung der Chromosomen in Verbindung mit der Genkartierung erbracht. Das verbreiteteste Verfahren hierfür ist die sog. G-Bandentechnik, die auf einer speziellen Vorbehandlung der Chromosomen und anschließender Giemsa-Färbung beruht. An Chromosomen der Prophase können so mehr als 850 dunkle und helle Banden unterschieden werden (> Abb. 1.3.4). Die hellen G-Banden werden auch als R-Banden („reverse bands“) bezeichnet. Eine Untergruppe davon bilden die T-Banden, die sich bevorzugt an den Chromosomenenden finden. Mittels der C-Bandentechnik werden die zentromernahen Bereiche spezifisch angefärbt, wobei die besonders großen C-Banden der Chromosomen 1, 9, 16

a

b

. Abb. 1.3.4a–d. Darstellung des Bandenmusters des Chromosoms 11 mit unterschiedlicher Auflösung. a Ca. 200 Banden pro haploidem Genom. Im mittleren Abschnitt des langen Armes von Chromosom 11 ist eine dunkle Bande erkennbar. Diese ist auf dem 400-Bandenstadium b eindeutig in zwei Banden aufgeteilt. Eine gute

1.3

und Y auffallen. Diese können zwischen verschiedenen Individuen erheblich variieren (chromosomale Heteromorphismen). Mittels In-situ-Hybridisierung kann heute sogar das Bandenmuster der Chromosomen im Interphasekern nachgewiesen und gezeigt werden, dass deren Größe etwa einem 600 Bandenstadium entspricht. Das heißt, die Gesamtlänge von Interphase- und Mitosechromosomen ist kaum verschieden, die Unterschiede betreffen die Ausbildung und Anordnung der Chromatinfibrille (Lemke et al. 2002). Nach Zugabe des Basenanalogons Bromdesoxyuridin (BrdU) während der DNA-Replikation können die neu synthetisierten Bereiche aufgrund ihrer geringen Anfärbung nachgewiesen werden. Hierbei zeigt sich, dass die R-Banden in der ersten Hälfte der S-Phase repliziert werden, die G-Banden in der zweiten Hälfte und ganz zum Schluss die C-Banden sowie das genetisch inaktive X-Chromosom im weiblichen Geschlecht. Bemerkenswert ist, dass die Zahl der Replikationsbanden praktisch der maximalen Anzahl von Banden entspricht, die nach differenzieller Färbung darstellbar sind. Geht man von 1.000 Banden pro haploidem Genom, d. h. pro 3u109 Bp, aus, entspricht eine Bande bzw. eine Replikationseinheit im Durchschnitt etwa 3u106 Bp oder 3 Mbp. Da die Initiationsstellen für die Replikation („replication origins“) ca. 50 bis mehr als 100 Kbp auseinanderliegen, sollten in einer Replikationseinheit etwa 10 bis 50 derartiger Replikons zusammengefasst sein (Übersicht bei Holmquist 1992; Craig u. Bickmore 1993; Machida et al. 2005). Direkte Hinweise auf die genetische Ausstattung der einzelnen chromosomalen Banden lieferte die Kartie-

c

d

Bänderungsqualität mit ca. 550 Banden ist in c gezeigt, wobei der kurze Arm drei distinkte dunkle Banden aufweist. Auf dem 850-Bandenstadium d kann die Bande 11p14.1 deutlich von 11p14.3 unterschieden werden. Die Schemazeichnungen b–d stammen aus ISCN, 1995 (Sperling et al. 1997)

48

Sektion 1 · Allgemeine Grundlagen

rung von Genen und repetitiven DNAs mittels In situHybridisierung. Die Befunde werden ausführlich im Kapitel „Chromosomopathien“ im Band „Monogen bedingte Erbkranheiten 2“ (Ganten u. Ruckpaul 2000) abgehandelt und lassen sich folgendermaßen zusammenfassen: 1. Die Chromosomen 13, 18 und 21 sind die Autosomen mit der niedrigsten Anzahl von Genen. Es sind auch die einzigen Autosomen, für die eine Trisomie mit dem Leben vereinbar ist, alle anderen Trisomien enden als Spontanaborte bzw. bereits vor der Implantation. 2. Die T-Banden sind die genreichsten Regionen, gefolgt von den R-Banden. Speziell finden sich hier die sog. „house-keeping genes“, die für den Grundmetabolismus der Zellen verantwortlich und in nahezu sämtlichen Zellen aktiv sind. Die G-Banden sind hingegen wesentlich genärmer und enthalten vor allem die entwicklungs- und gewebsspezifisch exprimierten Gene. Die C-Banden sind praktisch genleer (Übersicht bei Holmquist 1992; Craig u. Bickmore 1993). 3. Die chromosomalen Banden unterscheiden sich auch hinsichtlich der vorherrschenden repetitiven Elemente. So weisen die T- und R-Banden überwiegend kurze repetitive Elemente von etwa 300 Bp Länge auf („short interspersed nucleotide elements“, SINES), deren wichtigste Vertreter die Alu-Elemente sind (genannt nach einer charakteristischen Schnittstelle für das Restriktionsenzym AluI). In den G-Banden finden sich überwiegend längere repetitive Elemente („long interspersed nucleotide elements“, LINES), die weit über 1.000 Bp lang sein können (Übersicht bei Smit 1996; Kazazian 2005). 4. Das C-Banden-Material im Bereich der Zentromere besteht überwiegend aus sehr kurzen, millionenfach vorhandenen repetitiven Elementen (sog. SatellitenDNAs). Die großen C-Banden der Chromosomen 1, 9, 16 und Y sind jedoch deutlich komplexer aufgebaut. In Analogie zu Befunden an Drosophila und Erdmaus dürften sie dem β-Heterochromatin entsprechen, das C-Banden-positive Material in den Zentromerregionen der übrigen Chromosomen dem α-Heterochromatin (Neitzel et al. 1998). Werden diese Befunde zur genetischen Zusammensetzung der verschiedenen chromosomalen Strukturen in Bezug gesetzt zu den Vorstellungen ihrer molekularen Organisation, so ergibt sich folgendes Chromosomenmodell: Die Schleifen des Interphasechromatins, die durch SARs voneinander getrennt werden, stimmen hinsichtlich ihrer Länge gut mit einzelnen Replikons überein. Vermutlich handelt es sich dabei um die

gleichen funktionellen Grundeinheiten (funktionelle Domänen). Ein Cluster aus 10 bis 50 dieser Elemente dürfte einer chromosomalen Bande von 3 Mbp entsprechen. Diese Bereiche weisen zudem eine gut übereinstimmende Basenzusammensetzung auf. Es handelt sich um sog. Isochore, die sich im Dichtegradienten abtrennen lassen. Das Isochor mit dem höchsten GC-Gehalt ist bevorzugt in den T-Banden anzutreffen. Bei diesen Isochoren handelt es sich um ein Kennzeichen der Warmblüter und vermutlich eine evolutionäre Anpassung an die hohe Körpertemperatur, die eine entsprechende Stabilität der DNA erfordert (Bernardi 1989). Die R- und T-Banden sind besonders genreich, sie replizieren in der frühen S-Phase und haben eine offene Konformation und dürften größere Schleifen ausbilden als die G-Banden. Diese weisen deutlich weniger Gene auf, die in der Regel gewebsspezifisch exprimiert sind. Ihre Schleifen sind kleiner, der Kondensationsgrad in der Mitose größer. Aus klinischer Sicht ist bedeutsam, dass sich Veränderungen von R-Banden-Material gravierender auf die Entwicklung auswirken als von G-Banden [7 Kap. „Chromosomopathien“ im Band „Monogen bedingte Erbkrankheiten 2“ (Ganten u. Ruckpaul 2000)]. Die C-Banden bestehen nahezu ausschließlich aus repetitiven DNAs. Dies erklärt, weshalb Unterschiede in ihrer Menge ohne offenkundige klinische Auswirkungen sind. Neben diesen globalen Vergleichen erlaubt die vergleichende Genkartierung aber auch Einsichten, die die Regulation der Genaktivität betreffen. Aus der menschlichen Genkarte wird ersichtlich, dass Gene, die aufeinanderfolgende Schritte bestimmter Stoffwechselprozesse steuern, generell auf unterschiedlichen Chromosomen bzw. chromosomalen Abschnitten gelegen sind, anders als bei Bakterien, bei denen sie in ein Operon eingeschlossen sind. Dies trifft auch für solche Gene zu, die verschiedene Untereinheiten eines Proteins kodieren und daher in stöchiometrischen Verhältnissen vorliegen müssen. Ihre Regulation muss daher individuell erfolgen (Sperling 1999). Die Genkarte stellt das entscheidende Ordnungsprinzip in der Genetik dar. Die Angabe, wo welche Gene, klonierte DNA-Fragmente oder bereits sequenzierte Abschnitte gelegen sind, war die Voraussetzung für die Erstellung der vollständigen Basensequenz des menschlichen Genoms. Der Genkartierung kommt daher im Rahmen des Humangenomprojekts eine zentrale Rolle zu. Ebenso wichtig ist der rasche Zugriff auf diese Daten. Hier soll nur auf die Datenbank des NCBI (http://www. ncbi.nlm.nih.gov/) hingewiesen werden, die viele Banken zusammenfasst und Verbindungen von der Chromosomenkarte bis hinunter zu der Sequenz des Gens und seiner Beschreibung herstellt.

49 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin

1.3.4 Zellzyklus und CheckpointKontrolle Charakteristische Kennzeichen proliferierender Zellen sind das Zellwachstum und die Zellteilung. Der gesamte Zellzyklus setzt sich danach aus der Interphase sowie der Kern- und der Zellteilung (Zytokinese) zusammen, bei der die Chromosomen sichtbar werden. Der gesamte Ablauf der Mitose dauert etwa eine Stunde. Die Interphase hingegen ist sehr viel länger und variiert in dieser Hinsicht auch erheblich zwischen verschiedenen Geweben. Sie wird in drei Phasen unterteilt: die S-Phase (Synthese), in der die Verdoppelung des genetischen Materials stattfindet, die G1-Phase (engl. „gap“, Lücke), dem Zeitabschnitt vom Ende der Mitose bis zu Beginn der S-Phase, sowie der G2-Phase, dem Abschnitt zwischen Ende der S-Phase und Beginn der Mitose. Zur Kennzeichnung solcher Zellen, die sich nicht mehr teilen (z. B. die Muskelzellen des Erwachsenen) oder nur nach einem bestimmten Stimulus (z. B. die Lymphozyten des peripheren Blutes) wurde der Begriff G0-Phase eingeführt (> Abb. 1.3.5). Fusioniert man Mitosezellen mit solchen der G1-, Soder G2-Phase, kommt es in letzteren sofort zum Eintritt eines mitoseähnlichen Prozesses unter Ausbildung vorzeitig kondensierter Chromosomen („premature chro-

1.3

mosome condensation“, PCC). Erwartungsgemäß bestehen die Chromosomen der G1-Phase nur aus einer Chromatide, die der G2-Phase aus zwei noch eng gepaarten Chromatiden. Die Chromosomen der S-Phase hingegen zeigen ein „pulverisiertes“ Aussehen. Hierbei ist die Chromosomenkontinuität jedoch nicht aufgehoben, die ungefärbten Bereiche zwischen den einzelnen Fragmenten stellen vielmehr die Orte der DNA-Verdoppelung dar. So findet man in der frühen S-Phase nur einzelsträngige, in der späten S-Phase hingegen doppelsträngige Fragmente. Dies zeigt, dass bestimmte Bereiche der Chromosomen zu diskreten Zeiten der S-Phase repliziert werden. Diese Versuche zeigen, dass sich im Zytoplasma der Mitosezellen ein Faktor befindet, MPF (maturation promoting factor), dessen Vorhandensein bestimmt, wann eine Zelle in die Mitose eintritt und durch den alle nachfolgenden Prozesse wie die Chromosomenkondensation, die Auflösung der Kernmembran und die Ausbildung des Spindelapparats gesteuert werden (Übersicht bei Sperling u. Rao 1974; Sperling 1982; Lewin 1990). In vergleichbarer Weise wird die Chromosomenkondensation auch in der Meiose reguliert. So kommt es bei der In-vitro-Fertilisation nicht selten zur Ausbildung vorzeitig kondensierter Spermienchromosomen, wenn die Oozyten nach dem Eindringen des Spermiums . Abb. 1.3.5. Schematische Darstellung von Zellzyklus und Chromosomenzylus. Der Ablauf des Zellzyklus wird entscheidend durch spezifische zyklinabhängige Proteinkinasen (innerer Bildteil, nach Shackelford et al. 1999), die hier als S-CDK und M-CDK zusammengefasst wurden, und den APC („anaphase promoting complex“) gesteuert. Zugleich erfahren die Chromosomen charakteristische Veränderungen. In der G1-Phase bestehen sie aus einer Chromatide, an die sich der Prä-RC („pre replication complex“) anlagert. Die R-Banden replizieren in der frühen S-Phase, was sich an vorzeitig kondensierten S-Phase-Chromosomen (S-PCC) als Färbelücke darstellt, in der späten S-Phase sind diese Bereiche doppelsträngig und die replizierenden G-Banden ungefärbt. Beim Übergang in die Mitose kommt es durch helikale Faltung zu einer weiteren Verkürzung der Chromosomen. Weitere Einzelheiten 7 Text. (1): Checkpoints nach Schädigung der DNA; (2): Topoisomerase-IIabhängiger Checkpoint; (3): Spindel- (Kinetochor-)Checkpoint; (R): Restriktionspunkt

50

Sektion 1 · Allgemeine Grundlagen

in der Metaphase II arretiert bleiben (Schmiady et al. 1986). Heute sind die Faktoren identifiziert, die den Eintritt in die Mitose und S-Phase steuern. Es handelt sich um spezifische zyklinabhängige Proteinkinasen, CDKs („cyclin-dependent protein kinase“). Die katalytischen Untereinheiten dieser Kinasen sind nur dann aktiv, wenn sie mit einer regulatorischen Untereinheit, bestimmten Zyklinen, zusammentreten. Die Mitose wird durch die M-CDK (syn. MPF) gesteuert, die sich aus der Proteinkinase CDC2 („cell division control“, cdc, CDK1) und Zyklin A oder B zusammensetzt, die S-Phase durch die S-CDKs (> Abb. 1.3.5). Die Aktivität der Proteinkinasen variiert mit dem Zellzyklus, was entscheidend von der Verfügbarkeit der jeweiligen Zykline abhängt, die, wie der Name bereits verrät, zyklisch synthetisiert und nach Ubiquitinilierung durch das Proteasom abgebaut werden (Übersicht bei Solomon et al. 1990; Ohi u. Gould 1999; Tyers u. Jorgensen 2000; Pines u. Rieder 2001). In der frühen Prophase beginnt der Prozess der Chromosomenkondensation, in den zwei SMC-Komplexe („structural maintenance of chromosomes“, SMC) einbezogen sind, Condensin I und Condensin II (Übersicht bei Hirano 2005). Inzwischen wurde erstmalig eine autosomal-rezessive Erkrankung beim Menschen beschrieben, bei der es in den Zellen der Patienten zu einem vorzeitigen Eintritt in die Chromosomenkondensation kommt und zwar unmittelbar nach Beendigung der S-Phase (Neitzel et al. 2002). Ursächlich sind Mutationen im MCPH1-Gen, das offenbar ein Regulator des sogenannten Condensin-II-Komplexes ist (Trimborn et al. 2004; Trimborn et al. 2006). Nach Eintritt in die Mitose ordnen sich die Chromosomen in der Äquatorialplatte der Metaphase an. Erst nachdem alle Chromosomen so ausgerichtet sind, setzt die Trennung der Zentromerregion ein. Hierfür ist der Anaphase-Promoting-Complex (APC oder Cyclosom) verantwortlich, der zum einen diejenigen Proteine abbaut, die die Schwesterzentromere verbinden, und so den Eintritt in die Anaphase ermöglicht (> Abb. 1.3.5). Zum anderen trägt der APC-Komplex zum Abbau von Zyklin B und Komponenten des Spindelapparats bei. Zugleich wird dadurch der Block beseitigt, der die Anlagerung des Präreplikationskomplexes an die Chromatiden als Voraussetzung für die nachfolgende DNA-Synthese verhindert (Übersicht bei Peters 2002; Castro et al. 2005). Für den geregelten Ablauf des Zellzyklus ist entscheidend, dass die Mitose nicht beginnt, bevor die DNA vollständig repliziert ist und dass die Anaphase nicht eintritt, bevor sämtliche Chromosomen korrekt in der Äquatorialplatte angeordnet sind. Hierfür sind Kontrollmechanismen verantwortlich, die eng mit den Regulatoren des

Zellzyklus kooperieren. Von besonderer Bedeutung ist das „DNA damage response network“ (> Abb. 1.3.5), da die DNA das einzige Molekül der Zelle ist, das im Falle einer Schädigung nicht ersetzt, sondern repariert wird. Nach einer Schädigung der DNA kommt es zu einer Verlangsamung oder Arretierung des Zellzyklus in der G1-, S- oder G2-Phase, bis der Schaden behoben ist. Allerdings gibt es in der späten G2-Phase einen bestimmten Zeitpunkt („point of no return“), von dem an auch hohe Strahlendosen oder andere exogene Noxen den Eintritt in die Mitose nicht mehr aufhalten können. Bei einer Reihe höherer Tiere liegt dieser Punkt erst in der mittleren Prophase (Pines u. Rider 2001). Es ist eine Vielzahl von Genen an dem „DNA damage response network“ beteiligt. Solche, die der Schadenserkennung (Sensoren) dienen, und jene, die die Weiterleitung des jeweiligen Signals („signal transducer“) bis hin zu den Strukturen („target“) veranlassen, die die Arretierung des Zellzyklus bewirken (Übersicht bei Weinert 1998a, 1998b; Lisby u. Rothstein 2004). Hierbei besteht eine enge Kopplung mit den Prozessen, die für die Regulation des Zellzyklus und die DNA-Reparatur verantwortlich sind. Im Falle von DNA-Doppelstrangbrüchen (DSB) zählen dazu das ATM- und das NBS-Gen (Übersicht bei O’Driscoll u. Jeggo 2006). Eine Mutation in diesen Genen führt zu den autosomal-rezessiven Krankheiten Ataxia teleangiectatica bzw. dem Nijmegen-breakageSyndrom. Ihre Zellen weisen eine erhöhte Chromosomeninstabilität auf und eine extreme Empfindlichkeit gegenüber ionisierenden Strahlen, durch die bevorzugt DSBs ausgelöst werden. Auch diese Erkrankungen sind ein Beispiel dafür, wie eine zytogenetische Auffälligkeit, die erhöhte spontane und strahleninduzierte Chromosomenbrüchigkeit, den Weg zur Identifikation des zugrunde liegenden Gens eröffnet hat (Sperling et al. 1998; Digweed et al. 1999; Digweed u. Sperling 2004). Klinisch weisen diese Patienten ein hohes Tumorrisiko auf. Die Checkpoint-Kontrolle betrifft aber nicht nur DNA-Veränderungen, sondern auch die vollständige Anordnung der Chromosomen in der Äquatorialplatte der Metaphase als Voraussetzung für ihre korrekte Aufteilung. Ein einzelnes, fehlorientiertes Chromosom führt zur Blockierung in der Metaphase (Übersicht bei Rieder u. Salmon 1998; Dobie et al. 1999; Zachariae 1999). Für den Zusammenhalt der Schwesterchromatiden bis in die Prophase ist primär der Proteinkomplex Cohesin verantwortlich (Übersicht bei Losada u. Hirano 2005). Beim Roberts-Syndrom (Übersicht bei Van Den Berg u. Francke 1993) liegt eine Störung in der Kohäsion vor, zytogenetisch ist eine vorzeitige Trennung der Zentromere zu beobachten, die auf einem fehlenden Zusam-

51 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin

menhalt des zentromerischen Heterochromatins beruht. Die Kinder weisen u. a. schwere Skelettfehlbildungen auf. Als ursächlich wurden Mutationen im ESCO2-Gen identifiziert, einem hoch konservierten Protein, das für die Ausbildung der Schwesterchromatidkohäsion in der S-Phase verantwortlich ist. Auch bei der autosomal-rezessiven „Mosaic Variegated Aneuploidy“ liegt ein Gendefekt vor, der das BUB1B-Gen betrifft, das eine wichtige Rolle bei der Schwesterchromatidkohäsion und beim Spindelcheckpoint spielt (Kitajima et al. 2005). Die Betroffenen weisen in somatischen Zellen eine hohe Aneuploidierate und ein hohes Krebsrisiko auf. 1999 gelang es, das Gen zu identifizieren, das dem autosomal-rezessiven ICF-Syndrom („immunodeficiency“, „centromeric instability“, „facial anomalies“) zugrunde liegt (Okano et al. 1999; Xu et al. 1999). Zytogenetisch sind die Patienten durch eine „Instabilität“ des Heterochromatins der Chromosomen 1, 9 und 16 gekennzeichnet. Diese beruht auf einer Hypomethylierung dieser Chromatinfraktion infolge eines Defekts der DNA-Methyltransferase, DNMT3B. Damit geht auch eine Hypomethylierung des inaktiven X-Chromosoms im weiblichen Geschlecht einher, das zugleich früher repliziert und vermutlich nicht mehr der vollständigen Inaktivierung unterliegt (Hansen et al. 2000). Auch hier hat der zytogenetische Befund entscheidend zur Aufklärung dieses komplexen Krankheitsbildes beigetragen.

1.3.5 Chromosomopathien Die Chromosomopathien werden in einem eigenen Kapitel im Band „Monogen bedingte Erbkranheiten 2“ (Ganten u. Ruckpaul 2000) abgehandelt. Hier werden nur die Ergebnisse kurz zusammengefasst, die unmittelbar die molekulare Medizin berühren. Bei den verschiedenen Chromosomopathien können strukturelle von numerischen Mutationen unterschieden werden. Hinzu kommen Mosaike und Chimären, worunter das Vorliegen mehrerer chromosomal unterschiedlicher Zellinien in einem Individuum verstanden wird. Der unterschiedlichen Klassifikation liegt auch ein verschiedener Entstehungsmechanismus zugrunde (Sperling u. Neitzel 2000). Hinsichtlich der Häufigkeit von Chromosomenanomalien zum Zeitpunkt der Befruchtung nimmt der Mensch eine Sonderstellung ein, da vermutlich mehr als 30% aller Zygoten einen aberranten Chromosomensatz aufweisen, insbesondere eine Aneuploidie. Als eine Erklärung hierfür wird der fehlende Checkpoint gegenüber Chromosomenfehlverteilungen in der Oogenese angenommen. Die Zellteilungen nach der Befruchtung laufen rasch nacheinander ab und scheinen ebenfalls besonders feh-

1.3

leranfällig zu sein, da ein Großteil von 6–10 Zell-Embryonen nach FISH-Analyse eine Mosaikkonstitution aufweisen und etwa 10% vollkommen aberrante („chaotic“) Karyotypen (Delhanty et al. 1997). Diese Befunde sprechen dafür, dass die Checkpoint-Kontrolle bei den ersten Zellteilungen noch nicht wirkungsvoll funktioniert (Übersicht bei Handyside u. Delhanty 1997). Sie erklären zugleich, dass diskrepante chromosomale Befunde zwischen dem extraembryonalen Gewebe und dem eigentlichen Fetus nicht selten sind (Sperling et al. 1997). Ein erheblicher Anteil chromosomal aberranter Embryonen geht bereits vor der Implantation zugrunde, darunter praktisch sämtliche autosomale Monosomien, ein weiterer Teil führt zu einem Spontanabort. Der Anteil Neugeborener mit einem auffälligen Karyotyp liegt bei 0,6%.

1.3.5.1 Aneuploidien Die ungleiche Überlebensrate der verschiedenen Chromosomenanomalien ist Ausdruck der jeweiligen genetischen Imbalanc. Beispielhaft hat Gropp (1982) dies für die Maus gezeigt, da hier Spezialstämme zur Verfügung stehen, mit denen für jedes Autosom gezielt trisome bzw. monosome Feten erzeugt werden können. Entsprechend wie beim Menschen sind bald nach der Implantation nur noch trisome Feten zu finden, deren charakteristische Überlebensrate von dem jeweils betroffenen Chromosom abhängt. Dabei können – ebenso wie beim Menschen – verschiedene Trisomien gleiche Fehlbildungen aufweisen, während andere Fehlbildungsmuster charakteristisch für bestimmte Trisomien sind. Diese Semispezifität kann damit erklärt werden, dass komplexe morphogenetische Prozesse durch zahlreiche Gene gesteuert werden, die auf unterschiedlichen Chromosomen gelegen sind. Die Veränderungen in der Dosis jedes einzelnen Gens münden dabei in einen recht übereinstimmenden pathogenetischen Prozess ein. Wird hierdurch z. B. die Proliferation bestimmter Zellen während der Embryogenese verlangsamt, führt dies zu einer Hypoplasie. Wenn dadurch in einer kritischen Phase der Differenzierung eines Blastems weniger Zellen als normal zur Verfügung stehen, kann nach dem Alles-oder-nichts-Gesetz die Morphogenese gerade noch normal ablaufen oder so gestört sein, dass es zu einer Fehlbildung kommt. Dabei dürften auch stochastische Effekte eine Rolle spielen, ob ein kritischer Schwellenwert über- oder unterschritten wird. Zum Verständnis der Ätiologie derartiger Chromosomopathien spielt also nicht nur die genetische Ausstattung des jeweiligen Chromosoms eine Rolle, sondern auch der Zufall.

52

Sektion 1 · Allgemeine Grundlagen

1.3.5.2 Imprinting Der hohe Prozentsatz trisomer Zygoten und die Fehlerrate der ersten Zellteilungen kann auch dazu führen, dass es durch Anaphaseverlust oder Non-Disjunction des überzähligen Chromosoms zur Entstehung einer diploiden Zelllinie kommt. In einem Drittel der Fälle stammen dann beide Chromosomen nur von einem Elternteil, es liegt eine uniparentale Disomie (UPD) vor. Als Folge davon können Chromosomenabschnitte auftreten, die vollkommen identisch sind, d. h. die gleichen Allele aufweisen (uniparentale Isodisomie). Dies kann zu Homozygotie für seltene rezessive Erkrankungen führen, obwohl nur ein Elternteil heterozygoter Genträger ist (Engel 1998). Darüber hinaus kann es als Folge einer UPD zu Entwicklungsstörungen kommen, die auf einen Imprintingeffekt zurückgehen. Gemeint ist damit, dass die Expression bestimmter Gene von der elterlichen Herkunft abhängig ist. So ist in bestimmten Arealen des Gehirns (Hippocampus, Zerebellum) nur das mütterliche UBE3A-Gen auf dem Chromosom 15 aktiv. Im Falle einer paternalen UPD 15 wird daher das betreffende Protein dort nicht gebildet, und es kommt zum Angelman-Syndrom (AS). Der gleiche Effekt stellt sich ein, wenn das mütterliche Gen infolge einer Deletion verloren ging. Betrifft die Deletion das väterliche bzw. die UPD das mütterliche Chromosom 15, führt dies zum Prader-Willi-Syndrom. Hier ist das klinische Bild durch den Ausfall bestimmter väterlicher Gene bestimmt. Die Aktivität dieser Gene wird durch ein „Imprinting Center“ über eine größere Entfernung hinweg gesteuert und führt zu charakteristischen gametenspezifischen Methylierungsmustern. Es handelt sich hierbei also auch um ein chromosomales Phänomen (Brannan u. Bartolomei 1999; Ben-Porath u. Cedar 2000; Sleutels et al. 2000). Ein gesicherter Imprintingeffekt fand sich neben dem Chromosom 15 für paternale UPD 6 (transienter neonataler Diabetes mellitus), maternale UPD 7 (SilverRussell-Syndrome), paternale UPD 11 (Beckwith-Wiedemann-Syndrom), maternale UPD 14 (Minderwuchs und vorzeitige Pubertät) und paternale UPD 14 (starker Minderwuchs mit Skelettdysplasie). Derartige epigenetische Prozesse, bei denen die elterlichen Erbanlagen unterschiedlich programmiert sind, spielen in der frühen Entwicklung eine wesentliche Rolle. Erste Belege hierfür lieferte der zytogenetische Hinweis auf parthenogenetische Entwicklung beim Menschen (Surani 1995). Zum einen betrifft es gutartige Geschwülste, die sog. ovariellen Teratome. Diese können differenzierte Strukturen aller drei Keimblätter ausbilden und weisen stets einen weiblichen Chromosomensatz auf. Sie gehen auf eine unbefruchtete Eizelle zurück,

die die 1. Reifeteilung durchlaufen hat und infolge Verdopplung des haploiden Satzes wieder diploid wurde. Im anderen Fall handelt es sich um eine – abortive – Entwicklung mit ausschließlich väterlichem Erbgut. Durch Befruchtung einer kernlosen Eizelle mit einem X-haltigen Spermium und anschließender Verdopplung des haploiden Satzes kommt es zu vollständigen Blasenmolen, die keinen Embryo, sondern ausschließlich extraembryonales Gewebe aufweisen. Das heißt, die väterlichen Gene steuern bevorzugt die Entwicklung des extraembryonalen Gewebes, die mütterlichen die des eigentlichen Embryos. Ein weiteres epigenetisches Phänomen betrifft die X-Inaktivierung im weiblichen Geschlecht. Der sog. Dosiskompensationsmechanismus führt dazu, dass im weiblichen Geschlecht eines der beiden X-Chromosomen inaktiviert wird und dadurch die Zahl aktiver Xchromosomaler Gene in beiden Geschlechtern annähernd gleich ist. Die X-Inaktivierung findet in der frühen Embryogenese zufällig zwischen dem väterlichen und mütterlichen X statt, bleibt dann aber über die Zellteilungen hinweg erhalten. Das heißt, dass jede Zelle monosom für die X-gebundenen Gene ist und weibliche Individuen Mosaike aus Zellen darstellen, in denen entweder das väterliche oder das mütterliche X aktiv ist (Übersicht bei Migeon 1994). Dieser Mosaikstatus manifestiert sich besonders eindrucksvoll im Falle X-chromosomaler Hautkrankheiten (Übersicht bei Happle 1998). Die Inaktivierung des X-Chromosoms ist ein reversibler Prozess, da in den Oozyten beide X aktiv sind, in der Spermatogenese hingegen X-und Y-Chromosom inaktiviert werden. Sichtbarer Ausdruck davon ist das kompakte „Sexvesikel“ im Pachytän. Auch in weiblichen somatischen Zellen hat der inaktive Zustand des einen X sein morphologisches Korrelat in Form des Geschlechtschromatins (syn. Barr-Körperchen). Damit lassen sich weibliche von männlichen Zellen einfach unterscheiden. Ganz entsprechend sind 47,XXY-Individuen Geschlechtschromatinpositiv, 45,X-Individuen Geschlechtschromatin-negativ. 47,XXX-Individuen weisen in einem hohen Prozentsatz ihrer Zellen zwei Geschlechtschromatinkörperchen auf. Im Prinzip erklärt die Inaktivierung überzähliger X-Chromosomen bzw. die fehlende Inaktivierung im Falle der 45,X-Konstitution die geringen klinischen Auswirkungen gonosomaler gegenüber autosomalen Aneuploidien. Ein weiteres Kennzeichen der X-Inaktivierung ist die DNA-Replikation in der späten S-Phase und der hohe Grad an Methylierung der DNA sowie die Acetylierung der Histone (Übersicht bei Migeon 1994).

53 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin

1.3.5.3 Strukturelle Chromosomenmutationen Es waren strukturelle Mutationen des X-Chromosoms, die die Voraussetzung zur Aufklärung des Mechanismus der Inaktivierung legten. Generell gilt hierbei, dass beim Vorhandensein eines normalen und eines aberranten XChromosoms letzteres praktisch stets inaktiv ist, was die geringen klinischen Auswirkungen vom Grundsatz her verständlich macht. Überraschend war jedoch, dass Isochromosomen für den langen Arm nicht selten sind, solche für den kurzen Arm aber unter Neugeborenen bislang nicht gefunden wurden. Diese Isochromosomen sind genetisch aktiv, die genetische Imbalance ist daher so groß, dass die Embryonen frühzeitig zugrunde gehen. Das heißt aber auch, dass das für die Inaktivierung verantwortliche Segment auf dem langen Arm gelegen sein muss. Durch weitere strukturelle Chromosomenmutationen konnte das Inaktivierungszentrums auf Xq13.2 lokalisiert und das entscheidende Gen Xist (X inactive specific transcript) identifiziert werden (Übersicht bei Lee u. Jaenisch 1997; Brockdorff 1998; Kelley u. Kuroda 2000). Diese Inaktivierung kann im Falle von X-Autosomentranslokationen auch auf das angrenzende autosomale Material übergreifen und die betreffenden Gene – teilweise – inaktivieren (Übersicht bei Lyon 1998). Im Falle balancierter X-Autosomen-Translokationen ist das Translokationschromosom bei den Trägerinnen regelmäßig aktiv und das normale X inaktiv. Es kommt daher zu keiner genetischen Imbalance, sodass in der Regel damit keine klinischen Konsequenzen verbunden sind. Betrifft die Bruchstelle jedoch ein Gen, z. B. das für die Muskeldystrophie vom Typ Duchenne, sind die heterozygoten Genträgerinnen erkrankt, da das normale Gen ja auf dem inaktiven X-Chromosom gelegen ist, nicht exprimiert wird und das andere Allel infolge der Chromosomenmutation defekt ist. Strukturelle Chromosomenanomalien der Autosomen können direkt den Weg zu Genen mit Krankheitswert weisen. Offensichtlich ist dies im Falle „balancierter“ Translokationen, bei denen eine Bruchstelle innerhalb des Gens gelegen ist und dabei eine dominante Mutation bedingt. Etwa 6% derartiger Träger sind klinisch auffällig. Nicht immer ist der Karyotyp-PhänotypBezug jedoch so einfach. Die Bruchstellen können auch mehrere Hundert Kb vom eigentlichen Gen entfernt sein und dessen Expression beeinflussen. Es handelt sich dabei um einen „Positionseffekt“, der nicht auf DNA, sondern auf Chromosomen- (Chromatin-)Ebene erklärt werden muss. Im Gegensatz zum Menschen ist dieses Phänomen bei Hefe, Drosophila und mit Einschränkungen auch bei der Maus bereits gut analysiert (Übersicht bei Wallrath 1998; Cockell u. Gasser 1999; Dobie et al. 1997).

1.3

Ebenso wie Translokationen können auch Mikrodeletionen wegweisend für die Identifizierung betroffener Einzelgene oder ganzer Genkomplexe sein. Größere Deletionen und/oder Duplikationen bestimmter Chromosomenabschnitte, wie sie insbesondere unter den Nachkommen von Personen mit balancierten Translokationen gefunden werden, stellen die Zwischenglieder zu kompletten Trisomien oder Monosomien dar. Dennoch ist es angesichts der großen klinischen Variabilität nur sehr eingeschränkt möglich, einzelne Komponenten des klinischen Bildes der reinen Trisomien bestimmten Chromosomenabschnitten zuzuordnen. Allgemein zeigte sich jedoch, dass Veränderungen von T- und RBanden größere klinische Auswirkungen zeigen als die von G-Banden. Dies entspricht ihrem Gehalt von Genen und ist von praktischer Bedeutung für die Beurteilung des genetischen Risikos der Nachkommen von Trägern balancierter Chromosomentranslokationen. Exakte Vorhersagen sind jedoch nicht möglich, sodass man in der genetischen Beratung auf empirische Daten angewiesen ist (Stengel-Rutkowski et al. 1988). Ein besonderer Aspekt aus molekularer Sicht betrifft die Entstehung struktureller Chromosomenmutationen. So ist die Mutationsrate für Robertson-Translokationen, bei denen es zur „Fusion“ zweier akrozentrischer Chromosomen kommt, mit 4 u10-4 höher als für jede Genmutation, betrifft aber ganz bevorzugt die Fusion zwischen den Chromosomen 13 und 14 sowie 14 und 21. Ebenso ist die Mutationsrate für Mikrodeletionen bzw. -duplikationen auf Chromosom 17p12, die das Myelin-Gen, PMP22, betreffen und mit zwei neurologischen Erkrankungen einhergeht („hereditary neuropathy with liability to pressure palsies“, HNPP, und „Charot-Marie-Tooth Disease type 1B“, CMT1) mit 1 u10-4 ungewöhnlich hoch. In beiden Fällen ergab die Analyse, dass an der Entstehung der Umbauten bestimmte repetitive Elemente beteiligt sind. So weisen die Chromosomen 13, 14 und 21 Repeats auf, die eine starke Homologie miteinander haben. Nimmt man zusätzlich an, dass diese Sequenzen auf Chromosom 14 invertiert sind, würde ein Crossingover in diesem Bereich während der Oogenese die bevorzugte Entstehung derartiger Translokationschromosomen erklären (Sullivan et al. 1996). Im Falle des Chromosoms 17 geht die hohe Mutationsrate auf ungleiches Crossing-over zwischen zwei Repeats von 24 Kb zurück, die das PMP22-Gen flankieren. Diese Repeats enthalten zudem Signalstrukturen, die bei der Rekombination eine wichtige Rolle spielen („meiosis processing sequences“, MEPS), was eine Erklärung für die besonders hohe Crossing-over-Rate in diesem Bereich sein dürfte. Vermutlich wird dieser Entstehungsmechanismus noch bei einer Reihe weiterer Mikrodeletions-Syndrome vorliegen, da Repeats der erforderlichen Länge und Se-

54

Sektion 1 · Allgemeine Grundlagen

quenzübereinstimmung für ein (ungleiches ) Crossingover auch am Genlokus für das Williams-Beuren-, das Angelman- und Prader-Willi-, aber auch das DiGeorgeSyndrom gefunden wurden (Übersicht bei Lupski 1998). Einen Spezialfall stellen Repeats mit gegenläufiger Orientierung auf dem gleichen Chromosom dar („inverted repeats“). Im Falle des Gens für den Blutgerinnungsfaktor VIII, das auf Xq gelegen ist, befindet sich ein Repeat innerhalb des Gens, zwei andere etwa 500 Kb entfernt. Kommt es zur Rekombination zwischen diesen Repeats, entsteht eine Inversion, durch die das Gen inaktiviert wird. Diese Situation liegt bei nahezu der Hälfte aller Patienten mit schwerer Hämophilie vor. Die Neumutationen treten nahezu ausschließlich im männlichen Geschlecht auf. Eine Erklärung hierfür liegt auf der Hand: In der Spermatogenese liegt der lange Arm des X ungepaart vor, sodass es infolge intrachromosomaler Paarung zu derartigen Rekombinationsereignissen kommt, im weiblichen Geschlecht hingegen paaren sich die homologen X-Chromosomen normal (Pratt et al. 1994). Diese Beispiele zeigen aber auch, dass eine zytogenetische Analyse erforderlich ist, um die Ätiologie dieser monogen bedingten Krankheiten zu verstehen.

1.3.6 Somatische Chromosomenmutationen Die Zahl der Zellen des menschlichen Körpers mit etwa 1014 liegt weit über der Rate somatischer (Gen-) und Chromosomenmutationen, d. h., jede beliebige Mutation dürfte in den Zellen jedes Individuums wiederholt aufgetreten sein. Hier geht es 1. um regelmäßig auftretende Chromosomenveränderungen, die eine konstitutive Eigenschaft des Genoms sind (mitotisches Crossingover und Schwesterchromatidaustausche), 2. um eine stark erhöhte somatische Mutationsrate als Folge von Genmutationen der Keimbahn (Chromosomeninstabilitätssyndrome) und 3. um solche somatischen Chromosomenmutationen, die den Zellen einen Vorteil verschafft haben und sich daher ausbreiten konnten (Tumorgenese).

1.3.6.1 Somatische Rekombination Das Auftreten von somatischem (syn. mitotischem) Crossing-over ist aus der Drosophila-Genetik schon seit mehr als 60 Jahren bekannt. Eine der Voraussetzungen hierfür ist die regelmäßige Assoziation der homologen Chromosomen auch in den Somazellen. Dies liegt in den menschlichen und den Säugetierzellen offensichtlich nicht vor. Dennoch gibt es alte zytogenetische Beobach-

tungen, die einen Hinweis auf mitotisches Crossing-over liefern. Wie bereits erwähnt wurde, bleiben die Schwesterchromatiden bis in die Metaphase hinein gepaart. Hat sich in der vorausgegangenen Interphase ein somatisches Crossing-over ereignet, sollte dies zu Translokationsfiguren zwischen zwei homologen Chromosomen führen, die identische Bruchstellen betreffen. Bei der Auswertung normaler Lymphozytenmetaphasen zeigt sich, dass die spontane Häufigkeit dieser Austauschereignisse (ca. 1 auf 1.000 Metaphasen) praktisch ebenso hoch ist wie die zwischen allen heterologen Chromosomen zusammen (Therman u. Kuhn 1976) und bevorzugt genreiche Chromosomenabschnitte betrifft (Therman u. Kuhn 1981). Dieses Phänomen ist im Falle einer autosomal-rezessiven Krankheit, dem BloomSyndrom, extrem erhöht. Hier konnte auch der direkte molekulargenetische Beweis erbracht werden, dass es an homologen Stellen zur Rekombination kommt (German u. Ellis 1998). Bei Patienten mit dem Bloom-Syndrom, die heterozygot für zwei unterschiedliche Mutationen sind (Compound-Heterozygote), kommt es als Folge eines somatischen Crossing-overs innerhalb des Gens zur Bildung von Schwesterchromatiden mit der normalen Sequenz bzw. den beiden Mutationen. Nach der Mitose führt dies zu Zellen, die unverändert den Defekt aufweisen und solchen, die „geheilt „ sind (> Abb. 1.3.6). Das gleiche Phänomen wurde inzwischen auch bei Patienten mit Fanconi-Anämie gefunden und durch Sequenzanalyse bestätigt (Lo Ten Foe et al. 1997). Es ist zu erwarten, dass eine derartige „somatische Gentherapie“ auch das Krankheitsgeschehen beeinflusst. Dieses Phänomen sollte sich stets dann zeigen, wenn Individuen heterozygot für ein rezessives Gen sind, da als Folge somatischen Crossing-overs Zellen gebildet werden, die homozygot für den Defekt sind (> Abb. 1.3.6). Die pigmentlosen Flecken, die häufig bei Patienten mit dem Bloom-Syndrom zu finden sind, werden in diesem Sinne gedeutet. Da vermutlich jeder Mensch heterozygot für mehrere rezessive Gene ist, dürfte dieses Phänomen gar nicht so selten sein, allerdings ist die Beweisführung nicht einfach (Übersicht bei Happle 1998). Regelmäßige Rekombinationsereignisse finden auch zwischen Schwesterchromatiden statt. Dies lässt sich zytogenetisch nachweisen, indem man Zellen in Gegenwart des Basenanalogons BrdU kultiviert, wonach sich die Schwesterchromatiden differenziell anfärben lassen. Etwa 5–8 Schwesterchromatidaustausche, SCEs (sister chromatid exchanges), können so pro Metaphase nachgewiesen werden. Es wurde lange diskutiert, ob es sich hierbei um ein natürliches oder infolge der DNA Markierung induziertes Phänomen handelt. Die Antwort darauf haben zwei zytogenetische Beobachtungen geliefert: Im Falle von Ringchromosomen führt ein einfacher

55 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin

a

b

1.3

herangezogen, da meiotische Rekombination dafür nicht infrage kommt. Die SCE-Rate wird durch bestimmte mutagene Noxen stark erhöht, sodass angenommen werden kann, dass es sich um einen Prozess handelt, der bei der DNA-Reparatur eine Rolle spielt (Übersicht bei Tucker et al. 1993). Auch dies ist ein Beispiel dafür, dass ein grundlegendes zellbiologisches Phänomen erst durch die Zytogenetik entdeckt wurde und jetzt im Hinblick auf seine pathogenetische Relevanz gewertet werden muss.

1.3.6.2 Chromosomeninstabilität

c

d

. Abb. 1.3.6. Genetische Konsequenzen von somatischem Crossingover. a Paarung der homologen Chromosomen mit somatischem Crossing-over in der Interphase, Anordnung der Chromosomen in der Metaphase (die Pfeile weisen auf die Zellpole hin) und Ergebnis nach Auftrennung in der Anaphase. Die homologen Chromosomen sind durch unterschiedliche Grautöne gekennzeichnet. Die Schemata darunter geben die genetischen Konsequenzen von somatischem Crossing-over wieder; b Entstehung von Homozygotie bei Heterozygotie für ein rezessives Gen; c Entstehung normaler Zellen bei „Compound-Heterozygoten“; d Entstehung von „Zwillingsflecken“ bei doppelt Heterozygoten. Nähere Erläuterungen 7 Text

Schwesterchromatidaustausch zu großen dizentrischen Ringen, ein doppelter zu ineinander verhakten Ringen, was ohne Markierung der DNA nachweisbar ist und damit die spontane Natur der SCEs belegt. Zudem hat sich gezeigt, dass bei Patienten mit dem Bloom-Syndrom die SCE-Rate drastisch erhöht ist, d. h. das defekte Protein ist in diesen Prozess involviert. Die biologische Bedeutung dieser Rekombinationsvorgänge ist nicht offensichtlich, da sie keine genetischen Konsequenzen haben sollten. Im Falle ungleicher SCEs allerdings kann es zur Vermehrung bzw. Verminderung bestimmter Sequenzen kommen. Dies wird als eine Erklärung für die variable Größe des Y-Heterochromatins

Einzelne Chromosomenbrüche treten in wenigen Prozent der Metaphasen auf. Nach Exposition gegenüber ionisierenden Strahlen steigen sie dosisabhängig an und können auch noch Jahre nach einer Exposition zur biologischen Dosisabschätzung herangezogen werden, weil die T-Lymphozyten des peripheren Blutes besonders langlebig sind, d. h. zum Teil viele Jahre im peripheren Blut persistieren. Aus dem Aberrationsmuster der Chromosomen in der ersten Mitose nach Bestrahlung wird ersichtlich, ob das Chromosom uninem oder bereits verdoppelt war. So führt eine Exposition in der G1-Phase zu Aberrationen vom Chromosomentyp, in der späteren S- und G2-Phase vom Chromatidtyp (> Abb. 1.3.7). Das weitere Schicksal der Zellen hängt davon ab, wie groß die genetische Imbalance nach der Zellteilung ist. Besonders langlebig sind balancierte reziproke Translokationen, die mittels „chromosome painting“ sehr empfindlich nachgewiesen werden können (Übersicht bei Obe u. Müller 1999). Einzelne Chromosomenbrüche stellen gesundheitlich kein besonderes Risiko dar. Findet sich hingegen

. Abb. 1.3.7. Zusammenhang zwischen dem Stadium des Zellzyklus, zu dem eine Exposition mit ionisierenden Strahlen erfolgt und dem chromosomalen Aberrationsmuster in der darauf folgenden Mitose (aus Sperling und Obe 1977)

56

Sektion 1 · Allgemeine Grundlagen

eine erhöhte Chromosomeninstabilität bei Patienten mit einer genetisch bedingten Erkrankung, kommt ihr plötzlich ein großes Gewicht zu: Es weist darauf hin, dass das betreffende Gen direkt oder indirekt in die Aufrechterhaltung der DNA-Integrität involviert ist, d. h. in ein zentrales zellbiologisches Geschehen. Die betroffenen Patienten zeichnen sich durch ihr hohes Krebsrisiko aus und oftmals ihre spezifische Empfindlichkeit gegenüber bestimmten Mutagenen. So weisen die Zellen von Patienten mit der Ataxia teleangiectatica oder dem Nijmegen-breakage-Syndrom eine Überempfindlichkeit gegenüber ionisierenden Strahlen auf, die von Patienten mit der Fanconi-Anämie gegenüber Agenzien, die die einzelnen DNA-Stränge vernetzen. Diese zytogenetische Auffälligkeit dient als differenzialdiagnostisches Kriterium.

1.3.6.3 Chromosomenmutationen in der Tumorgenese Nahezu sämtliche Tumore weisen einen aberranten Chromosomensatz auf, zahlreiche davon zusätzlich eine Chromosomeninstabilität als Folge somatischer Mutationen, die Gene des „DNA damage response network“ betreffen. Hierdurch werden Zellen mit unterschiedlichen genetischen Imbalancen generiert, die im Hinblick auf raschere und kontinuierliche Proliferation ausgewählt werden. Zufällige Mutationen und Selektion sind daher die Grundlagen für die Entwicklung (Evolution) von Krebszellen. Entscheidende Einblicke in die Tumorgenese haben spezifische Chromosomenumbauten ermöglicht, durch die bestimmte Protoonkogene aktiviert (z. B. Burkitt-Lymphom, > Abb. 1.3.8) oder neue Fusionsgene generiert werden (z. B. 9/22 Translokation bei der chronisch myeloischen Leukämie). Mikrodeletionen der Bande 15q14 finden sich bei etwa 5% aller Patienten mit dem Retinoblastom und trugen entscheidend dazu bei, das Rb-Gen zu identifizieren und seine Natur als Tumorsuppressorgen aufzuklären. Im diesem Fall handelt es sich um eine Keimbahnmutation. Als Folge somatischer Mikrodeletionen können derartige Genverluste ebenfalls eintreten und durch FISHAnalyse nachgewiesen werden („loss of heterozygosity“, LOH). Dabei zeigte sich, dass in vielen Tumoren ein bestimmtes elterliches Chromosom bevorzugt betroffen ist, in der Mehrzahl das maternale Chromosom (Übersicht bei Feinberg 1998). Am Beispiel embryonaler Tumore (z. B. Wilms-Tumor) bei Kindern mit dem Wiedemann-Beckwith-Syndrom ließ sich nachweisen, dass hier genomisches Imprinting eine Rolle spielt, da das andere Allel in diesen Zellen nicht aktiv ist. Überraschenderweise zeigte sich für das IGF2-Gen im Wilms-Tumor, dass beide Allele

. Abb. 1.3.8. Chromosomale Umbauten beim Burkitt-Lymphom. Als Folge einer Translokation kommt das C-MYC-Gen auf Chromosom 8q24 in die Nachbarschaft der Gene für die leichten (κ, λ) Ketten oder das Gen für die schwere (H) Kette der Immunglobuline

aktiv sind, obwohl normalerweise nur das väterliche exprimiert wird. Hier und in vielen anderen Tumoren kommt es daher zu einem „loss of imprinting“ (LOI), einer der häufigsten Veränderungen in Tumoren überhaupt (Übersicht bei Feinberg 1998). Hier soll noch auf zwei Auffälligkeiten eingegangen werden, die speziell beim Neuroblastom eine pathogenetisch wichtige Rolle spielen (Übersicht bei Gutmann u. Collins 1998). Es handelt sich um die Bildung kleiner Chromatinfragmente („double minute chromatin bodies“, dmin) und längere einheitlich gefärbte Chromosomenabschnitte („homogeneously staining regions“, HSR). Diese sind Ausdruck der Amplifikation des MYCN-Onkogens auf Chromosom 2. Hierdurch werden extrachromosomale Elemente gebildet, die vermutlich ringförmig sind, kein Zentromer (Kinetochor) besitzen und daher bei der Mitose zufällig verteilt werden. Sie verleihen den Zellen offensichtlich einen Proliferationsvorteil. Sehr selten kommt es zur Integration in das Genom und zur Ausbildung der HSRs (> Abb. 1.3.9). Diese wenigen Beispiele sollen die zentrale Rolle der molekularen Zytogenetik in der Tumorforschung unterstreichen. In dem Katalog von Mitelman et al. (1994) sind mehr als 84.000 derartiger Fälle zusammengestellt.

57 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin

1.3

. Abb. 1.3.9. Zytogenetische Auffälligkeiten beim Neuroblastom. Als Folge einer Amplifikation des MYCN-Gens auf Chromosom 2 kommt es zur Entstehung kleiner, extrachromosomaler Partikel. Gelegentlich kommt es zur Integration in ein Chromosom und weiterer

Amplifikation, was zu einer homogen angefärbten Region führt („homogeneously staining region“, HSR) (nach Gutmann u. Collins 1998)

1.3.7 Ausblick

bei etwa 10% aller geistig schwer behinderten Kinder, wobei die Werte zwischen einzelnen Untersuchern zwischen 7% und 23% variieren (Knight u. Flint 2000). Als wichtigsten Entstehungsmechanismus derartiger Imbalancen werden inter- und intrachromosomale Rekombinationsereignisse angenommen, die auf repetitive Elemente im Genom zurückzuführen sind. Solche Elemente, die im Bereich der Telomerregionen liegen und sich nur geringfügig zwischen unterschiedlichen Chromosomen unterscheiden, begünstigen die Entstehung chromosomaler Translokationen, die nach der Meiose zu genetisch unbalancierten Nachkommen führen können ( Flint et al. 1995; Ballif et al. 2000; Varley et al. 2000). Jene Repeats, die bestimmte chromosomale Bereiche flankieren, erhöhen das Risiko für ungleiches Crossingover (Lopez et al. 2000; Trost et al. 2000). Als Folge davon kommt es zu Mikrodeletionen und -duplikationen. Bei einer systematischen, genomweiten Suche nach derartigen Imbalancen wird sicherlich bei wesentlich mehr Patienten mit angeborenen Fehlbildungen und geistiger Behinderung als bisher die eigentliche Ursache gefunden werden. Den entscheidenden diagnostischen Durchbruch zum genomweiten Nachweis von Mikrodeletionen dürften DNA-Chips geordneter DNA-Fragmente oder Oligonukleotide darstellen. Derzeit sind Chips verfügbar,

In diesem Beitrag wurde die Zytogenetik als medizinische Grundlagenwissenschaft dargestellt, die zu neuen Einsichten in die molekulare Ursache von Krankheiten geführt hat. Tatsächlich hat die Zytogenetik zugleich auch eine wesentliche angewandte Seite. Jährlich werden in Deutschland mehr als 100.000 zytogenetische Analysen durchgeführt, etwa 70.000 davon im Rahmen der vorgeburtlichen Diagnostik. Der diagnostische Umfang liegt daher deutlich über dem derzeitigen molekulargenetischen Nachweis schwerer monogen bedingter Erkrankungen. Vermutlich wird er in den kommenden Jahren noch deutlich zunehmen. Es spricht vieles dafür, dass bestimmte genomische Imbalancen, die sich bislang einem allgemeinen Nachweis weitgehend entzogen, als ursächlich für einen beträchtlichen Teil ungeklärter Krankheitsfälle infrage kommen. Es handelt sich um submikroskopische Deletionen und Duplikationen als Folge von Neumutationen oder familiärer, kryptischer Translokationen. So liegt eine Mikrodeletion am Locus 22q11.2 etwa 6% aller angeborenen Herzfehler und mehr als 10% aller pränatal diagnostizierten Herzfehlbildungen zugrunde, bei denen die anderen bekannten Ursachen ausgeschlossen wurden. Submikroskopische Imbalancen im Bereich der Telomerregionen finden sich

58

Sektion 1 · Allgemeine Grundlagen

die mehr als 30.000 Fragmente menschlicher DNA von 150 bis 200 Kbp („bacterial artificial chromosomes“, BACs) aufweisen oder solche mit bis zu 500.000 Oligonukleotiden, die das Genom gleichmäßig abdecken (Übersicht bei Pinkel u. Albertson 2005; Lockwood et al. 2006; Ylstra et al. 2006). Die jeweilige Anzahl der Genkopien wird dabei durch „comparative genomic hybridization“ bestimmt (Array-CGH). Der Zeitaufwand ist vergleichsweise gering, da die DNA des Testgewebes ohne vorherige Kultivierung eingesetzt werden kann und der Ablauf zudem automatisierbar ist. Da hiermit selbstverständlich auch vollständige Aneuploidien nachgewiesen werden und die Auflösung deutlich größer ist als bei der klassischen Zytogenetik, dürfte die Array-CGH in den nächsten Jahren die bisherige personal- und zeitaufwendige zytogenetische Diagnostik in der medizinischen Genetik zunehmend ersetzen. Den betroffenen Familien kann bei bekannter Ursache eine umfassende, individuelle Beratung angeboten werden. Bei Vorliegen einer Neumutation wird das Wiederholungsrisiko generell vernachlässigbar sein, bei familiären kryptischen Translokationen hingegen kann es präzisiert und auf die Möglichkeit einer pränatalen Diagnostik hingewiesen werden. Aus wissenschaftlicher Sicht eröffnen derartige Mikrodeletionen und -duplikationen zudem einen besonders einfachen, direkten Weg, die zugrunde liegenden Gene zu identifizieren. Von der verantwortungsbewussten Einführung dieser Methode in die medizinische Praxis wird es abhängen, ob die neuen diagnostischen Möglichkeiten im Sinne der Patienten und Ratsuchenden eingesetzt werden und gleichzeitig die bemerkenswerten wissenschaftlichen Optionen genutzt werden können. Der Qualitätssicherung kommt hierbei nicht nur im Hinblick auf die Zuverlässigkeit der Befundung, sondern auch bezüglich des Kontextes insgesamt, in dem diese Untersuchung angeboten und in Anspruch genommen werden, eine zentrale Bedeutung zu (Sperling et al. 1997). Drei Bereiche sind hierbei zu unterscheiden: 1. Die Strukturqualität Hierzu zählen die Qualifikation des Untersuchers, sowie die Rahmenbedingungen für die Inanspruchnahme der jeweiligen Leistung insgesamt, z. B. die Sicherstellung eines angemessenen Beratungsangebots. 2. Die Prozessqualität Diese betrifft die praktische Durchführung der Untersuchung mit interner und externer Qualitätskontrolle. So haben z. B. erste Untersuchungen gezeigt, dass Mikrodeletionen auch bei den unauffälligen Eltern der Probanden vorliegen können und daher nicht in jedem Fall klinisch relevant sein müssen (Ballif et al. 2000).

3. Die Ergebnisqualität Dazu rechnen die medizinischen und gesellschaftlichen Konsequenzen, die sich aus diesen neuen diagnostischen Möglichkeiten ergeben. Die zukünftige Entwicklung wird zeigen, ob diese methodische Revolution molekularzytogenetischer Diagnostik zugleich einen Fortschritt der molekularen Medizin bedeutet.

1.3.8 Literatur Arnold J (1879) Virchow’s Arch Path Anat 77: 181 Ballif BC, Kashork CD, Shaffer LG (2000) FISHing for mechanisms of cytogenetically defined terminal deletions using chromosome-specific subtelomeric probes. Eur J Hum Genet 8: 764– 770 Ballif BC, Kashork CD, Shaffer LG (2000) The promise and pitfalls of telomere region-specific probes. Am J Hum Genet 67: 1356– 1359 Barr ML, Bertram LF (1949) A morphological distinction between neurones of the male and the female and the behavior of the nucleolar satellite during accelerated nucleoprotein synthesis. Nature 163: 676–677 Barr ML, Bertram LF (1953) Surg Gynec Obstet 96: 641 Bednar J, Horowitz RA, Grigoryev SA, Carruthers LM, Hansen JC, Koster AJ, Woodcock CL (1998) Nucleosomes, linker DNA, and linker histone form a unique structural motif that directs the higher-order folding and compaction of chromatin. Proc Natl Acad Sci U S A 95: 14173–14178 Belmont AS, Dietzel S, Nye AC, Strukov YG, Tumbar T (1999) Largescale chromatin structure and function. Curr Opin Cell Biol 11: 307–311 Beneden van E (1883) Recherches sur la Maturation de L’Oeuf, la Fécondation et la Division Cellulaire. Arch. Biol. 4: 265 Ben-Porath I, Cedar H (2000) Imprinting: focusing on the center. Curr Opin Genet Dev 10: 550–554 Bernardi G (1989) The isochore organization of the human genome. Ann Rev Genet 23: 637–661 Boveri T(1887) Über die Befruchtung der Eier von Ascaris megalocephala. Sitzungsberichte der Gesellschaft für Morphologie und Physiologie in München 3: 71–80 Boveri T (1903) Über die Konstitution der chromatischen Kernsubstanz. In: Verhandlungen der Deutschen Zoologischen Gesellschaft, 13. Jahresversammlung zuWürzburg (Korschelt E, Hrsg.) S. 10–33. Leipzig: Wilhelm Engelmann Boveri, T. 1902. Über mehrpolige Mitosen als Mittel zur Analyse des Zellkerns.Verh Phys -med Ges Würzberg NF 35: 67–90 Boveri T (1914) Zur Frage der Entstehung Maligner Tumoren, Fischer, Jena, Germany Brannan CI, Bartolomei MS (1999) Mechanisms of genomic imprinting. Curr Opin Genet Dev 9: 164–170 Bridger JA, Bickmore WA (1998) Putting the genome on the map. Trends Genet 14: 403–409 Bridges CB (1913) Nondisjunction of the sex chromosomes of Drosophila. J Exp Zool 15: 587–606 Brockdorff N (1998) The role of Xist in X-inactivation. Curr Opin Genet Dev 8: 328–333 Brown R (1833) On the Organs and Mode of Fecundation in Orchideae and Asclepiadeae. The Transactions of the Linnean Society of London 16/3: 709–737

59 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin Caspersson T, Farber S, Foley GE, Kudynowski J, Modest EJ, Simonsson E, Wagh U, Zech L (1968) Chemical differentiation along metaphase chromosomes. Exp Cell Res 49: 219–222 Castro A, Bernis C, Vigneron S, Labbe JC, Lorca T (2005) The anaphase-promoting complex: a key factor in the regulation of cell cycle. Oncogene 24: 314–325 Cockell M, Gasser SM (1999) Nuclear compartments and gene regulation. Curr Opin Genet Dev 9: 199–205 Cremer T, Cremer C, Baumann H, Luedtke EK, Sperling K, Teuber V, Zorn C (1982) Rabl’s model of the interphase chromosome arrangement tested in Chinese hamster cells by premature chromosome condensation and laser-UV-microbeam experiments. Hum Genet 60: 46–56 Delhanty JD, Harper JC, Ao A, Handyside AH, Winston RM (1997) Multicolour FISH detects frequent chromosomal mosaicism and chaotic division in normal preimplantation embryos from fertile patients. Hum Genet 99: 755–760 Digweed M, Reis A, Sperling K (1999) Nijmegen breakage syndrome: consequences of defective DNA double strand break repair. BioEssays 21: 649–656 Digweed M, Sperling K (2004) Nijmegen breakage syndrome: clinical manifestation of defective response to DNA double-strand breaks. DNA Repair 3: 1207–1217 Dobie K, Mehtali M, McClenaghan M, Lathe R (1997) Variegated gene expression in mice. Trends Genet 13: 128–129 Dobie KW, Hari KL, Maggert KA, Karpen GH (1999) Centromere proteins and chromosome inheritance: a complex affair. Curr Opin Genet Dev 9: 206–217 Earnshaw WC (1988) Mitotic chromosome structure. BioEssays 9: 147–150 Engel E (1998) Uniparental disomies in unselected populations. Am J Hum Genet 63: 962–966 Feinberg AP (1998) Genomic imprinting and cancer. In: Vogelstein B, Kinzler KW (eds) The genetic basis of human cancer. McGrawHill Health Profession Division, New York, St. Louis, San Francisco, Auckland, Bogotá, Caracas, Lisbon, London, Madrid, Mexico City, Milan, Montreal, New Delhi, San Juan, Singapore, Sydney, Tokyo, Toronto, pp 95–108 Flemming W (1879) Beiträge zur Kenntnis der Zelle und ihrer Lebenserscheinungen, Teil I. Archiv für mikroskopische Anatomie 16: 302–436 Flemming W (1882) Zellsubstanz, Kern und Zellteilung. Leipzig Flint J, Wilkie AOM, Buckle VJ, et al. (1995) The detection of subtelomeric chromosomal rearrangements in idiopathic mental retardation. Nat Genet 9: 132–139 Ford CE, Hamerton JL (1956) The chromosomes of man. Nature 178: 1020–1023 Ford CE, Miller OJ, Polani PE, Almeida JC de, Briggs JH (1956) A sex chromosome anomaly in a case of gonadal dysgenesis (Turner’s syndrome). Lancet 1: 711–713 German J, Archibald R, Bloom D (1965) Chromosomal breakage in a rare and probably genetically determined syndrome of man. Science 148: 506–507 German J, Ellis NA (1998) Bloom syndrome. In: Vogelstein B, Kinzler KW (eds) The genetic basis of human cancer. McGraw-Hill Health Profession Division, New York, St. Louis, San Francisco, Auckland, Bogotá, Caracas, Lisbon, London, Madrid, Mexico City, Milan, Montreal, New Delhi, San Juan, Singapore, Sydney, Tokyo, Toronto, 301–316 Gropp A (1982) Value of an animal model for trisomy. Virchows Arch (Pathol Anat) 395: 117–131 Gutmann DH, Collins FS (1998) Neurofibromatosis type I. In: In: Vogelstein B, Kinzler KW (eds) The genetic basis of human cancer. McGraw-Hill Health Profession Division, New York, St. Louis,

1.3

San Francisco, Auckland, Bogotá, Caracas, Lisbon, London, Madrid, Mexico City, Milan, Montreal, New Delhi, San Juan, Singapore, Sydney, Tokyo, Toronto, pp 423–442 Handyside AH, Delhanty JDA (1997) Preimplantation genetic diagnosis: strategies and surprises. Trends Genet 13: 270– 275 Hansen RS, Stoger R, Wijmega C, Stanek AM, Canfield TK, Luo P, Matarazzo MR, D’Esposito M, Feil R, Gimelli G, Weemaes CMR, Laird CD, Gartler SM (2000) Escape from gene silencing in ICF syndrome:evidence for advanced replication time as a major determinant. Hum Molec Genet 9: 2575–2587 Happle R (1998) Manifestation genetischer Mosaike in der menschlichen Haut. In: Parthier B (Hrsg) Jahrbuch 1997 der Deutschen Akademie der Naturforscher. Leopoldina, Halle/ Saale, Reihe 3, Jahrgang 43: 307–334 Hart CM, Laemmli UK (1998) Facilitation of chromatin dynamics by SARs. Curr Opin Genet Dev 8: 519–525 Heitz E (1929) Heterochromatin, Chromozentren, Chromomeren. Berichte der Deutschen Botanischen Gesellschaft, Berlin Henking H (1891) Untersuchungen über die ersten Entwicklungsvorgänge in den Eiern der Insekten. I. Über Spermatogenese und deren Beziehung zur Entwicklung bei Pyrrhocoris apertus L. Zeitschrift für wissenschaftliche Zoologie 51: 280–354 Hertwig O (1876) Beiträge zur Kenntnis der Bildung, Befruchtung und Teilung des thierischen Eies. Morphologisches Jahrbuch 1: 347–434 Hirano T (2005) Condensins: Organizing and segregating the genome. Curr Biol 15: R265–75 Holmquist GP (1992) Chromosome bands, their chromatin flavors, and their functional features. Am J Hum Genet 51: 17–37 Jacobs PA, Strong JA (1959) A case of human intersexuality having a possible XXY sex-determining mechanism. Nature 183: 302– 303 Janssens FA (1909) Cellule 25: 389 Kai R, Ohtsubo M, Sekiguchi M, Nishimoto T (1986) Molecular cloning of a human gene that regulates chromosome condensation and is essential for cell proliferation. Mol Cell Biol 6: 2027– 2032 Kaufmann WE, Reiss AL (1999) Molecular and cellular genetics of fragile X syndrome. Am J Med Genet 88: 11–24 Kazazian HH Jr (2004) Mobile elements: drivers of genome evolution. Science 303: 1626–1632 Kelley RL, Kuroda MI (2000)The role of chromosomal RNA in making the X for dosage compensation. Curr Opin Genet Dev 10: 555– 561 Knight SJL, Flint J (2000) Perfect endings: a review of subtelomeric probes and their use in clinical diagnosis. J Med Genet 37: 401–409 Koshland D, Strunnikov A (1996) Mitotic chromosome condensation. Ann Rev Cell Dev Biol 12: 305–333 Lee JT, Jaenisch R (1997) The (epi)genetic control of mammalian X-chromosome inactivation. Curr Opin Genet Dev 7: 274– 280 Lejeune J, Gautier M, Turpin MR (1959) Ètude des chromosomes somatiques de neuf enfants mongoliens. CR Acad Sci 248 : 1721–1722 Lejeune J, Lafourcade J, Berger R, Vialatta J, Boeswillwald M, Seringe P, Turpin R (1963) Trois ca de deletion partielle du bras court d’un chromosome 5. C R Acad Sci 257: 3098 Lemke J, Claussen J, Michel S, Chudoba I, Muhlig P, Westermann M, Sperling K, Rubtsov N, Grummt UW, Ullmann P, KromeyerHauschild K, Liehr T, Claussen U (2002) The DNA-based structure of human chromosome 5 in interphase. Am J Hum Genet 71: 1051–1059

60

Sektion 1 · Allgemeine Grundlagen

Lewin B (1990) Driving the cell cycle: M phase kinase, its partners, and substrates. Cell 61: 743–752 Lisby M, Rothstein R (2004) DNA repair: keeping it together. Curr Biol. 14: R994–6 Lo Ten Foe JR, Kwee ML, Rooimans MA, Oostra AB, Veerman AJ, van Weel M, Pauli RM et al. (1997) Somatic mosaicism in Fanconi anemia: molecular basis and clinical significance. Eur J Hum Genet 5: 137–148 Losada A, HiranoT (2005) Dynamic molecular linkers of the genome: the first decade of SMC proteins. Genes Dev 19: 1269–1287 Look AT (1998) Genes altered by chromosomal translocations in leukemias and lymphomas. In: Vogelstein B, Kinzler KW (eds) The genetic basis of human cancer. McGraw-Hill Health Profession Division, New York, St. Louis, San Francisco, Auckland, Bogotá, Caracas, Lisbon, London, Madrid, Mexico City, Milan, Montreal, New Delhi, San Juan, Singapore, Sydney, Tokyo, Toronto, 109–142 Lockwood WW, Chari R, Chi B, Lam WL (2006) Recent advances in array comparative genomic hybridization technologies and their applications in human genetics. Eur J Hum Genet 14: 139–148 López Correa C, Brems H, Lázaro C, Marynen P, Legius E (2000) Unequal meiotic crossover: a frequent cause of NF1 microdeletions. Am J Hum Genet 66:1969–1974 Lupski JR (1998) Genomic disorders: structural features of the genome can lead to DNA rearrangements and human disease traits. Trends Genet 14: 417–422 Lyon MF (1961) Gene action in the X chromosome of the mouse. Nature 190: 372–373 Lyon MF (1962) Sex chromatin and gene action in the mammalian X chromosome. Am J Hum Genet 14: 135–148 Lyon MF (1998) X-chromosome inactivation: a repeat hypothesis. Cytogenet Cell Genet 80: 133–137 Machida YJ, Hamlin JL, Dutta A (2005) Right place, right time, and only once: replication initiation in metazoans. Cell 123: 13–24 Migeon BR (1994) X-chromosome inactivation: molecular mechanisms and genetic consequences. Trends Genet 10: 230–235 Mitelman F, Johansson B, Mertens F (1994) Catalog of chromosome aberrations in cancer. 5th edition, Wiley-Liss, Inc, New York Moorhead P S, Nowell P C, Mellman W J, Battips DMA Hungerford D A (1960) Chromosome preparations of leukocytes cultured from human peripheral blood. Exp Cell Res 20: 613–616 Morgan TH (1911) An attempt to analyze the constitution of the chromosomes on the basis of sex-limited inheritance in Drosophila. J Exp Zool 11: 365–413 Nägeli C (1842) Zur Entwicklungsgeschichte des Pollens. Zürich: Orell Füssli Neitzel H, Kalscheuer V, Henschel S, Digweed M, Sperling K (1998) Beta-heterochromatin in mammals: evidence from studies in Microtus agrestis based on the extensive accumulation of L1 and non-L1 retroposons in the heterochromatin. Cytogenet Cell Genet 80: 165–172 Neitzel H, Neumann LM, Schindler D, Wirges A, Tonnies H, Trimborn M, Krebsova A, Richter R, Sperling K (2002) Premature chromosome condensation in humans associated with microcephaly and mental retardation: a novel autosomal recessive condition. Am J Hum Genet 70: 1015–1022 Nowell PC, Hungerford DA (1960) Minute chromosome in human granulocytic leukemia, Science 132: 1497 Obe G, Müller W-U (1999) Zytogenetik in der genetischen Toxikologie und Strahlenbiologie. Med Gen 11: 373–377 O’Donovan M, Jones I, Craddock N (2003) Anticipation and repeat expansion in bipolar disorder. Am J Med Genet C Semin Med Genet. 123:10–17

O’Driscoll M, Jeggo PA (2006) The role of double-strand break repair – insights from human genetics. Nat Rev Genet 7:45–54 Ohi R, Gould KL (1999) Regulating the onset of mitosis. Curr Opin Cell Biol 11:267–273 Okano M, Bell, DW, Haber DA, Li E (1999) DNA methyltransferases Dnmt3a and Dnmt3b are essential for de nove methylation and mammalian develoment. Cell 99:247–257 Painter TS: Studies in mammalian spermatogenesis II. The spermatogenesis of man. J exp Zool 37:291–336 (1923) Padue ML, Gall, JG (1969) Molecular hybridization of radioactive DNA to the DNA of cytological preparations. Proc Nat Acad Sci 64: 600–604 Peters JM. (2002) The anaphase-promoting complex: proteolysis in mitosis and beyond. Mol Cell 9:931–943 Pines J und Rieder C (2001) Re-staging mitosis: a contemporary view of mitotic progression. Nature Cell Biol 3: E3–6 Pinkel D, Albertson DG (2005) Array comparative genomic hybridization and its applications in cancer. Nat Genet 37:11–17 Pratt Rossiter J, Young M, Kimberland ML, Hutter P, Ketterling RP, Gitschier J, Horst J et al. (1994) Factor VII gene inversions causing severe hemophilia A originate almost exclusively in male germ cells. Hum Mol Genet 3:1035–1039 Rieder CL, Salmon ED (1998) The vertebrate cell kinetochore and its roles during mitosis. Trends Cell Biol 8:310–318 Rowley JD (1973) A New Consistent Chromosomal Abnormality in Chronic Myelogenous Leukaemia identified by Quinacrine Fluorescence and Giemsa Staining. Nature 243, 290–293 Schmiady H, Sperling K, Kentenich H, Stauber M (1986) Prematurely condensed human sperm chromosomes after in vitro fertilization (IVF). Hum Genet 74:441–443 Schroeder T M, Anschutz F, Knopp A (1964) Spontane Chromosomenaberrationen bei familiaerer Panmyelopathie. Humangenetik 1: 194–196 Sleutels F, Barlow DP, Lyle R (2000) The uniqueness of the imprinting mechanism. Curr Opin Genet Dev 10:229–233 Smit AF (1996) The origin of interspersed repeats in the human genome. Curr Opin Genet Dev 6:743–748 Solomon MJ, Glotzer M, Lee TH, Philippe M, Kirschner W (1990) Zyklin Activation of p34cdc2. Cell 63:1013–1024 Sperling K (1982) Cell cycle and chromosome cycle: morphological and functional aspects. In: Rao PN, Johnson RT, Sperling K (eds) Premature chromosome condensation. Application to basic, clinical, and mutation research. Academic Press, New York, 43–78 Sperling K (1999) Die Genkarte des Menschen: Grundlage einer molekularen Anatomie. In: Parthier B (Hrsg) Jahrbuch 1998 der Deutsche Akademie der Naturforscher Leopoldina, Halle/ Saale, Reihe 3, Jahrgang 45: 431–447 Sperling K, Digweed M, Stumm M, Wegner RD, Reis A (1998) Chromosomeninstabilität, Strahlenempfindlichkeit und Krebs: Ataxia-telangiektasia und das Nijmegen Breakage Syndrom. Med Gen 10:274–277 Sperling K, Neitzel H, Wegner R-D (1997) Der Einsatz der Zytogenetik in der Pränataldiagostik unter qualitätssicherndem Aspekt. In: Arndt D, Obe G (Hrsg) Qualitätssicherung in der Zyto-und Molekulargenetik. Robert-Koch-Institut Schriften (RKI) 1/97, MMV Medizin Verlag, München Sperling K, Rao PN (1974) The phenomenon of premature chromosome condensation: its relevance to basic and applied research. Humangenetik 23:235–258 Steele MW, Breg WR Jr (1966) Chromosome analysis of human amniotic-fluid cells. Lancet 19:383–385 Stengel-Rutkowski S, Stene J, Gallano P (1988) Risk estimates in balanced parental reciprocal translocations. Monographie des Annales de Génétique. Exp Sci Franc Ed, Paris

61 1.3 · Die zytogenetischen Grundlagen der Molekularen Medizin Strasburger E (1882) Über den Teilungsvorgang der Zellkerne und das Verhältnis der Kerntheilung zur Zellteilung. Archiv für mikroskopische Anatomie 21: 476–590 Sullivan BA, Jenkins LS, Karson EM, Leana-Cox J, Schwartz S (1996) Evidence of structural heterogeneity from molecular cytogenetic analysis of dicentric Robertsonian translocations. Am J Hum Genet 59: 167–175 Surani MA (1995) Parthogenesis in man. Nat Genet 11:111–113 Sutton W S (1903) The chromosomes in heredity. Biological Bulletin 4: 231–251 Swedlow JR, Hirano T (2003) The making of the mitotic chromosome: modern insights into classical questions. Mol Cell 11: 557–569 Therman E, Kuhn EM (1976) Cytological demonstration of mitotic crossing-over in man. Cytogenet Cell Genet 17: 254–267 Therman E, Kuhn EM (1981) Mitotic crossing-over and segregation in man. Hum Genet 59: 93–100 Tjio HJ, Levan A (1956) The chromosome numbers of man. Heriditas 42: 1–6 Trimborn M, Bell SM, Felix C, Rashid Y, Jafri H, Griffiths PD, Neumann LM, Krebs A, Reis A, Sperling K, Neitzel H, Jackson AP (2004) Mutations in microcephalin cause aberrant regulation of chromosome condensation. Am J Hum Genet 75: 261–266 Trimborn M, Schindler D, Neitzel H, Hirano T (2006) Misregulated chromosome condensation in MCPH1 primary microcephaly is mediated by condensin II. Cell Cycle 5: 322–326 Trost D, Wiebe W, Uhlhaas S, Schwindt P, Schwanitz G (2000) Investigation of meiotic rearrangements in DGS/VCFS patients with a microdeletion 22q11.2. J Med Genet 37: 452–454 Tucker JD, Auletta A, Cimino MC, Dearfield KL, Jacobson-Kram D, Tice RR, Carrano AV (1993) Sister-chromatid exchange: second report of the gene-tox program. Mutat Res 297: 101–180

1.3

Tyers M, Jorgensen P (2000) Proteolysis and the cell cycle: with this RING I do thee destroy. Curr Opin Genet Dev 10: 54–64 Varley H, Di S, Scherer SW, Royle NJ (2000) Characterization of terminal deletions at 7q32 and 22q13.3 healed by de novo telomere addition. Am J Hum Genet 67: 610–622 Wallrath LL (1998) Unfolding the mysteries of heterochromatin. Curr Opin Gen Dev 8: 147–153 Weinert T (1998a) DNA damage and checkpoint pathways: molecular anatomy and interactions with repair. Cell 94: 555–558 Weinert T (1998b) DNA damage checkpoints update: getting molecular. Curr Opin Gen Dev 8: 185–193 Weismann, A. 1885.The continuity of the germ-plasm as the foundation of a theory of heredity. In Essays Upon Heredity and Kindred Biological Problems. 1889. Oxford at the Clarendon Press Wilson EB (1905) The chromosomes in relation to the determination of sex in insects. Science 22: 500–502 Winiwarter de H (1912) Arch. Biol. 27: 1 Wolf U (1995) The molecular genetics of human sex determination. J Mol Med 73: 325–331 Xu GL, Bestor TH, Bourc’his D, Hsieh C-L, Tommerup N, Bugge M, Hulten M, Qu X, Russo JJ, Viegas-Pequignot E (1999) Chromosome instability and immunodeficiency syndrome caused by mutations in a DNA methyltransferase gene. Nature 402: 187– 191 Ylstra B, van den Ijssel P, Carvalho B, Brakenhoff RH, Meijer GA (2006) BAC to the future! or oligonucleotides: a perspective for micro array comparative genomic hybridization (array CGH). Nucleic Acids Res 34: 445–450 Zachariae W (1999) Progression into and out of mitosis. Curr Opin Cell Biol 11: 708–716 Zink D, Cremer T (1998) Cell nucleus: chromosome dynamics in nuclei of living cells. Curr Biol 8: R321–R324

62

Sektion 1 · Allgemeine Grundlagen

1.3.9 Zeittafel Die angegebenen Zitate sind in den Literaturteil integriert. 1833

Beschreibung des Zellkerns in Epidermiszellen von Orchideen als »areola« durch R. Brown

1842

Beschreibung von Chromosomen (»Cytoblasten«) in Pollen durch K. Naegeli

1876

Beschreibung der Befruchtung beim Seeigel und Bedeutung des Zellkerns für die Vererbung durch O. Hertwig

1879

Beschreibung der Längsspaltung der Chromosomen bei der Zellteilung und Einführung des Begriffs »Mitose« durch W. Flemming. 1882 wird durch ihn der Begriff »Chromatin« geprägt. Im gleichen Jahr hat J. Arnold erstmals menschliche Chromosomen gezeichnet.

1882

Annahme von der Konstanz der Chromosomenzahl durch Untersuchungen an Pflanzen von E. Strasburger (Arch. mikr. Anat. 21: 476, 1882). Im Jahr 1888 wurde die Zahlenkonstanz durch Boveri auch für Tiere bestätigt.

1883

Nachweis durch E. van Beneden, dass die Zygote von beiden Eltern die gleiche Anzahl von Chromosomen erhält und die Meiose zur Halbierung der Chromosomenzahl führt

1885

Keimbahn-Theorie von A. Weismann. Die Keimbahnzellen stammen nur von Keimbahnzellen ab und sind daher potenziell unsterblich, während die somatischen Zellen zugrunde gehen. Daher kann es auch keine Vererbung erworbener somatischer Eigenschaften geben (Fischer Vlg. Jena 1885).

1887

Individualität der Chromosomen durch T. Boveri belegt. Danach bleiben die Chromosomen im Anschluss an die Anaphase auch im Interphasekern als distinkte Strukturen bestehen.

1888

Einführung des Begriffs »Chromosom« durch W. Waldeyer

1891

Erste Beschreibung eines X-Chromosoms bei der Feuerwanze durch H. Henking

1903

Begründung der Chromosomentheorie der Vererbung durch W. S. Sutton und T. Boveri, der zeigte, dass die Chromosomen sich nicht nur in ihrer Form sondern auch ihrer Funktion unterscheiden

1905

Entdeckung des XY-Mechanismus der Geschlechtsbestimmung bei Insekten durch E. B. Wilson

1909

Beschreibung und richtige Interpretation der Chiasmata in der Meiose durch F. A. Janssens

1911

Erklärung des Faktorenaustauschs (crossing-over) durch Chiasmabildung und Nachweis der linearen Anordnung der Gene auf den Chromosomen durch T. H. Morgan

1913

Nachweis von Nondisjunction bei Drosophila durch C. B. Bridges

1912

Bestimmung der diploiden Chromosomenzahl des Menschen mit 47 durch H. de Winiwarter und 1923 mit 48 durch T. S. Painter

1914

Chromosomentheorie der Krebsentstehung von T. Boveri

1929

Einführung der Bezeichnung »Heterochromatin« für stärker gefärbte Chromosomenregionen der Interphase durch E. Heitz

1949

Nachweis des Geschlechtschromatins bei Katzen durch M. L. Barr und E. A. Bertram und beim Menschen

1956

Nachweis der diploiden Chromosomenzahl des Menschen mit 2n=46 durch J. H. Tjio und A. Levan sowie C. E. Ford und J. L. Hamerton

1959

47,XXY-Karyotyp beim Klinefelter-Syndrom durch P. A. Jacobs entdeckt, 45,XO-Karyotyp beim Turner-Syndrom durch C. E. Ford sowie Trisomie 21 beim Down-Syndrom durch J. Lejeune

1960

Lymphozytenkultur zur einfachen Darstellung der menschlichen Chromosomen von P. C. Nowell und P. S. Moorhead et al. beschrieben

1960

Erstmals charakteristische somatische Chromosomenanomalie (sog. Philadelphia-Chromosom) bei Malignom (chronisch myeloischer Leukämie) durch P. C. Nowell und D. A. Hungerford beschrieben. J. D. Rowley wies 1973 nach, dass es sich um eine reziproke Translokation handelt.

1961

M. Lyon findet funktionelles Mosaik der X-Chromosomenaktivität bei der Maus und formuliert das Konzept vom Dosis-Kompensationsmechanismus beim weiblichen Säuger für X-chromosomale Gene (Lyon Hypothese).

1963

Beschreibung der ersten strukturellen Chromosomenanomalie beim Menschen durch J. Lejeune: 5p– (Katzenschrei-Syndrom)

1964

Erste Erkrankung mit Chromosomeninstabilität (Fanconi-Anämie) durch T. M. Schröder beschrieben und 1965 von J. German ebenfalls beim Bloom-Syndrom gefunden

1966

Steele und Breg zeigen, dass Zellen der Amnionflüssigkeit nach Kultivierung zur Chromosomenanalyse des Feten geeignet sind.

1968

Differenzielle Darstellung der menschlichen Chromosomen nach Anfärben mit Quinacrin durch T. Caspersson und L. Zech beschrieben

1969

In-situ-Hybridisierung von DNA-DNA und RNA-DNA durch J. R. Gall und M. L. Pardue beschrieben. Damit wurde die methodische Grundlage für die molekulare Zytogenetik gelegt.

1.4 1.4 Analyse von Biochips: Von der Sequenz zum System Ralf Herwig, Johannes Schuchhardt, Lukas Chavez und Hans Lehrach

1.4.1

Analyse von Krankheitsprozessen in der modernen Genomforschung – 65

1.4.2

Biochips I: Messung des Transkriptoms

1.4.2.1 1.4.2.2

Technologien zur Messung der Genexpression Plattformvergleich – 68

1.4.3

Biochips II: Messung transkriptioneller Abhängigkeiten – 69

1.4.3.1 1.4.3.2 1.4.3.3

RNS Interferenz (RNAi) – 69 Chromatin-Immunopräzipitation (ChIP-on-Chip) – 70 Sequenzbasierte Motivsuche – 72

1.4.4

Bildauswertung und Qualitätskontrolle von Biochips

1.4.4.1 1.4.4.2

Datenakquirierung – 73 Bildverarbeitung und Qualitätskontrolle

1.4.5

Detektion differenziell exprimierter Gene

1.4.5.1 1.4.5.2 1.4.5.3 1.4.5.4

Analyse von Expressionsunterschieden – 74 Statistische Testentscheidungen – 76 Korrekturverfahren für statistische Testentscheidungen – 77 Vergleich von statistischen Testentscheidungen und Verifizierung von Markergenen – 77

1.4.6

Analyse von Genexpressionsprofilen – 78

1.4.6.1 1.4.6.2 1.4.6.3

Ähnlichkeiten in multidimensionalen Beobachtungen – 79 Auffinden koregulierter Gene durch Clusteranalyse – 80 Validierung von Clusterergebnissen – 81

1.4.7

Klassifizierung

1.4.7.1 1.4.7.2 1.4.7.3

Binäre Klassifikationsprobleme – 83 Multiparametrische Verfahren – 84 Kreuzvalidierung – 86

– 66 – 66

– 73

– 73

– 74

– 83

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

1.4.8

Genetische Netzwerke

1.4.8.1 1.4.8.2 1.4.8.3

Vorwärtsmodellierung und Simulation genetischer Netzwerke Reverse engineering – 87 Netzwerkmotive – 90

1.4.9

Datenbanken und Datenintegration

1.4.9.1 1.4.9.2 1.4.9.3

Primärdatenbanken – 91 Datenbanken für funktionelle Annotation – 92 Standardisierung und Datenbankintegration – 93

1.4.10

Ausblick – Systembiologie in der molekularen Medizin

1.4.11

Literatur

– 94

1.4.12

Zeittafel

– 99

Literatur zur Zeittafel

– 86

– 100

– 87

– 91

– 93

65 1.4 · Analyse von Biochips: Von der Sequenz zum System

1.4.1 Analyse von Krankheitsprozessen in der modernen Genomforschung Die traditionelle biologische Forschung war in der Vergangenheit auf die Analyse einzelner biologischer Vorgänge fokussiert. Für spezielle Fragestellungen sind die entsprechenden Datensätze für den Beweis einzelner Hypothesen generiert und analysiert worden. Da sich aber in der Evolutionsgeschichte in einem Zeitraum von mehreren Milliarden Jahren biologische Prozesse zu fein regulierten und dabei sehr komplexen Netzwerken entwickelt haben, die die Komplexität der modernen Genomforschung ausmachen, haben die von einzelnen Hypothesen getriebenen Ansätze die Grenzen ihrer Effektivität erreicht. Dieser Paradigmenwechsel lässt sich z. B. in der Krebsforschung ablesen. Auch durch jahrzehntelange Forschung konnten – mit Ausnahme von Krebserkrankungen bei Kindern – keine wesentlichen Verbesserungen der Heilungsraten bei den verbreiteten Krebserkrankungen erreicht werden (Leaf 2004). Auch sehr erfolgreiche Wirkstoffe wie z. B. Herceptin oder Glivec sind nur auf einen Teil der Patienten mit individuellen Merkmalen anwendbar. Die wesentlichen Gründe für die Krebsentstehung sind Infektion, Umwelteinflüsse und genetische Prädisposition. Auf molekularer Ebene ist die Krebsentstehung jedoch nicht eindeutig klassifizierbar, stattdessen besteht hier ein komplexes Zusammenspiel verschiedener Faktoren, die Entstehung, Wachstum und Progression von Tumoren fördern (Hanahan u. Weinberg 2000). Diese komplizierten Mechanismen interagierender Moleküle, organisiert in zellulären Netzwerken der Signaltransduktion, Genregulation und des Metabolismus, können nur durch die Hochdurchsatzmethoden der modernen Genomforschung experimentell aufgelöst werden. In den letzten zwanzig Jahren, verbunden mit der Erfindung von PCRReaktionen und der DNS-Sequenzierung, ist der eher hypothesengerichtete Ansatz daher durch die Anwendung systematischer Ansätze komplementiert worden. Diese breiteren, datengerichteten Ansätze sind durch neue hochparallele und automatisierte Methoden in der molekularbiologischen Praxis möglich geworden. Obwohl anfänglich für Kartierungs- und Sequenzierungsprojekte entwickelt, sind Methoden wie Hochdurchsatzsequenzierung und Biochiptechnologie ein fester Bestandteil der klinisch orientierten Genomforschung geworden. Biochips erlauben es, die Expression von Tausenden von Genen in einem einzigen Experiment zu messen. Arbeitsgruppen weltweit nutzen diese und andere Technologien der funktionellen Genomforschung, um Gene als diagnostische Marker und Interventionspunkte für Therapien zu identifizieren und durch die

1.4

Analyse der zugrunde liegenden zellulären Netzwerke eine möglichst individuelle Medikation zu ermöglichen (Herwig u. Lehrach 2006). Dabei ist die anfängliche Euphorie der 1990er Jahre in der Betonung der Bedeutung dieser Methoden für die medizinische Forschung einer eher kritischen (und realistischeren) Sichtweise gewichen. Speziell bei der Entwicklung von neuen Medikamenten ist die Entwicklung nicht so schnell fortgeschritten, wie das am Anfang erhofft wurde, so gibt es z. B. ein zunehmendes Missverhältnis zwischen den Kosten bei der Medikamentenentwicklung und der Anzahl marktfähiger Produkte (Booth u. Zemmel 2004). Immer mehr kommt man zu der Erkenntnis, dass die komplexen Störungen, die den meisten polygenen Erkrankungen zugrunde liegen, eine umfangreichere Kenntnis der relevanten biologischen Prozesse erfordern (Hood u. Perlmutter 2004). Diese Lücke versuchen die Genomforschung auf experimenteller Seite sowie die bioinformatische Forschung auf analytischer Seite nun zu schließen. Biochips nehmen in diesem Zusammenhang immer noch eine zentrale Rolle ein. Die fortschreitende Vollsequenzierung von Genomen (Mensch, Maus, Ratte, Zebrafisch, Wurm, Drosophila, Hefe) ist die Basis für die Erstellung von Biochips, die eine genomweite Analyse von DNS-DNS-, DNS-RNS- oder DNS-Protein-Interaktionen erlauben. Biochips sind eine Schlüsseltechnologie in der modernen molekularen Medizin und gestatten einen komplexen Einblick in fundamentale Prozesse wie Zellentwicklung, -wachstum und -differenzierung. Der dieser Technik eigene hohe Parallelisierungsgrad erlaubt Visualisierung und simultane Analyse von komplexen genetischen Veränderungen. Neue Anwendungen von Biochips – wie z. B. RNS-Interferenz (RNAi) oder ChIP(Chromatin Immunopräzipitation-)on-Chip erlauben ferner eine kausale (nicht nur deskriptive) Interpretation der Expressionsmuster und somit die zielgerichtete Messung von genregulatorischen Netzwerken. In den letzten Jahren hat sich die Bioinformatik zu einem unverzichtbaren Bestandteil der Genomforschung entwickelt. Bioinformatische Werkzeuge wurden etabliert, die es erlauben, große Datensätze systematisch zu speichern, zu durchsuchen und auszuwerten. Dabei sind vor allem robuste mathematisch-statistische Verfahren von Bedeutung, die den immer noch hohen Fehlerraten bei Chip-Experimenten angepasst sind. Ein wesentliches Element der bioinformatischen Analyse ist das Filtern der Daten und damit die Trennung von Daten mit hohem Informationsgehalt von Daten mit niedrigem Informationsgehalt (> Abb. 1.4.1). Zur umfassenden Beschreibung eines biologischen Prozesses müssen üblicherweise unterschiedliche experimentelle Techniken eingesetzt werden. Ein wesentlicher Bestandteil der Bioinformatik ist daher die Korrelationsanalyse dieser Da-

66

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.4.1. Biochipexperimente und Krankheitsprozesse. Bioinformatische Komponenten dienen zur Identifizierung von Markern (Ebene 1), zur Konstruktion qualitativer, zellulärer Netzwerke bestehend aus Reaktionen, die mit diesen Markern assoziiert sind (Ebene 2) und zur dynamischen, quantitativen Modellierung dieser Netzwerke (Ebene 3)

ten, z. B. die Korrelation von Expressionsprofilen koregulierter Gene mit gemeinsamen Bindungsstellen in den entsprechenden Promotorregionen (Tavazoie et al. 2000) oder von RNAi- und ChIP-on-Chip-Zielgenen (Boyer et al. 2006; Babaie et al. 2007). Dadurch können kausale Beziehungen zwischen Genen, etwa einem Transkriptionsfaktor und seinen Zielgenen, hergestellt werden, die als Ausgangspunkt für eine mathematische Modellierung des Krankheitsprozesses dienen. Bioinformatische Methoden werden eingesetzt zur Detektion differenziell exprimierter Gene (7 1.4.5) und damit zur Identifizierung von Markergenen (z. B. für bestimmte Krankheitsstadien), zur Detektion von Genregulationsmustern (7 1.4.6), zur Klassifizierung von Patientengruppen (7 1.4.7) und nicht zuletzt zur Analyse und Visualisierung von krankheitsrelevanten Netzwerken (7 1.4.8). Bioinformatische Entwicklungen schließen aber auch die Entwicklung von Datenbanken, deren Integration und die Erstellung von Ontologien zur Beschreibung und automatischen Erfassung biologischer Information ein (71.4.9). Dadurch entsteht ein umfassendes Bild des dem entsprechenden Phänotyp zugrunde liegenden Genexpressionszustands.

1.4.2 Biochips I: Messung des Transkriptoms Biochips sind die am häufigsten genutzte Technologie zur Messung der Genexpression, da alternative Verfahren, wie z. B. Messungen durch RT-PCR oder In-situHybridisierungen (ISH) nicht den hohen Parallelisierungsgrad haben. Diese Techniken werden jedoch zumeist komplementär eingesetzt, z. B. bei der Verifizierung der unbekannten Markergene, die durch einen Biochip detektiert wurden (vgl. 7 1.4.5.4).

Ein Biochip besteht aus einem festen Trägermaterial (z. B. beschichteter Kunststoff oder beschichtetes Glas), auf der DNS-Sequenzen (Proben) immobilisiert sind, die spezifisch für die Gene des entsprechenden Organismus sind. Aus dem Zielmaterial wird mRNS extrahiert und markiert, und in einem Hybridisierungsexperiment wird die Stärke der gebundenen, markierten cRNS an der Probe detektiert, was als Indikator für die entsprechende Genexpression im Zielmaterial gilt (> Abb. 1.4.2). Die unterschiedlichen Plattformen für Chip-Experimente unterscheiden sich im Oberflächenmaterial, der Auswahl und dem Verfahren zur Immobilisierung der Proben sowie der Art der Markierung.

1.4.2.1 Technologien zur Messung der Genexpression Eine weit verbreitete Technologie ist das Affymetrix GeneChip System (Lockhart et al. 1996; Wodicka et al. 1997; Cho et al. 1998; Lipshutz et al. 1999), bei der Gene durch eine Menge von kurzen Oligonukleotidproben repräsentiert werden (typischerweise elf 25-mere, die über die Gensequenz verteilt sind). Man nutzt photolithographische Verfahren, um an exakten Positionen auf dem Chip einzelsträngige DNS-Sequenzen durch lichtgesteuerte Kupplungsreaktionen aufzubauen. Am Ende enthält jede Position rund zehn Millionen Moleküle des jeweiligen Oligonukleotids (> Abb. 1.4.2). Affymetrix-Chips haben sich zum Standard in der pharmazeutischen Industrie entwickelt, weil sie einen hohen Grad an Reproduzierbarkeit im Herstellungsprozess erreichen. Whole-Genome-Chips, die einen großen Teil des Transkriptoms abdecken, sind für etliche Organismen erhältlich, z. B. für Mensch, Maus, Ratte, Rind und Schwein. Ein Affymetrix-Chip-Experiment ist üblicherweise ein Einfarbenexperiment, d. h. die Markierung erfolgt mit einem Fluoreszenzfarbstoff, und genau ein experimenteller Zustand kann in einem Experiment gemessen werden. Die Proben der Whole-Genome-Chips tasten üblicherweise die nähere Umgebung des 3‘-Endes des entsprechenden Gens ab. Als neues Format bietet Affymetrix auch sogenannte Exon-Chips an (Mensch und Maus), auf denen die Oligonukleotidproben in den bekannten Exonbereichen verteilt sind. Dieses Chipformat bietet die Möglichkeit, spezifisch nach Splice-Varianten in unterschiedlichen Ausgangsmaterialien zu suchen. Eine alternative Technologie bietet Agilent (Hughes et al. 2000, 2001). Die immobilisierten Proben sind hier länger (60-mere), dafür gibt es genau eine Probe pro Gensequenz. Zur Immobilisierung wird eine ähnliche Technik wie beim Tintenstrahldrucker eingesetzt, um winzige Tröpfchen der zur Oligonukleotidsynthese be-

67 1.4 · Analyse von Biochips: Von der Sequenz zum System

1.4

. Abb. 1.4.2. Prinzip von Hybridisierungsexperimenten mit der cDNS Plattform (links) und dem Affymetrix GeneChip System (rechts). Im oberen Bereich ist jeweils die Konstruktion der Proben dargestellt, im unteren Bereich die Präparation des Zielmaterials. Der mittlere

Bereich beschreibt schematisch die Strategie zur Detektion differenziell exprimierter Gene mit dem Zweifarbenexperiment (cDNS-Plattform) und zweier Einfarbenexperimente (Oligonukleotidplattform). (Bilder aus Adjaye et al. 2004 und http://www.affymetrix.com)

nötigten Reaktionslösungen auf kleinste Flächen zu dosieren. Die 60-mer-Proben sind sehr spezifisch für das jeweilige Gen und zeigen typischerweise bessere Hybridisierungseigenschaften als kurze Proben. Experimente mit der Agilent-Plattform können als Ein- oder Zweifarbenexperiment durchgeführt werden, sodass also ein oder zwei Zustände pro Experiment verglichen werden können. Als erweiterte Möglichkeit bietet Agilent seit kurzem das „Arrays-on-Array“-Format, das es erlaubt, bis zu acht verschiedene Experimente auf demselben Chip durchzuführen. Agilent-Chips sind für verschiedene Organismen (z. B. Mensch, Maus, Ratte, Zebrafisch) verfügbar, es besteht ferner die Möglichkeit, durch das Design eigener Sequenzen nutzerspezifische Chips herzustellen. Ein neues Chipformat bietet das Illumina BeadChip System (Gunderson et al. 2004; Kuhn et al. 2004), das ein beadbasiertes Verfahren zur Immobilisierung der Proben nutzt. Hunderttausende dieser Beads sind auf der Oberfläche des Chips verteilt und in bestimmte Beadklassen unterteilt. Jede Beadklasse trägt dabei eine

spezifische Sonde. Die Probensequenzen (50-mere) sind verbunden mit einer Erkennungssequenz für die entsprechende Beadklasse. Nach der Assemblierung der Beads erfolgt eine Identifizierung und exakte Bestimmung der einzelnen Beadklassen und Probensequenzen. Auch Illumina bietet die Möglichkeit, verschiedene Experimente (entweder sechs oder acht) auf demselben Chip durchzuführen. Illumina Chips sind verfügbar für Mensch, Maus und Ratte. Andere kommerzielle Systeme sind Amersham Biosciences, NimbleGen, Febit und Applied Biosystems. Historisch waren cDNS-Chips die erste Technologie zur Messung hochparalleler Genexpression (Lennon u. Lehrach 1991). Zunächst für Nylonmembranen und radioaktive Markierung des Zellmaterials entwickelt (Poustka et al. 1989; Lehrach et al. 1990; Meier-Ewert et al. 1993; Maier et al. 1994, 1997), sind die meisten heute verfügbaren cDNS-Chips auf Glas erhältlich (Schena 1995, 1996; DeRisi 1996, 1997; Adjaye et al. 2004). cDNSChips sind weit verbreitet in der akademischen Forschung, da sie es erlauben, auch Proben zu analysieren,

68

Sektion 1 · Allgemeine Grundlagen

die nicht über kommerzielle Anbieter erhältlich sind. Die verwendeten einzelsträngigen cDNS-Sequenzen haben eine hohe Variabilität in der Probenlänge (100– 3000 bp) und werden durch PCR-Reaktionen amplifiziert. Die PCR-Produkte werden dann durch SpottingRoboter auf die Glasoberfläche transferiert. cDNS-ChipExperimente sind Zweifarbenexperimente. Die während der reversen Transkription unterschiedlich markierten mRNS-Mengen werden gemischt und binden im Hybridisierungsexperiment an ihre komplementären Einzelstränge auf dem Chip. Nach erfolgter Inkubation und den entsprechenden Waschschritten zum Entfernen falsch-positiver Signale wird der Chip durch einen oder zwei Laser angeregt, und in zwei verschiedenen Kanälen werden zwei digitale Bilder erzeugt, die für jede Probe auf dem Chip den Grad der gebundenen Fluoreszenz wiedergeben (> Abb. 1.4.2).

1.4.2.2 Plattformvergleich Jede Plattform hat Vorteile bzw. Nachteile bezüglich Spezifität der Hybridisierung, benötigter Materialmenge, Abdeckung des Genoms und anderer Faktoren (Hardiman 2004). Die implizite Annahme bei allen Chip-Eperimenten ist, dass das gemessene Signal (d. h. die Menge des an der Probe gebundenen markierten Materials) proportional zur Konzentration des entsprechenden Gens im untersuchten Material ist. Änderungen in der gemessenen Signalintensität können dann als Konzentrationsänderungen interpretiert werden. Die Signalintensität ist allerdings nur eine grobe Näherung für die tatsächliche Konzentration des Gens, und diese Interpretation ist nur dann korrekt, wenn die Beziehung zwischen Signalintensität und Konzentration annähernd linear ist. ChipExperimente zeigen allerdings oft Abweichungen von dieser Annahme, z. B. Sättigungseffekte, wenn das Signal über dem Detektionsniveau liegt oder andere nichtlineare Effekte, wenn das Signal unterhalb des Detektionsniveaus liegt. Whole-Genome-Chips enthalten Proben für einen Großteil des Genoms. Diese Chips werden typischerweise zu Beginn einer Studie verwendet, wenn Marker noch nicht bekannt sind, und neue Information gewonnen werden soll. Wenn allerdings a priori Information vorhanden ist, geht man oft aus Kostengründen, aber auch aus Gründen des Designs, zu themenspezifischen Chips über, die eine begrenzte Anzahl von Genen repräsentieren, z. B. mit Bezug auf eine bestimmte Krankheit (Krebs, Diabetes), auf eine bestimmte zelluläre Funktion (Kinasen) oder auf vorher bestimmte Markergene. Verschiedene Studien haben Chip-Plattformen miteinander verglichen (Parrish et al. 2004; Kuo et al. 2002;

Tan et al. 2003; Barnes et al. 2005). Die meisten Studien stellten dabei eine schwache Korrelation der globalen Genexpression fest. Die Gründe für diese schlechte Vergleichbarkeit liegen in Unterschieden bei der Bindungssensitivität aufgrund der unterschiedlichen Probenlängen, aufgrund der verschiedenen chemischen Behandlungen und aufgrund unterschiedlicher Datenprozessierung. DNS-Chips benutzen primär kurze Oligonukleotide (15–25 nt), längere Oligonukleotide (50–120 nt) und PCR-amplifizierte cDNS-Sequenzen (100–3.000 bp) als Proben. Kurze Oligonukleotide haben oft Spezifizitätsprobleme (Kreuz-Hybridisierungen) beim Herauslesen der Genexpression aus komplexem Zielmaterial im Vergleich zu cDNS-Sequenzen, die starke Signale produzieren und sehr spezifisch an ihr Gegenstück binden. Üblicherweise zeigen auch längere Oligonukleotidsequenzen eine bessere Spezifität, die mit der von cDNS vergleichbar ist (Stears et al. 2003). Eine weitere Variation besteht in der Annotation der Proben. Typischerweise variieren die Annotation und das Design der Proben, da die Chiphersteller verschiedene Datenbanken zugrunde gelegt haben, wie z. B. Unigene, Refseq, LocusLink, ENSEMBL etc. Diese Probenannotation muss regelmäßig aktualisiert werden, was zu gravierenden Änderungen in der Interpretation der Daten führen kann (Dai et al. 2005). Der wohl umfangreichste Plattformvergleich wurde in der MAQC-Studie durchgeführt (MAQC Consortium 2005). Hier wurden die meisten gängigen Plattformen in den Vergleich mit einbezogen, und anhand unterschiedlichen Materials (humanes Gehirn gegen humanen Gewebemix) die Korrelation der Expressionsunterschiede zwischen den verschiedenen Plattformen getestet. Die Studie kommt zu dem Ergebnis, dass die Oligonukleotid-Plattformen (Affymetrix, Agilent, Illumina) eine sehr gute Korrelation zeigen. Die Korrelation zwischen Oligonukleotid- und cDNS-Plattformen waren allerdings deutlich schlechter. Der Vergleich beruht auf einer Teilmenge von ca. 12.000 Genen, für die Proben auf allen Plattformen vorhanden waren, d. h., dem Datenvergleich war eine umfassende Reannotation der Proben vorangegangen. Alternativ zu Biochips gibt es noch weitere Hochdurchsatzverfahren zur Bestimmung der Genexpression, z. B. SAGE, ArrayCGH und EST-Sequenzierung. Eine völlig neue Technologie zur Messung der Genexpression wurde kürzlich mit der „2nd-generation-sequencing“Technologie eingeführt (454, Solexa). Diese hochparallele Technologie basiert auf dem „Sequencing-by-Synthesis“-Prinzip, bei dem DNS-Moleküle auf Beads immobilisiert werden (454-System) oder auf einer planaren Oberfläche (Solexa) (Margulies et al. 2005). Danach wird die DNS amplifiziert und dient als Maske für einzelne fluoreszenzmarkierte Nukleotide. In einer Abfolge

69 1.4 · Analyse von Biochips: Von der Sequenz zum System

aus Zugabe von Nukleotiden und anschließender Bilderkennung der entsprechenden Markierung entsteht so in jedem Zyklus an jeder Position ein neues Nukleotid, und so kann am Ende der Prozedur die jeweilige Sequenz des im Zielmaterial vorkommenden Moleküls bestimmt werden. Die Methoden sind hochparallel und erlauben das Auslesen von Millionen von Sequenzresultaten in einem Experiment. Dieses Verfahren kann für viele Anwendungen verwendet werden, z. B. Genexpressionsanalysen, aber auch Analysen von Sequenzunterschieden wie Mutationen und Splice-Varianten (Thomas et al. 2006).

1.4.3 Biochips II: Messung transkriptioneller Abhängigkeiten Der Weg vom Gen zu seinem Protein beginnt bei der DNS-abhängigen Synthese der RNS (Transkription). Sämtliche Faktoren, die regulatorisch auf den Prozess der Transkription wirken, gelten als Transkriptionsfaktoren (TF). Man unterscheidet dabei zwischen direkt und indirekt wirkenden Regulationen. Eine direkte transkriptionelle Regulation liegt vor, wenn der TF durch die Bindung an spezifischen DNS-Regionen, den Transkriptionsfaktorbindungsstellen (TFBSs), Einfluss auf die Expression eines Gens ausübt. Indirekte transkriptionelle Regulation liegt vor, wenn ein TF über nachgelagerte Prozesse regulatorisch auf die Genexpression wirkt. Insgesamt wirken TF entweder verstärkend (Aktivatoren) oder aber unterdrückend (Repressoren) auf die Transkription ihrer Zielgene. In den letzten Jahren wurden Verfahren entwickelt, mit denen man diese transkriptionellen Abhängigkeiten im Experiment messen kann. Die Verbindung dieser Techniken mit Biochips erlaubt dabei die hochparallele, genomweite Messung des Transkriptionseffekts. Durch ein RNS-Interferenz- (RNAi-)Experiment ist es möglich, kausale Zusammenhänge in Bezug auf die transkriptionellen Abhängigkeiten von TF und ihren Zielgenen zu detektieren (7 1.4.3.1). Ohne weitere Zusatzinformationen ist es jedoch nicht möglich, zwischen direkter und indirekter transkriptioneller Regulation zu unterscheiden. Ein experimenteller Ansatz, um direkte transkriptionelle Zusammenhänge zwischen TF und Zielgenen zu messen, ist Chromatin-Immunopräzipitation mit anschließender Hybridisierung auf einem Biochip (ChIP-on-Chip, 7 1.4.3.2).

1.4.3.1 RNS Interferenz (RNAi) Mittels eines RNS-vermittelten Interferenzexperiments (RNAi) ist es möglich, die Proteinbiosynthese eines Gens

1.4

posttranskriptionell zu verringern („silencing“, „knockdown“) (Carrington u. Ambros 2003; Paddison et al. 2002). Während des zweiten Abschnitts der Proteinbiosynthese, der Translation, dient die mRNS als Matrize für den sukzessiven Aufbau eines Polypeptids. Die Quantität der Proteinbiosynthese ist u. a. limitiert durch die Konzentration der entsprechenden mRNS. Der Wirkungsmechanismus eines RNAi-Experiments liegt in der Verringerung der Konzentration der mRNS eines Gens. Durch ein RNAi-Experiment kann gezielt die Degradierung ausgesuchter mRNS induziert werden, was folglich zu einer Verminderung der Proteinsynthese und somit zur Verminderung der Aktivität des entsprechenden Proteins führt. Die Degradierung von mRNS wird durch kurze doppelsträngige RNS- (dsRNS-)Moleküle initiiert. dsRNS-Fragmente, die regulatorisch auf die Genexpression wirken, wurden zunächst in den Modellorganismen Caenorhabditis elegans, Drosophila melanogaster und Arabidopsis thaliana untersucht (Fire et al. 1998; Lee et al. 1993; Lim et al. 2003; Llave et al. 2002; Reinhart et al. 2002), kommen aber nicht nur in wirbellosen Tieren und Pflanzen vor, sondern ebenso in Vertebraten (Lagos-Quintana et al. 2003; Lim et al. 2003). Es gibt unterschiedliche Klassen regulatorischer dsRNS. MikroRNS (miRNAs) haben eine Länge von 20–25 bp und entstehen aus Vorläufer-RNS, welche von nicht proteinkodierenden DNS-Regionen des Genoms transkribiert werden. Diese einzelsträngigen VorläuferRNS vollziehen eine selbstkomplementäre Faltung und werden daraufhin durch die Ribonuklease-Dicer geschnitten. Small-interfering-RNS-Fragmente (siRNAs) entstehen ebenfalls durch das Schneiden längerer Vorläufer dsRNS durch Dicer (Agrawal et al. 2003). Die Vorläufer-RNS sind im Falle von siRNAs jedoch exogener Herkunft (z. B. durch die Infektion mit einem Virus oder durch In-vitro-Manipulationen). Trotz ihrer unterschiedlichen Abstammung sind miRNAs und siRNAs funktionell gleich (Carrington u. Ambros 2003). Der Vorgang des Gene Silencing beginnt mit der Inkorporation der dsRNS-Fragmente in einen RNS-induzierten Silencing-Komplex (RISC). Nach dem Abbau eines der beiden Stränge der dsRNS kann es zur Hybridisierung zwischen der weiterhin im RISC inkorporierten einzelsträngigen RNS und komplementärer proteinkodierender mRNS kommen. Die katalytische Komponente des RISC, die Argonaut-Proteine, sind Endonukleasen und werden durch die Bindung der mRNS dazu veranlasst, diese zu degradieren (> Abb. 1.4.3) (Carrington u. Ambros 2003; Ronemus et al. 2006). Durch die Transfizierung einer Zellkultur mit TFspezifischen siRNAs ist es somit möglich, die Aktivität dieses TF stark zu reduzieren. Dieses Vorgehen erlaubt es, den transkriptionellen Einfluss des ausgeschalteten

70

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.4.3. Mechanismus der RNS-Interferenz (RNAi). Doppelsträngige RNS endogener (miRNA) oder exogener (siRNA) Herkunft wird durch die Endoribonuklease DICER in kleine Fragmente der Länge 10–25 bp geschnitten. Die kurzen dsRNS-Fragmente werden in

den RNS-induzierten Silencing-Komplex (RISC) inkorporiert, und ein Strang der dsRNS wird abgebaut. Komplementäre mRNS bindet an die RISC-gebundene RNS. Die anschließende Degradierung der mRNS führt zu dem Effekt des Gene silencing

TF auf andere Gene zu untersuchen. 24 bis 72 Stunden nach der Transfizierung kann mithilfe eines Biochips das Transkriptionsprofil der Zellkultur gemessen werden. Zur Kontrolle wird zum gleichen Zeitpunkt das Transkriptionsprofil eines biologischen Replikats der verwendeten Zellkultur ermittelt, welches anstatt mit den TF-spezifischen siRNAs mit unspezifischen siRNAs transfiziert wurde. Der Vergleich der Transkriptionsprofile zwischen spezifischer und unspezifischer RNAi spiegelt den Einfluss des ausgeschalteten TF auf die Transkription wider und erlaubt somit eine Identifizierung seiner Zielgene.

bezeichnet, und von dieser wird ein Teil für eine spätere Verwendung zurückbehalten. Durch die Zugabe von TF-spezifischen Antikörpern wird eine Anreicherung solcher DNS-Fragmente initiiert, die in der Probe von dem zu untersuchenden TF gebunden sind. Aufgrund der selektiven Bindung der Antikörper an den zu untersuchenden TF ist es möglich, eine Fällung der TF spezifischen DNS-Fragmente zu erreichen (Sandmann et al. 2006). Im Vergleich zu der Input-Probe liegt jetzt eine Probe vor, in der es eine Anreicherung von solchen DNS-Fragmenten gibt, an die der TF im natürlichen Zustand der Zellkultur gebunden ist. Eine weitere Erhöhung der Konzentration der DNS-Fragmente ist durch PCR möglich. Diese Probe wird als IP- („immunoprecipitated“-)Probe bezeichnet (> Abb. 1.4.4). Um den DNS-Fragmenten, an denen der TF gebunden ist, Positionen auf dem Genom zuordnen zu können, wird eine Variante der Biochips verwendet, die als Promotor- oder Tiling-Chip bezeichnet wird. TFBS sind gehäuft in der proximalen Promotorregion zu finden (bis zu 250bp vor der Anfangsposition der Transkription [TSS] eines Gens in Richtung der 5’-Region). Nichtsdestotrotz können TFBS auch in weiter entfernten Promotorregionen oder sogar erst hinter der TSS lokalisiert sein. Somit wird die Suche nach regulatorisch wirkenden DNS-Protein-Bindungsregionen in der Praxis häufig auf einen Bereich von –8 kb und bis zu +2 kb um die TSS eines Gens ausgedehnt (Boyer et al. 2005). Hierzu werden Oligonukleotide generiert, die in regelmäßigen Abständen komplementär zu diesem Bereich sind. Das

1.4.3.2 Chromatin-Immunopräzipitation (ChIP-on-Chip) Der Ausdruck ChIP-on-Chip setzt sich aus der Kombination zweier unterschiedlicher Techniken zusammen. Insgesamt dient der Ansatz der Suche nach ProteinDNS-Interaktionen. Zunächst werden die Protein-DNSVerbindungen, wie sie im natürlichen Zustand innerhalb der zu untersuchenden Zellkultur vorkommen, durch die Zugabe von Formaldehyd vernetzt und somit stabilisiert (Orlando 2000). Daraufhin wird die DNS durch den Einsatz von Ultraschall in kleine Fragmente der Länge 0.2–1 kb zerlegt. Dies führt dazu, dass innerhalb der Probe sowohl proteingebundene, als auch ungebundene DNS-Fragmente vorliegen. In diesem Zustand wird die Probe häufig als genomische bzw. Input-Probe

71 1.4 · Analyse von Biochips: Von der Sequenz zum System

1.4

b

a

c

d

. Abb. 1.4.4a–d. Prinzip der Chromatin-Immunopräzipitation. a Die Protein-DNS-Verbindungen werden durch die Zugabe von Formaldehyd fixiert. Durch Ultraschall wird die DNS in Fragmente der Länge 0,2–1 kb zerlegt (Input-Probe). In einem Teil der Probe wird die Fällung bestimmter DNS-Protein-Komplexe durch die Zugabe von TF-spezifischen Antikörpern erreicht (IP-Probe). Anschließend erfolgt ein Zweifarbenexperiment mit einer Reihe von Tiling-Chips.

b Der Bereich um die Transkriptions-Startposition (TSS) eines Gens wird in regelmäßigen Abständen durch komplementäre Oligonukleotide abgetastet. c Gegenüberstellung der absoluten Intensitätswerte der IP- und Input-Probe (log2). d Beispiel einer chromosomalen Region, die von einem spezifischen TF gebunden wurde. Die Intensitätswerte benachbarter Oligonukleotide sind in der IP-Probe signifikant größer als in der Input-Probe

Verhältnis zwischen der Länge der Oligonukleotide und ihrem Abstand zueinander bestimmt die Dichte eines Tiling-Chips und somit ebenfalls die Genauigkeit der späteren Zuordnung einer TFBS zu ihrer genomischen Position. Bei einer Länge von ca. 60 bp pro Oligonukleotid und einem Abstand relativ zur genomischen Sequenz von durchschnittlich 240 bp zueinander, werden ca. 35 Oligonukleotide benötigt, um den oben genannten Bereich abzudecken. Mithilfe eines solchen Tiling-Chips wird die Konzentration der TF-spezifischen DNS-Fragmente der IP-Probe im Verhältnis zu der Konzentration der TF-unspezifischen DNS-Fragmente der Input-Probe bestimmt. Hierbei werden die IP- und die Input-Proben mit zwei unterschiedlichen Farbstoffen markiert, auf den Tiling-

Chip aufgetragen (Zweifarbenexperiment) und für jedes Oligonukleotid sowohl die beiden absoluten Intensitätwerte gespeichert, als auch das Verhältnis zwischen IP- und Input-Probe berechnet. Die Bestimmung von signifikant unterschiedlichen Intensitätswerten erfolgt dann mit einigen Variationen analog zu den Zweifarben experimenten bei Whole-Genome-Chips (vgl. 7 1.4.2 und 1.4.5). Erste Tiling-Chip-spezifische Methoden wurden kürzlich veröffentlicht (Boyer et al. 2005; Li et al. 2005; Ji und Wong 2005).

72

Sektion 1 · Allgemeine Grundlagen

1.4.3.3 Sequenzbasierte Motivsuche Mithilfe der Röntgenkristallographie ist es möglich, Protein-DNS-Bindungen zu visualisieren (Reményi et al. 2003). Dadurch wird deutlich, dass die Bindungsdomänen der TF auf unterschiedliche Weise Wechselwirkungen mit der DNS eingehen können. Darüber hinaus können TF in Konglomeraten mit anderen TF oder mit weiteren transkriptionellen Kofaktoren DNS binden. Die Sequenzspezifizität eines TF lässt somit Variabilität zu. Die TFBS eines TF ist folglich nicht zwingend eine feste lineare Sequenz, sondern ein variables Motiv. Die Länge einer TFBS ist mit etwa 8–14 bp relativ kurz (Matys et al. 2006). Ist das Sequenzmotiv bekannt, für dass ein TF eine Bindungsaffinität besitzt, so kann dieses genutzt werden, um in der genomischen DNS nach potenziellen Bindungsstellen zu suchen. Ebenso können Protein-DNS-Bindungen, die durch ein ChIP-on-Chip-Experiment aufgedeckt wurden, durch die Suche nach bekannten TFBS validiert werden. Die Motivsuche ist somit ein weiteres Werkzeug, um transkriptionelle Abhängigkeiten zu untersuchen.

Die Identifizierung eines Musters in der DNS, welches als Bindungsstelle für einen TF gilt, ist aufgrund der Sequenzvariabilität bei Protein-DNS-Bindungen nicht trivial, und es gibt eine Vielzahl algorithmischer Ansätze zur Lösung dieses Problems. Ein Großteil dieser Algorithmen erwartet als Eingabe einen Sequenzdatensatz, der bereits potenzielle Zielgene eines TF enthält. Eine mögliche Quelle hierfür sind z. B. Sequenzabschnitte, die in einem ChIP-on-Chip-Experiment von einem TF gebunden wurden, aber auch Promotorsequenzen von Genen, die über experimentelle Zustände koreguliert sind (vgl. 7 1.4.6). In solchen TF-spezifischen Sequenzdatensätzen wird dann nach Motiven gesucht, die statistisch überrepräsentiert sind (MacIsaac u. Fraenkel 2006). Die Vorgehensweisen der verschiedenen Algorithmen lassen sich grob in deterministische (Pavesi et al. 2004) und probabilistische (Hughes et al. 2000; Bailey u. Elkan 1994) Methoden unterteilen. Darüber hinaus bieten multifunktionale Softwarepakete neben der Möglichkeit, verschiedene Algorithmen sequenziell auf einen Datensatz anwenden zu können, noch weiterführende

a

b

. Abb. 1.4.5a,b. Überblick über Sequenzanalyseprogramme. a Zusammenstellung von Anwendungen, Softwarepaketen und Datenbanken zu Transkriptionsfaktor-Bindungsstellen. b Darstellung eines

Bindungsmotivs. Die Höhe eines Buchstabens entspricht der Häufigkeit seines Auftretens in den Referenzsequenzen

73 1.4 · Analyse von Biochips: Von der Sequenz zum System

Analysemethoden (> Abb. 1.4.5). Hierzu gehört u. a. der Vergleich von Motiven untereinander, das Clustern von Motiven, eine Signifikanzanalyse gefundener Motive sowie das Suchen gegebener Motive in weiteren Sequenzen (Gordon et al. 2005). TF-spezifische Motive werden in speziellen Datenbanken gespeichert und können von dort abgerufen werden (Matys et al. 2006; Sandelin et al. 2004).

1.4.4 Bildauswertung und Qualitätskontrolle von Biochips 1.4.4.1 Datenakquirierung Üblicherweise erfolgt die digitale Quantifizierung der Biochips über einen Laserscanner. Jeder Chiphersteller vertreibt dabei ein eigenes Scannergerät, das an die entsprechenden Datenträger angepasst ist und den entsprechenden experimentellen Bedingungen (z. B. Oberflächenchemie) genügt. Der Scanner liefert für jeden Ort auf dem Chip einen Wert, der den Grad der aufgenommenen Fluoreszenz beschreibt. Die gescannte Region wird dabei in kleine Flächen aufgeteilt (Pixel). Der von der Auflösung bestimmte Wert für einen Pixel schwankt zwischen 0 und 65.536 (16-bit-Bild). Bei Zweifarbenexperimentenwerden zwei Bilder in getrennten Scan-Prozeduren erzeugt. Dabei nutzt man die Tatsache, dass die verwendeten Farbstoffe (Cy3 und Cy5) Licht mit verschiedenen Wellenlängen absorbieren und emittieren, das dann in den entsprechenden Bereichen detektiert werden kann. Bei den Cyanin-Farbstoffen sind die Bereiche 510–550 nm für Cy3-Farbstoff und 630–660 nm für Cy5-Farbstoff. Die entsprechenden Prozeduren werden nacheinander durchgeführt.

1.4.4.2 Bildverarbeitung und Qualitätskontrolle Das Problem der Bildverarbeitung besteht darin, der jeweiligen Probe (Bildpunkt) eine Gruppe von Pixeln in dem digital abgespeicherten Bild zuzuordnen und diese zu quantifizieren (Lim 1990; Wolberg 1990). Die meisten Bildverarbeitungsprogramme sind zweistufige Verfahren: Im ersten Schritt wird versucht, das Zentrum eines jeden Bildpunkts zu finden, also die exakte Position der einzelnen Zielprobe auf dem Biochip (Gitterdetektion), und im zweiten Schritt wird für jeden Bildpunkt in einer definierten Pixel-Umgebung über eine mathematische Funktion die Signalintensität berechnet (Quantifizierung). Die Genauigkeit der Quantifizierung ist dabei von der Auflösung abhängig, mit der der Biochip aufgenommen wurde. Für eine hinreichende

1.4

Genauigkeit sollten diese Bildpunktbereiche nach der Bildaufnahme aus mindestens 5u5=25 Pixeln bestehen. Die entstehende Pixelmatrix kann für die Integration des Bildbereichs mit verschiedenen Faktoren korreliert werden, die beispielsweise das Zentrum des Bildpunktbereichs anders gewichten als seine Randbereiche. Einige Quantifizierungsmethoden gehen dabei von einer festen Pixelfunktion aus, z. B. einer Normalverteilung, sodass die Gewichte entsprechend der Dichtefunktion der Verteilung eingestellt werden können (Steinfath et al. 2001). Andere Methoden arbeiten verteilungsunabhängig und benutzen Klassifikationsmethoden, um den Pixelbereich in Signal- und Rauschbereich aufzuteilen (Segmentation) und diese getrennt zu quantifizieren (Jain et al. 2002). Ein wesentliches Element bei der Quantifizierung der Bildpunkte ist neben der Errechnung der Bildpunktintensität die Berechnung eines lokalen Hintergrundes, um chipspezifische Einflussfaktoren zu eliminieren. Daher geht meist nicht nur der Bildpunkt in die Quantifizierung ein, sondern auch dessen Nachbarschaft. Weitaus die meisten Bildverarbeitungsprogramme sind semiautomatische Verfahren und erfordern die nutzergesteuerte Einstellung des Bildpunktgitters. Diese semiautomatischen Verfahren haben zwei entscheidende Nachteile: 1. Die Nutzerinteraktion ist bei durchaus realistischen Größenordnungen von 20.000–100.000 Bildpunkten sehr zeitaufwendig und 2. Die Nutzerinteraktion ist oft fehlerhaft und führt zu schlecht reproduzierbaren Resultaten. Vermehrt wird daher an vollautomatischen Verfahren gearbeitet, die das Bildpunktgitter automatisch finden. Dabei müssen Rotation des Gitters und lokale Verzerrungen der einzelnen Bildpunkte berücksichtigt werden. In der Praxis genutzte kommerzielle Bildverarbeitungsprogramme sind z. B.: 1. ImaGene (www.biodiscovery.com) 2. GeneSpotter (www.microdiscovery.com) 3. GenePix (www.moleculardevices.com/) 4. AIDA (www.raytest.com) 5. ArrayVision (www.imagingresearch.com) Bei der korrekten Bestimmung eines Intensitätswertes für den jeweiligen Bildpunkt gibt es eine Reihe von Punkten, die berücksichtigt werden müssen. Ein Problem besteht z. B. in der wechselseitigen Beeinflussung von Bildpunkten, die nicht klar voneinander getrennt sind, in schlecht gefundenen Gitterkoordinaten und lokalen Artefakten. Nach der Bildverarbeitung ist jeder Probe ein Intensitätswert zugeordnet, der proportional zur Konzentration des entsprechenden Gens im experimentellen Material ist. Zur Qualitätskontrolle verwenden die meisten

74

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.4.6. Qualitätskontrolle von Biochips mit der CheckReport-Software von MicroDiscovery GmbH

Chips Proben mit unterschiedlichen Kontrolleigenschaften, z. B. Verdünnungsreihen, um den dynamischen Bereich der Signalintensitäten abzudecken, Housekeeping-Gene, Positivkontrollen, um den oberen Signalbereich, und Negativkontrollen, um den unteren Signalbereich abzutasten. Numerische Kriterien wie z. B. Korrelationstabellen von technischen und biologischen Replika oder M/A-Graphiken, die die Abhängigkeit des Expressionsunterschieds von der Stärke des Signals wiedergeben, werden üblicherweise benutzt, um die Güte der Daten zu berechnen, zu visualisieren und damit fehlerhafte Experimente auszusortieren (> Abb. 1.4.6).

rung ihres Expressionsniveaus zeigen. Das mRNS-Material kann dabei z. B. aus gesundem und krankem Gewebe stammen, was Rückschlüsse auf die an der Krankheit beteiligten Gene und deren Proteine zulässt oder aus unterschiedlichen Stadien der Entwicklung eines Organismus, was die Charakterisierung entwicklungsspezifischer Gene erlaubt. Biochips ermöglichen die parallele Detektion differenziell exprimierter Gene und somit die umfassende Identifizierung von Markergenen und deren funktioneller Eigenschaften, z. B. erlauben sie detaillierte Rückschlüsse auf die mit den Markern verbundenen Signalübertragungswege. Insbesondere diese Charakteristik macht den Einsatz von Biochips für die pharmazeutische Forschung sehr attraktiv.

1.4.5 Detektion differenziell exprimierter Gene Eine wichtige Anwendung von Biochips besteht in der Identifizierung differenziell exprimierter Gene, d. h. solcher Gene, die bei Hybridisierung von mRNS-Material unterschiedlichen Ursprungs eine signifikante Ände-

1.4.5.1 Analyse von Expressionsunterschieden Um die differenzielle Expression eines Gens zu beurteilen, wurde ursprünglich lediglich der Expressionsquo-

75 1.4 · Analyse von Biochips: Von der Sequenz zum System

1.4

tient, also der Quotient aus gemessener Intensität bei Hybridisierung mit der Kontrollprobe und der behandelten Probe, als Kriterium verwendet (DeRisi et al. 1996, 1997; Schena et al. 1995, 1996; Iyer et al. 1999). Gene, deren Expression um mehr als einen bestimmten Schwellwert variierten, wurden als differenziell exprimiert bezeichnet. Als „zuverlässige“ Schwelle galt lange Zeit ein Faktor von mindestens 2, d. h. Genexpressionsunterschiede von weniger als 2 wurden als nicht signifikant eingestuft. Dieses Vorgehen ist allerdings zu ungenau und hängt ganz wesentlich von der Güte der Experimente ab. Gerade geringe Expressionsunterschiede, wie sie signifikant erst in einer ausreichenden Anzahl von (wenigstens 4) Experimenten nachgewiesen werden können, sind interessant – z. B., um eine Krankheit in einem frühen Stadium zu erkennen. Zahlreiche statistische Auswerteverfahren wurden – oft in Abhängigkeit von der Technologie – entwickelt, um den Expressionsquotienten zu bewerten (Greller u. Tobin 1999; Chen et al. 1997; Hilsenbeck et al. 1999; Lee et al. 2000; Roberts et al. 2000; Manduchi et al. 2000; Newton et al. 2001). Meist basieren diese Ver-

fahren auf bestimmten Verteilungsannahmen an die Struktur der Daten, z. B. auf der Modellierung mit geeigneten Dichtefunktionen. Eine wichtige Frage bei der Detektion differenziell exprimierter Gene betrifft die Anzahl der biologischen Wiederholungen, so dass eine verlässliche Berechnung der Signifikanz des Intensitätsquotienten gewährleistet ist. Eine einfache Simulation zeigt, wie die Höhe der detektierbaren differenziellen Expression von der Anzahl der Wiederholungen abhängt (> Abb. 1.4.7). Während augenfällige Expressionsunterschiede von 1:10 oder 1:5 bereits mit einem geringem Stichprobenumfang mit hoher Wahrscheinlichkeit detektierbar sind, kommt es gerade bei den kleinen Expressionsunterschieden sehr stark auf die Anzahl der Versuche an. Die Simulation zeigt, dass bei realistischer Annahme eines Experimentenfehlers von 15% und 4 experimentellen Wiederholungen bereits 90% der Expressionsunterschiede 1:2 detektiert werden können, aber nur 55% der Expressionsunterschiede 1:1,5. Um hier auf das gleiche Niveau zu gelangen, müssten mindestens sieben biologische Replika gemacht werden.

. Abb. 1.4.7. Simulation zur Detektion differenziell exprimierter Gene. Der Expressionsquotient, der durch statistische Tests detektiert werden kann, ist abhängig vom Stichprobenumfang, d. h., wieviele biologische Replika gemacht wurden. Hierzu wurden aus simulierten Verteilungen entsprechend dem eingestellten Grad der differenziellen Expression (z. B. 1:2, rote Kurve) und entsprechend dem Stichprobenumfang Daten zufällig gezogen (X-Achse). Die t-Test-Statitistik wurde berechnet und notiert, ob die differenzielle Expression signifi-

kant zum Niveau 0,05 detektiert wurde. Der Vorgang wurde 1000-mal wiederholt, und der Anteil korrekt detektierter Expressionsunterschiede wurde aufgetragen (Y-Achse). Zum Beispiel zeigt die Simulation, dass bei 4 Wiederholungen über 90% aller Expressionsquotienten von 1:2 detektiert werden können. Kleinere Expressionsunterschiede können nur mit genügendenWiederholungen reproduzierbar detektiert werden (1:1,5 schwarz, 1:2 rot, 1:3 grün, 1:5 blau, 1:10 gelb, 1:20 lila)

76

Sektion 1 · Allgemeine Grundlagen

1.4.5.2 Statistische Testentscheidungen

und weiterhin

Die Verwendung von statistischen Tests zur Detektion differenziell exprimierter Gene hat sich als sehr zuverlässig und sensitiv erwiesen (Claverie 1999; Ideker et al. 2000; Callow et al. 2000; Baldi u. Long 2001; Thomas et al. 2001; Herwig et al. 2001). Hierbei muss allerdings vorausgesetzt werden, dass genügend Wiederholungen der Chip-Experimente vorliegen. Mathematisch handelt es sich bei den meisten verwendeten Testverfahren um das sog. Zwei-StichprobenLokationsproblem (Lehmann 1975; Best u. Rayner 1987). Für jede Probe erhält man bei Wiederholung des Experiments zwei Folgen von Intensitätswerten, X1,...,XN und Y1,...,YM (behandelte Gruppe und Kontrollgruppe). Bei der statistischen Modellierung geht man davon aus, dass die Messreihen einer bestimmten Wahrscheinlichkeitsverteilung genügen, z. B. einer Normalverteilung. Es werden dann zwei Hypothesen gebildet: x H0: Die Messreihen haben denselben Mittelwert (Nullhypothese). x H1: Die Messreihen haben verschiedene Mittelwerte (Alternative).

sprechenden Mittelwerte. Diese Teststatistik hat eine vorgegebene Verteilung. Unter der Bedingung, dass Kontroll- und Behandlungsgruppe beide normalverteilt sind, ist dies eine t-Verteilung mit M+N–2 Freiheitsgraden. Zu jedem experimentellen Ergebnis kann daher ein P-Wert berechnet werden, der die Wahrscheinlichkeit unter der Nullhypothese angibt, mit der diese t-Verteilung einen noch extremeren Wert annimmt als den beobachteten. Somit ist der P-Wert ein Maß für die Signifikanz der Abweichung der Daten von der Nullhypothese, und daher indiziert ein kleiner P-Wert, dass das entsprechende Gen differenziell exprimiert ist. T-Tests sind parametrische Verfahren, die voraussetzen, dass die Daten einer parametrisierbaren Wahrscheinlichkeitsverteilung folgen, in diesem Fall einer Normalverteilung, während der Wilcoxon-Rangsummentest und der Permutationstest nichtparametrische Verfahren sind, die eine wesentlich schwächere Verteilungsannahme benötigen und daher für größere Problemklassen anwendbar sind. Ist also in der Praxis nicht klar, dass die gemessenen Intensitätswerte normalverteilt sind, so kann auf die nichtparametrischen Verfahren zurückgegriffen werden. Bei einem statistischen Test treten zwei Arten von Fehlern auf (> Tab. 1.4.1). Entscheidet man aufgrund der Teststatistik positiv, d. h., der Test suggeriert differenzielle Expression, aber das Gen ist nicht differenziell exprimiert (falsch-positiv), so spricht man vom Fehler 1. Art (V). Entscheided man aufgrund der Teststatistik negativ, d. h., der Test suggeriert keine differenzielle Expression, aber das Gen ist differenziell exprimiert (falschnegativ), so spricht man vom Fehler 2. Art (T). Allen statistischen Testentscheidungen ist gemein, dass sie nur jeweils einen dieser Fehler kontrollieren können. Kontrolliert man den Fehler 1. Art, so gibt man dazu ein Signifikanzniveau D vor (im Allgemeinen D = 0.01 bzw. D = 0.05) und klassifiziert alle Gene als signifikant differenziell exprimiert, die einen P-Wert unterhalb dieser Schwelle haben. Bei zutreffenden Verteilungsannahmen bedeutet dies, dass der Fehler 1. Art

Statistische Tests erlauben die Bewertung, ob diese Reihen aus der gleichen Population stammen (keine differenzielle Expression) oder nicht (differenzielle Expression). In der Praxis genutzte Testverfahren sind hierbei: x t-Test mit gleichen Varianzen x t-Test mit ungleichen Varianzen x Wilcoxons Rangsummentest (auch Mann-WhitneyU-Test) x Permutationstests Allen Tests ist gemeinsam, dass sie über eine Teststatistik, d. h. eine mathematische Funktion auf den Daten, einen P-Wert errechnen, der es erlaubt, die Signifikanz der differenziellen Expression zu bewerten. Beim t-Test hat die Teststatistik z. B. die Form

und

die ent-

. Tab. 1.4.1. Fehler von statistischen Testentscheidungen.

wobei SX2 und SY2 die empirischen Varianzen der Kontrollgruppe und der behandelten Gruppe sind, d. h.

bzw.

Teststatistik für Probe nicht signifikant

Teststatistik für Probe signifikant

Gen nicht differenziell exprimiert

Kein Fehler U

Fehler 1. Art V

Gen differenziell exprimiert

Fehler 2. Art T

Kein Fehler S

77 1.4 · Analyse von Biochips: Von der Sequenz zum System

kleiner als das vorgegebene Signifikanzniveau D gehalten wird.

1.4.5.3 Korrekturverfahren für statistische Testentscheidungen Der hohe Parallelisierungsgrad von Chipexperimenten induziert das Problem des multiplen Testens. Selbst wenn das vorgegebene Signifikanzniveau für eine einzelne Probe eingehalten werden kann, bedeutet z. B. ein Niveau von D = 0.05, dass 5% aller Gene falsch-positiv klassifiziert werden. Bei einem Durchsatz von 10.000 Genen bedeutet dies immerhin eine Menge von theoretisch möglichen 500 falsch-positiven Kandidaten. Um mögliche Folgekosten etwa bei Northern Blots oder RT-PCR-Experimenten zu vermeiden, können also strengere Kriterien angesetzt werden. Dies leisten statistische Korrekturverfahren. Die Wahrscheinlichkeit, eine korrekte Ablehnung der Nullhypothese zu bekommen, ist bei einer Einzelmessung ps = (1 – Ds) und daher (bei Annahme unabhängiger Einzelmessungen) bei der globalen Messung pg = (1 – Ds)n. Die Wahrscheinlichkeit, in einem der Einzeltests einen Fehler 1. Art zu machen, ist daher Dg = P (V > 0) = 1 – (1 – Ds)n (vgl. > Tab. 1.4.1). Dieser Fehler kann sehr schnell sehr groß werden. Zum Beispiel ist die Wahrscheinlichkeit, bei 100 Einzeltests mit einem jeweiligen Signifikanzniveau von 0,05 einen Fehler 1. Art zu machen, bereits 0,994. Diesen Fehler nennt man FWER („family-wise error rate“) des Experiments. Zweck der Korrekturverfahren ist es, statt des Signifikanzniveaus Ds der Einzelmessung dieses globale Signifikanzniveau Dg zu kontrollieren. Bei der Bonferroni-Korrektur wird dabei der angestrebte P-Wert durch die Anzahl der durchgeführten Tests, also die Anzahl der getesteten Gene, dividiert und nur solche Gene als signifikant angesehen, deren P-Wert unterhalb dieser korrigierten Schwelle liegt. Dies bedeutet bei 10.000 Genen und einem P-Wert von 0,05 eine korrigierte Schwelle von 5*10-6. Die Bonferroni-Korrektur (und auch alternative Verfahren wie die Korrektur nach Holm) ist allerdings zu streng und lässt in der Praxis zu wenig interessante Kandidaten zu. Mit anderen Worten, durch strengere Kontrolle des Fehlers 1. Art steigt der Fehler 2. Art. Daher wurden Verfahren entwickelt, die das multiple Testen durch sog. ResamplingMethoden bewerten (Shaffer 1995; Westfall u. Young 1993). Diesen Methoden liegt folgende Überlegung zugrunde: Man berechnet für ein Gen den Wert anhand der Teststatistik. Dies geschieht durch die bekannte Gruppeneinteilung von N Werten der Kontrolle und M Werten der Behandlung. Permutiert man diese Werte, d. h., teilt man die N+M-Werte willkürlich in zwei Grup-

1.4

pen der Größen N und M und errechnet für diese Permutation den Wert der Teststatisitik, so erhält man einen Wert, der unabhängig von der biologischen Gruppierung ist. Dieses Vorgehen wiederholt man für alle möglichen Permutationen und zählt diejenigen Fälle, bei denen man einen noch extremeren Wert für die Teststatistik erhält als den errechneten. Als adjustierten P-Wert erhält man den Quotienten aus denjenigen Fällen, die man gezählt hat, und der Anzahl aller möglichen Permutationen. Die Anzahl der Permutationen wächst sehr rasch, sodass man ab einer bestimmten Gruppengröße nicht mehr alle Permutationen durchzählen kann. Zum Beispiel für N = M = 3 gibt es 20 mögliche Permutationen, für N = M = 6 bereits 924 und für N = M = 12 gibt es 2.704.156 Permutationen. Bei der Auswertung von Chipdaten benötigt man eine Abschätzung des Fehlers 1. Art, die einen geeigneten Kompromiss zwischen zu vielen falsch-positiven Ergebnissen auf der einen Seite (keine Korrektur) und zu wenig signifikanten Ergebnissen auf der anderen Seite findet (FWER-Korrektur). Alternativ zur Kontrolle der FWER ist dafür die Berechnung der „false discovery rate“ (FDR) eingeführt worden. Die FDR ist die erwartete Anzahl von Fehlern 1. Art unter den abgelehnten Hypothesen E (Q), Q = V/(V + S) (Benjamini u. Hochberg 1995). Im Allgemeinen führt die FDR zu mehr signifikanten Ergebnissen als die Korrekturmethoden zur FWER, weshalb diese Verfahren im Moment sehr populär sind. Verschiedene Methoden zur Berechnung der FDR werden in Tsai et al. (2003) diskutiert.

1.4.5.4 Vergleich von statistischen Testentscheidungen und Verifizierung von Markergenen Die Güte eines Testverfahrens wird oft durch ROC- („receiver operating characteristic“-)Kurven dargestellt (> Abb. 1.4.8), indem man die Falsch-positiv-Rate (X-Achse) der Wahr-positiv-Rate (Y-Achse) gegenüberstellt. Idealerweise hat eine ROC-Kurve ein Integral von 1 und ist eine gerade Linie (keine falsch-positiven Testentscheidungen, maximale Sensitivität), sodass verschiedene statistische Testentscheidungen anhand des Integrals ihrer ROC-Kurve verglichen werden können. ROC-Kurven-Analysen setzen allerdings die Kenntnis über entsprechende Kontrollen voraus, z. B. die Verwendung von Genen, die in beiden Zuständen in der gleichen bzw. verschiedenen Konzentrationen vorkommen. Ist diese Voraussetzung nicht gegeben, so müssen die statistischen Testentscheidungen mit alternativen Technologien überprüft werden.

78

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.4.8. ROC-Kurven zum Vergleich von Normalisierungsverfahren und statistischen Testentscheidungen. Sechs unabhängige Experimente wurden gemacht, um Wildtyp-Zebrafische gegen chemisch behandelte Zebrafische (Lithium) zu vergleichen. 105 cDNS wurden als differenziell exprimiert durch unabhängige Methoden (ISH) erkannt und dienen als Wahr-positiv-Gruppe. Die Falsch-positivGruppe bilden 2.304 Kopien einer Arabidopsis-thaliana-cDNS, die in gleichen Konzentrationen dem entsprechenden Zielmaterial beigegeben wurden. Linkes Bild: Güte eines nichtparametrischen Tests

(Van-der-Waerden-Test) bei der Detektion differenziell exprimierter Gene mit verschiedenen Normalisierungsmethoden zur Datenprozessierung, Mediannormalisierung (schwarz), Varianzstabilisierung (rot) und lineare Regression (grün). Rechtes Bild: Student-t-test mit denselben Methoden zur Datenprozessierung. Anhand der ROC-Analyse erkennt man, dass der nichtparametrische Test eine bessere Güte als der t-Test hat und dass es auch innerhalb der Methoden zur Datenprozessierung Unterschiede gibt

Die Verifizierung von Markergenen durch unabhängige Methoden beschränkt sich allerdings aus Kostengründen auf eine Teilmenge von Genen. Die jeweilige Methode, die zur Verifizierung benutzt wird, richtet sich nach der experimentellen Fragestellung. Ist etwa die Lokalisierung der Genexpression von Interesse (z. B. beim Vergleich verschiedener Gewebe und der Detektion gewebespezifischer Marker), so nutzt man zur Visualisierung der Expressionsunterschiede WISHs („wholemount in situ hybridisations“) (Dickmeis et al. 2001; Poustka et al. 2007) (> Abb. 1.4.9a,b). Das Standardverfahren zur Validierung von Chipdaten ist RT-PCR (Kahlem et al. 2004; Adjaye et al. 2005) (> Abb. 1.4.9c). RT-PCR ist eine sehr sensitive Technologie, die auf der Amplifizierung der Markerprobe im Zielgewebe durch Polymerasekettenreaktion beruht. Durch einen Vergleich mit einer Kontrollprobe werden durch spezielle Verfahren auch kleine Expressionsänderungen detek-

tiert (Pfaffl 2001). Experimentelle Ergebnisse zeigen, dass ca. 85–95% der Expressionsunterschiede bei ChipExperimenten durch RT-PCR verifiziert werden können (Canales et al. 2006).

1.4.6 Analyse von Genexpressionsprofilen Eine wichtige Fragestellung beim Einsatz von Biochips besteht darin, die Expression der Gene über eine Reihe von Zuständen zu messen – z. B., um zeitaufgelöste Änderungen der Genexpression bei Zugabe von Medikamenten zu untersuchen, um die Transkriptionsstärke in verschiedenen Stadien der Entwicklung eines Organismus zu analysieren oder um die Transkriptionsstärke in verschiedenen Geweben zu untersuchen. Dazu wird entsprechend der biologischen Fragestellung für jeden Zu-

79 1.4 · Analyse von Biochips: Von der Sequenz zum System a

1.4

b

c

. Abb. 1.4.9a–c. Validierung von Chip-Experimenten. a Visuelle Verifizierung von Expressionsunterschieden zweier Gene (in Duplikaten) aus einer Studie zur Entwicklung im Zebrafisch (Dickmeis et al. 2001). Beide cDNS zeigen eine Überexpression beim Vergleich mit Tar*-injiziertem Zielmaterial mit dem Tar-Wildtyp. b In-situ-Hybridisierung

(ISH) validiert diese lokalisierte Genexpressionsunterschiede. c Korrelation zwischen Expressionsunterschieden von Biochip-Daten (blaue Balken) und qPCR (graue Balken) im Mausgehirn (Kortex) beim Vergleich von Kontrollmäusen mit genetisch veränderten Modellmäusen (TS65DN-Maus als Modell für Trisomie 21) (Kahlem et al. 2004)

stand ein Chip-Experiment durchgeführt und für jede Probe auf dem Biochip ein sog. Genexpressionsprofil erstellt, also ein Vektor von Intensitätswerten, der die Stärke der Transkription in den entsprechenden Experimenten beschreibt. Ziel der Bioinformatik ist es dann, durch Gruppierung der Genexpressionsprofile Gengruppen zu identifizieren, die ein ähnliches Profil zeigen und somit koreguliert sind.

1.4.6.1 Ähnlichkeiten in multidimensionalen Beobachtungen Das Auffinden von Genen mit ähnlichen Genexpressionsprofilen führt zu der Annahme, dass diese Gene denselben regulatorischen Prozessen unterliegen müssen. Ferner bietet dieses Vorgehen die Möglichkeit, bisher uncharakterisierte Gene durch funktionell bekannte Gene mit ähnlichem Genexpressionsprofil zu charakterisieren.

80

Sektion 1 · Allgemeine Grundlagen

Ziel der mathematischen Clusteranalyse ist es, die verschiedenen Gengruppen zu berechnen, so dass Gene mit ähnlichen Expressionsprofilen in dieselbe Gruppe eingeordnet werden und Gene mit verschiedenen Expressionsprofilen in verschiedene Gruppen (Duda u. Hart 1973; Jain u. Dubes 1988; Mirkin 1996). Misst man an N Genen P verschiedene Zustände, z. B. P verschiedene Zeitpunkte nach Behandlung mit einem Medikament oder Hybridisierung mit mRNS aus P verschiedenen Geweben, so führt das zu einer NxP-Datenmatrix in der jede Zeile dem Genexpressionszustand eines Gens auf dem Biochip entspricht und in der jede Spalte den Genexpressionszustand eines Zustands über alle Gene widerspiegelt. Die mathematische Ähnlichkeit zweier Datenpunkte (Gene) wird üblicherweise durch ein Distanzmaß bzw. Ähnlichkeitsmaß gemessen, das die Genexpressionszustände numerisch bewertet. Ist also X = (x1 ,...,xP) der Vektor, der die Expression von Gen X über die P Versuche beschreibt, und ist Y = (y1 ,... ,yP) der Vektor, der die Expression von Gen Y über die P Versuche beschreibt, so ist z. B. ein häufig benutztes Distanzmaß die Euklidische Distanz

Sind die Genexpressionsprofile der Gene über die P Versuche ähnlich, so wird dieses Maß einen kleinen Wert liefern, also eine hohe Ähnlichkeit indizieren, weichen die Genexpressionsprofile voneinander ab, so liefert dieses Maß einen großen Wert. In der Literatur benutzte Distanz- bzw. Ähnlichkeitsmaße sind: x Euklidische Distanz x Hamming-Distanz x Pearson-Korrelationskoeffizient x Rangkorrelationskoeffizient x Transinformation Ein Clusteralgorithmus entscheidet anhand eines solchen Ähnlichkeitsmaßes, ob zwei Gene in dieselbe Gruppe gehören oder nicht. Sind mehrere Genexpressionsvektoren im gleichen Cluster, so wird ein gemeinsamer den Cluster repräsentierender Genexpressionsvektor berechnet, z. B. als Mittelwert der dem Cluster zugeordneten Genexpressionsvektoren. Dadurch kann wiederum die Ähnlichkeit zwischen zwei Clustern berechnet werden.

1.4.6.2 Auffinden koregulierter Gene durch Clusteranalyse Häufig verwendete Clusterverfahren sind: x Hierarchische Verfahren x K-means x Graphentheoretische Ansätze x Selbstorganisierende Karten (SOM) Hierarchische Verfahren starten mit N Clustern, d. h., jeder Datenpunkt wird einem Cluster zugeordnet. In jedem Schritt des Algorithmus werden diejenigen Cluster zusammengeführt, die die geringste Distanz (die größte Ähnlichkeit) voneinander haben. Bestehen die Cluster aus nur einem Datenpunkt, so werden die Genexpressionsprofile direkt verwendet, die Distanz zweier Cluster mit zwei oder mehr Elementen wird entweder über die Distanz der Mittelwertsvektoren der den Clustern zugeordneten Datenpunkte berechnet („average linkage“), über die minimale Distanz von Elementen aus beiden Clustern („single linkage“) oder über die maximale Distanz von Elementen aus beiden Clustern („complete linkage“) berechnet. Der Algorithmus ist dann beendet, wenn alle Genexpressionsvektoren demselben Cluster zugeordnet sind. Hierarchische Verfahren liefern also keine direkte Information über die Anzahl der im Datensatz enthaltenen Gruppen. Die Ergebnisse eines hierarchischen Clusterverfahrens lassen sich allerdings sehr übersichtlich in Form eines Dendrogramms darstellen (> Abb. 1.4.10), weshalb sie häufig benutzt werden (Eisen et al. 1998; Alon et al. 1998; Wen et al. 1998). Beim K-means Verfahren muss man die Anzahl der zu berechnenden Cluster vorgeben. Dies geschieht zumeist dadurch, dass K zufällig ausgewählte Datenpunkte als Clustermittelpunkte initialisiert werden. Dann wird in einem iterativen Verfahren, jeder Datenpunkt dem ähnlichsten der K-initialisierten Datenpunkte zugeordnet, anschließend werden die Mittelpunkte der K-Cluster als Mittelwertsvektoren der jeweils den Clustern zugeordneten Datenpunkte neu berechnet usw. Die Iteration wird so lange wiederholt, bis eine vorher festgelegte Anzahl von Iterationen überschritten ist oder bis sich die Partition stabilisiert hat (Tavazoie et al. 1999). K-meansAlgorithmen sind abhängig von der zufälligen Initialisierung der Cluster (> Abb. 1.4.11). Daher wurde an Modifikationen gearbeitet, die die Anzahl der Cluster, K, aus den Daten selbst berechnet (Herwig et al. 1999, 2000). Graphentheoretische Ansätze arbeiten oft mit sog. Schwellwertgraphen. Ein Graph ist eine Menge von Ecken, die durch Kanten miteinander verbunden sind. Bei einem Schwellwertgraph entsprechen die Ecken den Datenpunkten, und die Kanten zwischen zwei Ecken werden gewichtet mit der paarweisen Ähnlichkeit der zugehörigen Genexpressionsvektoren. Zu einer vorgege-

81 1.4 · Analyse von Biochips: Von der Sequenz zum System

1.4

. Abb. 1.4.11. Initialisierungsproblem beim K-means-Algorithmus. 3 Cluster von Datenpunkten (Kreise) werden fehlerhaft partitioniert durch zufällige Initialisierung dreier Clustermittelpunkte (Vierecke). Die rot gefärbten Punkte beschreiben die initialisierten Clustermittelpunkte. Cluster 1 wird korrekt gefunden. Cluster 2 wird geteilt, da zwei Datenpunkte im Initialisierungsschritt des Algorithmus als Mittelpunkte verschiedener Cluster gesetzt wurden. Cluster 3 wird einem falschen Clustermittelpunkt zugeordnet

benen Ähnlichkeitsschwelle werden diejenigen Kanten aus dem Graph gestrichen, die unterhalb der Ähnlichkeitsschwelle sind. Cluster entstehen dabei als mehr oder weniger vollständige Teilgraphen, die mit speziellen Algorithmen berechnet werden können. Graphentheoretische Ansätze sind ebenfalls zur Clusteranalyse von Genexpressionsdaten verwendet worden (Ben-Dor et al. 1999; Sharan u. Shamir 2000). Weitere Clusteralgorithmen für Genexpressionsdaten sind selbstorganisierende Karten, SOM (Tamayo et al. 1999; Törönen et al. 1999), die an der Theorie neuronaler Netze angelehnt sind.

1.4.6.3 Validierung von Clusterergebnissen Während die Entwicklung neuer Clusteralgorithmen im Laufe der letzten Jahre stetig vorangetrieben wurde, fehlen vergleichende Studien über die Güte der einzel9 . Abb. 1.4.10. Dendrogramm als Ergebnis eines hierarchischen Clusterverfahrens. 78 Marker für die frühe humane Embryonalentwicklung zeigen eine Separierung von innerer Zellmasse (ICM) und Trophektoderm (TE). Für jede cDNS wurde der logarithmierte Genexpressionsquotient aus Signal und mittlerem Signal über alle 5 experimentellen Zustände berechnet. Benutzt wurde die Pearson-Korrelation zur Berechnung der paarweisen Ähnlichkeiten und„average-linkage“ als Aktualisierungsregel. Das Clusterergebnis zeigt eine klare Aufteilung in ICM-überexprimierte Gene und TE-überexprimierte Gene (Adjaye et al. 2005). Das Dendrogramm wurde mit der J-Express-Pro-2.7-Software erzeugt (www.molmine.com)

82

Sektion 1 · Allgemeine Grundlagen

nen Verfahren sowie Kriterien zur Bewertung des erhaltenen Clusterergebnisses. Die Validierung von Clustern ist jedoch in der Praxis sehr wichtig, da man oft vor dem Problem steht, welches der erhaltenen Clusterergebnisse die Daten am besten gruppiert, sei es, dass man denselben Datensatz mit verschiedenen Algorithmen bearbeitet, oder sei es, dass man für denselben Algorithmus verschiedene Parametereinstellungen (Anzahl der Cluster, Schwellwerte bei graphentheoretischen Ansätzen etc.) gewählt hat. In Jain und Dubes (1988) und Mirkin (1996) findet man einige Funktionen, mit denen man Clusterergebnisse bewerten kann. Zwei Klassen von Kriterien zur Validierung von Clusterergebnissen lassen sich unterscheiden: x externe Kriterien x interne Kriterien Bei externen Kriterien vergleicht man die berechnete Partition des Datensatzes mit A-priori-Wissen. Bei Simulationen etwa, bei denen man die korrekte Partition kennt, wird die errechnete Partition mit der wahren Par-

titon durch numerische Funktionen bewertet. Numerische Funktionen dieser Art sind z. B. der Jaccard-Koeffizient, der Rand-Index, Fowlkes und Mallows Statistik oder Huberts *-Statistik. So intuitiv diese Verfahren sind, sie lassen sich nur anwenden, wenn genügend A-priori-Wissen vorhanden ist. Ihr Einsatz ist daher weitgehend für Simulationsexperimente interessant. Interne Kriterien bewerten die errechnete Partition aus dem Datensatz selbst. Sinnvolle Konzepte zur Bewertung eines errechneten Genexpressionsclusters sind etwa „Kompaktheit“ und „Isolation“ (> Abb. 1.4.12). Kompaktheit bewertet die clusterinterne Abweichung der zugehörigen Datenpunkte – also, wie ähnlich die dem Cluster zugeordneten Datenpunkte sind. Isolation bewertet die Abweichung eines Clusters von den anderen errechneten Clustern – also, ob der Cluster genügend isoliert von anderen Clustern ist. Die mathematische Bewertung erfolgt wiederum durch Funktionen, die die paarweise Distanz von Datenpunkten und Clustern beschreiben. Es ist klar, dass diejenigen Cluster gut bewertet werden, die kompakt und isoliert sind, während bei nichtkompakten, nichtisolierten Clustern da-

. Abb. 1.4.12. Bewertung von Clusterergebnissen. Links: Cluster aus verschiedenen cDNS, die eine gehirnspezifische Genexpression haben. Verglichen wurden hier 9 verschiedene Gewebe in der Maus mit einem Whole-Genome-Ansatz, darunter 3 verschiedene Gehirnregionen (Kortex, Zerebellum, Midbrain). Rechts: Kompaktheit (X-Achse) und Isolation (Y-Achse) werden benutzt, um die Clustermitglieder zu

bewerten. Kreuze entsprechen den gehirnspezifischen cDNS, Kreise entsprechen einem anderen gewebespezifischen Cluster (Leber). GrüneRauten entsprechen zufällig erzielten Werten. Die Validierung erlaubt eine nachträgliche Reinigung von Genexpressionsclustern von Elementen, die fälschlich dem Cluster zugeordnet wurden, um die Güte z. B. bei nachfolgenden Promotoranalysen zu erhöhen

83 1.4 · Analyse von Biochips: Von der Sequenz zum System

von auszugehen ist, dass sie keine biologische Bedeutung haben. Eine oft verwendete Strategie zur Bewertung von Clustern besteht in der funktionellen Validierung der Cluster. Diese Strategie geht von der Annahme aus, dass Genexpressionscluster diejenigen Gene miteinander in Verbindung setzen, die funktionell ähnlich sind. In der Literatur werden oft Gene-Ontology- (GO-)Annotationen benutzt (vgl. 7 1.4.9). Für viele Gene ist diese funktionelle Kategorisierung bekannt, und so können berechnete Cluster daraufhin validiert werden, ob sie angereicherte funktionelle Information besitzen. Geht man von einem Cluster der Größe m aus, bei dem k Mitglieder eine bestimmte funktionelle Annotation besitzen (m–k besitzen eine andere Annotation) und sind n die Anzahl der untersuchten Gene und K die Anzahl aller Gene mit der speziellen Annotation, so wird die Wahrscheinlichkeit, das beobachtete Ergebnis bezüglich dieser Annotation zufällig zu bekommen, durch die hypergeometrische Verteilung berechnet, d. h.

Der P-Wert, also die Wahrscheinlichkeit einer noch signifikanteren Beobachtung, ist dann . Mit diesem Vorgehen lassen sich Genexpressionscluster auf funktionelle Information hin validieren. Signifikante Cluster sind dann solche, die einen niedrigen P-Wert bezüglich einer bestimmten Annotation haben.

1.4.7 Klassifizierung Klassifikationssysteme sind von großer Bedeutung in der biomedizinischen Forschung und Praxis: Die automatisierte Datengewinnung eröffnet völlig neue Möglichkeiten, Marker für die Diagnose von Krankheiten und für die Prognose von Krankheitsverläufen zu identifizieren. So werden z. B. zunehmend Biochips für den Einsatz in der Krebsdiagnostik eingesetzt. Aber auch Peptid- und Proteinarrays sowie massenspektrometrische Verfahren werden in der Forschung im Hinblick auf ihre diagnostische Einsetzbarkeit getestet. Bereits recht früh wurden an klinischen Proben Expressionsstudien an Brustkrebs und Darmkrebs (Perou et al. 1999; Alon et al. 1999) publiziert. Gene von potenzieller Funktion wurden identifiziert und bestimmten Krankheitsbildern zugeordnet. Eine umfassende Untersuchung von mehr als 60 menschlichen Krebszelllinien liefern Ross et al. (2000) und Scherf et al. (2000). Klassifikation von

1.4

Genexpressionsprofilen hat in der Literatur zur Klassifizierung von Krankheiten und deren Subtypen geführt. Golub et al. (1999) konnten zwei Typen von Leukämie, akute myeloische Leukämie (AML) und akute lymphatische Leukämie (ALL), auf der Basis von 50 Genen klassifizieren, die aus einer Gesamtanzahl von 6.817 Genen ausgesucht wurden. In dieser Studie gelang es, 36 von 38 Patienten korrekt zu klassifizieren. Die 50 relevanten Gene enthielten dabei solche, deren differenzielle Expression in den Subformen bekannt waren, sowie auch bisher unbekannte. Alizadeh et al. (2000) klassifizierten B-Zell-Lymphome (DLBL) in zwei getrennte Subformen und benutzten dazu einen Biochip mit 17.856 Genen.

1.4.7.1 Binäre Klassifikationsprobleme Es gibt viele verschiedene Ansätze, Klassifikationssysteme zu konstruieren. Vier besonders verbreitete Methoden werden im Folgenden kurz vorgestellt: x die logistische Regression, x das naive Bayessche Klassifikationssystem, x die Support-Vektor-Maschine und x das Entscheidungsbaumverfahren. Einen Vergleich der Leistung der verschiedenen Verfahren findet sich in Statnikov et al. (2005). In der Praxis ist das binäre Klassifikationsproblem, d. h. die Entscheidung bezüglich zweier Klassen, besonders häufig und wichtig. Daher beschränken wir uns im Folgenden auf diesen Fall. Die besprochenen Verfahren können aber auch auf allgemeinere Klassifikationsprobleme angewendet werden. Typischerweise wird ein Klassifikationssystem mit einem oder mehreren am Patienten gemessenen Parametern gefüttert und liefert einen Klassifikationswert zurück, der den Patienten einer Gruppe zuordnet. Der Klassifikationsprozess erfolgt in mehreren Stufen: die Messwerte werden zu einem Eigenschaftsvektor zusammengefasst, der dann durch ein Entscheidungsverfahren einer Klasse zugewiesen wird. Die einfachsten Klassifikationssysteme sind eindimensionale Schwellwertverfahren: dem Messwert x wird eine Klasse c(x) zugeordnet, die durch einen Schwellwert bestimmt ist. Zur Veranschaulichung sei angenommen, dass die Messwerte x aus normalverteilten Grundgesamtheiten gezogen sind. Dann erhält man zwei Verteilungen, die erste repräsentiert die Kontrollgruppe und damit die Nullhypothese, dass der Proband gesund ist, die zweite repräsentiert die Patientengruppe. Die Streuung der Messwerte ist im Wesentlichen auf zwei Ursachen zurückzuführen: Schwankungen im Messprozess und biologische Schwankungen. Schwankungen im Messprozess entstehen zum Beispiel bei der Probenent-

84

Sektion 1 · Allgemeine Grundlagen

1.4.7.2 Multiparametrische Verfahren

. Abb. 1.4.13. Klassifikation von normalverteilten Messwerten. Die blaue Kurve repräsentiert Messungen an einer Kontrollgruppe, die rote Kurve an einer Patientengruppe. Wird zur Klassifikation ein Schwellwert festgelegt (gestrichelte Linie), so führt das zu einer gewissen Anzahl von falsch-positiv (blau schraffiert) und falsch-negativ (rot schraffiert) klassifizierten Fällen. Der Prozentsatz korrekter Klassifikationen kann als Maß für die Güte des Klassifikationssystems verwendet werden. Je besser die Verteilungen getrennt sind, desto größer ist der Prozentsatz korrekter Klassifikationen, im Beispiel mehr als 95%

nahme und Aufbereitung oder bei der eigentlichen physikalischen Messung. Biologische Schwankungen sind zum Beispiel verursacht durch die Abhängigkeit des Parameters vom zirkadianen Rhythmus des Probanden sowie durch natürliche Schwankungen in der Bevölkerung aufgrund genetischer, metabolischer oder sonstiger Ursachen. Macht man die vereinfachende Annahme, dass die Breite der Schwankung in beiden Gruppen gleich groß ist, so kommt man zu der in > Abb. 1.4.13 dargestellten Situation. Aufgrund der oben besprochenen Schwankungen ist stets mit einer gewissen Anzahl von Fehlklassifikationen zu rechnen. Ein oft verwendetes Kriterium zur Bewertung der Güte eines Klassifikationssystems ist der Prozentsatz der korrekt klassifizierten Fälle in einem vorgegebenen Kollektiv. Dieses Maß ist vor allem dann sinnvoll, wenn die Patientengruppe und die Kontrollgruppe von vergleichbarer Größe sind und es keine weiteren Anforderungen an die falsch-positiv oder falsch-negativ Raten gibt. Die Bestimmung eines optimalen Schwellenwertes kann jetzt durch systematische Anpassung erfolgen. Dieser Prozess wird oft in einem iterativen Verfahren umgesetzt und wird als „Training“ des Klassifikationssystems bezeichnet.

Bisher wurde nur ein einzelner Parameter zur Klassifikation eingesetzt. Bei der Untersuchung komplizierterer Datensätze (z. B. bei komplexen Erkrankungen) ist es aber in der Regel erforderlich, mehrere Parameter zu berücksichtigen. Im Allgemeinen sind Klassifikationssysteme so gebaut, dass die eingehenden Messparameter in einen Merkmals- oder Eigenschaftsvektor zusammengefasst werden. Dieser Vektor enthält in jeder Komponente die kontinuierliche Ausprägung eines bestimmten Merkmals, wie zum Beispiel Alter, Blutzucker usw. In diesem Merkmalsraum versucht das Klassifikationssystem, Regionen zu definieren, die den vordefinierten Klassen zugeordnet werden. Einfache Klassifikationssysteme definieren entlang der Merkmalsachsen Schwellwerte und definieren durch logische Verknüpfung rechteckige Regionen im Eigenschaftsraum. Allgemeinere Klassifikationssysteme berücksichtigen auch Korrelationen in den Messparametern. Die Funktionsweise verschiedener Klassifikationssysteme wird im Folgenden am Beispiel eines Datensatzes zur Diagnostik neurodegenerativer Prozesse diskutiert. Anhand des Alters und einer Peptidmarkerkombination im Blut („peptide ratio“) soll die von Spezialisten vorgegebene Zuweisung in die zwei Klassen „nicht gefährdet“ und „gefährdet“ maschinell reproduziert werden. In > Abb. 1.4.14 ist die Operation von vier verschiedenen Klassifikationsmethoden für diesen Datensatz dargestellt. Logistische Regression (Hosmer u. Lemeshow 2000): Bei der logistischen Regression handelt es sich um ein Trennsystem, das eine Trennlinie oder Trennebene in den Merkmalsraum legen kann. Die Trennlinie wird algorithmisch so lange verschoben, bis eine maximierte Anzahl von korrekten Klassifikationen erreicht wird. Diese Art von Systemen funktioniert gut, wenn die Merkmale in einfacher linearer Abhängigkeit voneinander sind. Naives Bayessches Klassifikationssystem (Domingos u.

Pazzani 1997): Das Verfahren basiert auf der Annahme unabhängiger normalverteilter Messgrößen, die in zwei oder mehr Dimensionen ausgedehnt sind. Das Bayessche Klassifikationssystem definiert für normalverteilte Messgrößen ein optimales Klassifikationssystem. Die Klassifikationsregionen können dabei deutlich komplizierter sein als bei der logistischen Regression, so sieht man in > Abb. 1.4.14 beim Bayesschen Klassifikationssystem zwei kegelförmige Gebiete. Der Grund dafür ist die rigorose Annahme normalverteilter Messdaten. Es hängt von der Natur der Fragestellung ab, ob eine solche Annahme wirklich sinnvoll ist.

85 1.4 · Analyse von Biochips: Von der Sequenz zum System

1.4

. Abb. 1.4.14. Operation verschiedener Klassifikationssysteme bei der Klassifikation neurodegenerativer Erkrankungen (anonymisierte Daten, verwendet mit freundlicher Genehmigung von Prof. Dr. Jens Wiltfang, Universitätsklinik Erlangen). Ziel ist es, anhand von im Blutplasma bestimmten molekularen und weiteren physiologischen Parametern eine Zuordnung des Patienten vorzunehmen. Aus Gründen der Darstellbarkeit erfolgt hier eine Beschränkung auf 2 Parameter: einen proteomischen Parameter, der aus Peptidmarkern im

Blut abgeleitet ist, und einen physiologischen Parameter, das Alter. Blaue und gelbe Punkte repräsentieren Messwerte, die am Patientenkollektiv gewonnen wurden. Die Farbe des Hintergrundes zeigt, wie das Klassifikationssystem den entsprechenden Punkt im Merkmalsraum einstuft. Punkte, die eine andere Farbe als der Hintergrund haben, sind als Fehlklassifikation einzustufen. Oben links: logistische Regression, oben rechts: Bayessches Klassifikationssystem, unten links: Support-Vektor-Maschine, unten rechts: Entscheidungsbaum

Support-Vektor-Maschinen (Vapnik 1999; Brown et al.

tion verhält sich das System wie eine logistische Regression, im allgemeinen Fall kann durch die Superposition verschiedener Kernfunktionen auch eine sehr komplizierte Klassifikation abgebildet werden. Im Trainingsprozess werden die Parameter der Kernfunktionen angepasst, bis ein Optimum erreicht ist.

1999; Cristianini u. Shawe-Taylor 2000): In der Praxis sind die Daten oft nur näherungsweise (oder gar nicht) normalverteilt. Ein flexibles Verfahren zur Klassifikation bilden die Support-Vektor-Maschinen (SVM). Dieses Verfahren versucht, unter Einsatz einer geeigneten Transferfunktion (Kernfunktion) ein Klassifikationssystem zu definieren. Häufig eingesetzt werden radiale Basisfunktionen oder normale Kernfunktionen. Im einfachen Grenzfall von einer einzelnen linearen Kernfunk-

Entscheidungsbäume (Pittman 2004): Entscheidungs-

bäume definieren eine hierarchische Zerlegung des Datensatzes in Untergruppen, die durch einen Baum ver-

86

Sektion 1 · Allgemeine Grundlagen

anschaulicht werden kann. Ausgehend vom Stamm des Baumes wird der Datensatz auf der Basis von binären Entscheidungen in Klassen und Unterklassen zerlegt, bis eine ausreichende Genauigkeit erreicht ist. Für die formale Definition der Entscheidungen können verschiedene Verfahren eingesetzt werden. Im Beispiel wurde in jeder Stufe eines der Kriterien, Alter und Peptide-Ratio, mit einem optimierten Schwellwert eingesetzt. Die resultierende Zerlegung des Merkmalsraumes ist orthogonal, das linke untere Feld repräsentiert die Zuordnung zur Klasse „nicht gefährdet“.

1.4.7.3 Kreuzvalidierung Ein wichtiger Schritt besteht nach der Parameteroptimierung in der Validierung des Klassifikationssystems. Dazu gibt es verschiedene Vorgehensweisen. x Datensatzteilung: In der Regel spaltet man den Datensatz in einen Trainings- und einen Testdatensatz auf, etwa im Verhältnis 80% zu 20%. Mit dem einen Teil des Datensatzes (80%) wird das Training mit den oben genannten Verfahren vorgenommen, danach wird das Klassifikationssystem zur Vorhersage auf den Testdatensatz (20%) angewendet. Dadurch vermeidet man die Überschätzung der Vorhersagegüte durch ungenügende Statistik („Over-FittingEffekt“). x K-fache Kreuzvalidierung: Gründlicher als die einfache Testvorhersage ist die Kreuzvalidierung. Dazu wird der Datensatz in K disjunkte Teile zerlegt (in der Praxis etwa fünf), jeder dieser Teildatensätze dient einmal zum Test, der Rest der Daten zum Training. Der mittlere Fehler über alle K Klassifikationsprozesse dient dann als Fehlermaß. Diese Methode hat den Vorteil, dass die Aufteilung des Datensatzes gegenüber der ersten Methode eine weniger große Rolle spielt. Jeder Datenpunkt wird genau einmal als Testpunkt verwendet und K1-mal als Trainingspunkt. Eine Variante dieser Methode besteht darin, die Aufteilung der Daten in Trainings- und Testdaten K-mal zufällig vorzunehmen. Der Vorteil hierbei ist, dass die Größe der Teildatensätze individuell eingestellt werden kann. x Leave-one-out-Kreuzvalidierung: Diese Methode ist die K-fache Kreuzvalidierung mit K=N, wobei N die Anzahl aller Datenpunkte ist. Das heißt, N mal wird der Klassifikator an allen bis auf einen Datenpunkten trainiert und eine Vorhersage wird für den verbleibenden Datenpunkt gemacht. Wie zuvor wird der Gesamtfehler aus dem Durchschnitt aller Klassifikationen berechnet.

1.4.8 Genetische Netzwerke Ein zentrales Anliegen der molekularen Biologie ist das Verständnis der zellulären Netzwerke, insbesondere von genregulatorischen und metabolischen Netzwerken sowie Signaltransduktionswegen, da diese Netzwerke die fundamentalen Mechanismen der Zelle steuern und ihre Störung (z. B. durch Mutation von Proteinen) zu Krankheitsprozessen führen. Diesen Netzwerken liegen mannigfaltige zelluläre Vorgänge, darunter Transkriptionskontrolle, RNS-Splicing, Transport von mRNS, Translationskontrolle, posttranslationale Modifikationen und Degradierung von mRNS- und Proteinprodukten zugrunde. Die Modellierung der Gesamtheit dieser zellulären Vorgänge ist äußerst komplex und mit den bisher zur Verfügung stehenden Daten nur schwer bzw. gar nicht möglich. Da man bei der Datengenerierung (7 1.4.2 und 1.4.3) im Wesentlichen auf Genexpressionsmessungen angewiesen ist, bleibt die Modellierung zellulärer Vorgänge vor allem auf die Modellierung der Transkription beschränkt. Die Zelle wird dabei als Netzwerk von Genprodukten (mRNS, Proteine) interpretiert, die Interaktionen resultieren aus der Transkription eines Gens und dem Effekt seines Proteins auf die Aktivierung anderer Gene (> Abb. 1.4.15). Der Zustand der Zelle zu einem bestimmten Zeitpunkt wird dabei über das Genexpressionsniveau aller zu diesem Zeitpunkt gemessenen Gene definiert und bestimmt das Verhalten der Zelle zum nächsten Zeitpunkt. Man betrachtet also im Wesent-

. Abb. 1.4.15. Visualisierung von wechselseitigen physikalischen Interaktionen bei Hefegenen. Bekannte physikalische Wechselwirkungen von Hefegenen (Saccharomyces cerevisiae, http://mips.gsf. de/genre/proj/yeast/) wurden graphisch dargestellt und der resultierende Graph nach Zusammenhangskomponenten untersucht. Ein Interaktionsnetzwerk aus 25 Genen wurde durch einen dreidimensionalen Graphen visualisiert (BioMiner, MicroDiscovery, Berlin)

87 1.4 · Analyse von Biochips: Von der Sequenz zum System

lichen Änderungen des Genexpressionszustands über die Zeit. Vom analytischen Standpunkt aus können genetische Netzwerke entweder als deterministische oder als stochastische Systeme angesehen werden. In einem deterministischen System (z. B. einem Booleschen Modell) bestimmt ein Zustand in einem bestimmten Zeitpunkt eindeutig den Zustand des darauffolgenden Zeitpunktes, es gibt also nur einen Nachfolgezustand. Bei stochastischen Systemen kann ein Zustand zu einem bestimmten Zeitpunkt mehr als einen Nachfolgezustand haben, die Nachfolgezustände werden gemäß einer Wahrscheinlichkeitsverteilung angenommen. Netzwerkanalysen beschäftigen sich zum einen mit der Analyse von Eigenschaften, die als Effekte auftreten, wenn die Netzwerkparameter bekannt sind (Vorwärtsmodellierung), und zum anderen mit dem Schätzen eines erklärenden Netzwerks bei vorliegenden experimentellen Daten („reverse engineering“).

1.4.8.1 Vorwärtsmodellierung und Simulation genetischer Netzwerke Bei der Vorwärtsmodellierung startet man von deterministischen, regulatorischen Beziehungen, bei denen die Interaktionen der verschiedenen Elemente des zu modellierenden Systems vorgegeben sind. Die Elemente können Gene, Proteine oder auch komplexere Elemente sein. Es gibt im Moment einige Plattformen in dieser Richtung, z. B. das E-Cell-Projekt (http://www.e-cell.org, Tomita et al. 2000) und PyBioS (http://pybios.molgen. mpg.de, Wierling 2006). Das E-Cell-System soll die Definition der Funktionen von Proteinen, Protein-ProteinInteraktionen, Protein-DNS-Interaktionen und anderer zellulärer Prozesse gestatten und deren Modellierung ermöglichen. PyBioS ist eine Modellierungsplattform zur Analyse biochemischer Reaktionsnetzwerke mit einer umfangreichen Schnittstelle zu Datenbanken und experimentellen Daten (> Abb. 1.4.16). Die Parameter für die Interaktionen, z. B. Konzentrationen, Reaktionsraten etc., werden dabei durch Literaturrecherche, aber auch zunehmend durch geeignete Experimente gewonnen. Weitere Parameter betreffen die Startparameter der beteiligten Simulationsobjekte. Sind diese gefunden, so liefert die Vorwärtsmodellierung die Änderung dieser Parameter in der Zeit. Interessante Fragen bei der Vorwärtsmodellierung sind dann z. B. das Verhalten des Systems, wenn ein bestimmtes Gen ausgeschaltet wird (Knockout-Experiment), oder das Verhalten des Systems bei Zugabe eines bestimmten Medikaments. Das ultimative Ziel der Vorwärtsmodellierung ist es, ein möglichst genaues Modell der bioche-

1.4

mischen Vorgänge in der Zelle zu bekommen, um dann In-silico-Behandlungen durchzuführen, was eine erhebliche Bedeutung für die klinische und pharmazeutische Forschung hat. Im Bereich der kombinatorischen Therapie könnten dann z. B. Wechselwirkungen verschiedener Medikamente simuliert und geeignete Behandlungen gefunden werden, um einen bestimmten – den gewünschten – Genexpressionszustand der Zelle herzustellen. Diese Entwicklung wird allerdings noch Jahre auf sich warten lassen, da die zum Training der Modelle nötigen Daten weder in der Quantität noch in der Qualität dafür vorliegen. Nichtsdestotrotz liefern Hochdurchsatzverfahren die einzige Möglichkeit, die entsprechenden Daten für die Interaktionsparameter dieser sehr komplexen Systeme zu gewinnnen. Beim Auffinden der nötigen Parameter kann nur umfangreiches Expertenwissen helfen, die relevante Literatur muss durchforstet werden, und die regulativen Interaktionen zwischen den Elementen des Netzwerks müssen identifiziert werden. Beim Aufbau der Modellierungsumgebung muss die Klasse von Gleichungen definiert werden, die die Interaktionen beschreiben. Meistens dienen hierzu gewöhnliche Differenzialgleichungen, es gibt aber auch Varianten, die stochastische Differenzialgleichungen und sog. dynamische Bayessche Netze verwenden.

1.4.8.2 Reverse engineering Der Zweck des sog. Reverse engineering ist die Schätzung eines genetischen Netzwerkes, also der wechselseitigen Regulation der beteiligten Gene, aus den experimentellen Daten. Hat man etwa eine Zeitreihe gemessen, z. B. Hybridisierungsexperimente zu verschiedenen Zeitpunkten in der Entwicklung eines Organismus oder während der Antwort auf Medikamentenzugabe bzw. Umwelteinfluss, so stellt jedes Experiment die Messung des Zustands der Genexpression zu einem festen Zeitpunkt dar, und das Experiment am nächsten Zeitpunkt sollte durch die Regeln und Parameter des berechneten Netzwerkes möglichst gut wiedergegeben werden können. Die Ansätze unterscheiden sich dabei nach der Art der Dateninterpretation. Nimmt man die Expressionsdaten selbst, so spricht man von stetigen Modellen. Bildet man die Expressionsdaten durch eine Vorverarbeitung, z. B. einen geeigneten Schwellwert binär ab, so spricht man von Booleschen Modellen (Kauffman 1993; Somogyi et al. 2001). Bei Booleschen Modellen interessiert also nur, ob ein Gen im momentanen Expressionszustand aktiviert ist oder nicht, nicht aber die Stärke der Aktivierung. Boolesche Modelle können durch Tabellen beschrieben werden, in denen für jedes beteiligten Gen

88

Sektion 1 · Allgemeine Grundlagen

a

b

c

. Abb. 1.4.16a–c. Modellierung von Signaltransduktionswegen mit dem PyBioS-System (http://pybios.molgen.mpg.de). a Perzeption extrazellulärer Apoptosesignale. b Ausschnitt aus dem Diagramm des

PyBioS-Modells der extrinsischen, rezeptorvermittelten Apoptose. c In-silico-Experiment zur zellulären Antwort auf eine Variation eines extrazellulären Apoptose-Signals (FasL)

89 1.4 · Analyse von Biochips: Von der Sequenz zum System

. Tab. 1.4.2. Zustandsbeschreibung eines Booleschen Netzwerks mit drei Genen (> Abb. 1.4.17). Aktueller Zustand

Nächster Zustand

000

000

001

000

010

101

011

001

100

010

101

010

110

111

111

011

. Abb. 1.4.17. Darstellung eines Booleschen Netzwerks von 3 Genen (vgl. > Tab. 1.4.2). Jeder Zustand des Netzwerks hat genau einen Folgezustand, der durch die Vernetzungsregeln definiert ist. Dies führt bei gegebenen Anfangswerten zu einer Abfolge von

1.4

notiert wird, ob es aktiv ist oder nicht und in denen für jeden möglichen Zustand sein Nachfolgezustand definiert ist. Ein Boolesches Modell mit n Genen hat 2 n verschiedene Zustände. > Tabelle 1.4.2 veranschaulicht die möglichen Zustände eines Systems mit drei Genen (23 = 8 Zustände) mit den jeweiligen Nachfolgezuständen, die durch bestimmte Interaktionsregeln der Gene definiert sind (> Abb. 1.4.17). Dabei kann die Konnektivität des Modells, also die Anzahl der für die Regulation eines Genes relevanten Gene variieren. Die Konnektivität ist ein wichtiger Parameter, da er die Komplexität des Netzwerkes und damit seine numerische Berechnung erheblich beeeinflusst. Jeder Zustand hat dann aufgrund der Regeln einen klar definierten Folgezustand. In den letzten Jahren sind Algorithmen entwickelt worden, die eine Berechnung der wechselseitigen Regu-

Zuständen. Zustände, die immer wieder angestrebt werden, sind sog. Attraktoren, im ersten Fall ein Punktattraktor und im zweiten Fall ein dynamischer Attraktor, bestehend aus zwei Zuständen (Somogyi et al. 2001)

90

Sektion 1 · Allgemeine Grundlagen

lationen erlauben (Liang et al. 1998; Akutsu et al. 1999, 2000). Diese Algorithmen sind für eine kleine Anzahl von Genen (n < 50) und geringe Konnektivität (k = 3) brauchbar, erreichen aber schnell ihre obere Leistungsgrenze. Bei den stetigen Modellen verzichtet man auf die Binarisierung der Expressionsdaten (Mjolsness et al. 1991; McAdams u. Shapiro 1995; Arkin et al. 1997, 1998; McAdams u. Arkin 1997; Chen et al. 1999; Weaver et al. 1999; Hache et al. 2007). Hierbei kann man zwischen Modellen unterscheiden, die auf paarweisen Vergleichen der Genexpressionsvektoren beruhen, und Methoden, die die Gesamtheit der Geninteraktionen modellieren. Bei den letzteren Modellen geht man davon aus, dass jedes Gen einen regulativen Einfluss auf alle anderen Gene hat und dass dieser regulative Einfluss durch Gewichte geschätzt werden kann. Diese Gewichte können auch gleich Null oder negativ sein, sodass auch berücksichtigt wird, ob ein Gen von anderen Genen nicht beeinflusst oder gehemmt wird. Viele in der Literatur beschriebenen Modelle dieser Art lassen sich in folgender mathematischen Differentialgleichung unterbringen:

Eine wichtige Teilmenge dieser Modelle sind lineare Modelle. Hierbei ist die Aktivierungsfunktion linear, d. h. f(z) = z, die Reaktionsraten werden als konstant angenommen, so dass man das vereinfachte Modell

bekommt (D’Haeseleer 1998, 1999). Die interessierenden Parameter, die Gewichte wij , werden dann mit bekannten statistischen Modellen (lineare Regression, „simulated annealing“) aus den Daten geschätzt. Neben diesen Ansätzen gibt es auch probabilistische Modelle, die der Stochastizität wechselseitiger Genregulierung größere Rechnung tragen. Durch sog. Bayessche Netzwerke (Jensen 1996) werden Gene und die an ihrer Regulation beteiligten Gene durch eine Wahrscheinlichkeitsverteilung beschrieben. Diese Bayesschen Netzwerke haben den Vorteil, dass sie eine lokale Modellierung zulassen (Friedman et al. 2000; Pe’er et al. 2001; Tanay und Shamir 2001).

1.4.8.3 Netzwerkmotive Hierbei sind: f(): Funktion, die die Aktivierung der Expression beschreibt xi(t): Genexpression von Gen i zum Zeitpunkt t ri: Reaktionsrate von Gen i wij: Gewicht, das den Einfluss von Gen j auf Gen i beschreibt uk(t): externer Input (z. B. Medikament) zum Zeitpunkt t vik: Einfluss des k-ten externen Inputs auf Gen i bi: Basisexpressionslevel von Gen i Oi: Degradierungskonstante des i-ten Genprodukts Die Aktivierungsfunktion, f, wird dabei als monoton angenommen. Dies folgt der experimentellen Beobachtung: Mit Zunahme der Konzentrationen der regulierenden Signale nimmt die individuelle Genaktivierung ebenfalls zu. Meistens haben diese Funktionen sigmoide Form, sodass Sättigungseffekte und die unterschiedlich schnelle Zunahme der Genaktivierung berücksichtigt werden können, z. B.

Ein zweiter Satz von Parametern berücksichtigt externen Input, z. B. Chemikalien, Temperaturänderungen, Abbau von Nährstoffen etc.). Die Degradierungskonstante berücksichtigt den individuellen Abbau des Genprodukts.

Die Dimensionalität genregulatorischer Netzwerke ist das größte Problem bei den in 7 1.4.8.2 aufgeführten mathematischen Verfahren. Man geht daher dazu über, Teile dieser Netzwerke zu identifizieren. Das Gesamtnetzwerk wird als Zusammenschluss verschiedener Module, sog. Netzwerkmotive, interpretiert. Davidson et al. (2002) haben die frühe Entwicklung beim Seeigel mit unterschiedlichen experimentellen Techniken, wie QPCR, Chip-Experimente, WISHs sowie bioinformatische Methoden zur Analyse von TFBS, untersucht. Dieses entwicklungsspezifische Netzwerk ist mit ca. 50 verschiedenen Proteinen eher groß, es beinhaltet jedoch noch kleinere, elementare Bauteile, die sich topologisch charakterisieren lassen. Shen-Orr et al. (2002) haben das transkriptionelle Netzwerk von Escherichia coli untersucht. Als Ausgangsbasis wurde eine Datenbank (RegulonDB, Salgado et al. 2001) und zusätzliche Literatur verwendet. Mit zeitlich aufgelösten Daten gelang die Identifizierung von drei verschiedenen, kleinen Netzwerkmotiven, die charakteristische funktionelle Eigenschaften haben und aus denen das Gesamtnetzwerk konstruiert werden konnte. In ähnlicher Weise haben Lee et al. (2002) Saccharomyces cerevisiae untersucht. Die Autoren benutzten 106 verschiedene Heferegulatoren und identifizierten potenzielle Zielgene durch ChIP-on-Chip Experimente (vgl. 7 1.4.3.2). Sie fanden ca. 4.000 signifikante regulatorische Bindungen (im Durchschnitt 38 Zielgene pro Regulator). Ihre Analyse enthüllte sechs verschiedene

91 1.4 · Analyse von Biochips: Von der Sequenz zum System

elementare Motive, die die drei aus der vorangegangenen Studie einschließen: x Autoregulation motif – ein Regulator bindet an die Promoterregion seines eigenen Gens. x Multi-component loop – es handelt sich um eine Schleife, die zwei oder mehr Regulatoren beinhaltet. x Feedforward loop – ein Regulator kontrolliert einen anderen Regulator, und beide binden an ein Zielgen. x Single-input motif – ein Regulator bindet an verschiedene Promotoren. x Multi-input motifs (dense overlapping regulons) – eine Menge von Regulatoren bindet gemeinsam an eine Menge von Promotoren. x Regulatory chain – eine Kette von Regulatoren, wobei der nte Regulator an den Promoter des n+1ten Regulators bindet. Motiven kann eine charakteristische biologische Funktion zugeordnet werden – z. B. bei „feedforward loops“. Hier besteht die Möglichkeit einer zeitlichen Kontrolle des Signalprozesses, da die Expression des Zielgens abhängig von der Akkumulierung von Aktivierungssignalen der Regulatoren sein kann (Shen-Orr et al. 2002). Die Klassifizierung von Netzwerkmotiven und die Konstruktion und Integration der Motive in große Netzwerke (Bottom-up-Verfahren) ist gegenwärtig eine Hauptaufgabe der bioinformatischen Netzwerkanalyse. Forscher arbeiten an einer Art Baukonstruktion für biologische Funktion, die die fundamentalen Bestandteile zusammenträgt und deren Kombinationen funktionell charakterisiert, ähnlich einem Bauplan für elektrische Schaltkreise.

1.4.9 Datenbanken und Datenintegration Es ist klar, dass die Flut von Daten nicht nur aus BiochipExperimenten gespeichert, sortiert und vergleichbar gemacht werden muss (Zehetner u. Lehrach 1994). Insbesondere die Analyse von Krankheitsprozessen und die Entwicklung von mathematischen Modellen für zelluläre Systeme erfordert Informationen über DNS-, RNS-, Proteinsequenz, Genexpression, Proteinexpression und -interaktionen sowie kinetische Daten. Solche Informationen werden in biologischen Datenbanken gespeichert und zugänglich gemacht. Es existiert eine große Zahl verfügbarer öffentlicher Datenbanken, deren Inhalt von primären Daten (also Rohdaten aus Experimenten) bis zu hochgradig interpretierten Daten (z. B. die Informationen über biochemische Reaktionsnetzwerke) reicht. Diese Datenbanken sind ein wichtiger Bestandteil der medizinischen Forschung, weil sie einen systematischen Überblick über

1.4

das vorhandene Wissen bieten und somit häufig die Ausgangshypothesen liefern, an denen neue experimentelle Ergebnisse bewertet werden.

1.4.9.1 Primärdatenbanken Der Annotation von Genen und Proteinen kommt nicht nur beim Design von Biochips (vgl. 7 1.4.2) sondern auch bei der nachfolgenden Interpretation der Daten, eine große Bedeutung zu. Es existiert eine Vielzahl öffentlicher Datenbanken, die mehr oder weniger detaillierte Informationen hierzu liefern (z. B. GenBank, EMBL, IMAGE, SwissProt, PDB), aber oft sehr unterschiedlich in der Annotierung vorgehen. Der Vereinheitlichung von Datenformaten und der Definition von einheitlichen Strukturen und Grammatiken für biologische Daten hat sich das Gene Ontology Consortium verschrieben (http://geneontology.org/). Das Konsortium setzt sich aus mehreren Datenbanken von Modellorganismen zusammen: SGD (Saccharomyces-cerevisiae-Genom Datenbank; Ball et al. 2000), FlyBase (Datenbank zum Genom von Drosophila melanogaster; FlyBase Consortium 1999) und MGD/GXD (Mausgenom-Datenbank; Blake et al. 2000; Ringwald et al. 2000). Weitere Datenbanken von Modellorganismen sind bereits integriert worden, wie z. B. von Arabidopsis thaliana (TAIR; Huala et al. 2000). Neben der Vereinheitlichung der Annotation gibt es Bestrebungen, die Qualität von Biochips und den Folgeanalysen zu erhöhen (Microarray Gene Expression Database Group MGED, http://www.mged.org), um deren Nutzung in der klinischen Praxis zu ermöglichen. MGED ist ein Diskussionsforum zur Definition von Standards in Biochip-Experimenten, wie Annotierung, Datenrepräsentation, standardisierte Protokolle, Normalisierungsmethoden und dem Austausch von Information aus verschiedenen Datenbanken sowie die Definition von gemeinsamen Schnittstellen zur Veröffentlichung der Daten. Das National Center for Biotechnology (NCBI) und das European Bioinformatics Institute (EMBL-EBI) stellen die meist genutzten öffentlichen Datenbanken zur Verfügung. Diese Zentren bieten Information über Nukleotidsequenzen, Molekülstrukturen, Genexpressionsdaten und andere primäre Daten, z. B. GenBank, RefSeq und UniGene (NCBI) bzw. TrEMBL, UniProt und Ensembl (EMBL-EBI). Des Weiteren existieren Datenbanken über Proteinfamilien, Domänen und funktionelle Gruppen sowie Datenbanken zu RNS und MikroRNS. Genexpressionsdaten sind verfügbar im Gene Expression Omnibus (GEO) und ArrayExpress. Diese Datenbanken gewähren freien Zugang zu großen Sammlungen experimenteller Daten. Diese Daten

92

Sektion 1 · Allgemeine Grundlagen

beinhalten alle diskutierten Biochip Plattformen (vgl. 7 1.4.2.1) sowie alternative Technologien, z. B. SAGE und ArrayCGH. Einen Überblick über die aktuellen molekularbiologischen Datenbanken gibt die jährlich erscheinende Datenbankausgabe von Nucleic Acids Research (Galperin 2007).

1.4.9.2 Datenbanken für funktionelle Annotation Für die Analyse von Krankheitsprozessen ist funktionelle Information, z. B. in Form von biochemischen Pathways, von besonderem Interesse. Diese Information wird von einer großen Anzahl von Datenbanken zur Verfügung gestellt. Die Datenbanken bieten eine integrierte Visualisierung und Repräsentation funktioneller Information über die verschiedenen Komponenten eines biochemischen Reaktionsnetzwerks und bilden eine Basis für die mathematische Modellierung dieser Systeme. Die meisten Datenbanken sind auf spezielle Klassen biochemischer Reaktionsnetzwerke beschränkt. KEGG (Kyoto Encyclopedia of Genes and Genomes, Kanehisa et al. 2006), Reactome (Joshi-Tope et al. 2005) und BioCyc (Karp et al. 2005) enthalten metabolische Reaktionen und verschiedene Signaltransduktionswege. KEGG bietet Information über 317 verschieden Pathways, die über Sequenzhomologie der beteiligten Moleküle für 38 eukaryotische Organismen und eine Vielzahl von Mikroorganismen verfügbar sind. KEGG kann über verschiedene Schnittstellen angesprochen werden, z. B. über die Internetschnittstelle, ftp oder sogenannte Web-Services. Reactome ist entstanden als Kooperation des European Bioinformatics Institute (EBI), des Cold Spring Harbor Laboratory und des Gene Ontology Consortium. Zugrunde liegt ein sehr detailliertes Datenmodell für die Komponenten und Interaktionen biochemischer Reaktionen (Ontologie), das z. B. Informationen über Stöchio-

metrie und zelluläre Lokalisation enthält wie auch Referenzen zu externen Datenbanken. Dies beinhaltet z. B. Informationen über Bildung von Proteinkomplexen, Phosphorylierungen und Translokation von Molekülen. Eine weitere Pathway-Datenbank ist BioCyc, die Pathways unterschiedlicher Organismen wie z. B. Escherichia coli (EcoCyc), Mikroorganismen (MetaCyc) und Mensch (HumanCyc) bündelt. Daneben existieren viele PathwayDatenbanken, die einen Fokus auf Signalübertragungswege haben, wie z. B. BioCarta, Spike, Transpath, STKE, NetPath und die Pathway Interaction Database (PID), die über die Nature Publishing Group zugänglich ist. Weitere Fokusse von Reaktionsdatenbanken sind Protein-Protein-Interaktionen (Hermjakob et al. 2004; Xenarios et al. 2000) und genregulatorische Prozesse. Informationen über Genregulation sind allerdings im Moment nur limitiert verfügbar, wichtige Informationsquellen hierbei sind RegulonDB, TRED und Transfac. Im Moment existiert noch kein einheitliches Datenmodell, das die Informationen dieser und anderer (im Ganzen ca. 230!) Datenbanken funktioneller Informationen integriert und einen einheitlichen Zugang zur Verfügung stellt. Stattdessen ist zu beobachten, dass die Diversifizierung weiter voranschreitet und die gespeicherte Information noch spezialisierter werden wird. So gibt es z. B. Datenbanken über Mutationen in Signalproteinen, Datenbanken für Interaktionen spezieller Organismen und bezüglich einzelner Krankheiten. Einen Überblick über den Inhalt der oben diskutierten Datenbanken für den Menschen bietet > Tab. 1.4.3. Neben topologischer Information, also der Information über die Vernetzung der verschiedenen Moleküle, ist zur Analyse der Netzwerke (vgl. 7 1.4.8) kinetische Information nötig, d. h. Information über die kinetischen Gesetze der am Netzwerk beteiligten Reaktionen, kinetische Konstanten etc., die in Datenbanken wie BRENDA (Schomburg et al. 2004) und SABIO-RK (Wittig et al. 2006) gespeichert sind. Solche Informa-

. Tab. 1.4.3. Anzahl der Reaktionen bzw. Interaktionen in selektierten Datenbanken und deren Schnittmengen (Quelle: http://pybios.molgen.mpg.de/CPDB/)

Reactome

KEGG

HumanCyc

PID

Biocarta

Intact

Reactome

12042

KEGG

209

1498

HumanCyc

93

199

1077

PID

8

0

0

1064

Biocarta

62

0

1

114

2160

Intact

78

0

1

0

42

5690

Dip

15

0

2

0

25

114

Dip

1152

93 1.4 · Analyse von Biochips: Von der Sequenz zum System

tionen sind ebenfalls nur sehr limitiert verfügbar, und kinetische Information ist im Gegensatz zu topologischer Information in viel stärkerem Maß vom jeweiligen Experiment abhängig. In letzter Zeit ist man dazu übergangen, auch mathematische Modelle biochemischer Reaktionsnetzwerke zu speichern und verfügbar zu machen. Voraussetzung dafür war die Entwicklung eines einheitlichen Schemas (SBML), in dem Informationen wie kinetische Parameter, Modelltopologie, mathematische Beschreibung der Kinetik, Konzentrationen etc. abgebildet werden können. Eine Datenbank zur Speicherung mathematischer Modelle ist z. B. BioModels (Le Novère et al. 2006), die zurzeit ca. 120 verschiedene Modelle beinhaltet.

1.4.9.3 Standardisierung und Datenbankintegration Die Diversität der Datenbanken macht es in der Praxis schwer, einen umfassenden Einblick in einen Krankheitsprozess zu gewinnen, da der Nutzer häufig zwischen mehreren Datenbanken wechseln muss, um zu den entsprechenden Informationen zu gelangen. Daher gibt es internationale Initiativen, die für viele Datentypen standardisierte Schemata entwickeln, mit denen die entsprechenden Daten integriert, ausgetauscht und visualisiert werden können. Die meisten dieser Schemata benutzen dabei formatierten Text, wie es in XML- (eXtensibleMarkup-Language-)Formaten vorgegeben ist. XML besteht aus hierarchisch angeordneten Schlüsselwörtern, die mit der jeweiligen Information belegt sind. Die Menge der Schlüsselwörter kann dabei sehr flexibel definiert werden, was zur Entwicklung von zahlreichen XML-Formaten für unterschiedliche Datentypen geführt hat (> Tab. 1.4.4) (Achard et al. 2001).

1.4

Die Integration verschiedener Datenbanken in eine gemeinsame Nutzerschnittstelle leistet z. B. das EnsMart (http://www.ensembl.org/EnsMart) System. EnsMart ist ein öffentlich zugängliches Data-Warehouse-System (Kasprzyk et al. 2004), das mit einer umfangreichen Suchschnittstelle verknüpft ist. Das System basiert auf der Ensembl-Datenbank, die über viele Verknüpfungen zu anderen Datenbanken und zahlreiche Organismen verfügt (u. a. Homo sapiens, Mus musculus, Rattus norvegicus, Danio rerio, Fugu rubripes, Anopheles gambiae, Drosophila melanogaster, Caenorhabditis briggsae and Caenorhabditis elegans) (Birney et al. 2004). EnsMart ist an zentralen Objekten organisiert, sog. Fokusse, die mit den Daten assoziiert sind. Zentrale Objekte sind z. B. Gen und SNP („single nucleotide polymorphisms“). Das System besteht aus einer Nutzerschnittstelle zur Interaktion, aus einer lokalen Datenbank und einer optimierten Suchschnittstelle zur Datenwiedergabe. Ein anderes System zur Integration von Datenbanken ist SRS („Sequence Retrieval System“). Zunächst für Sequenzdaten entwickelt (Etzold u. Argos 1993; Etzold et al. 1996), wurde SRS auf viele andere Datentypen erweitert. SRS wurde zunächst von LION Bioscience Ltd. als kommerzielles Produkt vertrieben, seit 2006 von BioWisdom Ltd. SRS hat ein objektorientiertes Design. Es benutzt Metadaten zur Definition von Datenklassen und Regeln für die strukturierte Eingabe von Information. SRS besitzt eine eigene Sprache (Icarus) zur Programmierung der Datenbankschnittstellen (Zdobnov et al. 2002).

1.4.10 Ausblick – Systembiologie in der molekularen Medizin Eine große Herausforderung der Datenanalyse in der Genom- und Proteomforschung ist es, die in der Litera-

. Tab. 1.4.4. Wichtige XML-Standards in der funktionellen Genomik XML-Format

Beschreibung

Information

BSML

Bioinformatic Sequence Markup Language

Genomische Sequenzen

MATHML

Mathematical Markup Language

Mathematische Formeln

BioML

Biopolymer Markup Language

Annotation von Protein- und DNS-Sequenzen

MAGEML

Microarray and gene expression Markup Language

Biochip-Experimente

PSI-MI

Proteomics Standards Initiative Molecular Interaction

Protein-Protein-Interaktionen

SBML

Systems Biology Markup Language

Mathematische Modelle für Reaktionsnetzwerke

BioPAX

Biological Pathways Exchange

Beschreibung biologischer Pathways

CML

Chemical Markup Language

Chemische Information

CellML

Cell Markup Language

Mathematische Modelle für Reaktionsnetzwerke

94

Sektion 1 · Allgemeine Grundlagen

tur erzeugten Daten in die Analyse von neuen Experimenten zu integrieren. Die dazu notwendigen Datenbanken sind vorhanden und müssen in der Zukunft sinnverknüpfend in Verbindung miteinander gebracht werden. Systeme wie TAVERNA bieten die Möglichkeit, über Web-Service-Schnittstellen mit einer einheitlichen Nutzerschnittstelle eine Vielzahl von Datenbanken anzusprechen (http://taverna.sourceforge.net/). Die meisten kommerziell erhältlichen Genomanalyse-Programmpakete erreichen bisher mit einer einfachen Ausgabe der Resultate und Visualisierungsmethoden ihre Grenzen. Dabei wird gegenwärtig dem Nutzer die Entscheidung überlassen, ob diese Ergebnisse in Übereinstimmung mit dem schon existierenden Wissen stehen oder nicht. Will man daher die bioinformatische Arbeit in den kommenden Jahren charakterisieren, so wird sie in verstärktem Maße integrativ und komplex sein, neben den bisherigen Aufgaben von Datenerfassung, Datenanalyse und Datenspeicherung wird zunehmend die Datenintegration und die funktionelle Interpretation der Daten treten. Genomforschung und Bioinformatik sind eng miteinander verbunden. Eine Tendenz der letzten Jahre geht zu immer komplexeren Fragestellungen und damit komplexeren Projekten, die oft nicht mehr von einem Labor allein durchgeführt werden, sondern von weltweit vernetzten Forschungskonsortien, vergleichbar den Sequenzierungsprojekten der 1990er Jahre. Letztlich liegt dieser komplexen Forschungsstruktur die Erkenntnis zugrunde, dass Krankheitsprozesse nur über systematische Ansätze aufzuklären sind. Diese Entwicklung wird getrieben durch neue experimentelle Verfahren, die immer größere Datenmengen liefern, z. B. Tiling Arrays, Exon Arrays, 2nd Generation Sequencing Technologie. Dieser Entwicklung trägt die neue Disziplin der Systembiologie Rechnung, zu der sich ein Teil der Bioinformatik weiterentwickelt hat. Systembiologie zielt auf die Erklärung von Physiologie und Erkrankung auf der Ebene von Interaktionen z. B. von molekularen Signalwegen, Regulationsnetzwerken, Zellen und letztlich dem gesamten Organismus (Klipp et al. 2005). Mithilfe von Computermodellen werden in silico Voraussagen über den Krankheitsfortschritt oder den Effekt individueller Therapien erzeugt. Diese neuen Verfahren werden unser Wissen über Krankheitsprozesse und die Interpretation von Daten aus Hochdurchsatztechnologien vorantreiben. Eine weitere Zukunftskomponente betrifft die Datenintegration. Statt der Entwicklung neuer Verfahren ist immer mehr eine parallele Verarbeitung und Korrelation verschiedener Verfahren zu beobachten. Entscheidend für den Schritt von der qualitativen, explorativen Datenanalyse zur quantitativen, prädiktiven Analyse ist die Kombination von experimentellen Daten mit der umfangreichen Kenntnis über das zugrunde liegende

biochemische Reaktionssystem. Immer mehr werden daher integrierte bioinformatische Werkzeuge zur Modellierung und Simulation solcher Systeme unter Einarbeitung experimenteller Daten entwickelt werden. Objekte dieser Systeme sind mathematische Modelle der Reaktionsnetzwerke als Teil des Krankheitsprozesses. Zuverlässige mathematische Modelle für Krankheitsprozesse gibt es im Moment allerdings nur in sehr limitierter Form, insbesondere im Bereich der Krebsforschung. Beispiele betreffen hier generelle Charakteristika von Signalwegen (Bhalla u. Iyengar 1999) wie verzögerte Signaldauer, Schwellwertverhalten etc., und Modelle für einzelne Pathways wie EGFR (Schoeberl et al. 2002) und NFκB (Cho et al. 2003). In der Zukunft werden solche Modelle in noch viel stärkerem Maße als bisher in der medizinischen Genomforschung entwickelt werden.

1.4.11 Literatur Achard F, Vaysseix G, Barillot E (2001) XML, bioinformatics and data integration. Bioinformatics 17:115–125 Adjaye, J., Herwig, R., Herrmann, D., et al. (2004) Cross-species hybridisation of human and bovine orthologous genes on high density cDNA microarrays. BMC Genomics 5:83 Adjaye, J., Huntriss, J., Herwig, R., et al. (2005) Primary differentiation in the human blastocyst: Comparative molecular portraits of inner cell mass and trophectoderm cells. Stem Cells 23:1514–1525 Agrawal N, Dasaradhi PVD, Mohmmed A, Malhotra P, Bhatnagar RK, Mukherjee SK (2003) RNA interference: biology, mechanism, and applications. Microbiol Mol Biol Rev 67:657–685 Akutsu T, Miyano S, Kuhara S (1999) Identification of genetic networks from a small number of gene expression patterns under the Boolean network model. In: Altman R (ed) Proceedings of the Pacific Symposium on Biocomputing, World Scientific, Singapore, S 17–28 Akutsu T, Miyano S, Kuhara S (2000) Algorithms for identifying Boolean networks and related biological networks based on matrix multiplication and fingerprint function. J Comp Biol 7:331–343 Alizadeh AA, Eisen MB, Davis RE et al. (2000) Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 403:503–511 Alon U, Barkai N, Notterman DA, et al. (1999) Broad patterns of gene expression revealed by clustering analysis of tumor and normal colon tissues probed by oligonucleotide arrays. Proc Natl Acad Sci USA 96:6745–6750 Arkin A, Ross J, McAdams, HH (1998) Stochastic kinetic analysis of developmental pathway bifurcation in phage lambda-infected Escherichia coli cells. Genetics 149:1633–1648 Arkin A, Shen P, Ross J (1997) A test case of correlation metric construction of a reaction pathway from measurements. Science 277:1275–1279 Babaie Y, Herwig R, Greber B, et al. (2007) Analysis of Oct4-dependent transcriptional networks regulating self-renewal and pluripotency in human embryonic stem cells. Stem Cells 25:500–510 Bailey TL, Elkan C (1994) Fitting a mixture model by expectation maximization to discover motifs in biopolymers. Proc Int Conf Intell Syst Mol Biol 2:28–36

95 1.4 · Analyse von Biochips: Von der Sequenz zum System Baldi P, Long AD (2001) A Bayesian framework for the analysis of microarray expression data: regularized t-test and statistical inferences of gene changes. Bioinformatics 17:509–519 Ball CA, Dolinski K, Dwight SS et al. (2000) Integrating functional genomic information into the Saccharomyces Genome Database. Nucleic Acids Res 28:77–80 Barnes M, Freudenberg J, Thompson S, Aronow B, Pavlidis P (2005) Experimental comparison and cross-validation of the Affymetrix and Illumina gene expression analysis platforms. Nucleic Acids Res. 33:5914–5923 Ben-Dor A, Shamir R, Yakhini Z (1999) Clustering gene expression patterns. J Comp Biol 6:281–297 Benjamini Y, Hochberg Y (1995) Controlling the false discovery rate: a practical and powerful approach to multiple testing. J Royal Statist Soc B 57:289–300 Best DI, Rayner CW (1987) Welch’s approximate solution for the Behrens-Fisher problem. Technometrics 29:205–220 Bhalla US, Iyengar R (1999) Emergent properties of networks of biological signaling pathways. Science 283:381–387 Birney E, Andrews TD, Bevan P, et al. (2004) An overview of Ensembl. Genome Res 14:925–928 Bittner M, Meltzer P, Chen Y et al. (2000) Molecular classification of cutaneous malignant melanoma by gene expression profiling. Nature 406:536–540 Blake JA, Eppig JT, Richardson JE et al. (2000) The Mouse Genome Database (MGD): Expanding genetic and genomic resources for the laboratory mouse. Nucleic Acids Res 28:108–111 Booth B, Zemmel R (2004) Prospects for productivity. Nat Rev Drug Discov 3:451–456 Boyer LA, Lee TI, Cole MF et al. (2005) Core Transcriptional Regulatory Circuitry in Human Embryonic Stem Cells. Cell 122:947–956 Brown M, Grundy W, Lin D et al. (1999) Knowledge-based analysis of microarray gene expression data using support vector machines. Proc Natl Acad Sci USA 97:262–267 Callow MJ, Dudoit S, Gong EL, Speed TP, Rubin EM (2000) Microarray expression profiling identifies genes with altered expression in HDL-deficient mice. Genome Res 10:2022–2029 Canales RD, Luo Y, Willey JC, et al. (2006) Evaluation of DNA microarray results with quantitative gene expression platforms. Nature Biotechnol 24:1115–1122 Carrington JC, Ambros V (2003) Role of microRNAs in plant and animal development. Science 301:336–338 Chen T, He HL, Church GM (1999) Modeling gene expression with differential equations. In: Altman R (ed) Proceedings of the Pacific Symposium on Biocomputing, World Scientific, Singapore, S 29–40 Chen Y, Dougherty E, Bittner M (1997) Ratio-based decisions and the quantitative analysis of cDNA microarray images. J Biomed Optics 2:364–374 Cho RJ, et al. (1998) A genome-wide transcriptional analysis of the mitotic cell cycle. Mol Cell 2:65–73 Cho KH, Shin SY, Lee HW, Wolkenhauer O (2003) Investigations into the analysis and modeling of the TNF alpha-mediated NFkappa B-signaling pathway. Genome Res. 13:2413–2422 Claverie JM (1999) Computational methods for the identification of differential and coordinated gene expression. Hum Mol Genet 8:1821–1832 Cristianini N, Shawe-Taylor J (2000) An Introduction to support vector machines, Cambridge University Press, Cambridge Dai M, Wang P, Boyd AD, et al. (2005) Evolving gene/transcript definitions significantly alter the interpretation of GeneChip data. Nucleic Acids Res. 33:e175 Davidson EH, Rast JP, Oliveri P, et al. (2002) A genomic regulatory network for development. Science 295:1669–1678

1.4

Dickmeis T, Aanstad P, Clark M, et al. (2001). Identification of nodal signalling targets by array analysis of induced complex probes. Developmental Dynamics 222:571–580 Domingos P, Pazzani M (1997) On the optimality of the simple Bayesian classifier under zero-one loss. Machine Learning 29:103–137 Duda RO, Hart PE (1973) Pattern classification and Scene Analysis, Wiley, New York Durbin R, Eddy S, Krogh A, Mitchison G (1998) Biological sequence analysis: probabilistic models of proteins and nucleic acids, Cambridge University Press Eickhoff H, Schuchhardt J, Ivanov I et al. (2000) Tissue gene expression analysis using arrayed normalized cDNA libraries. Genome Res 10:1230–1240 Eisen MB, Spellman PT, Brown PO, Botstein D (1998) Cluster analysis and display of genome-wide expression patterns Proc Natl Acad Sci USA 95:14863–14868 Etzold T, Argos P (1993) SRS – an indexing and retrieval tool for flat file data libraries. Comp. Appl. Biosc. 9:49–57 EtzoldT, Ulyanov A, Argos P (1996) SRS: information retrieval system for molecular biology data banks. Methods Enzymol 266:114– 128 Ewing B, Hillier LD, Wendl MC, Green P (1998) Base-Calling of Automated Sequencer Traces Using Phred I: Accuracy Assessment. Genome Res 8:175–185 Fire A, Xu S, Montgomery M, Kostas S, Driver S, Mello C (1998) Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature 391:806–811 Friedman N, Linial M, Nachman I, Pe’er D (2000) Using Bayesian networks to analyze expression data. J Comp Biol 7:601–620 Galperin MY (2007) The Molecular Biology Database Collection: 2007 update. Nucleic Acids Res 35:D3–D4 Gene Ontology Consortium (2001) Creating the gene ontology resource: design and implementation. Genome Res 11:1425– 1433 Golub TR, Slonim D, Tamayo P et al. (1999) Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 286:531–538 Gordon DB, Nekludova L, McCallum S, Fraenkel E (2005) TAMO: a flexible, object-oriented framework for analyzing transcriptional regulation using DNA-sequence motifs. Bioinformatics 21:3164–3165 Greller LD, Tobin FL (1999) Detecting selective expression of genes and proteins. Genome Res 9:282–296 Gunderson KL, Kruglyak S, Graige MS, et al. (2004) Decoding randomly ordered DNA arrays. Genome Res 14:870–877. Hache H, Wierling C, Lehrach H, Herwig R (2007) Reconstruction and Validation of Gene Regulatory Networks with Neural Networks. Proceedings of the 2nd Foundations of Systems Biology in Engineering Conference (FOSBE), Stuttgart. D’Haeseleer P, Wen X, Fuhrman S, Somogyi R (1999) Linear modeling of mRNA expression levels during CNS development and injury. In: Altman R (ed) Proceedings of the Pacific Symposium on Biocomputing, World Scientific, Singapore, S 41–52 D’Haeseleer P, Wen X, Fuhrman S, Somogyi R (1998) Inferring gene relationships from large-scale gene expression data. In: Holcombe M, Paton R (eds) Information processing in cells and tissues, Plenum Press, New York, S 203–212 Hanahan D und Weinberg RA (2000) The hallmarks of cancer. Cell 100:57–70 Hardiman G. (2004) Microarray platforms – comparisons and contrasts. Pharmacogenomics 5:487–502 Hermjakob H. et al. (2004) IntAct – an open source molecular interaction database. Nucleic Acids Res 32:D452–D455.

96

Sektion 1 · Allgemeine Grundlagen

Herwig R, Poustka A, Müller C, Bull C, Lehrach H, O’Brien J (1999) Large-scale clustering of genetic fingerprinting data. Genome Res 9:1093–1105 Herwig R (2000) Ein Normalisierungs- und Clusteranalyseprogramm zur Bearbeitung großer genomischer Datenmengen. In: Plesser T, Hayd H (eds), Forschung und wissenschaftliches Rechnen. Beiträge zum Heinz-Billing Preis 1999, GWDG, Göttingen, S 93–109 Herwig R, Aanstad P, Clark M, Lehrach H (2001) Statistical evaluation of differential expression on cDNA nylon arrays with replicated experiments. Nucleic Acids Res 29:e117 Herwig R, Lehrach H (2006) Expression profiling of drug response – from genes to pathways. Dialogues in Clinical Neuroscience 8:283–293. Hilsenbeck SG, Friedrichs WE, Schiff R, et al. (1999) Statistical analysis of array expression data as applied to the problem of tamoxifen resistance. J Nat Cancer Inst 91:453–459 Hood L, Perlmutter RM (2004) The impact of systems approaches on biological problems in drug discovery. Nature Biotechnol 22:1215–1217 Hosmer DW, Lemeshow S (2000) Applied Logistic Regression, 2nd ed. New York, Chichester, Wiley. Huala E, Dickerman AW, Garcia-Hernandez M et al. (2001) The Arabidopsis information resource (TAIR): A comprehensive database and web-based information retrieval, analysis and visualization system for a model plant. Nucleic Acids Res 29:102–105 Hughes JD, Estep PW, Tavazoie S, Church GM (2000) Computational identification of cis-regulatory elements associated with groups of functionally related genes in Saccharomyces cerevisiae. J Mol Biol 296:1205–1214 Hughes T, Marton MJ, Jones AR, et al. (2000) Functional discovery via a compendium of expression profiles. Cell 102:109–126 Hughes T, Mao M, Jones AR et al. (2001) Expression profiling using microarrays fabricated by an ink-jet oligonucleotide synthesizer. Nature Biotechnol 19:342–347 Ideker T, Thorsson V, Siegel AF, Hood LE (2000) Testing for differentially-expressed genes by maximum-likelihood analysis of microarray data. J Comp Biol 7:805–817 Iyer V, Eisen MB, Ross DT et al. (1999) The transcriptional program in the response of human fibroblasts to serum. Science 283: 83–87 Jain AK, Dubes RC (1988) Algorithms for clustering data, PrenticeHall, Englewood Cliffs, NJ Jain AN, Tokuyasu TA, Snijders AM, Segraves R, Albertson DG, Pinkel D (2002) Fully automatic quantification of microarray image data. Genome Res. 12:325–332 Jensen FV (1996) An introduction to Bayesian networks, UCL Press Limited, London Ji H, Wong WH (2005) TileMap: create chromosomal map of tiling array hybridizations. Bioinformatics 21:3629–3636 Joshi-Tope G, et al. (2005) Reactome: a knowledgebase of biological pathways. Nucleic Acids Res 33:D428–D432 Kahlem P, Sultan M, Herwig R, et al. (2004) Transcript level alterations reflect gene dosage effects across multiple tissues in a mouse model of down syndrome. Genome Res 14:1258–1267 Kanehisa M, Goto S, Hattori M, et al. (2006) From genomics to chemical genomics: new developments in KEGG. Nucleic Acids Res 34:D354–357 Karp PD, Ouzounis CA, Moore-Kochlacs C, et al. (2005) Expansion of the BioCyc collection of pathway/genome databases to 160 genomes. Nucleic Acids Res 19:6083–6089 Kasprzyk A, Keefe D, Smedley D, et al. (2004) EnsMart: a generic system for fast and flexible access to biological data. Genome Res 14:160–169

Kauffman SA (1993) The origins of order, self-organization and selection in evolution, Oxford University Press Klipp, E., Herwig, R., Kowald, A., Wierling, C., and Lehrach, H. (2005) Systems Biology in Practice. Wiley-VCH, Weinheim. Kuhn K, Baker SC, Chudin E, et al. (2004) A novel high-performance random array platform for quantitative gene expression profiling. Genome Res 14:2347–2356. Kuo WP, Jenssen TK, Butte AJ, Ohno-Machado L, Kohane IS (2002) Analysis of matched mRNA measurements from two different microarray technologies. Bioinformatics 18:405–412 Lagos-Quintana M, Rauhut R, Meyer J, Borkhardt A, Tuschl T (2003) New microRNAs from mouse and human. RNA 9:175–179 Lander ES (1996) The new genomics: Global views of biology. Science 274:536–539 Leaf C (2004) Why we’re losing the war on cancer and how to win it. Fortune March 22: 77–92 Lee ML, Kuo FC, Whitmore GA, Sklar J (2000) Importance of replication in microarray gene expression studies: statistical methods and evidence from repetitive cDNA hybridisations. Proc Natl Acad Sci USA 97:9834–9839 Lee RC, Feinbaum R, Ambros V (1993) The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell 75:843–854 Lee TI, Rinaldi NJ, Robert F, et al. (2002) Transcriptional regulatory networks in Saccharomyces cerevisiae Science 298:799–804 Lehmann EL (1975) Nonparametrics: Statistical Methods Based on Ranks. Holden-Day, San Francisco Lehrach H, Drmanac R, Hoheisel J et al. (1990) Hybridization Fingerprinting in Genome Mapping and Sequencing. In: Davies KE, Tilghman S (eds) Genome Analysis Volume 1: Genetic and Physical Mapping, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, S 39–81 Lennon G, Lehrach H (1991) Hybridization analyses of arrayed cDNA libraries. Trends Genet 7:314–317 Le Novère N, Bornstein B, Broicher A, et al. (2006) BioModels Database: A Free, Centralized Database of Curated, Published, Quantitative Kinetic Models of Biochemical and Cellular Systems. Nucleic Acids Res 34:D689–D691 Li W, Meyer CA, Liu XS (2005) A hidden Markov model for analyzing ChIP-chip experiments on genome tiling arrays and its application to p53 binding sequences. Bioinformatics 21(Suppl 1): i274–i282 Liang S, Fuhrman S, Somogyi R (1998) REVEAL, A general reverse engineering algorithm for inference of genetic network architectures. In: Altman R (ed) Proceedings of the Pacific Symposium on Biocomputing, S 18–29 Lim JS (1990) Two-dimensional signal and image processing, Prentice Hall, Englewood Cliffs, NJ Lim LP, Lau NC, Weinstein EG, et al. (2003) The microRNAs of Caenorhabditis elegans. Genes Dev 17:991–1008 Lim LP, Glasner ME, Yekta S, Burge CB, Bartel DP (2003) Vertebrate microRNA genes. Science 299:1540 Lipshutz RJ, Fodor SP, Gingeras TR, Lockhart DJ (1999) High density synthetic oligonucleotide arrays. Nature Genet 21:20–24 Llave C, Kasschau K, Rector MA, Carrington JC (2002) Endogenous and silencing-associated small RNAs in plants. Plant Cell 14: 1605–1619 Lockhart DJ, Dong H, Byrne MC et al. (1996) Expression monitoring by hybridization to high-density oligonucleotide arrays. Nature Biotechnol 14:1675–1680 Lockhart DJ, Winzeler EA (2000) Genomics, gene expression and DNA analysis. Nature 405:827–836 MacIsaac KD, Fraenkel E (2006) Practical strategies for discovering regulatory DNA sequence motifs. PLoS Comput Biol 2:e36

97 1.4 · Analyse von Biochips: Von der Sequenz zum System Maier E, Meier-Ewert S, Ahmadi A, Curtis J, Lehrach H (1994) Application of robotic technology to automated sequence fingerprint analysis by oligonucleotide hybridisations. J Biotechnol 35:191–203 Maier E, Meier-Ewert S, Bancroft D, Lehrach H (1997) Automated Array Technologies for Gene Expression Profiling. Drug Discovery Today 2:315 Manduchi E, Grant GR, McKenzie SE, Overton GC, Surrey S, Stoeckert C (2000) Generation of patterns from gene expression data by assigning confidence to differentially expressed genes. Bioinformatics 16:685–698 MAQC Consortium (2006) The MicroArray Quality Control (MAQC) project shows inter- and intraplatform reproducibility of gene expression measurements. Nature Biotechnology 24:1151–1161 Margulies M, Egholm M, Altman WE, et al. (2005) Genome sequencing in microfabricated high-density picolitre reactors. Nature 437:376–380 Matys V, Kel-Margoulis OV, Fricke E, et al. (2006) TRANSFAC and its module TRANSCompel: transcriptional gene regulation in eukaryotes. Nucleic Acids Res 34:D108–D110 McAdams HH, Arkin A (1997) Stochastic mechanisms in gene expression. Proc Natl Acad Sci USA 94:814–819 McAdams HH, Shapiro S (1995) Circuit simulation of genetic networks. Science 269:650–655 Meier-Ewert S, Maier E, Ahmadi A, Curtis J, Lehrach H (1993) An automated approach to generating expressed sequence catalogues. Nature 361:375–376 Mirkin B (1996) Mathematical Classification and Clustering, Kluwer Academic Publishers, Dordrecht Mjolsness E, Sharp DH, Reinitz J (1991) A connectionist model of development. J Theor Biol 152:429–453 Newton MA, Kendziorski CM, Richmond CS, Blattner FR, Tsui KW (2001) On differential variability of expression ratios: Improving statistical inference about gene expression changes from microarray data. J Comp Biol 8:37–52 Orlando V (2000) Mapping chromosomal proteins in vivo by formaldehyde-crosslinked-chromatin immunoprecipitation. Trends Biochem Sci 25:99–104 Paddison PJ, Caudy AA, Hannon GJ (2002) Stable suppression of gene expression by RNAi in mammalian cells. Proc Natl Acad Sci USA 99:1443–1448 Parrish ML, Wei N, Duenwald S, et al. (2004) A microarray platform comparison for neuroscience applications. J Neurosci Meth. 132:57–68 Pavesi G, Mereghetti P, Mauri G, Pesole G (2004) Weeder Web: discovery of transcription factor binding sites in a set of sequences from co-regulated genes. Nucleic Acids Res 32:W199–203 Pe’er D, Regev A, Elidan G, Friedman N (2001) Inferring subnetworks from perturbed expression profiles. In: Brunak S (ed) Proceedings of the 9th International Conference on Intelligent Systems for Molecular Biology, Oxford University Press, Hinxton, S S215–S224 Perou CM, Jeffrey S, van de Rijn M et al. (1999) Distinctive gene expression patterns in human mammary epithelial cells and breast cancers. Proc Natl Acad Sci USA 96:9212–9217 Pfaffl MW (2001) A new mathematical model for relative quantification in real-time RT-PCR. Nucleic Acids Res 29:e45 Pittman J, Huang E, Nevins J, Wang O, West MP (2004) Bayesian analysis of binary prediction tree models for retrospectively sampled outcomes. Biostatistics 5:587–601. Poustka A, Pohl T, Barlow DP, et al. (1989) Molecular approaches to mammalian genetics. In: Cold Spring Harbor Symposia on Quant. Biol. 51, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, S 131–139

1.4

Poustka AJ, Kuhn A, Groth D, et al. (2007) A global view of gene expression in lithium and zinc treated sea urchin embryos: new components of gene regulatory networks. Genome Biology, 8:R85. Reinhart BJ, Weinstein EG, Rhoades MW, Bartel B, Bartel DB (2002) MicroRNAs in plants. Genes Dev 16:1616–1626 Reményi A, Lins K, Nissen LJ, Reinbold R, Schöler HR, Wilmanns M (2003) Crystal structure of a POU/HMG/DNA ternary complex suggests differential assembly of Oct4 and Sox2 on two enhancers. Genes Dev 17:2048–2059 Ringwald M, Eppig JT, Kadin JA et al. (2000) GXD: A gene expression database for the laboratory mouse-current status and recent enhancements. Nucleic Acids Res 28:115–119 DeRisi J, Penland L, Brown P et al. (1996) Use of a cDNA microarray to analyse gene expression patterns in human cancer. Nature Genet 14:457–460 DeRisi J, Iyer VR, Brown P et al. (1997) Exploring the metabolic and genetic control of gene expression on a genomic scale. Science 278:680–686 Roberts CJ, Nelson B, Marton MJ et al. (2000) Signaling and circuitry of multiple MAPK pathways revealed by a matrix of global gene expression. Science 287:873–880 Ronemus M, Vaughn MV, Martienssen RA (2006) MicroRNA-targeted and small interfering RNA-mediated mRNA degradation is regulated by argonaute, dicer, and RNA-dependent RNA polymerase in Arabidopsis. Plant Cell 18:1559–1574 Ross DT, Scherf U, Eisen MB et al. (2000) Systematic variation in gene expression patterns in human cancer cell lines. Nature Genet 24:227–235 Salgado, H, et al. (2001) RegulonDB (version 3.2):transcriptional regulation and operon organization in Escherichia coli K-12. Nucleic Acids Res 29:72–74 Sandelin A, Alkema W, Engström P, Wasserman WW, Lenhard B (2004) JASPAR: an open-access database for eukaryotic transcription factor binding profiles. Nucleic Acids Res 32:D91–D94 Sandmann T, Jakobsen J, Furlong EEM (2006) ChIP-on-chip protocol for genome-wide analysis of transcription factor binding in Drosophila melanogaster embryos. Nat Protoc 1:2839–2855 Schena M, Shalon D, Davis RW, Brown PO (1995) Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science 270:467–470 Schena M, Shalon D, Heller R, Chai A, Brown P, Davis R (1996) Parallel human genome analysis: microarray-based expression monitoring of 1000 genes. Proc Natl Acad Sci USA 93:10614–10619 Scherf U, Ross DT, Waltham M et al. (2000) A gene expression database for the molecular pharmacology of cancer. Nature Genet 24:236–244 Schoeberl B, Eichler-Jonsson C, Gilles ED, Muller G (2002) Computational modeling of the dynamics of the MAP kinase cascade activated by surface and internalized EGF receptors. Nature Biotechnol 20:370–375 Schomburg I, Chang A, Ebeling C, et al. (2004) BRENDA, the enzyme database: updates and major new developments. Nucleic Acids Res 32:D431–433 Shaffer JP (1995) Multiple hypothesis testing. Annu Rev Psychol 46:561–584 Sharan R, Shamir R (2000) CLICK: A clustering algorithm with applications to gene expression analysis. In: Altman R (ed) Proceedings of the 8th International Conference on Intelligent Systems for Molecular Biology (ISMB), AAAI Press, Menlo Park, S 307–316 Shen-Orr SS, Milo R, Mangan S, Alon U (2002) Network motifs in the transcriptional regulation network of Escherichia coli. Nature Genet 31, 64–68

98

Sektion 1 · Allgemeine Grundlagen

Somogyi R, Fuhrman S, Wen X (2001) Genetic network inference in computational models and applications to large-scale gene expression data. In: Bower JM, Bolouri H (eds.) Computational Modelling of Genetic and Biochemical Networks, MIT Press, Cambridge (Mass.), S 119–157 Statnikov A, Aliferis CF, Tsamardinos I, Hardin D, Levy S (2005) A comprehensive evaluation of multicategory classification methods for microarray gene expression cancer diagnosis. Bioinformatics 21:631–643 Stears RL, Martinsky T, Schena M (2003) Trends in microarray analysis. Nature Medicine 9:140–145 Steinfath M, Wruck W, Seidel H, Lehrach H, Radelof U, O’Brien J (2001) Automated image analysis for array hybridisation experiments. Bioinformatics 17:634–641 Tamayo P, Slonim D, Mesirov J et al. (1999) Interpreting patterns of gene expression with self-organizing maps: methods and applications to hematopoietic differentiation. Proc Natl Acad Sci USA 96:2907–2912 Tan PK, Downey TJ, Spitznagel EL, et al. (2003) Evaluation of gene expression measurements from commercial microarray platforms. Nucleic Acids Res. 31:5676–5684 Tanay A, Shamir R (2001) Computational expansion of genetic networks. In: Brunak S (ed) Proceedings of the 9th International Conference on Intelligent Systems for Molecular Biology, Oxford University Press, Hinxton, S S270–S278 Tavazoie S, Hughes JD, Campbell MJ, Cho RJ, Church GM (2000) Systematic determination of genetic network architecture. Nature Genet 22:281–285 Thomas JG, Olson JM, Tapscott SJ, Zhao LP (2001) An efficient and robust statistical modelling approach to discover differentially expressed genes using genomic expression profiles. Genome Res 11:1227–1236 Thomas RK, Nickerson E, Simons JF, et al. (2006) Sensitive mutation detection in heterogeneous cancer specimens by massively parallel picoliter reactor sequencing. Nature Med 12:852– 855. Tomita M, Hashimoto K, Takahashi K et al. (2000) E-CELL: software environment for whole–cell simulation. Bioinformatics 15:72– 84

Törönen P, Kolehmainen M, Wong G, Castren E (1999) Analysis of gene expression data using self-organizing maps. FEBS Lett 451:142–146 Tsai CA, Hsueh HM, Chen JJ (2003) Estimation of False Discovery Rates in Multiple Testing: Application to Gene Microarray Data. Biometrics 59:1071–1081 Vapnik V (1999) The nature of statistical learning theory. Springer Verlag. Weaver DC, Workman CT, Stormo GD (1999) Modeling regulatory networks with weight matrices. In: Altman R (ed) Proceedings of the Pacific Symposium on Biocomputing, World Scientific, Singapore, S 112–123 Wen X, Fuhrman S, Michaels GS, et al. (1998) Large-scale temporal gene expression mapping of CNS development. Proc Natl Acad Sci USA 95:334–339 Westfall PH, Young SS (1993) Resampling-based multiple testing: examples and methods for p-value adjustment, Wiley, New York Wierling C (2006) PyBioS – ein Modellierungs- und Simulationssystem für komplexe biologische Prozesse. In Forschung und wissenschaftliches Rechnen. Beiträge zum Heinz-Billing Preis 2005 (Hrsg. K. Kremer, V. Macho), 69:53–71, Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen (GWDG). Wittig U, Golebiewski M, Kania R, et al. (2006) SABIO-RK: Integration and Curation of Reaction Kinetics Data. In proceedings of the 3rd International workshop on Data Integration in the Life Sciences 2006 (DILS‘06). Hinxton, UK. Lecture Notes in Computer Science, 4075:94–103 Wodicka L, Dong H, Mittman M, Ho MH, Lockhart DJ (1997) Genomewide expression monitoring in Saccharomyces cerevisiae. Nature Biotechnol 15:1359–1367 Wolberg G (1990) Digital Image Warping, IEEE Computer Society Press, Los Alamitos Xenarios I, Rice DW, Salwinski L, et al. (2000) DIP: The Database of Interacting Proteins. Nucleic Acids Res 28:289–291 Zdobnov EM, Lopez R, Apweiler R, Etzold T (2002) The EBI SRS server – recent developments. Bioinformatics 18:368–373 Zehetner G, Lehrach H (1994) The Reference Library System – sharing biological material and experimental data. Nature 367:489–49

99 1.4 · Analyse von Biochips: Von der Sequenz zum System

1.4.12 Zeittafel Die angegebenen Zitate beziehen sich nur auf die Zeittafel. 1869

Entdeckung der DNS durch Miescher

1902

Boveri und Sutton postulieren DNS als Träger des Erbguts.

Avery et al. (1944)

Einem US-Forscherteam gelingt der Nachweis, dass die DNS Träger der genetischen Information ist.

Chargaff (1951)

Vier Bausteine der DNS, die »Basen«, liegen in bestimmten Verhältnissen zueinander vor (Chargaff-Regel). Dabei bilden Adenin (A) und Thymin (T) sowie Guanin (G) und Cytosin (C) jeweils ein Paar.

Watson und Crick (1953)

Entdeckung der räumlichen Struktur der DNS (Doppelhelix)

Sanger (1951)

Entschlüsselung der Aminosäuresequenz von Insulin; damit ist bewiesen, dass Eiweiße aus einer definierten Abfolge von Aminosäuren bestehen.

Jacob und Monod (1961)

Erste allgemeine Studie zum Regulationsmechanismus von Genen

Nierenberg u. Matthaei (1961), Nierenberg et al. (1966), Khorana et al. (1966), Speyer et al. (1963)

Entzifferung des genetischen Kodes: Je drei DNS-Bausteine definieren jede der 20 Aminosäuren.

Linn u. Arber (1968)

Entdeckung der Restriktionsenzyme, die DNS-Moleküle an definierten Stellen schneiden können

Temin u. Mizutani (1970), Baltimore (1970)

Entdeckung des Enzyms reverse Transkriptase, mit dessen Hilfe einige Retroviren ihre Erbinformationen umschreiben können, um sie in die Wirts-DNS einzubauen

Dayhoff (1969), Needleman u. Wunsch (1970)

Entwicklung erster Verfahren zur Sequenzanalyse

Jackson et al. (1972)

Mithilfe von Restriktionsenzymen gelingt es, DNS zu zerschneiden und mit einem weiteren Enzym (Ligase) wieder zu verbinden. So entsteht das erste vollständige rekombinante DNS-Molekül.

Sanger u. Coulson (1975), Maxam u. Gilbert (1977)

Entwicklung leistungsfähiger Methoden zur DNS-Sequenzierung

1982

Das erste gentechnisch hergestellte Medikament (Insulin) wird in den USA vertrieben.

1982

Erste Sequenzdatenbanken entstehen (GenBank und EMBL).

Mulis u. Faloona (1986)

Polymerasekettenreaktion (PCR) zur enzymatischen Amplifizierung von Nukleotidsequenzen

1987

Entwicklung der automatischen DNS-Sequenzierung

1988

Die Initiative »Human Genome Project« wird in den USA und in Japan beschlossen. Sie soll die systematische Entschlüsselung des menschlichen Erbguts leisten.

Capecchi (1989)

Entwicklung einer zuverlässigen Technik, mit der bestimmte Gene in Mäusen gezielt ausgeschaltet werden können (»Knockout-Methode«)

Pearson u. Lipman (1988), Altschul et al. (1990)

Entwicklung von Standardprogrammen zur Sequenzanalyse (FASTA, BLAST)

Lehrach et al. (1990); Lennon u. Lehrach (1991); Schena et al. (1995); Lockhart et al. (1996)

Entwicklung von Genchips zur parallelen Messung des Transkriptionszustands ganzer Genome durch Hybridisierungsexperimente

1995

Beitritt Deutschlands zum »Human Genome Project«

Weber u. Myers (1997)

Entwicklung der Shotgun-Methode zur Hochdurchsatzsequenzierug ganzer Genome

Fire et al. (1998)

Fire und Mellow entdecken die RNS-Interferenz-Stummschaltung von Genen durch doppelsträngige RNS.

Dunham et al. (1999)

Sequenzierung des ersten menschlichen Chromosoms (Chromosom 22)

Hattori et al. (2000)

Sequenzierung des menschlichen Chromosoms 21; Sequenzierung des ersten Insekts (Drosophila melanogaster)

International Human Genome Sequencing Consortium (2001), Venter et al. (2001)

Sequenzierung des kompletten menschlichen Genoms

1.4

100

Sektion 1 · Allgemeine Grundlagen

Literatur zur Zeittafel Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) Basic local alignment search tool. J Mol Biol 215:403–410 Avery OT, MacLeod CM, MacCarty M (1944) Studies on the chemical nature of the substance inducing transformation of pneumococcal types. J Exp Med 79:137–158 Baltimore D (1970) Viral RNA-dependent DNA polymerase. Nature 226:1209-1211 Capecchi M (1989) The new mouse genetics: Altering the genome by gene targeting. Trends Genet 5:70–76 Chargaff E (1951) Structure and function of nucleic acids as cell constituents. Fed Proc 10:654–659 Dayhoff M (1969) Atlas of protein sequence and structure. National Biomedical Research Foundation, Silver Spring, Maryland Dunham I, Hunt AR, Collins JE et al. (1999) The DNA sequence of human chromosome 22. Nature 402:489–495 Fire A, Xu S, Montgomery MK, Kostas SA, Driver SE, Mello CC (1998) Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. In: Nature Bd 391:S 806–811 Hattori M, Fujiyama A, Taylor TD et al. (2000) The DNA sequence of human chromosome 21. Nature 405:311–319 International Human Genome Sequencing Consortium (2001) Initial sequencing and analysis of the human genome. Nature 409:860–921 Jackson D, Symons R, Berg P (1972) Biochemical method for inserting new genetic information into DNA of simian virus 40: circular SV40 DNA molecules containing lambda phage genes and the galactose operon of E. coli. Proc Natl Acad Sci USA 69:2904– 2909 Jacob F, Monod J (1961) Genetic regulatory mechanisms in the sythesis of proteins. J Mol Biol 3:318–356 Khorana HG, Büchi H, Ghosh H, Gupta N, Jacob TM, Kössel H, Morgan R, Narang SA, Ohtsuka E, Wells RD (1966) Polynucleotide synthesis and the genetic code. Cold Spring Harbor Symp Quant Biol 31:39–49 Lehrach H, Drmanac R, Hoheisel J et al. (1990) Hybridization Fingerprinting in Genome Mapping and Sequencing. In: Davies KE, Tilghman S (eds) Genome Analysis Volume 1: Genetic and Physical Mapping, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, p 39–81 Lennon G, Lehrach H (1991) Hybridization analyses of arrayed cDNA libraries. Trends Genet 7:314–317

Linn S, Arber W (1968) Host specificity of DNA produced by E. coli, X. In vitro restriction of phage fd replicative form. Proc Natl Acad Sci USA 59:1300–1306 Lockhart DJ, Dong H, Byrne MC et al. (1996) Expression monitoring by hybridization to high-density oligonucleotide arrays. Nat Biotechnol 14:1675–1680 Maxam AM, Gilbert W (1977) A new method of sequencing DNA. Proc Natl Acad Sci USA 74:560–564 Mullis K, Faloona F (1987). Specific synthesis of DNA in vitro via a polymerase catalysed chain reaction. Meth Enzymol 55:335–350 Needleman S, Wunsch C (1970) A general method applicable to the search for similarities in the amino acid sequence of two proteins. J Mol Biol 48:443–453 Nierenberg MW, Matthaei JH (1961) The dependence of cell-free protein synthesis in E. coli upon naturally occurring or synthetic polynucleotides. Proc Natl Acad Sci USA 47:1588–1602 Nierenberg MW, Caskey T, Marshall R, Brimacombe R, Kellogg DD, Doctor B, Hatfield D, Levin J, Rottman F, Pestka S, Wilcox M, Anderson F (1966) The RNA code and protein synthesis. Cold Spring Harbor Symp Quant Biol 31:11–24 Pearson R, Lipman DJ (1988) Improved tools for biological sequence comparison. Proc Natl Acad Sci USA 85:2444–2448 Sanger F, Tuppy H (1951) The amino-acid sequence in the phenylalanyl chain of insulin. Biochem J 49:463–490 Sanger F, Coulson AR (1975) A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. J Mol Biol 94:444–448 Schena M, Shalon D, Davis RW, Brown PO (1995) Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science 270:467–470 Speyer JF, Lengyel P, Basilio C, Wahba AJ, Gardner RS, Ochoa S (1963) Synthetic polynucleotides and the amino acid code. Cold Spring Harbor Symp Quant Biol 28:559–567 Temin HM, Mizutani S (1970) Viral RNA-dependent DNA polymerase. Nature 226:1211–1213 Venter JC, Adams MD, Myers EW et al. (2001) The sequence of the human genome. Science 291:1304–1351 Watson JD, Crick FHC (1953) Molecular structure of nucleic acids: a structure of deoxyribose nucleic acids. Nature 171:737–738 Watson JD, Crick FHC (1953) The structure of DNA. Cold Spring Harbor Symp Quant Biol 18:123–131 Weber JL, Myers EW (1997) Human whole-genome shotgun sequencing. Genome Res 7:401–409

1.5 1.5 Mitochondriale DNA des Menschen Bernd Wissinger

1.5.1

Struktur und Funktion der Mitochondrien – 102

1.5.2

Das mitochondriale Genom des Menschen – 103

1.5.3

Transkription und RNA-Prozessierung

1.5.4

Translation

– 107

1.5.5

Replikation

– 108

1.5.6

Mitochondriale Vererbung

1.5.7

Mitochondriale Erkrankungen

1.5.8

mtDNA als molekularer Marker

1.5.9

Literatur

– 116

1.5.10

Zeittafel

– 118

– 104

– 111 – 113 – 115

Literatur zur Zeittafel – 118

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

102

Sektion 1 · Allgemeine Grundlagen

1.5.1 Struktur und Funktion der Mitochondrien Ein Primärmerkmal von Eukaryonten ist der Besitz von Mitochondrien als Bestandteile des Zytoplasmas. Mitochondrien sind zumeist stäbchenförmig und messen zwischen 0,2–1 µm im Durchmesser und 2–8 µm in Längsrichtung. Ihre Zahl schwankt je nach Zelltyp zwischen wenigen Dutzenden in den Spermien und primordialen Keimzellen bis zu Zehntausenden in Leberzellen oder reifen Oozyten. Die bisherige Vorstellung von Mitochondrien als solitären Zellorganellen ist jedoch nicht länger haltbar; Mitochondrien durchziehen die Zelle als verzweigte Netzwerke, welche dynamischen Fusions- und Spaltungsprozessen unterliegen. Die Mitochondrien einer Zelle bilden somit eine strukturelle und physiologische Einheit, die man als mitochondriales Retikulum bezeichnet (Okamoto u. Shaw 2005). Mitochondrien besitzen zwei Membranen, die äußere und die innere Mitochondrienmembran. Dadurch werden zwei in sich abgeschlossene Kompartimente geschaffen, der Intermembranraum und der innere Matrixraum. Die innere Mitochondrienmembran ist stark aufgefaltet und bildet dadurch Invaginationen, die sog. Cristae, die in den Matrixraum hineinreichen. Durch die Cristae wird die Fläche der inneren Mitochondrienmembran stark vergrößert. Neuere Untersuchungen mittels Elektronenmikroskop-Tomographie zeigen, dass die Cristae je nach Zelltyp tubulär, lamellenförmig oder unregelmäßig mit sackartigen Ausstülpungen gestaltet sind und lediglich durch dünne Tubuli mit dem anliegenden Rest der Innenmembran in Verbindung stehen (Manella 2006). Die äußere und innere Mitochondrienmembran unterscheiden sich erheblich in ihrem Aufbau und ihren biophysikalischen Eigenschaften. Die äußere Membran ähnelt in ihrer Lipidzusammensetzung derjenigen typischer intrazellulärer Membransysteme (z. B. der des endoplasmatischen Retikulums). Sie enthält einen relativ geringen Anteil an Protein und besitzt Poren (Porine), die eine hohe Permeabilität für Ionen und Metabolite gewährleisten. Im Gegensatz dazu ist die Lipidzusammensetzung der inneren Mitochondrienmembran ungewöhnlich: Es findet sich kein Cholesterin, dafür ein hoher Anteil von Kardiolipin – Merkmale, wie sie für die Membran von Bakterien typisch sind. Die innere Mitochondrienmembran enthält einen extrem hohen Anteil an Proteinen (etwa 80%) und ist weitgehend inpermeabel für Metabolite, sodass der Stoffaustausch von spezifischen Translokatorproteinen abhängig ist (Palmieri 1994). Die Mitochondrien sind der Ort der aeroben Energiegewinnung (oxidative Phosphorylierung) und wichtiger Knotenpunkt im Stoffwechsel der Zelle. Von besonderer Bedeutung ist dabei der Citratzyklus (Krebs-

zyklus), der im Matrixraum der Mitochondrien angesiedelt ist. Hier wird das aus der Decarboxylierung von Pyruvat und dem Abbau von Fettsäuren gewonnene Acetyl-CoA in einem zyklischen Reaktionsprozess zu CO2 oxidiert. Dabei entstehen Reduktionsäquivalente in Form von NADH+H+ bzw. FADH2, die in die Atmungskette eingespeist werden. Die Atmungskette setzt sich aus vier Proteinkomplexen, eingebettet in die innere Mitochondrienmembran, zusammen: x NADH-Ubichinon-Oxidoreduktase (NADH-Dehydrogenase, Komplex I) x Succinat-Ubichinion-Oxidoreduktase (Komplex II) x Ubichinon-Cytochrome c-Oxidoreduktase (Komplex III) x Cytochrome c-Oxidase (Cytochrom-Oxidase, Komplex IV) Die von den Reduktionsäquilaventen in den Komplex I bzw. Komplex II (für FADH2) eingespeisten Elektronen durchlaufen ein Redoxkette und werden schließlich auf O2-Moleküle übertragen, die nachfolgend zu H2O reduziert werden. Gekoppelt an diesen exergonen Elektronentransport ist ein gerichteter Transport von Protonen in den Intermembranraum. Es entsteht dadurch ein elektrochemisches Potential für Protonen (Protonengradient) zwischen dem Intermembran- und dem Matrixraum. Der Rückfluss der Protonen entlang dieses Gradienten wird durch den membranständigen ATPaseKomplex kanalisiert und treibt dabei die Synthese von ATP aus ADP und freiem Phosphat an (Chemiosmotische Theorie nach Mitchell). Neben der Bereitstellung von Reduktionsäquivalenten für die Atmungskette nehmen der Citratzyklus und die vorgeschaltete Pyruvatdecarboxylase eine Zentralstellung im katabolen und anabolen Stoffwechsel der Zelle ein. Dazu gehört beispielsweise die Bereitstellung von Ausgangssubstraten für die Biosynthese bestimmter Aminosäuren, für die Fettsäuresynthese, die Glukoneogenese und die Porphyrinbiosynthese. Eine weitere besondere Bedeutung der Mitochondrien besteht in ihrer Funktion als intrazellulärer Ca2+-Speicher und als Vermittler des apoptotischen Zelltods (7 Kap. 1.8). Bereits Ende des 19. Jahrhunderts wurde von Richard Altmann die Vermutung aufgestellt, dass Mitochondrien und Chloroplasten von ursprünglich selbstständigen Organismen abstammen, die im Laufe einer zellulären Symbiose zu Organellen „domestiziert“ worden sind. An dieser Endosymbiontenhypothese zur Erklärung des Ursprungs der Organellen gibt es kaum mehr ernsthafte Zweifel (zur Übersicht s. Margulis 1981). Vergleichende Sequenzanalysen deuten auf eine Verwandtschaft der Vorläufer der Mitochondrien mit Vertretern aus der Gruppe der D-Proteobakterien hin. Obwohl man in der Größe und Struktur des mitochondrialen Genoms, so-

103 1.5 · Mitochondriale DNA des Menschen

wie in der Zahl und Anordnung der darin kodierten Gene eine sehr große Variabilität zwischen verschiedenen Eukaryontengruppen findet, verstärken sich Hinweise auf einen monophyletischen Ursprung der Mitochondrien (zur Übersicht s. Gray et al. 1999). So sind beispielsweise die Aminosäuresequenzen mitochondrial kodierter Proteine zwischen den verschiedenen Eukaryontengruppen weit besser konserviert, als zu den homologen Proteinen der am nächsten verwandten Bakterien. Auch mit der Identifizierung „primitiver“ mitochondrialer Genome, wie kürzlich jenes des heterotrophen Flagellaten Reclinomonas americana mit insgesamt 97 Genen, gelingt es zunehmend, Bindeglieder für den monophyletischen Evolutionsweg der Mitochondrien zu rekonstruieren (Lang et al. 1997).

1.5.2 Das mitochondriale Genom des Menschen Die Beobachtung von nichtmendelnden Erbgängen und das daraus entwickelte Konzept von extrachromosomalen, plasmatischen Erbfaktoren geht zurück auf Arbeiten von Bauer und Correns zu Beginn des 20. Jahrhunderts. Den entscheidenden Impuls für eine eigenständige Mitochondriengenetik lieferten jedoch die Arbeiten von Ephrussi über die Erzeugung und das Kreuzungsverhal-

a . Abb. 1.5.1a,b. Das mitochondriale Genom des Menschen. a Schematische Darstellung der Struktur und des Aufbaus des humanen mitochondrialen Genoms. Der äußere Kreis stellt den H-Strang und der innere Kreis den L-Strang der mtDNA dar. Die Gene für die beiden rRNA-Gene (12S, 16S) sind in rot, die proteinkodierenden Gene (ND16, CO1-3, ATP6, ATP8 und CYB) in blau und die tRNA-Gene (benannt

1.5

ten von atmungsdefizienten petite-Mutanten (kleine Kolonien) bei der Bäckerhefe. Mit dem Nachweis von DNA in Mitochondrien (mtDNA) im Jahr 1963 und der nachfolgenden Entwicklung von Methoden zur Isolierung von mtDNA mittels Dichtezentrifugation wurde schließlich die Ära der Molekulargenetik der Mitochondrien eingeleitet, die mit der Komplettsequenzierung des humanen mitochondrialen Genoms im Jahre 1981 einen ersten Höhepunkt feiern konnte (Anderson et al. 1981). Die damals ermittelte Sequenz (Cambridge Sequence) mit einer Gesamtlänge von 16569 bp bildet noch heute das Grundgerüst der humanen mtDNA-Referenzsequenz (http://www. mitomap.org/mitoseq.html). Andererseits zeichnet sich die humane mtDNA durch ihre Sequenzvariabilität aus, sodass man typischerweise 10 bis 20 Sequenzabweichungen beim Vergleich zweier Individuen findet. Das humane mitochondriale Genom ist ein singuläres, doppelsträngiges Ringmolekül (> Abb. 1.5.1). Im nativen Zustand ist dieses Ringmolekül in eine negativ gewundene „supercoil“-Konformation aufgedrillt. Bei der mtDNA wird historisch zwischen H- („heavy“) und L- Strang („light“) des Ringmoleküls unterschieden; eine Differenzierung, die auf die unterschiedliche Dichte der beiden Einzelstränge in der denaturierenden CsCl-Dichtezentrifugation abhebt. Der GC-Gehalt der humanen mtDNA ist mit 44% nur unwesentlich höher als der des Kerngenoms.

b im Ein-Buchstaben-Code für die jeweils spezifizierte Aminosäure) in grün dargestellt. OH, OL – Replikationsursprung des H- bzw. L-Stranges. IHR, IHT, IL – Initiationsorte für die Transkription der vom H- bzw. L-Strang kodierten Gene. b Elektronenmikroskopische Aufnahme eines partiell entfalteten mtDNA-Moleküls aus menschlichen HeLaZellen (75.000-fache Vergrößerung)

104

Sektion 1 · Allgemeine Grundlagen

. Tabelle 1.5.1. Gene im humanen mitochondrialen Genom Klasse /Komplex

Zahl

rRNAs

2

tRNAs

22

Proteinkodierende Gene (Untereinheiten der ~)

13

Bezeichnung/ Gensymbol 12S, 16S tRNATrp, etc.

NADH-Ubiquinon-Oxidoreduktase

7

ND1, ND2, ND3, ND4 ND4L, ND5, ND6

Ubiquinon-Cytochrome c-Oxidoreduktase

1

CYB

Cytochrome c-Oxidase

3

CO1, CO2, CO3

ATP-Synthetase

2

ATP6, ATP8

Das mitochondriale Genom des Menschen enthält insgesamt 37 Gene, darunter Gene für zwei ribosomale RNAs (12S- und 16S-rRNA), für 22 Transfer-RNAs (tRNAs) und 13 proteinkodierende Gene (> Tabelle 1.5.1). Die Letztgenannten kodieren für Untereinheiten der mitochondrialen Atmungskettenkomplexe I (7 Gene, ND1-6), III (1 Gen, CYB) und IV (3 Gene, CO13) bzw. der ATP-Synthetase (2 Gene, ATP6 und ATP8). Da die Mehrzahl der Untereinheiten dieser Multiproteinkomplexe kernkodiert ist, haben wir hier interessanterweise Mosaikstrukturen, zusammengesetzt aus kernund mitochondrial kodierten Bestandteilen, vor uns. Anders als sonst üblich hat es sich für das mitochondriale Genom in der Literatur eingebürgert, den Matrizenstrang als den kodierenden Strang zu benennen. Dieser Konvention entsprechend wird die überwiegende Mehrzahl der mitochondrialen Gene (28/37) vom H-Strang kodiert, lediglich 8 tRNA-Gene und das ND6Gen sind auf dem L-Strang lokalisiert. Das mitochondriale Genom des Menschen – und dies gilt für alle höheren Tiere – zeichnet sich durch seine Kompaktheit und äußerst ökonomische Anordnung und Struktur der Gene aus. Diese enthalten keine Introns und grenzen mit ihren kodierenden Sequenzen zumeist un-

. Abb. 1.5.2. Partiell überlappende Kodierung zwischen dem ATP8und ATP6-Gen. Die beiden Gene überlappen in einem 46 bp langen Abschnitt. Dargestellt ist die Transkriptsequenz (in schwarz) und die von den beiden Genen genutzten Leseraster samt der zugehörigen Aminosäuresequenz (ATP8 in blau, ATP6 in grün). Gezeigt ist weiter-

mittelbar aneinander. An drei Positionen im humanen mitochondrialen Genom findet sich sogar eine überlappende Kodierung von Genen (> Abb. 1.5.2). Auch fehlen den proteinkodierenden Genen die sonst üblichen nichttranslatierten Sequenzabschnitte vor und nach dem Leseraster einschließlich der Ribosomenbindungstelle. Und schließlich werden in der Mehrzahl der Fälle die letzten Basen der Terminationskodons erst durch die Polyadenylierung der prozessierten Transkripte ergänzt (> Abb. 1.5.2, 7 Abschn. 1.5.3 „Transkription und RNA-Prozessierung“). Die Kompaktheit des humanen mitochondrialen Genoms mit seiner engen Aneinanderreihung der Gene spiegelt sich in der extrem hohen mittleren Gendichte von 447,8 bp/Gen wieder. Der ca. 1100 bp lange Abschnitt zwischen den Genen für die tRNAPro und die tRNAPhe, der die Promotoren und den Replikationsursprung für den H-Strang enthält, ist der einzige größere Sequenzanteil der mtDNA, der keine kodierende Funktion hat (> Abb. 1.5.1). Aufgrund des geringen kodierenden Potentials des mitochondrialen Genoms ist der genetische Apparat der Mitochondrien größtenteils von kernkodierten Genfunktionen abhängig. So werden im Extremfall (beim Menschen und generell allen höheren Tieren) alle für die Replikation und der Transkription notwendigen Faktoren und alle Proteinkomponenten des Translationsapparats vom Kern kodiert und müssen in die Mitochondrien importiert werden.

1.5.3 Transkription und RNA-Prozessierung Die Transkription der Gesamtheit aller Gene des humanen mitochondrialen Genoms wird von lediglich zwei Promotoren, je einem für den H- und den L-Strang, gesteuert. Die beiden Promotoren („heavy/light strand promotor“, HSP/LSP) liegen eng benachbart in der nichtkodierenden Region des mt-Genoms (> Abb. 1.5.3). Sie setzen sich aus je zwei Sequenzelementen, einer ca. 10–15 Basenpaare langen Sequenz um die Initiationsstelle der Transkription und die sich davor anschließende Binde-

hin die Vervollständigung des UAA-Stoppkodons für das ATP6-Gen durch die Polyadenylierung des Transkripts und die vom „universellen“ genetischen Code abweichende Verwendung des UGA-Tripletts für die Kodierung der Aminosäure Tryptophan (*)

105 1.5 · Mitochondriale DNA des Menschen

1.5

. Abb. 1.5.3. Funktionelle Organisation der mtDNA-Kontrollregion. Schematische Darstellung und Positionierung der für die Initiation der Transkription und der H-Strang Replikation bedeutsamsten Sequenzelemente. Die Promotoren für die Transkription des H- (HSP-) und L-Stranges (LSP) setzen sich aus der „Core“-Sequenz (in schwarz) um den Initiationsort der RNA-Synthese (IHR bzw. IL) und den benachbarten Bindungsstellen für den Transkriptionsfaktor mtTFA (in gelb, Orientierung in Pfeilrichtung) zusammen. Weitere sekundäre mtTFABindungsstellen im Bereich des LSP sind hellgelb dargestellt. Die

Transkription der Gene auf dem H-Strang erfolgt von zwei Initiationsorten aus. Am IHR initiiert die Transkription der rRNA-Gene, am IHT die Transkription des kompletten H-Stranges mit der Mehrzahl der tRNAGene und proteinkodierenden Gene. Am IL initiiert die Synthese des RNA-Primers (7S-RNA) als Ausgangspunkt für die Replikation des HStranges. Für die Stabilisierung und Prozessierung des RNA-Primers ist die Präsenz evolutiv konservierter Sequenzelemente (CSB1-3, in grau) essenziell. Ansetzend an dem prozessierten RNA-Primer beginnt am OH die Replikationssynthese des H-Stranges

stelle für den Transkriptionsfaktor mtTFA im Bereich zwischen den Positionen –12 bis –39 vor der Initiationsstelle, zusammen. Die kritischen Sequenzelemente von HSP und LSP sind nur partiell konserviert; die daraus abzuleitende Konsensussequenz für die Initiationsstelle lautet 5c-ACC(G)0-1CC(A)3-4GA-3c, wobei die Transkription an der Position der zentralen Adenosinnukleotide initiiert. Die mtTFA-Bindestellen von HSP und LSP zeigen bezüglich der Transkriptionsrichtung eine gegensätzliche Orientierung, d. h., die Aktivierung der Transkription durch mtTFA erfolgt unabhängig von der Orientierung der entsprechenden Bindungsstelle. Die Bindungsaffinität von mtTFA für den LSP ist weitaus höher als für den HSP. Zusätzlich befinden sich weitere, schwächere mtTFA-Bindungsstellen stromab des LSP. Der Transkriptionsfaktor mtTFA ist für die Transkriptionsinitiation essenziell. Er krümmt und entwindet das DNA-Molekül als Voraussetzung für die Bildung des Initiationskomplexes, bestehend aus der mitochondrialen RNA-Polymerase POLRMT und dem Transkriptionsfaktor TFB1M bzw. TFB2M (Fisher et al. 1992; Falkenberg et al. 2002). Ausgehend von den Initiationstellen können beide Stränge des mt-Genoms in nahezu ihrer gesamten Länge transkribiert werden, und es entstehen dabei polycistronische Vorläufer-Transkripte (> Abb. 1.5.4). Pulsmarkierungsexperimente zeigen, dass der L-Strang etwa 2- bis 3-fach stärker transkribiert wird als der H-Strang. Mit Ausnahme der 7S RNA, die als RNA-Vorläufer für die Initiation der DNA-Replikation benötigt wird (s. u.), haben die L-Strang - Transkripte jedoch eine sehr geringe Lebensdauer und sind nur in geringer Menge im Transkriptpool nachweisbar. Diese hohe Turnover-Rate der L-Strang-Primärtranskripte verhindert möglicherweise eine Antisense-Interferenz mit den komplementären Transkripten des H-Stranges.

Im Transkriptpool der Mitochondrien überwiegen jedoch kürzere RNA-Spezies definierter Länge, die aus der Prozessierung der Primärtranskripte des L- und HStranges noch während der Transkription hervorgehen (Ojala et al. 1981) (> Abb. 1.5.4). Für die Spaltung des Primärtranskripts ist die in der Organisation des mt-Genoms auffällige Positionierung der tRNAs zwischen den proteinkodierenden Genen von Bedeutung. Die Primärtranskripte werden nämlich durch spezifische endonukleolytische Spaltungsreaktionen am 5c- und 3c-Ende der tRNAs unter Beteiligung einer RNAse P und einer 3c-tRNA-Prozessierungsendonuklease in die reifen rRNAs, tRNAs und proteinkodierenden mRNAs zerlegt (Ojala et al. 1981; Rossmanith et al. 1995). Lediglich in zwei Fällen (ATP8/ATP6/CO3 und ND4L/ND4) bleibt eine di- bzw. tricistronische Transkripteinheit erhalten. Die Transkriptspaltung durch die mitochondriale RNAse P (mtRNAse P) erfolgt analog zum Mechanismus der tRNA-Prozessierung bei Bakterien und im Kern der Eukaryonten (Altman et al. 1986). Die mtRNAse P ist ein Ribonukleoproteinkomplex mit einem 340 Nukleotide langen RNA-Anteil, welcher identisch ist mit der H1-RNA der nukleären RNAse P (Puranam u. Attardi 2001). Wichtig ist hieraus die Erkenntnis, dass Mitochondrien einen geregelten RNA-Importmechanismus für die kernkodierte H1-RNA und auch den RNA-Anteil der an der Replikation beteiligten RNAse MRP (s. u.) haben müssen. Da mitochondriale Erkrankungen (Mitochondriopathien, 7 Abschn. 1.5.7) sehr häufig durch Mutationen in den tRNA-Genen verursacht sind, versucht man, sich diesen RNA-Import aus dem Zytoplasma für Therapieansätze nutzbar zu machen (Kolesnikova et al. 2004). Neben der endonukleolytischen Spaltung der Vorläufertranskripte sind weitere posttranskriptionelle Mo-

106

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.5.4. Transkription und Prozessierung der mtDNA-Transkripte. Linearisierte Darstellung der mtDNA (Farbcodierung der Gene entsprechend Abb. 1.5.2) mit der Übersicht über die vom H- und L-Strang abgelesenen Primärtranskripte und deren nachfolgende Prozessierung. Zwei verschiedene Primärtranskripte werden vom H-Strang abgelesen, die durch die alternative Transkriptionsinitiation am IHR bzw. IHT spezifiziert sind. Das kürzere rRNA-Vorläufertranskript

terminiert am Ende des 16s rRNA-Gens und liefert die Hauptmasse der rRNAs. Die Zerlegung der Primärtranskripte erfolgt durch endonukleolytisches „Ausschneiden“ der tRNAs bereits während der Transkription. Die proteinkodierenden mRNAs werden nachfolgend durch Polyadenylierung vervollständigt und stabilisiert. Im Gegensatz dazu werden die nichtkodierenden Abschnitte des L-StrangTranskripts rasch abgebaut

difikationen der mitochondrialen Transkripte erforderlich. In frühen Untersuchungen konnte bereits gezeigt werden, dass die reifen mRNA-Transkripte einen 50–60 Nukleotide langen Poly(A)-Schwanz tragen. Auch die rRNA-Transkripte werden am 3c-Ende adenyliert, jedoch finden sich hier nur Abschnitte mit 5–10 Adenosinnukleotiden. Im Gegensatz dazu sind die reifen tRNAs nicht 3c-adenyliert, stattdessen muss wie bei den zytosolischen tRNAs das typische 3c-terminale CCA-Trinukleotid durch eine Nukleotidyltransferase angehängt werden (Reichert u. Mörl 2000). Sieben der 13 Leseraster für proteinkodierende Gene (ND1-ND4, ATP6, CO3, CYB) enden ohne vollständiges Terminationskodon. Erst durch die Polyadenylierung der prozessierten Transkripte wird das Ende des Leserasters zu einem funktionellen Stoppkodon ergänzt (Anderson et al. 1981) (> Abb. 1.5.2). Aus dem bisher vorgestellten Modell der mitochondrialen Transkription und Prozessierung wäre ein stöchiometrisches Verhältnis zwischen den mRNA-, tRNAund rRNA-Transkriptspezies zu folgern. Im Transkriptpool der Mitochondrien sind jedoch lediglich die verschiedenen mRNAs in annähernd gleichem Mengenverhältnis vorhanden, während die rRNAs in einem 15bis 60-fachen Überschuss vorliegen (Attardi 1985). Nur ein Teil dieses Überschusses resultiert aus der höheren Lebensdauer der rRNA. Der entscheidende Unterschied

ist durch eine deutlich erhöhte Neusyntheserate der rRNAs begründet (Gelfand u. Attardi 1981). Wie wird in den Mitochondrien dieser Unterschied in der Syntheserate bewerkstelligt? Attardi et al. konnten durch eine Reihe von Untersuchungen zeigen, dass bei der Transkription des H-Strangs zwei alternative Wege existieren. Sie sind durch die Verwendung unterschiedlicher Transkriptionsinitiationsstellen gekennzeichnet. Die Transkription des kompletten H-Strang-Vorläufertranskripts, aus welchem die reifen mRNAs hervorgehen, initiiert am 5c-Ende des 12S-rRNA-Gens (IHT). Im Gegensatz dazu erfolgt die Transkriptionsinitiation für die Hauptmenge der rRNAs direkt am circa 90 bp weiter stromauf gelegenen HSP (IHR) und schließt das Gen für die tRNAPhe mit ein (Montoya et al. 1983) (> Abb. 1.5.3). Diese am IHR initiierte Transkription terminiert frühzeitig bereits am 3c-Ende des 16S-rRNA-Gens (> Abb. 1.5.4). Entscheidend dafür ist der kernkodierter Terminationsfaktor (mTERF), ein 34-kD-Protein mit zwei basischen Abschnitten für die Bindung an die DNA und drei Leucinzipperdomänen, welches spezifisch an ein Sequenzmotiv am 5c-Ende des tRNALeu(UUR)-Gens bindet. Im phosphorylierten Zustand bildet mTERF an dieser Stelle eine physikalische Barriere, an welcher die mtRNA-Polymerase stoppt und vom DNA-Molekül abfällt (Kruse et al. 1989; Prieto-Martin et al. 2004). mTERF bindet aber zusätzlich auch an die IHR, wodurch eine auch elektro-

107 1.5 · Mitochondriale DNA des Menschen

nenmikroskopisch beobachtbare Loop-Struktur entsteht, in der sich wie in einer Mikrodomäne die Transkription der Hauptmasse der rRNA vollzieht (Martin et al. 2005).

1.5.4 Translation Mitochondrien unterhalten einen eigenen Proteinbiosyntheseapparat, der beim Menschen für die Synthese von lediglich 13 Polypeptidketten aufrechterhalten wird. Wesentliche funktionelle Bestandteile des Proteinbiosyntheseapparats wie z. B. die ribosomalen Proteine, die Aminoacyl-tRNA-Synthetasen und die Initiations-, Elongations- und Terminationfaktoren der Translation werden alle vom Kern kodiert und müssen importiert werden. Lediglich die RNA-Bestandteile des Proteinbiosyntheseapparats – rRNAs und t-RNAs – sind mitochondrial kodiert. Die mitochondrialen Ribosomen (Mitoribosomen) unterscheiden sich in ihrer Zusammensetzung deutlich von der zytoplasmatischer und auch prokaryoter Ribosomen. Die Sedimentationskoeffizienten der intakten Monosomen bzw. der großen und der kleinen Untereinheit betragen in Säugermitochondrien 55S, 39S und 28S (Patel et al. 2001). Die Gesamtmolekularmasse eines solchen Mitoribosoms beträgt ca. 3,5u106 Da und ist damit deutlich größer als die bei E. coli. Sehr ungewöhnlich ist das relative Massenverhältnis von RNA zu Protein, welches bei den Mitoribosomen lediglich 1:3 beträgt. Ausschlaggebend dafür ist einerseits der hohe Anteil und die große Anzahl ribosomaler Proteine (ca. 85–90 beim Rind), die deutlich über derjenigen in Prokaryonten und auch der zytoplasmatischer Ribosomen liegt, und anderseits die geringe Größe der mitochondrialen rRNA-Moleküle. Die tierischen Mitoribosomen enthalten lediglich zwei rRNA-Spezies, 16S- und 12S-rRNA, mit einer Länge von ca. 1560 bzw. 950 Nukleotiden. Eine kleine rRNA, wie sie bei anderen Systemen (5S-rRNA bei Eubakterien bzw. 5,8S-rRNA bei Eukaryonten) aber auch bei Pflanzenmitochondrien vorkommt, fehlt bei tierischen Mitoribosomen. Trotz ihrer geringeren Größe zeigen Faltungsmodelle für die beiden mitochondrialen rRNAs deutliche strukturelle Ähnlichkeit mit der 23S- und 16S-rRNA von E. coli. Der Größenunterschied spiegelt sich dabei insbesondere im Fehlen einiger Sekundärstrukturelemente wieder (Wolstenholme 1992). Am auffälligsten ist das Fehlen einer Anti-Shine-Dalgarno-Sequenz am 3c-Ende der 12S-rRNA. Bei E. coli ist die Interaktion dieses Abschnittes am 3’-Ende der 16S-rRNA mit einer purinreichen Sequenz am 5c-Ende der bakteriellen mRNAs (Shine-DalgarnoSequenz) für eine effiziente Translation notwendig. Andererseits wurde bereits angeführt, dass die Mehrzahl der reifen mitochondrialen Transkripten unmittelbar

1.5

mit dem Initiationskodon der Translation beginnt. Auch fehlt den mitochondrialen Transkripte ein 5c-terminales (7-methyl-guanosin-)m7G(5c)ppp-cap, welches für die Translation eukaryoter mRNAs wichtig ist. Die sich daraus ergebende Frage nach dem Mechanismus der Transkripterkennung und Translationsinitiation durch die Mitoribosomen ist bis heute ungeklärt. Die Mitoribosomen enthalten im Vergleich mit den zytoplasmatischen Ribosomen einen geringeren Anteil basischer Proteine. Antikörper gegen die ribosomalen Proteine der Mitoribosomen zeigen keine Kreuzreaktion mit denen der zytoplasmatischen Ribosomen, und es ist offensichtlich, dass der größte Teil, wenn nicht sogar alle ribosomalen Proteine der Mitoribosomen von distinkten nukleären Genen kodiert werden (Pietromonaco et al. 1991). Die Einzelprozesse der mitochondrialen Translation – Initiation, Elongation und Termination – sind nur ansatzweise erforscht. Einzelne Komponenten wie die Elongationsfaktoren EF-Tu, EF-Ts und EF-G und der Terminationsfaktor RF1 konnten isoliert und die zugehörigen Gene kloniert werden. In ihrer Aminosäuresequenz ähneln sie den homologen Faktoren von E. coli. Auch die bislang spärlichen biochemischen Untersuchungen zum Elongationszyklus zeigen eine nahe Verwandtschaft zur Translation im prokaryoten System (Cai et al. 2000). Die Proteinbiosyntheseleistung der Mitochondrien ist vergleichsweise gering und beträgt nur ein Bruchteil der Gesamtmasse der in der Zelle synthetisierten Polypeptide. Entsprechend niedrig ist die Konzentration der Proteinbiosynthese-Komponenten in den Mitochondrien. Bei vergleichbarem Volumeninhalt beträgt die Zahl der Mitoribosomen bzw. die Konzentration der tRNAs und der Translationsfaktoren nur circa 0,1–1% derjenigen einer stoffwechselaktiven Prokaryontenzelle (Cai et al. 2000). Der größte Teil der Mitoribosomen ist mit der inneren Mitochondrienmembran assoziiert. Offensichtlich erfolgt hier ein unmittelbarer Einbau der neusynthetisierten Proteine in die Membran (Liu u. Spremulli 2000). Eine der Schlüsselerkenntnisse bei der Analyse des mitochondrialen Genoms war die Entdeckung, dass Mitochondrien einen vom „universellen“ Kode abweichenden genetischen Kode verwenden (Barrell et al. 1979). In den humanen Mitochondrien wird das Kodon AUA mit Methionin statt Isoleucin „übersetzt“, UGA kodiert für Tryptophan anstatt der Terminationsfunktion im universellen Kode, und die üblicherweise für Arginin kodierenden Tripletts AGA und AGG dienen als Stoppkodons (> Tabelle 1.5.2). Schließlich werden zusätzlich zum AUG auch die Tripletts AUA und AUU (im mtGenom anderer Säuger darüber hinaus auch AUC; Wolstenholme 1992) als Initiationskodons verwendet. An internen Kodons wird AUU und AUC jedoch regel-

108

Sektion 1 · Allgemeine Grundlagen

. Tabelle 1.5.2. Genetischer Kode in Mitochondrien Kodon

„Standard Kode“

Säuger-Mitochondrien

UGA

Stop

Trp

AUA

Ile

(f-)Met

AGA, AGG

Arg

Stop

AUU, AUC

Ile

f-Met/Ile*

* Neben AUG dienen auch AUA, AUU und AUC als Initiationskodons der Translation. Interne AUU und AUC werden als Ile übersetzt.

. Abb. 1.5.5. tRNA-Struktur und Kodon/Antikodon-Erkennung in Mitochondrien. Sekundärstruktur der mitochondrialen tRNAVal mit der Antikodonsequenz UAC. Die Uridinbase an der ersten Antikodonposition interagiert mit allen vier Basen an der dritten Kodonposition und erlaubt damit eine Erkennung aller vier Kodons (GUN) für Valin („super-wobble“). Zusätzlich hervorgehoben ist das CCA-Trinukleotid am 3‘-Ende der tRNA. Die Anbindung dieses Trinukleotids erfolgt posttranskriptionell durch eine Nukleotidyltransferase

recht als Isoleucin translatiert. Die genannten Abweichungen vom universellen genetischen Kode gelten soweit als bekannt für die Mitochondrien aller Vertebraten. Im mitochondrialen Genom niederer Tiere, Einzeller, Pilze und Pflanzen finden sich jedoch auch andere Kodeabweichungen und zwischenzeitlich gibt es auch zahlreiche Beispiele für abweichende genetische Kodes im Kerngenom (Knight et al. 2001). Die Abänderung des genetischen Kodes ist eng mit der Evolution einer unkonventionellen Kodonerkennung durch die tRNAs verknüpft. Die vom humanen mitochondrialen Genom kodierten 22 tRNAs sind ausreichend für die komplette Dekodierung aller 60 translatierten Tripletts. Grundlage dafür ist, dass alle Kodons der einheitlich „übersetzten“ Kodonquartette (CUN-Leucin, GUN-Valin, UCN-Serin, CCN-Prolin, ACN-Threonin, GCN-Alanin, CGNArginin und GGN-Glycin) von einer einzigen tRNASpezies erkannt werden. Bei diesem als „super wobble“ bezeichneten Mechanismus paart eine unmodifizierte Uridinbase an erster Position in der Antikodonsequenz mit allen vier Basen an der dritten Stelle im Kodon (Barrell et al. 1980) (> Abb. 1.5.5). Bei Kodonquartetten, die für zwei unterschiedliche Aminosäuren kodieren (z. B. CAU/CAC-Histidin und CAA/CAG-Glutamin) erfolgt

offensichtlich eine Spezifizierung der „super wobble“Erkennung. Kodons mit Purinbasen an der dritten Kodonpositon werden von tRNAs mit einer Modifikation des Uridins an der ersten Antikodonpositon spezifiziert, während die mit Pyrimidinbasen endenden Kodons von tRNAs mit Guanin an der ersten Antikodonposition erkannt werden. Die mitochondrialen tRNAs zeigen einen ungewöhnlich hohen Anteil von Adenosin- und Uridinnukleotiden und sind in ihrer Struktur und Sequenz weit weniger stark konserviert als die tRNAs bei Prokaryonten und die nukleär kodierten tRNAs von Eukaryonten. Insbesondere die Größe und Sequenz der üblicherweise konservierten Loops des DHU- und des TYC-Arms ist sehr variabel. Ein extremes Beispiel ist die tRNASer(AGY), bei der der DHU-Arm durch eine kurze ungepaarte Ausfaltung ersetzt ist.

1.5.5 Replikation Die Replikation der beiden mtDNA-Stränge verläuft asynchron. Zunächst erfolgt eine Replikation des H-Stranges bis nach circa 2/3 des Molekülumfangs die Signalsequenz für die Initiation der L-Strang-Replikation freigelegt wird (Clayton 1982). Die Initiation der Replikation am OH, dem Replikationsursprung für den H-Strang im nichtkodierenden Abschnitt der mtDNA, ist eng mit dem Prozess der Transkriptionsinitiation am L-Strang-Promotor (HSP) verknüpft. Ähnlich wie bei einigen prokaryoten Replikons (z. B. ColE1, Phage T7) bilden RNA-Primer die Ausgangssubstrate für die DNASynthese bei der Replikation des H-Stranges (Chang u. Clayton 1985). Daher muss zu Beginn der Replikation zunächst ausgehend vom HSP eine RNA-Synthese initiiert werden. Die Synthese des RNA-Primers erfolgt analog der herkömmlichen Transkription unter Beteiligung des Initiationsfaktors mtTFA und der mtRNA-Polymerase (> Abb. 1.5.3). Es ist ungeklärt, inwieweit sich die Synthese von RNA-Primern (als 7S-RNA in der älteren

109 1.5 · Mitochondriale DNA des Menschen

Literatur bezeichnet) als Ausgangspunkt für die Replikation vom ordinären Transkriptionsprozess unterscheidet; ob also auch die üblichen L-Strang-Transkripte ein Substrat für die Replikationsinitiation darstellen. Kennzeichnend für den Beginn des Replikationsprozesses ist die Ausbildung eines stabilen RNA-DNA-Hybrids (R-Loop) zwischen dem neusynthetisierten RNA-Primer und dem L-Strang (> Abb. 1.5.6). Die Ausbildung des R-Loops wird durch evolutiv konservierte Sequenzabschnitte, die sog. „conserved sequence blocks“ (CSBIIII), stabilisiert (Xu u. Clayton 1996). Beim R-Loop am mitochondrialen OH (H-Strang „origin of replication“) handelt es sich jedoch nicht um eine simples RNA-DNAHybrid, sondern um eine komplexe Struktur, die den verdrängten DNA-Strang mit einbezieht und durch die erhöhte Torsionspannung des partiell entwundenen DNA-Moleküls konfiguriert wird. Der RNA-Anteil des R-Loops nimmt dabei eine Faltungsstruktur ein, die für die nachfolgende Prozessierung durch die mitochondriale RNAse MRP, einer sequenzspezifischen Endoribonuklease erforderlich ist (Lee u. Clayton 1997) (> Abb. 1.5.6) Wie bei der RNAse P handelt es sich auch bei der RNAse MRP um einen Ribonukleoprotein(RNP-)Komplex mit einem RNA- und einem Proteinanteil (Chang u. Clayton 1987). Die Funktion der RNAse MRP in den Mitochondrien besteht in der endonukleolytischen Spaltung des RNAPrimers im Bereich des R-Loops, wodurch ein Angriffspunkt für die mitochondriale DNA-Polymerase generiert wird. Noch während der Replikationssynthese wird der RNA-Primer am 5c-Ende des neusynthetisierten H-Strangs abgebaut. Die mitochondriale DNA-Synthese erfordert eine spezifische, kernkodierte Polymerase, die DNA-Polymerase J. Dieses Enzym setzt sich aus zwei Polypeptidketten zusammen, einer größeren, katalytisch aktiven Untereinheit von etwa 125–140 kDa mit DNA-Polymerase- und 3'-5'-Exonuklease-Aktivität und einer kleineren, akzessorischen E-Untereinheit (Lecrenier u. Foury 2000). Die mit der großen Untereinheit assoziierte Exonukleaseaktivität hat offensichtlich „proof reading“-Funktion, da Mäuse mit einer Mutation in dem entsprechenden Abschnitt der DNA-Polymerase eine 3- bis 5-fach erhöhte Mutationsrate der mtDNA aufweisen (Trifunovic et al. 2004) Die Initiation der DNA-Synthese am RNA-Primer gewährleistet jedoch nicht obligatorisch die vollständige Replikation des mitochondrialen Genoms. Typisch für die mtDNA bei Wirbeltieren ist das Auftreten von Molekülen mit einem partiell duplizierten H-Strang. Im Bereich benachbart zum OH bildet sich ein sog. D-Loop, eine Triplexstruktur aus den beiden Elternsträngen und einem etwa 570–650 Nukleotide langen Tochter-HStrang (7S-DNA) (> Abb. 1.5.6) Diese Struktur entsteht

1.5

durch einen frühen Replikationsstopp des H-Strangs, wobei Tochter- und Template-Strang weiter assoziiert bleiben (Clayton 1982). Die Beobachtung, dass die 7S-DNA-Moleküle einheitliche 3c-Enden aufweisen, impliziert die Beteiligung eines spezifischen Abbruchmechanismus, wobei evolutiv konservierte Sequenzmotive („termination associated sequences“, TAS) eine wichtige Rolle spielen. Die Frequenz von mtDNA-Molekülen mit D-Loops variiert zwischen Zellen und Gewebe und ist abhängig von den jeweiligen physiologischen Bedingungen. Zum Teil sind Präparationen mit einem über 75%igen Anteil an mtDNA-Molekülen mit D-Loops beschrieben (Robberson u. Clayton 1972). Ob die Ausbildung von DLoops lediglich Ausdruck eines replikationskompetenten Zustands ist, oder ob er eine regulatorische Funktion hat, ist bislang nicht geklärt. Es fehlen bislang auch schlüssige Erkenntnisse darüber, ob die im D-Loop terminierten Tochter-H-Stränge in vivo tatsächlich auch weiter verlängert werden können, oder ob für einen erfolgreichen Replikationszyklus vollständig neu synthetisierte Stränge, die der Termination an den TAS entgehen, notwendig sind. Interessanterweise konnte gezeigt werden, dass u. a. Sequenzabschnitte des D-Loops Verankerungspunkte mit der inneren Mitochondrienmembran darstellen (Jackson et al. 1996). Wie bei anderen Replikationssystemen sind bei der mitochondrialen DNA Replikation neben der DNAPolymerase J weitere akzessorische Proteine beteiligt. Dazu gehören eine DNA-Helikase zum Entwindung der DNA vor der Replikationsgabel und ein Einzelstrangbindeprotein (SSB) zur Stabilisierung der Einzelstränge (> Abb. 1.5.6) Die Replikationsgabel des H-Strangs erreicht erst nach ca. 2/3 des Molekülumfangs den Initiationsort für die Replikation des L-Strangs (ori L oder OL). Der OL umfasst einen etwa 30 Nukleotide langen Abschnitt zwischen den Genen für tRNAAsn und tRNACys. In diesem Bereich kann sich der freigelegte elterliche H-Strang in eine thermodynamisch stabile Haarnadelstruktur auffalten. Auch die Initiation der L-Strang-Replikation erfordert zunächst die Synthese eines RNA-Primers mittels einer spezifischen mtDNA-Primase. Die RNA-Synthese initiiert an einem thymidinreichen Sequenzmotiv im Loop der OL-Haarnadelstruktur und setzt sich bis zu einem konservierten Sequenzabschnitt an der Basis der Haarnadelstruktur fort (Hixson et al. 1986). An dieser Stelle erfolgt die Transition von der RNA- zur DNA-Synthese, wobei das 3c-Ende des RNA-Primers der DNA-Polymerase J als Angriffspunkt dient (Wong and Clayton 1985). Von hier aus erfolgt die weitere Elongation und Replikation des L-Stranges entsprechend der am H-Strang, nur in gegenläufiger Richtung (> Abb. 1.5.6)

110

Sektion 1 · Allgemeine Grundlagen a

b

. Abb. 1.5.6a,b. Replikation des humanen mitochondrialen Genoms. a Initiationsprozesse der H-Strang Replikation. Zunächst erfolgt ausgehend vom LSP und initiiert durch den Transkriptionsfaktor mtTFA die Synthese eines RNA-Primers (7S RNA) durch die mtRNAPolymerase. Anteile des Transkripts verbleiben am template-Strang und bilden dabei eine komplexe RNA-DNA Hybridstruktur (R-Loop) aus, die durch evolutiv konservierte Sequenzelemente (CSB1-3) stabilisiert wird. Die Ausbildung des R-Loops und die tRNA-ähnliche Rückfaltungsstruktur des freien Transkriptendes sind Voraussetzung für die endonukleolytische Spaltung des Transkripts durch die RNAse MRP. Das prozessierte 3‘-Ende des Transkripts dient dann als Ansatz-

punkt für die mtDNA-Polymerase γ und ist damit Ausgangspunkt (OH) für die DNA-Synthese bei der H-Strang-Replikation. Es kommt dabei zur Ausbildung der typischen dreisträngigen D-Loop-Struktur. Vor der Replikationsgabel müssen die elterlichen DNA-Stränge durch eine DNA-Helikase entwunden und der freigelegte elterliche HStrang durch Einzelstrangbindeproteine (SSB) fixiert werden. b Übersicht über den Replikationszyklus der humanen mtDNA. Die Replikation des DNA-Moleküls verläuft asynchron. Zunächst erfolgt die Replikation des H-Strangs, bis nach ca. 2/3 des Molekülumfangs der Replikationsursprung des L-Strangs freigelegt wird und die L-StrangReplikation initiiert (nach Clayton 1982)

111 1.5 · Mitochondriale DNA des Menschen

Noch vor Beendigung der L-Strang-Replikation werden die beiden Tochter-mtDNA-Moleküle voneinander getrennt, und die verbleibende Lücke im neusynthetisierten L-Strang wird rasch aufgefüllt. Die RNA-Primer an den 5'-Enden der neusynthetisierten Tochterstränge werden abgebaut und die Enden durch eine DNA-Ligase geschlossen. Schließlich werden die vollständig replizierten Tochter-mtDNA-Moleküle durch eine Topoisomerase in ihre übliche „Supercoil“-Struktur aufgedrillt, wobei jedes Molekül ca. 100 negativ superhelikale Windungen erhält (Clayton 1982). Zusätzlich und koexistent zum oben beschriebenen Mechanismus der asymmetrischen Replikation wird die Existenz eines konventionellen, für beide Stränge synchronen Replikationsmechanismus, ausgehend vom OH, diskutiert (Holt et al. 2000). Anders als im Kern gibt es keinen spezifischen Mechanismus, der dafür sorgt, dass die mtDNA-Moleküle bei einer Teilung bzw. Aufspaltung des mitochondrialen Retikulums regelrecht auf die Tochtermitochondrien verteilt werden. Die mtDNA ist jedoch innerhalb der Mitochondrien nicht frei verteilt. Mikroskopische Beobachtungen zeigen vielmehr, dass die mtDNA mit Proteinen assoziiert und in Form von distinkten Nukleoidkomplexen vorliegt. Einzelne Nukleoide bestehen aus 2–8 mtDNA-Molekülen und beinhalten u. a. einen hohen Anteil an mtTFA und der Helikase, sodass man annimmt, dass diese Proteine neben ihrer Aufgabe bei der Transkription und der Replikation auch eine Strukturfunktion im Sinne einer Dekorierung und der Verpackung der mtDNA haben. Die Nukleoide zeigen eine gewisse Mobilität, sodass es bei der Fusion von Zellen mit distinkten Mitochondrien zu einer langsamen, gegenseitigen Durchmischung innerhalb des mitochondrialen Retikulums kommt (Legros et al. 2004). Die bisherige Vorstellung von einer Teilung eines Mitochondriums in zwei Tochterorganellen muss dahingehend korrigiert werden, dass das mitochondriale Retikulum einem ständigen dynamischen Prozess von Fusion und Aufspaltung unterliegt (Chen u. Chan 2005). Eine intensive Vermehrung von Mitochondrien und die korrelierte hohe Replikationsrate der mtDNA beobachtet man insbesondere in Perioden aktiver Zellteilung, bei Ausdauertraining, elektrischer Muskelstimulierung und bestimmter Hormonstimulation. Dabei sind die Prozesse der Replikation und Transkription des mitochondrialen Genoms und die Expression kernkodierter Mitochondrienproteine eng miteinander verkoppelt. So aktivieren die nukleären Transkriptionsaktiviatoren NRF-1 und NRF-2 sowohl die Gene für kernkodierte Bestandteile der Atmungskettenkomplexe, als auch die Gene für mtTFA und den RNA-Anteil der RNase MRP (Virbasius u. Scarpulla 1994). Die Bedeutung dieser nukleären Faktoren für die Replikation und damit letztlich

1.5

den Erhalt der mtDNA wird durch „Knockout“-Experimente an Mäusen unterstrichen. Sowohl die gezielte Ausschaltung des NRF1-Gens, als auch die des mtTFAGens führt im homozygoten Zustand zu einem drastischen Verlust an mtDNA und zum frühen Absterben der Embryonen (Huo et al. 2001; Larsson et al. 1998).

1.5.6 Mitochondriale Vererbung Die mitochondriale DNA und die damit verbundenen Merkmale werden bei Säugern grundsätzlich rein mütterlich (maternal) vererbt (Giles et al. 1980; Birky 1995) (> Abb. 1.5.7). Während manche Populationsgenetiker aus der Beobachtung mutmaßlich rekombinanter mtDNA seit längerem zumindest einen seltenen väterlichen (paternalen) Beitrag zur mitochondrialen Erblinie fordern, gibt es bislang beim Menschen nur einen einzigen belegbaren Fall einer paternalen mtDNA-Transmission (Schwartz u. Vissing 2002). Ausschlaggebend für die maternale Vererbung ist das große Plasmavolumen und die darin enthaltenen Mitochondrien der Eizelle (ca. 100.000) gegenüber der Spermazelle (etwa 100) und effektive physikalische und biochemische Barrieren, die das Eindringen und den Verbleib väterlicher Mitochondrien weitestgehend ausschließen. Bei der Befruchtung dringen das Mittelteil und der Schanz des Spermiums mit den darin enthaltenen Mitochondrien zwar häufig in die Eizelle ein, jedoch ist die mtDNA dieser Mitochondrien geschädigt und wird zudem aktiv abgebaut (Nishimura et al. 2006). Mutationen in der mitochondrialen DNA führen zu einem gemischterbigen Genotyp, der als Heteroplasmie bezeichnet wird und der Homoplasmie (Reinerbigkeit) gegenübergestellt wird. Da sowohl die Verteilung der mtDNA-Moleküle bei der Teilung der Mitochondrien, als auch die Aufteilung der Mitochondrien bei der Zellteilung weitgehend ungeregelt erfolgt, tritt Heteroplasmie in jedwedem graduiertem Verhältnis auf. Ausgeprägte Schwankungen im Heteroplasmiegrad lassen sich bereits zwischen verschiedenen Geweben eines Individuums feststellen (mitotische Segregation) (Howell et al. 1994; Matthews et al. 1994). Neuere Untersuchungen bei heteroplasmatischen Mäusen zeigen für einige Gewebe eine rein zufällige Segregation, für andere jedoch eine altersabhängige Selektion bestimmter mtDNA-Genotypen (Jenuth et al. 1997). Betrachtet man in diesem Zusammenhang jedoch die vergleichsweise geringe Zahl an Zellteilungen in der mütterlichen Keimbahn, so überrascht, dass auch zwischen Geschwistern große Unterschiede im Heteroplasmiegrad beobachtet werden und in der Generationsfolge heteroplasmatische Genotypen rasch in Reinerbigkeit

112

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.5.7. Maternale Vererbung und Anwendung der mtDNAAnalyse für forensische Fragestellungen. Dargestellt sind Teile des Stammbaums der Zarenfamilie mit farblicher Kennzeichnung der beiden maternalen Erblinien. Durch forensische Vergleichsanalysen der mtDNA zwischen Knochenfunden aus einem Massengrab in der Nähe von Jekatarinenburg und Proben von Familienmitgliedern der

beiden maternalen Erblinien (mit Pfeilen gekennzeichnet) konnte die Identität der sterblichen Überreste der Zarenfamilie bewiesen werden. Eine beim Zar Nikolaus vorhandene Heteroplasmie an einer Nukleotidposition der mtDNA (*) zeigte sich auch bei der Untersuchung der mtDNA seines Bruders Georgij, nicht jedoch bei den weiter entfernt verwandten Familienmitgliedern

übergehen. In Anlehnung an populationsgenetische Modelle ist daher die sog. „Bottleneck“-Hypothese zur Erklärung dieses Phänomens aufgestellt worden (Ashley et al. 1989). Danach beruht die rasche Entmischung heteroplasmatischer Genotypen auf einem Prozess, der dafür sorgt, dass nur eine geringe Zahl an mtDNA-Molekülen effektiv zur mtDNA-Population in der Nachkommenschaft beiträgt. Eine solche Einengung („bottleneck“) der effektiven mtDNA-Population erklärt den beobachtbaren genetischen Drift im relativen Verhältnis zweier mtDNA-Populationen. In einem eleganten Ansatz konnten Shoubridge et al. durch Untersuchungen an heteroplasmatischen Mäusen den „bottleneck“ dem Stadium der primordialen weiblichen Keimzellen mit einer effektiven mtDNA-Population von lediglich etwa 200 Molekülen zuordnen (Jenuth et al. 1996). Der „bottleneck“ bei der Weitergabe der mtDNA von einer Generation zur nächsten ist daneben aber auch von immenser Bedeutung für die Evolution der mtDNA. Im Vergleich zum nukleären Genen zeigt die mitochondriale DNA eine etwa 10-fach erhöhte Divergenzrate, d. h., die mtDNA evolviert rascher als das Kerngenom. Ein Grund dafür ist die wesentlich höhere Mutationsrate (Khrapko et al. 1997), die durch die Exposition der mtDNA mit mutagenen Sauerstoffderivaten und ineffizienten DNA-Reparaturmechanismen begründet wird (Shadel u. Clayton 1997). Tritt aber eine Mutation auf, so kann sie sich bei einer großen effektiven Ausgangspopu-

lation an mtDNA-Molekülen nur schwer etablieren und nur über sehr lange Zeiträume in der Population „durchsetzen“. Ist die effektive Ausgangspopulation aber klein – wie beim „bottleneck“ –, so kann eine Mutation durch den genetischen Drift sehr schnell akkumulieren. Der „bottleneck“ begünstigt daher die Fixierung neuer mtDNA-Mutationen in der Keimbahn und trägt wesentlich zur hohen Diversität und raschen Evolution der mtDNA bei (Howell et al. 1996). Die meisten Experten betrachten die mitochondriale Vererbung als rein asexuellen Prozess mit einer ausschließlich klonalen Weitergabe der mtDNA in strikt getrennten Erblinien. Über längere Zeiträume kommt es in solchen rein klonalen Erblinien jedoch zur Anreicherung nachteiliger Mutationen. Dieser fortschreitende genetische Degenerationsprozess wird nach der erstmalig von Hermann Muller theoretisch begründeten Formulierung als „Muller’s ratchet“ bezeichnet (Muller 1964). Es scheint jedoch so, als ob die Mitochondrien Strategien entwickelt hätten, „Muller’s ratchet“ zu blockieren oder zumindest zu verlangsamen. Allein schon die geringe Größe des mitochondrialen Genoms verringert bereits die Zahl potenzieller Mutationen. Von großer Bedeutung ist aber wohl auch der „bottleneck“ bei der Weitergabe der mtDNA von einer zur nächsten Generation. Durch den damit verbundenen genetischen Drift werden Neumutationen rasch exponiert und können im Fall nachteiliger Eigenschaften durch Selektion

113 1.5 · Mitochondriale DNA des Menschen

besser eliminiert werden (Hoekstra 2000). Eine andere, attraktive Lösung des Problems böte sich durch Rekombination, entweder zwischen mtDNA-Molekülen einer Erblinie (z. B. bei Heteroplasmie) oder durch den Eintrag paternaler mtDNA-Moleküle in die Eizelle bei der Befruchtung. In-vitro-Experimente mit mitochondrialen Lysaten hatten gezeigt, dass die für eine Rekombination notwendigen Enzymaktivitäten in den Mitochondrien durchaus vorhanden sind (Thyagarajan et al. 1996), dennoch war diese Frage lange Zeit heftig umstritten. Zwischenzeitlich gibt es jedoch einige sehr sorgfältige Studien, sowohl im experimentellen System als auch in vivo, die eindeutig eine wenn auch seltene Rekombination der mtDNA belegen (Sato et al. 2005; Zsurka et al. 2005).

1.5.7 Mitochondriale Erkrankungen Eine Übersicht über das menschliche mitochondriale Genom und den genetischen Apparat der Mitochondrien wäre unvollständig, ohne zumindest kurz auf dessen medizinische Bedeutung einzugehen. Für eine ausführliche Abhandlung dieser Thematik sei auf eine Reihe ausführlicher Übersichtsarbeiten verwiesen: Howell (1999) und Schon (2000).

1.5

Mutationen im mitochondrialen Genom sind für eine Reihe z. T. sehr schwerwiegender Erkrankungen (Mitochondriopathien) verantwortlich (> Tabelle 1.5.3; für eine komplette Übersicht, 7 MITOMAP-Datenbank: http://www.mitomap.org/). Schätzungen für Großbritannien gehen von einer Gesamtprävalenz pathogener mtDNA-Mutationen in der Größenordnung von 1:8.000 aus (Chinnery et al. 2000). Deletionen und/oder partielle Duplikationen der mtDNA sind die Ursache für spezifische Krankheitsbilder, wie das Kearns-Sayre-Syndrom (KSS, Multisystemerkrankung), die mildere progressive externe Ophthalmoplegie (PEO, Myopathie der äußeren Augenmuskulatur) und das Pearson-Syndrom (Erkrankung des Knochenmarks und der Bauchspeicheldrüse). Die Erkrankungen treten immer sporadisch auf, was für einen somatischen Ursprung der Deletionen spricht. Es sind Dutzende verschiedener Deletionen beschrieben. Sie variieren in ihrer Ausdehnung zwischen 1 und 10 kb und erfolgen zumeist zwischen kurzen Sequenzwiederholungen der mtDNA. Die häufigste Deletion (common deletion) betrifft einen 4977-bp-Abschnitt zwischen dem ATP8-und dem ND5-Gen. MtDNA-Deletionen liegen immer heteroplasmatisch vor und sind häufig mit partiellen mtDNA-Duplikationen assoziiert. Dutzende mutmaßlich pathogene Punktmutationen der mtDNA sind in den letzten Jahren beschrieben wor-

. Tabelle 1.5.3. Die wichtigsten pathogenen mtDNA-Mutationen Mutation (Nukleotidaustausch)

Gen (Proteinveränderung)

Homo./ Heteroplasmie

Erkrankung*

Deletionen (1–10kb)

diverse

het.

Kearns-Sayre-Syndrom, Pearson-Syndrom, PEO

1555A:G

12S-rRNA

hom.

Taubheit

3243A:G

tRNALeu(UUR)

het.

MELAS / DMDF

3260A:G

tRNA

Leu(UUR)

het.

MMC

3271T:C

tRNA

Leu(UUR)

het.

MELAS

3302A:G

tRNALeu(UUR)

het.

Myopathie

8344A:G

tRNALys

het.

MERRF / MELAS

Lys

het.

MERRF

8356T:C

tRNA

8993T:G

ATP6 (Leu156Arg)

het.

M. Leigh / NARP

8993T:G

ATP6 (Leu156Pro)

het.

M. Leigh / NARP

3460G:A

ND1 (Ala52Thr)

hom./het.

LHON

11778G:A

ND4 (Arg340His)

hom./het.

LHON

14484T:C

ND6 (Met64Val)

hom./het.

LHON

* PEO – Progressive External Ophthalmoplegia; MELAS – Mitochondrial Encephalopathy, Lactic Acidosis and Stroke-like Episodes; DMDF – Diabetes mellitus and Deafness; MMC – Maternal Myopathy and Cardiomyopathy; MERRF – Myoclonic Epilepsy and Ragged-Red Fibers; NARP – Sensory Neuropathy, Ataxia and Retinitis pigmentosa; LHON – Lebers hereditary Optic Neuropathy.

114

Sektion 1 · Allgemeine Grundlagen

den. Dabei ist aufgrund der interindividuellen Sequenzvariablität der mtDNA die Bewertung einer Mutation als pathogen oftmals schwierig, gerade wenn es sich um Einzelbeobachtungen handelt. Anders als bei den sporadisch auftretenden Deletionen kann man bei den Punktmutationen häufig den mütterlichen Erbgang erkennen. Der Grad der Erblichkeit hängt jedoch davon abhängt, ob Heteroplasmie oder Homoplasmie für die Mutation vorliegt. Die meisten der bekannten Punktmutationen betreffen die Gene für die mitochondrialen tRNAs, wobei in diesen Fällen immer Heteroplasmie vorliegt. Klassische Beispiele für solche tRNA-Mutationen sind das MERRF-Syndrom („myoclonic epilepsy and ragged-red fibers“), verursacht durch Mutationen im tRNALys-Gen, und das MELAS-Syndrom („mitochondrial encephalopathy, lactic acidosis and stroke-like episodes“) mit Mutationen insbesondere im Gen für die tRNALeu(UUR). Andere häufige mit tRNA-Mutationen assoziierte Krankheitsbilder und Symptome sind Myopathien (Skelettmuskelmyopathien, Kardiomyopathien, PEO), Enzephalopathien, Diabetes mellitus und Taubheit. Dabei sind das klinische Bild und die Ausprägung der Einzelsymptome in starkem Maß vom Heteroplasmiegrad in den verschiedenen Geweben abhängig. So findet man beispielsweise ein und dieselbe Mutation (3243A:G) im Gen für die tRNALeu(UUR) sowohl bei MELAS-Patienten, als auch bei Fällen von PEO oder Diabetes mellitus plus Taubheit. Sehr spezifisch dagegen ist die klinische Ausprägung der 1555A:G Mutationen im Gen für die 12S-rRNA in Form einer Schwerhörigkeit. Das Spektrum der Punktmutationen in den proteinkodierenden Genen des mt-Genoms ist vergleichsweise gering. Neben sporadischen Einzelfällen mit Mutationen im CYB- bzw. den CO-Genen gibt es drei klassische Krankheitsbilder, die durch „missense“-Mutationen in proteinkodierenden Genen verursacht werden. Die maternal vererbte Form des Morbus Leigh ist eine meist tödlich verlaufende, neurodegenerative Erkrankung der Basalganglien und des Stammhirns, die durch die Mutationen 8993T:G (Leu156Arg) oder 8993T:C (Leu156Pro) im ATP6-Gen verursacht wird. Die Mutationen liegen dabei heteroplasmatisch vor und Leigh-Patienten zeigen einen sehr hohen Anteil (>90%) mutierter mtDNA. Interessanterweise führen die gleichen Mutationen bei geringerem Anteil mutierter mtDNA-Moleküle (70–90%) zu einem gänzlich anderem Krankheitsbild, dem NARPSyndrom (Neuropathy, Ataxia and Retinitis pigmentosa), welches durch axonale Neuropathie, Gleichgewichtstörungen und Netzhautdegeneration gekennzeichnet ist. Weitaus häufiger als der Morbus Leigh oder das NARP-Syndrom tritt die Lebersche hereditäre Optikusneuropathie (LHON) auf. LHON ist eine spezifische Erkrankung des Sehnervs, die mit einem hochgradigen Verlust des Sehvermögens einhergeht. Typisch für

LHON ist das Auftreten einer Punktmutation im ND1(3460G:A; Ala52Thr), ND4- (11778G:A; Arg340His) oder ND6-Gen (14484T:C; Met64Val). Im Gegensatz zu anderen mtDNA-Mutationen findet man bei LHON-Patienten überwiegend eine Homoplasmie für die jeweilige Mutation, die sich auch über viele Generationen hinweg zeigen lässt. Die Bedeutung von mtDNA-Mutation bei neurodegenerativen Erkrankungen des Alters wie der ParkinsonErkrankung und der Alzheimer-Erkrankung ist eine seit längerer Zeit diskutierte Frage (Howell 1999). Manche Autoren mutmaßen, dass möglicherweise das Zusammenwirken verschiedener Sequenzvarianten in der mtDNA bzw. spezifische mtDNA-Haplotypen ein erhöhtes erbliches Risiko für diese Erkrankungen mit sich bringen (Shoffner et al. 1993). Neuere Untersuchungen zeigen andererseits eine sehr ausgeprägte und spezifische Akkumulation somatischer mtDNA-Mutationen in der Substantia nigra von Parkinson-Patienten, die begleitet ist von einer deutlich erhöhten Zahl cytochromoxidasenegativer, d. h. atmungskettendefizienter Neuronen (Bender et al. 2005). Manche Forscher leiten aus diesen Ergebnissen bereits ein grundlegendes Prinzip für den Alterungsprozess im Allgemeinen ab. Unbestritten ist dabei, dass die mtDNA aufgrund des hohen Sauerstoffumsatzes bei der oxidativen Phosphorylierung in den Mitochondrien ständig hohen Konzentrationen an reaktiven Sauerstoffderivaten (Peroxid, Sauerstoff- und Superoxidradikalen) mit hohem mutagenem Potential ausgesetzt ist. In der Tat ist der Anteil oxidierter Basen in der mtDNA etwa 16-mal höher als in der nukleären DNA (Richter 1994). Leider ist der Nachweis einer unterschwelligen, ungerichteten Akkumulation von somatischen Punktmutationen technisch schwierig und Teil der Kontroverse über Ergebnisse, die eine altersabhängige Anreicherung von mtDNA-Deletionen oder Mutationen in der Promotorregion der mtDNA zeigen (Corral-Debrinski et al. 1992; Michikawa et al. 1999; Chinnery et al. 2001). Neuen Schub für eine Beteiligung der mtDNA an Alterungsprozessen liefern zwei unabhängige Untersuchungen an Mausmutanten mit einer Mutation in der Exonukleasedomäne der mitochondrialen DNA-Polymerase J. Der damit verursachte Verlust der „proofreading“-Aktivität des Enzyms führt zu einer deutlich erhöhten Mutationsrate in der mtDNA. Solche Mäuse zeigen eindeutige Merkmale vorzeitigen Alterns (Progeria) und sterben weitaus früher als Kontrolltiere (Trifunovic et al. 2004; Kujoth et al. 2005). Von der als „mtDNA-mutator“-Maus bezeichneten Mutante erhofft man sich auch Fortschritte für die weitere Erforschung mitochondrialer Erkrankungen, der es bisher an der Verfügbarkeit geeigneter Tiermodelle mangelte. Bis dato stand hier lediglich ein Mausmodell mit einer in der Keimbahn vererbten, hete-

115 1.5 · Mitochondriale DNA des Menschen

roplasmatischen mtDNA-Deletion auf der Habenseite (Inoue et al. 2000).

1.5.8 mtDNA als molekularer Marker Die mtDNA wird sehr häufig als Marker bei forensischen Untersuchungen und für phylogenetische Fragestellungen angewendet. Die wesentlichen Gründe dafür sind die im Vergleich zur nukleären DNA hohe Kopienzahl der mtDNA in biologischen Proben, die hohe interindividuelle Sequenzvariabilität und die klonale Weitergabe der mtDNA. Letzteres ist beispielsweise dann wichtig, wenn die Identität bzw. die Verwandtschaft einer Person geklärt werden soll, für die nur Vergleichsproben von entfernten Familienmitgliedern zur Verfügung stehen. Ein Paradebeispiel dafür und generell für den Wert der mtDNA-Analyse in der Forensik ist die Identifizierung der sterblichen Überreste der letzten Zarenfamilie. Soweit aus Aufzeichnungen und Zeugenaussagen bekannt, wurde die Zarenfamilie in der Nacht vom 16. auf den 17. Juli 1918 im Keller des Ipatijev-Hauses in Jekatarinenburg von bolschewikischen Revolutionären erschossen. Danach wurden die Leichen fortgeschafft und in einer Grube am Straßenrand verscharrt. Im Jahr 1991 wurde von zwei russischen Amateurhistorikern 30 Kilometer von Jekatarinenburg entfernt ein Massengrab mit 9 Skeletten, darunter vermeintlich auch die der Zarenfamilie, entdeckt. Für die forensische Untersuchung wurde mtDNA aus den Knochenresten extrahiert und ein Sequenzvergleich mit der mtDNA von lebenden Verwandten der mütterlichen Erblinien durchgeführt (> Abb. 1.5.7). Dabei konnte mit großer Sicherheit die Identität der Funde als die sterblichen Überreste von Zar Nicholas II, der Zarin Katharina und drei ihrer Töchter bestimmt werden (Gill et al. 1994). Die zunächst aufgekommene Unsicherheit über die Identität des Zaren aufgrund einer Heteroplasmie im untersuchten mtDNAAbschnitt konnte durch deren Bestätigung an Proben des exhumierten Bruders des Zaren, Georgij, ausgeräumt werden (Ivanov et al. 1996). Durch die klonale Weitergabe der mtDNA in der mütterlichen Linie lassen sich insbesondere auch Rückschlüsse auf die Populationsgeschichte und die Herkunft des modernen Menschen ziehen. Grundlage dafür ist die Sequenzvariabilität der mtDNA innerhalb und zwischen Populationen, Volksstämmen oder Sprachgruppen. Die gefundenen mtDNA-Haplotypen können in einen „Stammbaum“ integriert werden („maximum parsimony analysis“), mit dem versucht wird, die Entstehung und Entwicklung der rezenten Haplotypen aus einer gemeinsamen Wurzel zu strukturieren. Aufsehen erregt hat hier insbesondere eine Studie von Cann, Vigilant et al. über den Ursprung und die Herkunft der

1.5

mütterlichen Erblinie. Sie kamen aufgrund einer vergleichenden Untersuchungen der mtDNA von 134 verschiedenen Individuen verschiedener Rassen und geographischer Herkunft zu dem Schluss, dass alle rezenten mtDNA-Haplotypen auf einen gemeinsame Wurzel (Stammmutter, „Eva“) in Afrika zurückgeführt werden können (Cann et al. 1987, Vigilant et al. 1991). Auch wenn diese „Out-of-Africa“-Hypothese aufgrund der fossilen Belege weitgehend unstrittig ist, so hat doch die Datierung dieser Stammmutter auf etwa 200.000 Jahre vor unserer Zeit für sehr viele kontroverse Diskussionen gesorgt. Der Streit entzündet sich darüber, ob und inwieweit Homo erectus, der bereits vor ca. 1 Mio. Jahren aus Afrika kommend weite Gebiete Europas und Asiens besiedelt hat, zur Evolution des modernen Menschen außerhalb Afrikas beigetragen hat. Oder ist er durch eine zweite Einwanderungswelle vor ca. 50.000–100.000 Jahren vollständig vom Homo sapiens verdrängt worden ist. Letztere Hypothese wird durch die Untersuchung der mtDNA aus Knochenfunden des Neandertalers gestützt, bei der Abweichungen im Vergleich mit der mtDNASequenz des modernen Menschen gefunden wurden (Krings et al. 1997). Dies deutet darauf hin, dass der von der frühen Homo erectus-Besiedlung abstammende Neandertaler zwar eine Zeit lang neben dem neu eingewanderten Homo sapiens in Europa gelebt hat, es aber offensichtlich zu keiner merklichen Vermischung zwischen beiden Spezies gekommen ist, zumindest nicht in der mütterlichen Erblinie. Nach Ansicht von Brian Sykes, Professor für Humangenetik an der Universität Oxford, lassen sich 95% der Europäer aufgrund der mtDNA-Sequenz sogar auf eine von sieben europäischen Stammmüttern zurückverfolgen. Geschäftstüchtig und öffentlichkeitswirksam wie er ist, hat Brian Sykes darüber nicht nur ein populärwissenschaftliches Buch geschrieben (Die sieben Töchter Evas, Luebbe Verlag, 2001), sondern auch eine Firma gegründet, bei der man seine Abstammung von Ursula, Xenia, Helena, Velda, Tara, Katrine oder Jasmine (so nennt er die sieben Stammmütter) feststellen lassen kann. Neuerdings kann man auch prüfen lassen, ob man von Dschingis Khan abstammt. Aber das ist eine andere Geschichte … Wie auch immer man solchen „Anwendungen“ gegenübersteht, so ist doch bemerkenswert, dass unser heutiges Bild vom Ursprung des modernen Menschen, von seiner Besiedlung der Kontinente und der Herkunft von Volks- und Sprachgruppen insbesondere durch die Ergebnisse der mtDNA-Analysen geprägt ist.

116

Sektion 1 · Allgemeine Grundlagen

1.5.9 Literatur Altman S, Baer M, Guerrier-Takada C, Vioque A (1986) Enzymatic cleavage of RNA by RNA. Trends Biochem Sci 11: 515–518 Anderson S, Bankier AT, Barrell BG, de Bruijn MHL, Coulson AR, Drouin J, Eperon IC, Nierlich DP, Roe BA, Sanger F, Schreier PH, Smith AJH, Staden R, Young IG (1981) Sequence and organization of the human mitochondrial genome. Nature 290: 457–465 Ashley MV, Laipis PJ, Hauswirth WW (1989) Rapid segregation of heteroplasmic bovine mitochondria. Nucleic Acids Res 17: 7325–7331 Attardi G (1985) Animal mitochondrial DNA: an extreme example of genetic economy. Int Rev Cytol 93: 93–145 Barrell BG, Bankier AT, Drouin J (1979) A different genetic code in human mitochondria. Nature 282: 189–194 Barrell BG, Anderson S, Bankier AT, de Bruijn MH, Chen E, Coulson AR, Drouin J, Eperon IC, Nierlich DP, Roe BA, Sanger F, Schreier PH, Smith AJ, Staden R, Young IG (1980) Different pattern of codon recognition by mammalian mitochondrial tRNAs. Proc Natl Acad Sci USA 77 : 3164–3166 Bender A, Krishnan KJ, Morris CM, Taylor GA, Reeve AK, Perry RH, Jaros E, Hersheson JS, Betts J, Klopstock T, Taylor RW, Turnbull DM (2005) High levels of mitochondrial DNA deletions in substantia nigra neurons in aging and Parkinson disease. Nat Genet 38: 515–517 Birky CW (1995) Uniparental inheritance of mitochondiral and chloroplast genes: mechanisms and evolution. Proc Natl Acad Sci USA 92: 11331–11338 Cai YC, Bullard JM, Thompson NL, Spremulli LL (2000) Interaction of mitochondrial elongation factor Tu with aminoacyl-tRNA and elongation factor Ts. J Biol Chem 275: 20308–20314 Cann RL, Stoneking M, Wilson AC (1987) Mitochondrial DNA and human evolution. Nature 325: 31–36 Chang DD, Clayton DA (1985) Priming of human mitochondrial DNA replication occurs at the light-strand promotor. Proc Natl Acad Sci USA 82: 351–355 Chang DD, Clayton DA (1987b) A mammalian mitochondrial RNA processing activity contains nuclear-encoded RNA. Science 235: 1178–1184 Chen H, Chan DC (2005) Emerging functions of mammalian mitochondrial fusion and fission. Hum Mol Genet 14: R283–289 Chinnery PF, Johnson MA, Wardell TM, Singh-Kler R, Hayes C, Brown DT, Taylor RW, Bindoff LA, Turnbull DM (2000) Epidemiology of pathogenic mitochondrial DNA mutations. Ann Neurol 48: 188–193 Chinnery PF, Taylor GA, Howell N, Brown DT, Parsons TJ, Turnbull DM (2001) Point mutations of the mtDNA control region in normal and neurodegenerative human brains. Am J Hum Genet 68: 529–532 Clayton DA (1982) Replication of animal mitochondrial DNA. Cell 28: 693–705 Corral-Debrinski M, Horton T, Lott MT, Shoffner JM, Beal MF, Wallace DC (1992) Mitochondrial DNA deletions in human brain: regional variability and increase with advanced age. Nat Genet 2: 324–329 Falkenberg M, Gaspari M, Rantanen A., Trifunovic A, Larsson NG, Gustafsson CM (2002) Mitochndrial transcription factors B1 and B2 activate transcription of human mtDNA. Nat Genet 31: 289–294 Fisher RP, Lisowsky T, Parisi MA, Clayton DA (1992) DNA wrapping and bending by a mitochondrial migh mobility group-like transcriptional activator protein. J Biol Chem 267: 3358–3367 Gelfand R and Attardi G (1981) Synthesis and turnover of mitochondrial ribonucleic acids in HeLa cells: the mature ribosomal and

messenger ribonucleic acid species are metabolically unstable. Mol Cell Biol 1: 497–511 Giles RE, Blanc H, Cann HM, Wallace DC (1980) Maternal inheritance of human mitochondrial DNA. Proc Natl Acad Sci USA 77: 6715–6719 Gill P, Ivanov PL, Kimpton C, Piercy R, Benson N, Tully G, Evett I, Hagelberg E, Sullivan K (1994) Identification of the remains of the Romanov family by DNA analysis. Nature Genet 6: 130–135 Gray MW, Burger G, Lang BF (1999) Mitochondrial evolution. Science 283: 1476–1481 Hixson JE, Wong TW, Clayton DA (1986) Both the conserved stemloop abd divergent 5‘-flanking sequences are required for initiation at the human mitochondrial origin of light-strand DNA replication. J Biol Chem 261: 2384–2390 Hoekstra RF (2000) Evolutionary origin and consequences of uniparental mitochondrial inheritance. Hum Reprod 15 (Suppl. 2): 102–111 Holt IJ, Lorimer HE, Jacobs HT (2000) Coupled leading- and lagging strand synthesis of mammalian mitochondrial DNA. Cell 100: 515–524 Howell N (1999) Human mitochondrial disease: answering questions and questioning answers. Int Rev Cyt 186: 49–116 Howell N, Kubacka I, Mackey DA (1996) How rapidly does the human mitochondrial genome evolve ? Am J Hum Genet 59: 501–509 Howell N, Xu M, Halvorson S, Bodis-Wollner I, Sherman J (1994) A heteroplasmic LHON family: tissue distribution and transmission of the 11778 mutation. Am J Hum Genet 55: 203–206 Huo L, Scarpulla RC (2001) Mitochondrial DNA instability and periimplantation lethality associated with targeted disruption of nuclear respiratory factor 1 in mice. Mol Cell Biol 21: 644–654 Inoue K, Nakada K, Ogure A, Isobe K, Goto Y, Nonaka I, Hayashi JI (2000) Generation of mice with mitochondrial dysfunction by introducing mouse mtDNA carrying a deletion into zygotes. Nat Genet 26: 176–181 Ivanov PL, Wadhams MJ, Roby RK, Holland MM, Weedn VW, Parsons TJ (1996) Mitochondrial DNA sequence heteroplasmy in the Grand Duke of Russia Georgij Romanov establishes the authenticity of the remains of Tsar Nicholas II. Nat Genet 12: 417–420 Jackson DA, Bartlett J, Cook PR (1996) Sequences attaching loops of nuclear and mitochondrial DNA to underlying structures in human cells: the role of transcription units. Nucleic Acids Res 24: 1212–1219 Jenuth JP, Peterson AC, Fu K, Shoubridge EA (1996) Random genetic drift in the female germline explains the rapid segregation of mammalian mitochondrial DNA. Nat Genet 14: 146– 151 Jenuth JP, Peterson AC, Shoubridge EA (1997) Tissue-specific selection for different mtDNA genotypes in heteroplasmic mice. Nat Genet 16: 93–95 Khrapko K, Collier HA, Andre PC, Li, XC, Hanekamp JS, Thilly W (1997) Mitochondrial mutation spectra in human cells and tissues. Proc Natl Acad Sci USA 94: 13798–1380 Knight RD, Freeland SJ, Landweber L (2001) Rewiring the keyboard: evolvability of the genetic code. Nature Rev 2: 49–58 Kolesnikova OA, Entelis NS, Jacquin-Becker C, Goltzene F, Chrzanowska-Lightowlers ZM, Lightowlers RN, Martin RP, Tarassov I (2004) Nuclear DNA-encoded tRNAs targeted into mitochondria can rescue a mitochondrial DNA mutation associated with the MERRF syndrome in cultured human cells. Hum Mol Genet 13: 2519–2534 Krings M, Stone A, Schmitz RW, Krainitzki H, Stoneking M, Pääbo S (1997) Neandertal DNA sequences and the origin of modern humans. Cell 90: 19–30

117 1.5 · Mitochondriale DNA des Menschen Kruse B, Narasimhan N, Attardi G (1989) Termination of transcription in human mitochondria: identification and purification of a DNA binding protein factor that promotes termination. Cell 58: 391–397 Kujoth GC, Hiona A, Pugh TD, Someya S, Panzer K, Wohlgemuth SE, Hofer T, Seo AY, Sullivan R, Jobling WA, Morrow JD, Van Remmen H, Sedivy JM, Yamasoba T, Tanokura M, Weindruch R, Leeuwenburgh C, Prolla TA (2005) Mitochondrial DNA mutations, oxidative stress, and apoptosis in mammalian aging. Science 309: 481–484 Lang BF, Burger G, O‘Kelly CJ, Cedergren R, Golding GB, Lemieux C, Sankoff D, Turmel M, Gray MW (1997) An ancestral mitochondrial DNA resembling an eubacterial genome in miniature. Nature 387: 493–497 Larsson NG, Wang J, Wilhelmsson H, Oldfors A, Rustin P, Lewandoski M, Barsh GS, Clayton DA (1998) Mitochondrial transcription factor A is necessary for mtDNA maintenance and embryogenesis in mice. Nat Genet 18: 231–236 Lecrenier N, Foury F (2000) New features of mitochondrial DNA replication system in yeast and man. Gene 246: 37–48 Lee DY, Clayton DA (1997) RNAse mitochondrial RNA processing correctly cleaves a novel R loop at the mitochondrial DNA leading-strand origin of replication. Genes Develop 11: 582–592 Legros F, Malka F, Frachon P, Lombes A, Rojo M (2004) Organization and dynamics of human mitochondrial DNA. J Cell Sci 117: 2653–2662 Liu M and Spremulli L (2000) Interaction of mammalian mitochondrial ribosomes with the inner membrane. J Biol Chem 275: 29400–29406 Manella CA (2006) The relevance of mitochondrial membrane topology to mitochondrial function. Biochim Biophys Acta 1762: 140–147 Margulis, L (1981) Symbiosis in cell evolution. Freeman, San Francisco Martin M, Cho J, Cesare AJ, Griffith JD, Attardi G (2005) Termination factor mediated DNA loop between termination and initiation sites drives mitochondrial rRNA synthesis. Cell 123: 1227–1240 Matthews PM, Hopkin J, Brown R, Stephenson J, Hilton-Jones D, Brown GK (1994) Comparison of the relative levels of the 3243 AoG mtDNA mutation in heteroplasmic adult and fetal tissues. J Med Genet 31: 41–44 Michikawa Y, Mazzucchelli F, Bresolin N, Scarlato G, Attardi G (1999) Aging-dependent accumulation of point mutations in the human mtDNA control region for replication. Science 286: 774–779 Montoya J, Gaines GL, Attardi G (1983) The pattern of transcription of the human mitochondrial rRNA genes reveals two overlapping transcription units. Cell 34: 151–159 Muller HJ (1964) The relation of recombination to mutational advance. Mutat Res 1: 2–9 Nishimura Y, Yoshinari T, Naruse K, Yamada T, Sumi K, Mitani H, Higashiyama T, Kuroiwa T (2006) Active digestion of sperm mitochondrial DNA in single living sperm revealed by optical tweezers. Proc Natl Acad Sci USA 103: 1382–1387 Ojala D, Montoya J, Attardi G (1981) tRNA punctuation model of RNA processing in human mitochondria. Science 290: 470–474 Okamoto K, Shaw JM (2005) Mitochondrial morphology and dynamics in yeast and multicellular eukaryotes. Annu Rev Genet 39: 503–36 Palmieri F (1994) Mitochondrial carrier proteins. FEBS Lett 246: 48–54 Patel VB, Cunningham CC, Hantgan RR (2001) Physiochemical properties of rat liver mitochondrial ribosomes. J Biol Chem 276: 6739–6746

1.5

Pietromonaco SF, Denslow ND, O’Brien TW (1991) Proteins of mammalian mitochondrial ribosomes. Biochimie 73: 827–836 Prieto-Martin A, Montaya J, Martinez-Azorin F (2004) Phosphorylation of rat mitochondrial transcription termination factor (mTERF) is required for transcription termination but not for binding to DNA. Nucleic Acids Res 32: 2059–2068 Puranam RS, Attardi G (2001) The RNase P associated with HeLa cell mitochondria contains an essential RNA component identical in sequence to that of the nuclear RNase P. Mol Cell Biol 21: 548–561 Reichert A, Mörl M (2000) Repair of tRNAs in metazoan mitochondria. Nucleic Acids Res 28: 2043–2048 Richter C (1994) Role of mitochondrial DNA modifications in degenerative diseases and aging. Curr Topics Bioenerg 17: 1–16 Robberson DL, Clayton DA (1972) Replication of mitochondrial DNA in mouse L cells and their thymidine kinase- derivatives: displacement replication on a covalently-closed circular template. Proc Natl Acad Sci USA 69: 3810–3814 Rossmanith W, Tullo A, Potuschak T. Karwan R, Sbisa E (1995) Human mitochondrial tRNA processing. J Biol Chem 270: 12885–12891 Sato A, Nakada K, Akimoto M, Ishikawa K, Ono T, Shitara H, Yonekawa H, Hayashi JI (2005) Rare creation of recombinant mtDNA haplotypes in mammalian tissues. Proc Natl Acad Sci USA 102: 6057–6062 Schon EA (2000) Mitochondrial genetics and disease. Trends Biochem Sci 25: 555–560 Schwartz M, Vissing J (2002) Paternal inheritance of mitochondrial DNA. New Engl J Med 347: 576–580 Shadel GS, Clayton DA (1997) Mitochondrial DNA maintenance in vertebrates. Annu Rev Biochem 66: 409–435 Shoffner JM, Brown MD, Torroni A, Lott MT, Cabell MF, Mirra SS, Beal MF, Yang CC, Gearing M, Salvo R, Watts RL, Juncos JL, Hansen LA, Crain BJ, Fayad M, Rechord CL, Wallace DC (1993) Mitochondrial DNA variants observed in Alzheimer and Parkinson disease patients. Genomics 17: 171–184 Thyagarajan B, Padua RA, Campbell C (1996) Mammalian mitochondria possess homologous recombination activity. J Biol Chem 271: 27536–27543 Trifunovic A, Wredenberg A, Falkenbaerg M, Spelbrink JN, Rovio AT, Bruder CE, Bohlooly-Y M, Gidlöf S, Oldfors A, Wibom R, Törnell J Jacobs HT, Larsson NG (2004) Premature ageing in mice expressing defective mitochondrial DNA polymerase. Nature 429: 417–423 Vigilant L, Stoneking M, Harpending H, Hawkes K, Wilson AC (1991) African populations and the evolution of human mitochondrial DNA. Science 253: 1503–1507 Virbasius CA and Scarpulla RC (1994) Activation of the human transcription factor A gene by nuclear respiratory factors: a potential link between nuclear and mitochondrial gene expression in organelle biogenesis. Proc Natl Acad Sci USA 91: 1309– 1313 Wolstenholme DR (1992) Animal mitochondrial DNA: structure and evolution. Int Rev Cytol 141: 173–216 Wong TW, Clayton DA (1985) Isolation and characterization of a DNA primase from human mitochondria. J Biol Chem 260: 11530–11535 Xu B, Clayton DA (1996) RNA-DNA hybrid formation at the human mitochondrial heavy-strand origin ceases at replication start sites: an implication for RNA-DNA hybrids serving as primers. EMBO J 15: 3135–3143 Zsurka G, Kraytsberg Y, Kudina T, Kornblum C, Elger CE, Khrapko K, Kunz WS (2005) Recombination of mitochondrial DNA in skeletal muscle of individuals with multiple mitochondrial DNA heteroplasmy. Nat Genet 37: 873–877

118

Sektion 1 · Allgemeine Grundlagen

1.5.10 Zeittafel 1856

Erste mikroskopische Beobachtungen von Mitochondrien (Granulae) in Muskelzellen durch Albert von Kölliker (von Kölliker 1856)

ab 1883

Erste Formulierungen der Endosymbiontenhyothese durch Schimper, Altmann und Mereschkowsky (Schimper 1883; Altman 1890; Mereschkowsky 1905)

1898

Namensgebung Mitochondrien durch Benda (Benda 1898)

1909

Nichtmendelnde, plasmatische Vererbung (Correns 1909)

1952

Beschreibung der Ultrastruktur der Mitochondrien durch Palade (Palade 1952)

1953

petite-Mutanten bei der Hefe, Beginn der Mitochondriengenetik (Ephrussi 1953)

1961

Chemiosmose-Theorie der oxidativen Phosphorylierung durch Mitchell (Mitchell 1961)

1963

Nachweis von DNA in Mitochondrien (Nass u. Nass 1963)

ab 1970

Studien zur physikalischen Organisation, der Transkription und Replikation des mitochondrialen Genoms, vor allem von Clayton und Attardi (Aloni u. Attardi 1971; Robberson u. Clayton 1972)

1979

Abweichender genetischer Kode in Mitochondrien (Barrell et al. 1979)

1981

Komplette Sequenz des humanen mitochondrialen Genoms (Anderson et al. 1981)

1982

„Bottleneck“-Hypothese zur Vererbung der mtDNA in der Keimbahn (Hauswirth u. Laipis 1982)

1987

Phylogenie des humanen mitochondrialen Genoms, „Out-of-Africa“-Hypothese (Cann et al.1987)

1988

Erste Beschreibung einer durch eine mtDNA-Mutation verursachten Erkrankung (Wallace et al. 1988)

1989

Generierung von mtDNA depletierter rho--Zellen (King u. Attardi 1989)

1997

Die Analyse von mtDNA aus Knochenfunden des Neandertalers zeigt nur entfernte Verwandtschaft mit dem modernen Menschen (Krings et al. 1997)

1998

„Knockout“-Mausmodell für den mitochondrialen Transkriptionsfaktor mtTFA führt zum Verlust von mtDNA (Larsson et al 1998)

2000

Erzeugung eines ersten Mausmodells mit einer mtDNA-Deletion (Inoue et al. 2000)

2002

Beschreibung eines Falls mit paternal vererbter mtDNA beim Menschen (Schwartz u. Vissing 2002)

2004

„mtDNA-mutator“-Maus mit Mutation in der mitochondrialen DNA-Polymerase als Modell für mitochondrial bedingte Alterungsprozesse (Trifunovic et al. 2004)

2005

Nachweis von Rekombination im humanen mitochondrialen Genom (Zsurka et al. 2005)

Literatur zur Zeittafel Aloni Y, Attardi G (1971) Symmetrical in vivo transcription of mitochondrial DNA in HeLa cells. Proc Natl Acad Sci U S A 68: 1757– 1761 Altman R (1890) Die Elementarorganismen und Ihre Beziehungen zu den Zellen. Verlag von Veit, Leipzig Anderson S, Bankier AT, Barrell BG, de Bruijn MHL, Coulson AR, Drouin J, Eperon IC, Nierlich DP, Roe BA, Sanger F, Schreier PH, Smith AJH, Staden R, Young IG (1981) Sequence and organization of the human mitochondrial genome. Nature 290: 457– 465 Barrell BG, Bankier AT, Drouin J (1979) A different genetic code in human mitochondria. Nature 282:189–194 Benda C (1898) Weitere Mitteilungen über die Mitochondria. Verh Physiol Ges Berlin 376–383

Cann RL, Stoneking M, Wilson AC (1987) Mitochondrial DNA and human evolution. Nature 325: 31–36 Correns C (1909) Vererbungsversuche mit blass (gelb) grünen und buntblättrigen Sippen bei Mirabilis jalapa, Urtica und Lunaria. Z Indukt Abstammungs Vererbungsl, 27: 235–237 Ephrussi B (1953) Nuclear-Cytoplasmic Relations in Micro-Organisms. Oxford University Press, London Hauswirth WW, Laipis PJ (1982) Mitochondrial DNA polymorphism in a maternal lineage of Holstein cows. Proc Natl Acad Sci USA 79: 4686–4690 Inoue K, Nakada K, Ogure A, Isobe K, Goto Y, Nonaka I, Hayashi JI (2000) Generation of mice with mitochondrial dysfunction by introducing mouse mtDNA carrying a deletion into zygotes. Nat Genet 26: 176–181 King MP, Attardi G (1989) Human cells lacking mtDNA: repopulation with exogenous mitochondria by complementation. Science 246: 500–503

119 1.5 · Mitochondriale DNA des Menschen Krings M, Stone A, Schmitz RW, Krainitzki H, Stoneking M, Pääbo S (1997) Neandertal DNA sequences and the origin of modern humans. Cell 90: 19–30 Larsson NG, Wang J, Wilhelmsson H, Oldfors A, Rustin P, Lewandoski M, Barsh GS, Clayton DA (1998) Mitochondrial transcription factor A is necessary for mtDNA maintenance and embryogenesis in mice. Nat Genet 18: 231–236 Mereschkowsky C (1905) Über Natur und Ursprung der Chromatophoren im Pflanzenreiche. Biol Centralbl 25:593–604 Mitchell P (1961) Coupling of phosphorylation to electron and hydrogen transfer by a chemi-osmotic type of mechanism. Nature 191: 144–148 Nass S, Nass MMK (1963b) Intramitochondrial fibers with DNA characteristics: Enzymatic and other hydrolytic treatments. J Cell Biol 19: 613–629 Palade GE (1952) The fine structure of mitochondria. Anat Rec 114: 427–451 Robberson DL, Clayton DA (1972) Replication of mitochondrial DNA in mouse L cells and their thymidine kinase – derivatives: displacement replication on a covalently-closed circular template. Proc Natl Acad Sci U S A 69: 3810–3814

1.5

Schimper AFW (1883) Über die Entwicklung der Chlorophyllkörner und Farbkörner. Botanische Zeitung 41:105–114 Schwartz M, Vissing J (2002) Paternal inheritance of mitochondrial DNA. New Engl J Med 347:576–580 Trifunovic A, Wredenberg A, Falkenbaerg M, Spelbrink JN, Rovio AT, Bruder CE, Bohlooly-Y M, Gidlöf S, Oldfors A, Wibom R, Törnell J Jacobs HT, Larsson NG (2004) Premature ageing in mice expressing defective mitochondrial DNA polymerase. Nature 429:417–423 Von Kölliker A (1856) Zeitschrift für wissenschaftl Zoologie VIII, 311–318 Wallace DC, Singh G, Lott MT, Hodge JA, Schurr TG, Lezza AM, Elsas LJ, Nikoskelainen EK (1988) Mitochondrial DNA mutation associated with Leber‘s hereditary optic neuropathy. Science 242: 1427–1430 Zsurka G, Kraytsberg Y, Kudina T, Kornblum C, Elger CE, Khrapko K, Kunz WS (2005) Recombination of mitochondrial DNA in skeletal muscle of individuals with multiple mitochondrial DNA heteroplasmy. Nat Genet 37:873–877

1.6 Regulationsmechanismen der Transkription in Eukaryonten Rainer Renkawitz und Joerg Leers

1.6.1

Transkription durch die RNA-Polymerase

– 121

1.6.1.1 1.6.1.2 1.6.1.3 1.6.1.4 1.6.1.5

Aufbau eines Gens – 121 Aufbau eines Promotors – 121 Basale Transkriptionsfaktoren – 121 RNA-Polymerase II – 122 Regulationssequenzen – 124

1.6.2

Das Chromatin

1.6.3

„Regulationsmaschinen“

1.6.3.1 1.6.3.2 1.6.3.3

Mediatorkomplexe – 129 Chromatin-Modifikationskomplexe – 129 Chromatin-Remodeling-Komplexe – 130

1.6.4

Regulation durch nichtkodierende RNA – 131

1.6.5

Regulationsmodelle mit klinischer Relevanz

1.6.5.1 1.6.5.2 1.6.5.3 1.6.5.4 1.6.5.5

NFκB – 132 Fos/Jun – 132 Kernrezeptoren – 133 HOX-Gene – 134 Imprinting – 134

1.6.6

Ausblick

– 135

1.6.7

Literatur

– 135

1.6.8

Zeittafel

– 137

– 125

Literatur zur Zeittafel

– 129

– 132

– 138

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

121 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

1.6.1 Transkription durch die RNA-Polymerase 1.6.1.1 Aufbau eines Gens Die von Generation zu Generation weitergegebene, also vererbte, Information bezeichnet man als das Genom. Diese Information beinhaltet in kodierter Form die Anleitung zur Produktion von Proteinen, und diese Proteine wiederum bestimmen die Entwicklung von einzelnen Zellen, komplexeren Organen bis hin zum vollständigen Organismus. Das Genom besteht aus Desoxyribonukleinsäure (DNA) und ist untergliedert in Untereinheiten, den sog. Genen. Jedes Gen enthält die Information für ein Protein. Der Mensch z. B. besitzt ca. 25.000 Gene. Jedes Gen enthält einen transkribierten Bereich (Matrize), der mittels einer RNA-Polymerase in Ribonukleinsäure (RNA) umgeschrieben wird. Nur ein Teil dieses transkribierten Abschnitts trägt die Information für ein Protein, andere Bereiche wiederum tragen keine Informationen für die Proteinsynthese und werden nach der Transkription wieder aus dem RNA-Transkript entfernt. Neben den transkribierten Bereichen gibt es regulatorische Abschnitte, die nicht in RNA umgeschrieben werden. Diese regulatorischen Abschnitte bestimmen, wie oft ein Gen transkribiert wird, d. h., wie viel RNA-Kopien von einem Gen angefertigt werden. In der Regel folgt aus einer hohen Transkriptionsrate eine entsprechend hohe Proteinmenge. Die Transkriptionsrate jedes Gens wird zu jedem Zeitpunkt von der Entstehung bis zum Tod einer Zelle exakt reguliert. Eine Deregulation auch nur eines einzigen Gens, wie sie zum Beispiel durch Mutationen erfolgen kann, kann dramatische Auswirkungen auf die Zelle haben. Im vorliegenden Kapitel wird die Transkription von Genen behandelt.

1.6.1.2 Aufbau eines Promotors Der Transkriptionsstartpunkt, bei dem die RNA-Polymerase II mit der RNA-Synthese beginnt, wird durch die sog. TATA-Box bestimmt. Diesen Abschnitt bezeichnet man auch als den „core“-Promotor. Die TATA-Box, die in der Regel die Sequenz TATAAA besitzt, befindet sich 25 Basenpaare (Bp) stromauf („upstream“) von dem Transkriptionsstartpunkt und ist die Erkennungs- und Bindestelle des „TATA-binding protein“ (TBP). Mutationen auch nur einer einzigen Base innerhalb des TATAAA-Motivs führen zu einer drastischen Reduktion der Transkriptionsrate. Die meisten Gene besitzen eine solche TATA-Box. Interessanterweise gibt es eine Gruppe von Genen, die keine TATA-Box aufweist. Diese Gene kodieren für Proteine, die in jeder Zelle benötigt werden und aus diesem Grund Haushaltsgene genannt werden.

1.6

Statt der TATA-Box besitzen sie GC-Boxen, GC-reiche Regionen, an die der ubiquitär exprimierte Transkriptionsfaktor SP1 bindet und die Transkription aktiviert. Des Weiteren besitzen die Promotoren derjenigen Gene keine TATA-Box, die von den RNA-Polymerasen I und III transkribiert werden. Die RNA-Polymerase I transkribiert die Gene der ribosomalen RNAs 28S, 18S und 5,8S, während die RNA-Polymerase III die 5S-rRNA und tRNAs synthetisiert. Das heißt, die Gene, die von der RNA-Polymerase I oder III transkribiert werden, kodieren für Transkripte, die nicht in Protein translatiert werden.

1.6.1.3 Basale Transkriptionsfaktoren Die „core“-Promotorregion eines Gens ist der Bereich, der den Startpunkt der Transkription festlegt. Für diesen Prozess sind mehrere Proteine notwendig, die sich zum sog. Präinitiationskomplex (PIC) zusammenlagern. Das TATA-binding protein TBP ist schon bei seiner Bindung an die TATA-Box mit mindestens 12 weiteren Proteinen assoziiert, den sog. TBP-assoziierten Faktoren (TAFs), die die Bindung von TBP an die DNA regulieren. TBP und TAFs formen zusammen den TFIID-Komplex (> Abb. 1.6.1). TBP bindet in der kleinen Furche der DNA und erzeugt dadurch eine starke Biegung der Doppelhelix. Diese Biegung ermöglicht die Bindung der Proteine TFIIA und TFIIB benachbart zu TFIID an die DNA. Beide Faktoren sorgen für eine stabilere Assoziation des TFIID-Komplexes an die DNA. Der Komplex aus TFIID, TFIIA und TFIIB bildet die Oberfläche für die Bindung der RNA-Polymerase II (Roeder 2005). Diese Rekrutierung der RNA-Polymerase II wird durch den Faktor TFIIF stabilisiert. Der Komplex wird dann durch die Faktoren TFIIE und TFIIH komplettiert. TFIIE reguliert die unterschiedlichen enzymatischen Aktivitäten von TFIIH. Diese bestehen in einer Helikasefunktion, die zu einer Entwindung der DNA-Helix und dem nachfolgenden Aufbrechen des DNA-Doppelstrangs und somit zu einem offenen Promotorkomplex führt. Des Weiteren ist TFIIH mitverantwortlich für die Phosphorylierung der C-terminalen Domäne der RNA-Polymerase II (7 1.6.1.4). Diese Phosphorylierung erlaubt der RNA-Polymerase II den Promotorbereich zu verlassen („promotor clearance“) und mit der RNAPolymerasereaktion, der Transkription, zu beginnen. Während einige Transkriptionsfaktoren nach dem Start der Polymerisation den Promotor verlassen, bleiben andere Faktoren wie TFIID, TFIIA, TFIIE und TFIIH auch weiterhin im Promotorbereich. Dies hat zur Folge, dass eine Re-Initiation durch den Aufbau eines neuen vollständigen Komplexes schneller erfolgen kann.

122

Sektion 1 · Allgemeine Grundlagen

1.6.1.4 RNA-Polymerase II

. Abb. 1.6.1. Die Transkriptionsfaktoren TFIIA, -B, -D und -E sind für die Initiation der Transkription durch die RNA-Polymerase II essenziell. Der Zusammenbau dieses generellen Proteinkomplexes beginnt mit der Bindung von TFIID an die TATA-Box. Die an TFIIF gebundene Polymerase kann an den Komplex binden, nachdem TFIIA, -B und -D auf dem Promotorbereich der DNA positioniert sind. Dabei ermöglichen TFIIE und TFIIF der Polymerase den Zugang zur DNA. (TS) Stelle des Transkriptionsstarts

Die RNA-Polymerase II ist ein Enzym, das aus 2 großen und 12 kleinen Untereinheiten besteht. Sequenzvergleiche dieser Untereinheiten zwischen weit entfernt verwandten Organismen ergaben einen hohen Konservierungsgrad. So zeigen die großen Untereinheiten der RNA-Polymerase II von Wirbeltieren immer noch Sequenzhomologien mit RNA-Polymerase-Untereinheiten von E. coli. Diese Vergleiche erlauben den Schluss, dass die RNA-Polymerase II sehr früh in der Evolution entstanden ist und sich seither vergleichsweise wenig verändert hat. Die C-terminale Domäne (CTD) der größten Untereinheit besitzt 52 Wiederholungen der 7 Aminosäuren: Tyr-Ser-Pro-Thr-Ser-Pro-Ser. Die Aminosäuren Serin und Threonin innerhalb dieser Sequenz können phosphoryliert werden. Im unphosphorylierten Zustand rekrutiert die CTD den Multiproteinkomplex-Mediator (7 1.6.3.1). Er ist damit Teil des PIC. Nach der Phosphorylierung der CTD durch TFIIH, sowie durch Komponenten des Mediators, verliert der Mediator die Bindungsaffinität zur CTD und damit zur RNA-Polymerase II. Dieses Ablösen vom Mediator ist der entscheidende Schritt, der es der RNA-Polymerase erlaubt, mit der Transkription zu beginnen (Meinhart et al. 2005). Den Prozess der eigentlichen Polymerasereaktion, die in 5c-3c-Richtung erfolgt, bezeichnet man als Elongation. Hierbei werden Triphosphat-Nukleotide über eine Veresterung des D-Phosphats mit dem 3'-OH-Ende des bestehenden RNA-Strangs verknüpft. Die Energie, die diese Reaktion benötigt, entsteht durch die Abspaltung der E- und J-Phosphate des jeweils neu hinzugefügten Nukleotids. Während der Polymerisation bewegt sich die RNA-Polymerase entlang des DNA-MatrizenStrangs. Dabei wird die DNA-Doppelhelix kontinuierlich geöffnet und nach der Passage wieder geschlossen. Aufgrund der helikalen Struktur bedarf dieser Vorgang einer ständigen Entwindung der DNA (> Abb. 1.6.2).

. Abb. 1.6.2. Modell der Transkriptionselongation. In Bewegungsrichtung (horizontaler Pfeil) der RNA-Polymerase wird die DNA-Doppelhelix einzelsträngig entwunden und nach Passage der RNA-Polymerase wieder geschlossen. Die neu entstehende RNA wächst in 5c-3c-Richtung

123 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

Erfahrungsgemäß kann die RNA-Polymerase II den RNA-Strang während der Elongationsphase um etwa 2000 Nukleotide pro Minute verlängern. Noch bevor der neu synthetisierte RNA-Strang 30 Nukleotide lang ist, erfolgt das sog. Capping. Bei diesem Vorgang wird an das 5c-Phosphat-Ende der mRNA ein 7-Methylguanosin-Cap über eine 5c-5c-Triphosphat-Verbindung angehängt. Beim Beginn der Translation ist das Cap wichtig für die Bindung der Ribosomen an die mRNA (vgl. Kap. 1.7). Nach der Transkription eines Gens durch die RNAPolymerase II erfolgen zwei offensichtlich zusammenhängende Prozesse (> Abb. 1.6.3). Das primäre RNATranskript wird etwa 10–30 Bp unterhalb einer Basenabfolge AAUAAA geschnitten. An das freie 3c-Ende werden anschließend mehr als 250 Adenosinmoleküle angehängt. Diesen Schritt bezeichnet man als Polyadenylierung, die dem Schutz vor Nukleasen dient, den Export der mRNA erleichtert und damit die Translationseffizienz erhöht. Gleichzeitig mit der Polyadenylierung läuft weiter unterhalb die Termination der Transkription ab (Buratowski 2005). Die für die Polyadenylierung sowie für die Termination verantwortlichen Proteinkomplexe sind mit der CTD der RNA-Polymerase II assoziiert und begleiten die Polymerase während der Elongationsphase. Nach der Termination wird die CTD dephosphoryliert, die Polyadenylierungsproteine fallen ab, und die RNA-Polymerase II steht für eine erneute Initiation der Transkription zur Verfügung. Bei den Eukaryonten ist in der Regel der kodierende Bereich von nichtkodierenden Genabschnitten unter-

1.6

brochen. Die kodierenden Bereiche bezeichnet man als Exons („expressed sequences“), während die nichtkodierenden Bereiche Introns („intervening sequences“) genannt werden. In der Regel bestehen eukaryote Gene aus mindestens 2 bis hin zu 400 Exons. Interessanterweise ist die Länge der Introns oftmals viel größer als die der Exons und kann bis zu mehrere Megabasen umfassen. Das primäre Produkt der Transkription umfasst also zunächst einmal ein viel längeres RNA-Molekül als es für die Translation benötigt wird. Der Vorgang, der für die Entfernung der überflüssigen Abschnitte verantwortlich ist, bezeichnet man als Spleißen (> Abb. 1.6.4). Dieser Prozess läuft zeitlich parallel zur Elongation der Transkription ab. Wie auch die Proteine, die das Capping, die Polyadenylierung und die Termination regulieren, so sind auch die Spleißfaktoren an die phosphorylierte CTD der RNA-Polymerase II gebunden. Diese Spleißfaktoren sind RNA-Protein-Komplexe, die als snRNP U1, U2 bis U6 bezeichnet werden. Im sog. Spleißosom erfüllen sie unterschiedliche Aufgaben (> Abb. 1.6.4). Der Mechanismus des Herausspleißens von Introns besteht zunächst in der Erkennung der Grenzen des Introns durch das Spleißosom. Die 5c-Intron-Enden beginnen nahezu immer mit der Abfolge GU und weisen am 3c-Ende immer die Basen AG auf. Nach Fixierung dieser Enden durch das Spleißosom bildet der dazwischen liegende Abschnitt, das Intron also, eine Art Lasso- oder auch Lariatstruktur. Die Enden der Exons wiederum gelangen auf diese Weise in sehr dichte räumliche Nähe, sie werden gespalten und die Exons verbunden (Kornblihtt et al. 2004).

. Abb. 1.6.3. Spaltung und Polyadenylierung des Primärtranskripts. Eine spezifische Endonuklease erkennt das Spaltungssignal (AAUAAA) und spaltet das Primärtranskript. Anschließend wird ein Schwanz aus etwa 250 Adenosinmolekülen durch das Enzym PolyAPolymerase an das 3c-Ende angefügt. Die Reifung der Prä-mRNA findet im Zellkern statt, wobei die reife mRNA entsteht, die nachfolgend ins Zytoplasma transportiert und dort zum Protein translatiert wird. Das Primärtranskript enthält eine 5c-Cap-Struktur, die auch nach der Prozessierung erhalten bleibt

124

Sektion 1 · Allgemeine Grundlagen

a

nen sukzessive verändert werden, während andere Bereiche konstant bleiben. Verdopplungen und anschließende Translokationen von Exons in die Introns anderer Gene können erfolgen, was zu modularen Ergänzungen eines bestehenden Proteins führt. Ein weiterer Grund für die Organisation in Exons und Introns ist die Möglichkeit, aus einem einzigen Gen und seinem primären Transkript unterschiedliche Spleißprodukte zu generieren. Diesen Prozess bezeichnet man als alternatives Spleißen. Dabei werden nicht unbedingt nur benachbarte Exons miteinander verknüpft, sondern ein oder mehrere Exons können mitsamt den dazwischen liegenden Introns entfernt werden. Dadurch können unterschiedliche Proteine gebildet werden. Durch den Mechanismus des alternativen Spleißens ergibt sich also gegenüber der Zahl von 25.000 menschlichen Genen eine weit höhere Anzahl an resultierenden Genprodukten.

1.6.1.5 Regulationssequenzen b . Abb. 1.6.4.a,b. a Spleißen von Introns aus Prä-mRNA. Introns bilden eine Lariatstruktur und werden anschließend aus dem Primärtranskript entfernt. Die reife mRNA besteht anschließend lediglich aus Exonsequenzen. b Zusammenbau eines Spleißosoms. Beginn und Ende von Introns sind durch spezifische Sequenzen festgelegt. Das Spleißdonorsignal am 5c-Ende des Introns ist durch die Sequenz GU, das Akzeptorsignal am 3c-Ende des Introns durch die Basenfolge AG gekennzeichnet. Zu Beginn des Spleißvorgangs binden U1- und U2snRNP an die Start- und Verzweigungssequenz. Danach bindet der Komplex aus U4–U6 und komplettiert das Spleißosom

Worin liegt nun der Sinn eines solch komplizierten Mechanismus? Die Unterteilung des primären Transkripts in kodierende und nichtkodierende Abschnitte hat wahrscheinlich enorme Vorteile für die Evolution von Proteinen. Einzelne Bausteine eines Proteins kön-

Man unterscheidet verschiedene regulatorische Bereiche innerhalb eines Gens. Der Abschnitt, der oberhalb des „core“-Promotors lokalisiert ist, ist der so genannte „upstream“-Promotor. Weiter entfernt von der transkribierten Region liegende andere regulatorische Abschnitte nennt man je nach ihrer Funktion Enhancer, Silencer und Isolatoren. Regulierende Transkriptionsfaktoren binden an Erkennungsstellen, die einen kurzen Bereich von 6 bis 12 Basenpaaren umfassen. Nach der Bindung an die Regulationssequenzen beeinflussen die Transkriptionsfaktoren die Transkriptionsrate entweder positiv (Transaktivatoren) oder negativ (Transrepressoren). Die regulatorischen Bereiche können zum Teil mehrere 10.000 Basenpaare entfernt vom Promotor lokalisiert sein. Sie liegen sowohl vor den Genen („upstream“) als auch dahinter („downstream“) oder in den Genen selbst, dann in der Regel in Introns. Wenn sie aktivieren, spricht

125 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

man von Enhancer-Elementen oder, wenn sie reprimieren, von Silencer-Elementen. Die Kombination und Anzahl der auf die Transkriptionsrate aktivierend oder reprimierend wirkenden Bindestellen führt zu einer spezifischen Genaktivität. Proteine, die an diese Enhancer- oder Silencer-Elemente binden, sind in der Regel gewebsspezifische Faktoren oder Proteine, die nur während einer bestimmten Phase des Zellzyklus in der Zelle aktiviert werden. Sie werden oftmals durch Modifikationen wie Phosphorylierungen reguliert oder durch Hormone in ihrer Funktion als Aktivator oder Repressor festgelegt (7 1.6.5). Diese Proteine sind in der Lage ihr aktivierendes bzw. reprimierendes Signal von den weit entfernt liegenden Enhancer- bzw. Silencer-Elementen auf den PIC zu übertragen. Dabei interagieren diese Proteine mit Proteinen am Transkriptionsstartpunkt. Die sich zwischen den entfernt liegenden Regulationssequenzen und dem Transkriptionsstart befindende DNA, die mehrere 10000 Basenpaare umfassen kann, bildet dabei eine Schleife (> Abb. 1.6.5) (West u. Fraser 2005). Der genaue Wirkungsmechanismus von aktivierenden oder reprimierenden Proteinen auf die Transkription ist noch nicht endgültig geklärt. Oftmals besitzen aktivierende,

1.6

an Enhancer bindende Proteine die Eigenschaft, Enzyme zu rekrutieren, die Histone acetylieren. Im Gegensatz dazu können reprimierende, an Silencer bindende Proteine Enzyme binden, die Histone deacetylieren (7 1.6.2.2). Diese antagonistischen enzymatischen Wirkungen auf die Modifikationen von Histonen resultieren in einem offenen Chromatin im Falle der aktivierenden Proteine und in einem kompakten Chromatin im Falle der reprimierenden Transkriptionsfaktoren.Diese Unterschiede in der Struktur des Chromatins bestimmen dann graduell die Zugänglichkeit anderer DNA-bindender Proteine am Promotor. Daneben interagieren viele dieser aktivierenden oder reprimierenden Transkriptionsfaktoren mit Proteinen des PIC, wie TAFs oder Mediatorkomponenten, sowie mit Chromatin-Remodeling-Komplexen (7 1.6.3). Die große Distanz, die enhancerbindende Transkriptionsfaktoren überwinden können, um ihr Signal auf den PIC zu übertragen, beinhaltet ein prinzipielles Problem. Wie kann verhindert werden, dass ein Enhancer nur das Gen reguliert, das reguliert werden soll? Ein benachbartes Gen könnte ebenfalls unter Kontrolle des „fremden“ Enhancers geraten. Um die Autarkie der Regulation jedes einzelnen Gens zu gewährleisten, gibt es sog. Isolatoren, die die äußere Begrenzung einer Genregulationseinheit darstellen. Enhancerbindende Transkriptionsfaktoren sind nicht in der Lage, ihr Signal über einen solchen Isolator hinweg zu vermitteln. In höheren Eukaryonten bindet der Faktor CTCF an diese Isolatoren und bewirkt eine Enhancerblockade. Auf welchem molekularen Weg die Enhancerwirkung verhindert wird, ist im Moment noch unklar. Es wird diskutiert, dass die Annäherung der enhancergebundenen Transkriptionsfaktoren zum PIC durch den CTCF-gebundenen Isolator verhindert wird (Ohlsson et al. 2001; West u. Fraser 2005).

1.6.2 Das Chromatin . Abb. 1.6.5. Transkriptionsfaktoren und Multiproteinkomplexe regulieren die Genaktivität. DNA (schwarze Linie) ist um Histon-Oktamere (graue Ovale) gewickelt und bildet die Nukleosomen. Transkriptionsfaktoren (rote Ovale) können an„upstream“-Promotor-Elemente oder an Enhancer-Sequenzen gebunden sein. DNA-gebundene Transkriptionsfaktoren rekrutieren Multiproteinkomplexe unterschiedlicher Funktion. Chromatin-Remodeling-Komplexe bewirken die ATPabhängige Verschiebung und Veränderung der Nukleosomen. Chromatinmodifizierende Komplexe verändern die Acetylierung, die Methylierung und die Phosphorylierung der Histone. Diese Veränderungen markieren das Chromatin für die Genaktivierung bzw. für die Genrepression. Der Mediatorkomplex verbindet die DNA-gebundenen Transkriptionsfaktoren mit dem Präinitiationskomplex (PIC), der die Transkription durch die RNA-Polymerase II (Pol II) ermöglicht. Große Abstände zwischen Enhancer und Promotor werden durch die Ausfaltung des Chromatins und die Interaktion (graue Pfeile) zwischen Enhancer- und Promotor-Komplexen überbrückt

Die DNA der Eukaryonten ist auf den Chromosomen des Zellkerns untergebracht. Der Mensch hat 46 Chromosomen, die insgesamt einen DNA-Gehalt besitzen, der eine Gesamtlänge von zwei Metern einnehmen würde, wenn man die DNA der einzelnen Chromosomen aneinanderreihte. Diese enorme DNA-Länge muss im jeweiligen Zellkern unterzubringen sein, der in der Regel einen Durchmesser von 5–10 μm besitzt. Die Lösung dieses Mengenproblems wird durch die Verpackung in das Chromatin ermöglicht. Chromatin erlaubt es, dass während der Arbeits- oder Interphase des Zellzyklus die DNA für die Genaktivität und auch zur Verdopplung durch DNA-Polymerasen erreichbar ist. Dieses während der Interphase des Zellzyklus relativ wenig verpackte

126

Sektion 1 · Allgemeine Grundlagen

Chromatin muss für die Durchführung der Mitose deutlich kompakter vorliegen. Bei der Mitose bilden sich die Mitosechromosomen durch eine zunehmende Verpackungsdichte des Chromatins. Das ist notwendig, da die Mitose vollständige Chromatiden eines jeden Chromosoms auf die Tochterzellen verteilt. Dieses wäre mit räumlich sehr ausgedehntem Chromatin nicht möglich. Der maximale Verkürzungs- und Verpackungsgrad im Mitosechromosom lässt sich mit ca. 10.000 angeben. Wie sieht die Verpackung aus? Die kleinste Untereinheit des Chromatins liegt in Form sog. Nukleosomen vor (> Abb. 1.6.6) (Strahl u. Allis 2000). Diese Nukleosomen bestehen aus einem DNA-Abschnitt von ca. 200 Bp Länge, der um einen Proteinanteil, die Histone, herumgewickelt ist. Histone sind basische Proteine, die in der Lage sind, an das saure DNA-Molekül zu binden. Insgesamt bildet ein Oktamer von Histonen die Grundstruktur, die jeweils aus zwei Histonen vom Typ H2a, H2b, H3 und H4 besteht. Die genaue Anordnung der Histone innerhalb eines Oktamers lässt sich am besten in Form zweier Tetramere beschreiben: H2a (2x) plus H2b (2x) bildet ein Tetramer und H3 (2x) plus H4 (2x) füllen das Oktamer auf. Um dieses Oktamer herum liegt die DNA in ca. zwei Windungen, die schon zu einer deutlichen Verkürzung des DNA-Moleküls führen. Die ca. 200 Basenpaare an DNA, die mit einem Nukleosom verbunden sind, befinden sich über einem Abschnitt von 147 Bp in engem Kontakt zum Nukleosom. Der verbleibende Anteil an DNA wird als sog. Linker bezeichnet, der eine Verbindung zum nächsten Nukleosom darstellt. LinkerAbschnitte können in ihrer Länge variieren und werden durch das Histon H1, einem fünften Histon, gebunden. H1 ermöglicht eine stärkere Kompaktierung des Chromatins, indem es durch eine Verbindung zweier Nukleosomen zu einer Faltung höherer Ordnung der Chromatinfaser führt. Durch diese Faltung wird das dünnere Chromatinfilament mit einem Durchmesser von ca. 10 nm zu einem kürzeren aber dickeren Chromatinfaden mit einem Durchmesser von ca. 30 nm überführt. Diese Chromatinfaltung stellt den größten Anteil des Chromatins während der Interphase dar. Für den Wechsel von der Interphase zur Mitose muss ein weiterer Verpackungsgrad erzielt werden. Auch diese zusätzliche Verkürzung erfolgt durch unterschiedliche Hierarchien. Der nächsthöhere Verpackungszustand ist durch eine Struktur beschrieben, die einen Durchmesser von ca. 300 nm einnimmt und die dadurch zustande kommt, dass der 30-nm-Faden über eine Schleifenstruktur an chromosomale Gerüstproteine gebunden wird. Die dreidimensionale Struktur des Chromosomengerüsts selbst liegt in einer gewundenen Anordnung vor, sodass der 300-nm-Faden nun im Mitosechromosom einen Durchmesser von 700 nm einnimmt, unter gleichzeitiger Verkürzung auf die Länge der mikroskopisch

. Abb. 1.6.6. Die Chromatinstruktur. Die DNA (schwarze Linie) ist um Histon-Oktamere (jeweils zwei Moleküle H2A, H2B, H3 und H4) gewunden und bildet so das Nukleosom. Viele dieser Nukleosomen hintereinander bilden eine Chromatinfaser mit einem Durchmesser von 10 nm. Durch das nicht dargestellte Histon H1 wird diese Faser weiter zu einer 30-nm-Faser verpackt. Die Histone des Nukleosoms ragen mit ihren N-terminalen Enden aus dem Nukleosom heraus (rote Linien). Wie am Beispiel für das Histon H3 gezeigt, kann dieser N-Terminus unmodifiziert vorliegen oder aber an verschiedenen Aminosäuren Modifikationen aufweisen (nach Strahl u. Allis 2000)

sichtbaren Mitosechromosomen (Watson et al. 2004). Die Morphologie und die Funktion mitotischer Chromosomen sind in Kapitel 1.3 (zytogenetische Grundlagen) näher erläutert. Neben der oben beschriebenen Funktion der Chromatinverpackung, eine Verkürzung der enormen DNAMengen des Zellkerns zu ermöglichen, gibt es wichtige regulatorische Funktionen des Chromatins während der Interphase. Innerhalb der regulatorischen Funktionen muss man zwei grundsätzliche Funktionsebenen unterscheiden. Einerseits können chromatinverpackte Gene und regulatorische Sequenzen direkt durch Chromatinmodifikationen (s. u.) in ihrer Aktivität beeinflusst werden. Darüber hinaus sind aber auch mehr globale Funktionen des Chromatins erkennbar, die zu einer Untergliederung größerer Genomabschnitte in sog. chromosomale Territorien führt (Cremer u. Cremer 2001). Die genauere Untersuchung der Verteilung von Sequenzabschnitten innerhalb des Interphase-Zellkerns hat gezeigt, dass Chromatin nicht beliebig im Zellkern verteilt vorliegt und auch keine willkürliche Vermischung der Chromatinabschnitte verschiedener Chromosomen zu beobachten ist. Vielmehr gibt es eine Zellkernarchitektur, die in Form von Chromosomenterritorien sichtbar wird. Eine durch verschiedene Experimente unterstütze Erklärung zur Funktion der Territorien führt an, dass an den Außengrenzen der Territorien die aktiven Gene liegen, die über die Zwischenräume der Territorien mit den notwendigen Regulationsfaktoren und Enzymen ver-

127 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

1.6

. Abb. 1.6.7. Vielfältige Modifikationen der N-terminalen Aminosäuren der Histone beeinflussen die Genaktivität. Für jedes der Histone des Nukleosoms sind die N-terminalen Aminosäuren dargestellt. Bekannte Modifikationen sind die Phosphorylierung (gelbes P), die Acetylierung (rotes A), sowie die Methylierung (grünes M) (nach Peterson u. Laniel 2004)

sorgt werden. Mit der gleichen Argumentation kann man davon ausgehen, dass die Gene im Inneren der Territorien häufig inaktiv sind, da sie nicht von den notwendigen Regulationsfaktoren erreicht werden können. Allerdings ist völlig unklar, über welche Mechanismen ein inaktives Gen von der inneren Region eines Territoriums nach außen wandert, um zu einem aktiven Gen zu werden. Neben der Rolle des Chromatins als globale Organisationsform spielt Chromatin aber auch eine wichtige Rolle bei der lokalen Regulation. Strukturanalysen der Nukleosome haben gezeigt, dass die Hauptanteile der Histonmoleküle von der DNA umschlossen werden, die ca. zwei Mal um das Nukleosom herum gewunden vorliegt. Darüber hinaus wurde aber deutlich, dass die N-terminalen Enden der Histone aus diesen Nukleosomenstrukturen herausragen (> Abb. 1.6.6). Diese sog. Histonschwänze sind potenzielle Substrate für Enzyme, die das Chromatin modifizieren. Eine wichtige Modifikation der Histone stellt die Acetylierung dar. HistonAcetyltransferasen (HAT) sind in der Lage, die Histonschwänze zu acetylieren (> Abb. 1.6.7). Dieses geschieht an den Seitenketten der Lysine und führt zu einer Änderung der Ladung der Histone. Prinzipiell sind Histone basische Proteine mit einer positiven Ladung, die relativ stabil an die negativ geladene DNA binden. Durch die Acetylierung erfolgt eine Reduzierung der positiven Ladung, sodass die Histone nun nicht mehr fest an die DNA gebunden vorliegen. Solche Acetylierungen beobachtet man an den Lysinresten der Schwänze an den Histonen H2a, H2b, H3 und H4 (Peterson u. Laniel 2004; Strahl u. Allis 2000). Es hat sich gezeigt, dass acetyliertes Chromatin in Verbindung mit Genaktivierung gefunden wird. Entsprechend können aktive Gene durch die Wirkung von Histon-Deacetylasen (HDAC) deacetyliert und damit inaktiviert werden. Die Mechanismen der spezifischen Zielstellenerkennung und Acetylierung, bzw. Deacetylierung werden im Abschnitt 1.6.3 beschrieben. Neben der Acetylierung wurde auch die Phosphorylierung bestimmter Histonschwänze beobachtet. Besonders die Phosphorylierung von Serinen

scheint eine Rolle im Zusammenhang mit Genaktivierung zu spielen. Die beteiligten Enzyme sind Phosphokinasen bzw. Phosphatasen. Eine weitere, sehr wichtige Modifikation der Histonschwänze ist die Methylierung von Lysinen bzw. von Argininen. Hier kann man keine pauschale Beschreibung der Funktion eines methylierten Lysin- bzw. Argininrests angeben. Vielmehr scheint die exakte Aminosäure, bzw. die exakte Position im Histonschwanz, von wichtiger Bedeutung dafür zu sein, ob sich eine Methylierung als Aktivierung der Genaktivität auswirkt oder vielmehr als Repression. Diese und weitere Modifikationen können auch in Kombination auftreten, sodass der Begriff des „Histon-Kodes“ geprägt wurde. Das heißt, in Abhängigkeit vom Modifikationsmuster wird an den unterschiedlichen Histonschwänzen eine Repression bzw. eine Aktivierung der Genaktivität erreicht. Die Auflockerung des Chromatins bzw. die Bindung spezifischer Transkriptionsaktivatoren an modifizierte Histone entsprechend dem Histon-Kode alleine reicht noch nicht aus, um der RNA-Polymerase (7 1.6.1) die Synthese entlang der DNA durch die Nukleosomen hindurch zu ermöglichen. Darüber hinaus sind manche Bindestellen für sequenzspezifische Transkriptionsaktivatoren durch Nukleosomen besetzt. So hat man gesehen, dass in Abhängigkeit von der jeweiligen DNA-Sequenz Nukleosomen nicht gleichmäßig und zufällig über die DNA verteilt sind, sondern vielmehr, dass Nukleosomen häufig eine Positionierung aufweisen. Die Konsequenz einer solchen Positionierung besteht darin, dass u. U. wichtige Regulationssequenzen in engem Kontakt zum Nukleosom vorliegen und somit nicht zugänglich sind, bzw. dass andere Sequenzen im LinkerBereich zwischen den Nukleosomen zu finden sind. Daher ist ein weiterer Aspekt der DNA-Verpackung im Chromatin durch die Positionierung der Nukleosomen gegeben. Diese scheinbar statische Anordnung von Nukleosomen kann durch sog. Remodeling-Komplexe verändert werden (7 1.6.3). Man kann davon ausgehen, dass ein Nukleosom-Remodeling (energieabhängiges Verschieben oder Öffnen von Nukleosomen) nicht nur

128

Sektion 1 · Allgemeine Grundlagen

für die Freigabe von Regulationssequenzen notwendig ist, sondern auch für die Passage der RNA-Polymerase durch die Nukleosomen hindurch (Watson et al. 2004). Neben der Modifikation der Histone kann aber auch die DNA selbst modifiziert sein. Hier spielt die Methylierung von Cytosinen eine wichtige Rolle, die benachbart zu einem Guanosin vorliegen. Man spricht hier von sog. CpG-Dinukleotiden, die an der 5-Position des Cytosins methyliert sein können. Eine solche Methylierung hat meistens zur Folge, dass ein benachbartes Gen über einen längeren Zeitraum abgeschaltet bleibt. Diese Abschaltung wird durch Proteine erzielt, die spezifisch 5-Methyl-Cytosin erkennen und weitere Modifikationen wie z. B. die Deacetylierung von Histonen vermitteln. Das heißt, auch die methylierte DNA wirkt indirekt über die Veränderung der Histonmodifikationen auf die Genaktivität. Die Tatsache, dass DNA-Methylierung an CpG-Dinukleotiden zu finden ist, erklärt einen Mechanismus zum Erhalt eines bestimmten DNA-Methylierungsmusters auch nach der DNA-Replikation. Dadurch, dass eine CpG-Sequenz ein Palindrom darstellt, findet sich auf dem komplementären Strang ebenso eine CpG-Sequenz (> Abb. 1.6.8). In der Regel sind methylierte Cytosine in einer CpG-Sequenz auch auf dem komplementären Strang am Cytosin methyliert. Andere, unmethylierte CpG-Sequenzen, sind auf beiden DNASträngen unmethyliert. Nach erfolgter DNA-Replikation ist der jeweils neue DNA-Einzelstrang zunächst einmal nicht methyliert. Bestimmte Enzyme, die Erhaltungsmethylasen, erkennen nun solche CpG-Sequenzen, die nur auf einem Strang die Methylierung aufweisen, und vermitteln die Methylierung auf dem zweiten Strang. Hingegen bleiben CpG-Sequenzen, die unmethyliert waren, auch nach der Replikation unmethyliert, da die Erhaltungsmethylasen hier nicht wirken können. So wird leicht erklärbar, dass von einer Replikation zur nächsten ein bestimmtes Methylierungsmuster von einer Zellteilung zur nächsten weitervererbt wird (Robertson 2005). Dieses Muster ist so stabil, dass es auch von Eltern auf die Nachkommen vererbt werden kann, was den Vorgang der genetischen Prägung ermöglicht. Dieses Phänomen (engl. „imprinting“) führt dazu, dass für bestimmte Gene nur eines der beiden elterlichen Allele aktiv ist, während das andere inaktiv bleibt. So gibt es manche Gene, die nur am väterlichen Allel Aktivität aufweisen, während andere Gene nur am mütterlichen Allel Aktivität zeigen. Dieses Aktivitätsmuster wird durch ein bestimmtes DNA-Methylierungsmuster vermittelt, das in den Keimzellen gebildet wird und auch nach der Befruchtung im erwachsenen Organismus erhalten bleibt. Die durch eine genetische Prägung regulierten Gene sind in der Regel für das embryonale Wachstum entscheidend (7 1.6.5).

. Abb. 1.6.8. Das Muster methylierter und unmethylierter CpGDinukleotide bleibt auch nach der Replikation erhalten. (Oben) Eine DNA-Doppelstrang-Sequenz ist mit zwei CpG-Dinukleotiden dargestellt. Eines der beiden CpG-Dinukleotide (rot) ist am Cytosin methyliert (rotes Dreieck). Diese Methylierung befindet sich auch auf dem komplementären Strang am entsprechenden C-Nukleotid. Ein weiteres unmethyliertes CpG (grün) ist auch auf dem komplementären Strang nicht methyliert. (Mitte) Nach erfolgter Replikation ist der jeweils neu synthetisierte Strang (kursiv) in allen Positionen unmethyliert (grün). (Unten) Die nur in einem Strang methylierten CpGDinukleotide werden durch Erhaltungsmethylasen auch auf dem komplementären Strang methyliert, sodass am Ende dieser Reaktion das CpG-Dinukleotid wieder auf beiden Strängen eine Methylierung aufweist. Das ursprünglich unmethylierte CpG-Dinukleotid bleibt auch im Anschluss an die Replikation weiterhin unmethyliert

Die hier besprochenen Regulationsmechanismen, die zur Abschaltung einzelner Gene führen, dienen auch der Inaktivierung größerer Genomabschnitte. Solche Bereiche, die dauerhaft inaktiv bleiben, bezeichnet man als Heterochromatin. Heterochromatin fällt dadurch auf, dass es nicht die zellzyklusabhängige Dekondensierung während der Interphase und stärkere Verpackung während der Mitose mitmacht, sondern permanent kompakt vorliegt. Das konstitutive Heterochromatin enthält repetitive Sequenzen, wie man sie an den Chromosomenenden, bzw. im Bereich des Zentromers findet (7 Kap. 1.3). Darüber hinaus liegt das zweite X-Chromosom bei weiblichen Säugern heterochromatisch als kompakter Barr-Körper auch während der Interphase vor. Dieses Heterochromatin bezeichnet man als das fakultative Heterochromatin (Watson et al. 2004).

129 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

1.6.3 „Regulationsmaschinen“ Die Transkription wird durch eine Vielzahl von Faktoren reguliert. Nur diese große Anzahl an antagonistischen oder mit sich synergierenden oder miteinander kompetitierenden Faktoren gewährleistet eine Feinabstimmung in der Genregulation, wie sie zu beobachten ist. Bestimmte Teilaufgaben bei der Transkriptionskontrolle, und zwar solche, die in jeder Zelle zu jedem Zeitpunkt ablaufen, werden von großen Proteinkomplexen oder auch „Regulationsmaschinen“ bewerkstelligt. Diese Komplexe integrieren die Funktionen vieler einzeln wirkender, spezifischer Faktoren. Im Folgenden sollen drei dieser „Maschinen“ besprochen werden.

1.6.3.1 Mediatorkomplexe Der Mediator ist ein Komplex, der mit der RNA-Polymerase II am PIC vorliegt. Er bindet dort an die unphosphorylierte CTD (vgl. Abschn. 1.6.1.4). Der Mediator umfasst einen 1–2-MDa-Proteinkomplex von bis zu 37 Proteinen. 22 dieser Untereinheiten sind in allen Eukaryonten von Saccharomyces cerevisiae bis hin zum Menschen konserviert. Während der Mediatorkomplex in der Hefe schon zu Beginn der 1990er Jahre aufgereinigt wurde, entsprang die Isolierung des Mediators der Säuger mehr einem Zufallsprodukt. Verschiedene Gruppen versuchten unabhängig voneinander, mit unterschiedlichen Methoden Proteine zu identifizieren, die mit jeweils einem anderen Transkriptionsfaktor interagieren. Interessanterweise isolierten diese Gruppen trotz unterschiedlicher Methoden und unterschiedlicher Ausgangsproteine nahezu den gleichen Proteinkomplex, dessen Bestandteile sich als Komponenten des Mediators erwiesen. Mit diesen Ergebnissen, die überraschenderweise verdeutlichten, dass verschiedene Transkriptionsfaktoren an ein und denselben Komplex binden und dadurch mit dem PIC physisch in Kontakt treten können, war offensichtlich geworden, dass der Mediator als Integrationsstelle für eine Reihe von Transkriptionsfaktoren wirken kann. Das wird dadurch ermöglicht, dass die unterschiedlichen Transkriptionsfaktoren mit immer wieder anderen Untereinheiten des Mediatorkomplexes interagieren können (> Abb. 1.6.5). So besitzen auch funktionell antagonistisch wirkende Transkriptionsfaktoren im Mediatorkomplex eine Interaktionsstelle mit dem PIC. Auch virale Proteine, die Einfluss auf die Transkription nehmen, interagieren mit dem Mediator. So sind das tumorpromovierende Protein E1A des Adenovirus oder der stärkste bekannte Transaktivator im eukaryoten System, das VP16-Protein des Herpes-simplex-Virus, mediatorinteragierende Transkriptionsfaktoren. Auch sie benutzen den Mediator als An-

1.6

dockstelle, um die transaktivierende Wirkung zu vermitteln (Lewis u. Reinberg 2003). Der molekulare Mechanismus, der der Wirkung des Mediatorkomplexes auf die Transkriptionsrate zugrunde liegt, ist bislang nicht vollständig geklärt. Wie kontrolliert die Bindung des Mediators an die CTD die Aktivität der RNA-Polymerase II? Es scheint so zu sein, als ob hier dem Faktor TFIIH eine Schlüsselrolle zukommt. Der Mediator kann TFIIH phosphorylieren und somit die Kinaseaktivität von TFIIH, die normalerweise die CTD phosphoryliert, hemmen. Offensichtlich ist der Mediator in der Lage, den Übergang von der Initiation zur Elongationssphase der Transkription zu verzögern und damit die Transkriptionsrate zunächst einmal zu erniedrigen. Aktivatoren, die mit dem Mediator interagieren, könnten die Phosphorylierung von TFIIH inhibieren – ein Schritt, der zu einer erhöhten Transkriptionsrate führen würde. Analog dazu könnten Repressoren diese Phoshorylierung steigern – mit dem Effekt einer verringerten Transkription. Nachdem die RNA-Polymerase mit der Polymerisation begonnen und den Transkriptionsstartpunkt verlassen hat, verbleiben der Mediator neben TFIID, TFIIA, TFIIE und TFIIH am Transkriptionsstartpunkt. Als Integrationskomplex für viele Transkriptionsfaktoren bildet der Mediator damit eine ideale Oberfläche für die Reassemblierung des PIC und damit für die Organisation der Re-Initiation (Roeder 2005).

1.6.3.2 Chromatin-Modifikationskomplexe Ein Mechanismus der Transaktivatoren und auch der Transrepressoren wirkt auf den am Transkriptionsstart lokalisierten Mediatorkomplex. Eine andere Möglichkeit der Transkriptionskontrolle ist die Veränderung der Chromatinstruktur in der Nähe eines Promotors. Durch die Auflockerung des Chromatins, wie es durch die Acetylierung der Histonschwänze geschieht, ist die DNA für DNA-bindende Proteine zugänglich. Eine besser zugängliche Promotorregion bedeutet automatisch eine erhöhte Bindung der für den Aufbau des PIC nötigen Proteine und damit eine erhöhte Transkriptionsrate. Umgekehrt verursacht eine Deacetylierung und in den meisten Fällen eine Methylierung der Histonschwänze ein kompaktes Chromatin und damit eine Reduktion der Transkriptionsrate (Peterson u. Laniel 2004). Die aktivierend oder reprimierend wirkenden Transkriptionsfaktoren besitzen allerdings selbst nicht das Vermögen, das Chromatin zu modifizieren. Dazu bedarf es enzymatischer Funktionen wie der Acetyltransferase, Deacetylase oder Methyltransferase. Diese Enzymaktivitäten sind in größeren, sog. Chromatin-Modifikationskomplexen integriert, die, je nach Funktion, Koaktivator-

130

Sektion 1 · Allgemeine Grundlagen

oder Korepressorkomplex genannt werden und die an die DNA-gebundenen Transkriptionsfaktoren binden (> Abb. 1.6.5). Der erste Koaktivatorkomplex, der Mitte der 1990er Jahre entdeckt wurde, besteht u. a. aus einem Adapterprotein, das mit einem DNA-gebundenen Aktivator interagieren kann. Es gibt drei sehr verwandte Adapterproteine, die nach ihrem Molekulargewicht p160 genannt werden. Diese rekrutieren ein Protein mit einem Molekulargewicht von ca. 300 KDa, entweder CBP oder das nah verwandte p300, und dieses wiederum bindet das Protein P/CAF. CBP, p300 als auch P/CAF besitzen die enzymatische Funktion der Histonacetyltransferase, d. h., sie sorgen durch die Acetylierung der Histonschwänze für eine Auflockerung des Chromatins und damit eine gesteigerte Transkriptionsrate. Neben den beiden Histonacetyltransferasen wird durch das p160Protein auch das Enzym CARM 1 gebunden. CARM 1 ist eine Argininmethyltransferase, die spezifische Arginine des N-terminalen Endes von Histon H3 methyliert. Diese Methylierungen führen zu einer gesteigerten Transkription (7 1.6.2). Neben den DNA-bindenden aktivierenden Regulationsfaktoren gibt es auch Repressoren. Ähnlich dem oben genannten Koaktivatorkomplex bindet ein Adapterprotein an den DNA-bindenden Faktor. Dieser Adapter interagiert wiederum mit Proteinen, die mit Histonen interagieren sowie mit dem Enzym HDAC (Histondeacetylase). Dieses Enzym ist für die Deacetylierung von Histonenden verantwortlich, die zu einem kompakteren Chromatin und damit zu einer Verringerung der Transkriptionsrate führt (Silverstein u. Ekwall 2005). Ein wichtiger Korepressor ist der Mi-2/NuRD-Komplex („nucleosome Remodeling and histone deacetylase“), der aus etwa 7 Untereinheiten besteht. Eine dieser Untereinheiten, das Protein MBD2, bindet an methylierte CpGs (7 1.6.2). Solche methylierten Nukleotide findet man im Genom im Bereich von Heterochromatin und auch in anderen Abschnitten mit geringer Transkription. Der Mi-2/NuRD-Komplex lagert sich an diese methylierten CpGs an und deacetyliert durch die KomplexUntereinheiten HDAC1 und HDAC2. Dies führt ebenso zu einem kompakten Chromatin im Bereich von methylierter DNA (Bowen et al. 2004).

1.6.3.3 Chromatin-Remodeling-Komplexe Viele Transkriptionsfaktoren sind nicht in der Lage, DNA zu binden, wenn die DNA-Sequenz im Nukleosom um ein Histon-Oktamer gewunden ist. Dies bedeutet, dass ein stark mit Nukleosomen besetzter Promotor für Transkriptionsfaktoren schlecht zugänglich ist und die

Transkriptionsrate dementsprechend niedrig ist. Die Chromatin-Modifikationskomplexe sind in der Lage, Chromatin strukturell zu verändern. Dies führt einerseits zu Oberflächen, die von Proteinen mit Chromooder Bromodomänen gebunden werden können (s. u.), andererseits werden die positiven Ladungen der Histonschwänze durch die Modifikationen verringert, was zu einer geringeren Affinität der Histone zu der negativ geladenen DNA führt. Solche Nukleosomen, die verstärkt acetyliert sind, können daher leichter in ihrer Position verändert werden. Die Chromatin-Modifikationskomplexe sind dazu allerdings nicht in der Lage. Für diesen Prozess, den man Chromatin-Remodeling nennt, gibt es spezielle „Maschinen“, die Nukleosomen entlang der DNA bewegen können. Die Energie, die für diesen Prozess notwendig ist, wird aus der Hydrolyse von ATP gewonnen. Je nach ATPase, die zu einem Chromatin-Remodeling-Komplex gehört, unterscheidet man unterschiedliche Komplexe. Der bereits angesprochene NuRD-Komplex besitzt mit Mi-2 eine ATPase vom sog. Chd1-Typ. Komplexe mit dieser Art von ATPase besitzen Komponenten, die mittels Chromodomänen in der Lage sind, methylierte Histone zu binden. Außerdem besitzen sie zusätzlich HDAC-Untereinheiten, die Chromatin deacetylieren. Chromatin-Remodeling-Komplexe mit der ATPase-Komponente vom Typ ISWI zeichnen sich dadurch aus, dass sie Nukleosomen zusammensetzen können oder die gegebene Struktur des Chromatins stabilisieren können (Lusser u. Kadonaga 2003). Der am besten studierte ChromatinRemodeling-Komplex ist der Swi/Snf-Komplex, der zunächst in Hefe entdeckt und charakterisiert wurde. Dieser Komplex besitzt eine ATPase vom Typ SNF2. Die Komplexe dieses Typus besitzen Untereinheiten mit Bromodomänen, die acetylierte Proteine binden können. Wie auch beim Mediator wurde der Swi/Snf-Komplex redundant bei zwei unabhängigen Screens entdeckt. In einer Untersuchung wurden Mutanten isoliert, die einen Defekt im „Mating-type Switching“ besaßen (SWI), im anderen Ansatz wurden Gendefekte im Sucrosestoffwechsel untersucht („sucrose non-fermenting“, SNF). Der Komplex besteht aus ungefähr 12 Untereinheiten mit einem Molekulargewicht von ca. 2 MDa. Der Komplex gliedert sich in einen nichtvariablen Kernkomplex sowie variable Komponenten. Die variablen Komponenten sind dafür verantwortlich, dass der Swi/SnfKomplex sowohl zu transkriptioneller Aktivierung als auch zu Repression führen kann. Eine ATPase-Aktivität vom SNF2 Typ besitzen in Wirbeltieren die nah verwandten Komponenten BRM und BRG1, jedoch befindet sich immer nur eines der beiden Proteine in einem Swi/Snf-Komplex (Roberts u. Orkin 2004). Die Anwesenheit eines dieser ATP-hydrolysierenden Proteine ist essenziell für den funktionellen Komplex, da durch die-

131 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

sen Prozess die Energie für das Verschieben der Nukleosomen gewonnen wird. Interessanterweise sind die Komponenten, die ATP hydrolysieren, auch unabhängig von anderen Untereinheiten in der Lage, Nukleosomen zu verschieben. Was ist dann aber die Funktion der Nicht-ATPase-Untereinheiten im Swi/Snf-Komplex? Grundsätzlich gibt es zwei bekannte Funktionen. Die Nicht-ATPase-Untereinheiten sind in der Lage, die Chromatin-Remodeling-Funktion der ATPase-Komponenten zu regulieren. So ist bekannt, dass andere Swi/ Snf-Untereinheiten beide Swi/Snf-ATPasen BRM und BRG1 in ihrer Chromatin-Remodeling-Funktion verstärken. Die zweite Aufgabe besteht in der Interaktion mit Transkriptionsfaktoren, die an die DNA gebunden haben. Durch solche Protein-Protein-Interaktionen wird der Swi/Snf-Komplex an Promotorbereiche indirekt assoziiert und kann dort lokal Einfluss auf das Chromatin nehmen (> Abb. 1.6.5). Wie geschieht eigentlich Chromatin-Remodeling? Am deutlichsten werden die Mechanismen, wenn man die Wirkung der SNF2-ATPasen, die zur Auflockerung des Chromatins führen, mit denen der ISWI-ATPasen vergleicht, die in der Regel eine bestehende Chromatinorganisation stabilisieren. An Mononukleosomen wurde gezeigt, dass SNF2-Komplexe die Interaktion zwischen Histonen und DNA unterbrechen können; ISWI-Komplexe waren dazu in parallelen Ansätzen nicht in der Lage. Im Gegensatz zu ISWI-Komplexen können SNF2Komplexe Histone von einem DNA-Template auf ein zweites übertragen, hingegen können beide Komplexe die Bewegung von Nukleosomen entlang der DNA katalysieren. Während SNF2-Komplexe das Auseinanderbauen von Nukleosomen fördert, katalysiert der ISWIKomplex den Zusammenbau von Nukleosomen. Diese Wirkungen machen deutlich, wie diese „Maschinen“ auf die Chromatinstruktur Einfluss nehmen können, und wie verschiedene Chromatin-Remodeling-Komplexe antagonistische Funktionen übernehmen (Lusser u. Kadonaga 2003).

1.6.4 Regulation durch nichtkodierende RNA Neben der Regulationskontrolle der Transkription wurde in den letzten Jahren ein wichtiger Mechanismus der posttranskriptionellen Regulation („post-transcriptional gene silencing“, PTGS, oder RNA-Interferenz, RNAi) entdeckt (Mendes Soares u. Valcarcel 2006). Die Basis dieses Regulationsmechanismus besteht in doppelsträngiger RNA, die durch eine RNAse mit dem Namen Dicer in kurze, 21 Nukleotide lange RNA-Abschnitte zerlegt wird. Diese kurze RNA, die auch als „short interfering RNA“ (siRNA) bezeichnet wird, wird von einem Enzym-

1.6

komplex RISC (RNA „induced silencing complex“) aufgenommen. Mit Hilfe der siRNA kann der RISC-Komplex an mRNA-Sequenzen binden, die komplementäre Sequenzen zur siRNA enthält. RISC schneidet die mRNA an der Bindestelle und führt somit zu einem sequenzspezifischen mRNA-Abbau. Man nimmt an, dass sich dieser Mechanismus als eine Schutzfunktion gegen doppelsträngige RNA-Viren entwickelt hat. Darüber hinaus scheint der molekulare Mechanismus des posttranskriptionellen Silencing auch auf der Transkriptionsebene zu einer Repression zu führen. Hier handelt es sich um die Abschaltung von Heterochromatin. Das konstitutive Heterochromatin, das aus wiederholten DNA-Sequenzen besteht, wird durch bidirektionale Transkription in RNA-Abschnitte übersetzt, die eine doppelsträngige Konformation einnehmen können. Doppelsträngige RNA dient dann wieder als Substrat für den Dicer, was wiederum zur RNA-Spaltung und zum Einbau in RISC-Komplexe führt. Da die gebildete RNA von repetitiver DNA stammt, wird sie auch als „repeat associated siRNA“ bezeichnet (rasiRNA). Die RISC-ähnlichen Komplexe, die rasiRNA aufnehmen, werden als RITS-Komplexe (RNA „induced transkriptional silencing“) bezeichnet, da sie zu einer Transkriptionsrepression führen. Über noch unbekannte Mechanismen ist RITS in der Lage, das transkribierte Heterochromatin sowohl über DNA-Methylierung als auch über Histonmethylierung abzuschalten. Im Gegensatz zu den oben beschriebenen Mechanismen, die durch siRNA und rasiRNA vermittelt werden und durch perfekt gepaarte doppelsträngige RNA charakterisiert sind, wird eine andere Klasse regulatorischer RNA, die sog. MicroRNA (miRNA), von einzelsträngigen RNA-Vorläufermolekülen gebildet. Durch Zurückfaltung auf interne komplementäre Bereiche wird auch eine doppelsträngige RNA erzeugt, dennoch handelt es sich hier um nicht perfekt gepaarte Moleküle. Auch diese werden durch Dicer und RISC prozessiert, bzw. an MessengerRNA-Sequenzen gebunden. Diese Bindung führt nicht zu einer RNA-Spaltung, sondern es wird die Translation dieser mRNA-Moleküle blockiert. Die Zielsequenzen für die paarende miRNA liegen im 3c-Bereich und unterhalb des translatierten Bereiches der mRNAs. Der Mechanismus der Translationsblockade ist noch unbekannt. Wo kommen die miRNA-Vorläufermoleküle her? Im Gegensatz zu siRNA und rasiRNA, deren Herkunft entweder exogen (doppelsträngige RNA-Viren) oder von transkribierten Heterochromatinbereichen stammen, gibt es für die miRNAs ganz spezifische Gene. Man geht davon aus, dass einzelne miRNA-Moleküle mehrere verschiedene mRNAs in der Translation blockieren können, da die Bindung der miRNA an die mRNA unterschiedliche Fehlpaarungen erlaubt. Es gibt eine zunehmende Anzahl von Experimenten, die zei-

132

Sektion 1 · Allgemeine Grundlagen

gen, dass miRNAs in der Entwicklung und Differenzierung eine wichtige Rolle spielen und dass sie bei einer Fehlregulation auch zur Entstehung menschlicher Tumore beitragen. Nur ca. 2% der Sequenzen des menschlichen Genoms findet man in Form von mRNA-Molekülen vertreten. Dennoch führen aktuelle Untersuchungen mit immer sensitiveren Methoden und genomweiten Suchen zu dem Befund, dass der größte Teil des Genoms transkribiert wird. Eine große Klasse synthetisierter RNAs, die nicht zur Gruppe der mRNAs gerechnet werden können, sind nichtkodierende RNAs. Hiermit beschreibt man RNA-Sequenzen, die von spezifischen Genen abgelesen werden, ohne jedoch für ein Protein zu kodieren. Diesen ncRNAs konnte man bisher in den meisten Fällen noch keine Funktion zuordnen. Nur in wenigen Ausnahmen konnte ein Funktionsbereich gefunden werden. Zu diesen Fällen gehört die XistRNA, die für die Abschaltung des zweiten X-Chromosoms bei weiblichen Säugern zuständig ist. Auch im Bereich der Gengruppen, die ein Imprinting aufweisen (7 1.6.5), befinden sich Gene, die zwar eine RNA produzieren, nicht aber für ein Protein kodieren können.

leküle, virale Infektion, oxidativer Stress und verschiedene Zytokine. Diese Zytokine, wie z. B. Interleukin-1, binden an Rezeptortyrosinkinasen an der Oberfläche von Zellen, die eine Kaskade von Signalen im Zytoplasma initiieren (Johnson u. Lapadat 2002). Ein Zielort der Signalkaskade ist ein Inhibitormolekül (INB), welches die Translokation von NFNB in den Kern verhindert. Erst durch die Aktivierung der Signalkaskade wird INB phosphoryliert und ermöglicht NFNB, in den Zellkern einzuwandern (> Abb. 1.6.9). Dort findet dieser Regulationsfaktor seine spezifischen Bindestellen auf der DNA im Bereich von Promotoren oder von Enhancer-Sequenzen. Dadurch werden benachbarte Gene aktiviert, und es kommt zur Transkription. Daher ist es nicht verwunderlich, dass eine abnormale Aktivierung von NFNB eine zentrale Rolle in vielen Entzündungsprozessen, wie z. B. Asthma und rheumatoider Arthritis spielt. Darüber hinaus kann die konstitutive Aktivität von NFNB zur Zellproliferation und zur Hemmung von Apoptose führen. Somit spielt NFNB auch eine wichtige Rolle in der Entwicklung verschiedener Tumore, wie z. B. Leukämien, Karzinomen und Adenokarzinomen.

1.6.5 Regulationsmodelle mit klinischer Relevanz

1.6.5.2 Fos/Jun

Die exakte Genregulation ist eine Voraussetzung für geregelte Zelldifferenzierung und Zellproliferation, für die Entwicklung mehrzelliger Organismen sowie für den Stoffwechsel. Daher stellt die zeitliche und räumliche Kontrolle der Genregulation eine der wichtigsten fundamentalen Prozesse in der Biologie und Medizin dar. Inzwischen kennt man viele Beispiele für eine Fehlregulation der Genaktivität im Zusammenhang mit pathologischen Situationen. Daher ist das Verständnis der Transkriptionsmechanismen und der Regulationsmechanismen von hoher klinischer Bedeutung. Der jeweils aktuelle Stand der Informationen zu einzelnen Genen ist auf der Datenbank des Weizmann-Instituts gespeichert (http://www.genecards.org/). Einige wenige Beispiele für Regulationsmechanismen mit klinischer Relevanz sind hier zusammengefasst.

1.6.5.1 NFκB NFNB ist ein DNA-bindender Transkriptionsfaktor, der aus zwei Proteinen der Rel-Familie gebildet wird. NFNB stellt einen wichtigen Regulator in der Abwehr von Infektionskrankheiten und zellulärem Stress dar (Luo et al. 2005). Die Aktivierung von NFNB erfolgt durch eine Vielzahl verschiedener Signale, wie z. B. bakterielle Mo-

Die Fos- und Jun-Proteine sind Mitglieder der Transkriptionsfaktoren der Klasse bZIP („basic zipper“) (Hess et al. 2004). Diese „basic zipper“-Transkriptionsfaktoren können über die basische Domäne an die DNA binden und über die Zipper-Domäne eine Homo- oder Heterodimerisierung durchführen. Fos und Jun wurden ursprünglich als die beiden Untereinheiten des Transkriptionsfaktors AP-1 identifiziert. Sie regulieren die Expression einer Vielzahl von Genen, die in Differenzierung, Apoptose und Zellproliferation eingreifen. Die Regulation von Fos und Jun erfolgt über ein großes Spektrum physiologischer und pathologischer Stimuli, wie Zytokine, Wachstumsfaktoren, Stresssignale und Infektionen. Regulationsmechanismen beruhen sowohl auf der Bereitstellung unterschiedlicher Mengen der verschiedenen Fos- und Jun-Mitglieder, als auch auf der Ebene der Proteinmodifikation durch Phosphorylierung (> Abb. 1.6.9). Diese Phosphorylierungen können über verschiedene Kinasen erfolgen, u. a. innerhalb von Signaltransduktionskaskaden, die über zellmembrangebundene Rezeptortyrosinkinasen gestartet werden (Johnson u. Lapadat 2002; Karin u. Hunter 1995). Die Tatsache, dass Fos und Jun als zelluläre homologe Gene der retroviralen Onkoproteine (v-Fos und v-Jun) entdeckt wurden, zeigt schon deutlich, dass die Fehlfunktion beider Proteine eine wichtige Rolle bei der Tumorentstehung spielt.

133 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

1.6

. Abb. 1.6.9. Exemplarische Darstellung von drei Regulationskaskaden mit klinischer Relevanz. Steroidhormone binden zytoplasmatische Rezeptoren, die nach Dimerisierung in den Zellkern einwandern und an spezifische DNA-Sequenzen binden. Dieser Typ von Rezeptor wandert also direkt in den Kern ein und reguliert dort benachbarte Gene. Daher werden diese Rezeptoren auch als Kernrezeptoren bezeichnet. Zytokine, wie z. B. Interleukin-I (Il-I) binden an Interleukinrezeptoren (Il-IR) und können eine Signalkaskade auslösen. Ein Zielmolekül dieser Signalkaskaden ist der Inhibitor IκB, der

phosphoryliert wird (gelber Kreis) und sich von den NFκB-Untereinheiten ablöst. NFκB kann nun in den Zellkern einwandern und an spezifische Regulatorsequenzen binden. Andere Wachstumsfaktoren oder Zytokine binden an ihre spezifischen Rezeptoren, die eigene Signalkaskaden in den Zellkern hineinleiten. Zielmoleküle können u. a. die Transkriptionsfaktoren Fos und Jun sein, die durch die Phosphorylierung zur Dimerisierung und DNA-Bindung geführt werden. Fos und Jun, auch bekannt als Transkriptionsfaktor Ap1, sind in der Lage, benachbarte Gene zu aktivieren

1.6.5.3 Kernrezeptoren

rung der Transkriptionsrate. Die Rezeptoren des anderen Typs sind bereits in der Abwesenheit ihres Hormons an ihre Erkennungssequenzen gebunden. Die meisten Rezeptoren dieser großen Proteinfamilie binden als Heterodimer mit einem gemeinsamen Heterodimerisierungspartner an die DNA. Dieser Partner ist der Rezeptor für 9-cis Retinsäure (RXR). In Abwesenheit des spezifischen Hormons assoziieren diese Rezeptoren mit Korepressorkomplexen und vermitteln dadurch die Repression der Transkription (Privalsky 2004). Nach der Bindung des Hormons verlieren die Rezeptoren durch eine Konformationsänderung die Affinität zu den Korepressorkomplexen und binden stattdessen Koaktivatorkomplexe, die für eine Steigerung der Transkriptionsrate sorgen (Perissi u. Rosenfeld 2005). Die Kern-Hormonrezeptoren übersetzen ein Hormonsignal also ohne die Vermittlung einer Signalkaskade direkt in eine geänderte Transkription. Die direkten physiologischen Wirkungen jedes einzelnen Rezeptors sind unglaublich vielfältig und aus diesem Grund noch nicht vollständig erforscht. Exemplarisch seien hier einige Funktionen einiger Rezeptoren erwähnt: Der Östrogenrezeptor führt zur Ausbildung der weiblichen Geschlechtsorgane, der Entwicklung des Gehirns, kardiovaskulärer Funktion, Regulation des Knochenstoffwechsels sowie zur Induktion des Epiphysenschlusses. Der Cortisonrezeptor führt zur Aktivierung der Glukoneogenese, der anabolen Funktion in der

Kern-Hormonrezeptoren sind Transkriptionsfaktoren, die durch Hormone gesteuert werden, deren lipophile Struktur es erlaubt, dass Zell- und Kernmembranen passiert werden. Die Kernrezeptoren sind daher im Gegensatz zu Rezeptoren von Wachstumsfaktoren, für die die Zellmembran undurchdringlich ist, nicht als Transmembranrezeptoren in der Zellmembran lokalisiert, sondern im Zytoplasma oder im Kern. Man unterscheidet zwei Gruppen von nukleären Hormonrezeptoren (Gronemeyer et al. 2004). Die relativ kleine Gruppe der Steroidrezeptoren, die Rezeptoren für Östrogen, Progesteron, Testosteron, Cortison und Aldosteron sind, und eine Familie von etwa 50 Rezeptoren, die neben dem Thyroidhormon hauptsächlich Nahrungsmittelkomponenten bzw. Metabolite von Nahrungsmitteln bindet. Diese Stoffe wie Retinsäure, Vitamin D3, Gallensäure oder oxidierte Cholesterole wirken im Körper als Hormone. In der Abwesenheit von Hormonen sind die Steroidrezeptoren überwiegend im Zytoplasma lokalisiert. Dort sind sie mit Heat-shock-Proteinen assoziiert. Nach Bindung des Hormons löst sich der Rezeptor aus diesem Komplex, dimerisiert mit einem Rezeptor gleichen Typs, wandert in den Kern und bindet an spezifische Erkennungssequenzen auf der DNA (> Abb. 1.6.9). Dort binden Koaktivatorkomplexe an das Rezeptor-Homodimer und vermitteln die Steige-

134

Sektion 1 · Allgemeine Grundlagen

Leber, der katabolen Funktion in Muskel- und Fettgewebe und hat vielfältige Einflüsse auf Entzündungsprozesse, u. a. durch Reduktion von T-Zellen. Der Thyroidhormonrezeptor ermöglicht die Steuerung des Grundumsatzes, der Gehirnentwicklung (Kretinismus), des Liver-X-Rezeptor-(LXR-)HDL-Transports aus den Zellen, die Steigerung des Cholesterinabbaus in der Leber sowie die Differenzierung von Fettgewebe (Glass 2006). Fehlfunktionen der Kern-Hormonrezeptoren können zu den unterschiedlichsten Krankheiten im Bereich der Stoffwechselkontrolle, der Reproduktion und des Zellwachstums führen. Hierzu zählen Tumorereignisse, Fertilitätsstörungen sowie Diabetes und Obesitas. Daher stellen auch die Kernrezeptoren eine sehr große Zielgruppe für die Entwicklung neuer Pharmazeutika dar (Gronemeyer et al. 2004). Die ligandenabhängige An- oder Abschaltung bestimmter Gene konnte genutzt werden, um die detaillierten Vorgänge im Promotorbereich zu untersuchen. Ein erstaunliches Ergebnis war, dass die Bindung von Regulationsfaktoren und weiterer Regulatorkomplexe (Remodeling-Komplexe, Modifikationskomplexe, Mediatorenkomplexe, 7 1.6.3) nicht einmalig und statisch an den Promotor erfolgt, sondern vielmehr, dass sequenzielle Bindungen und Modifikationen zu beobachten sind. So werden in den ersten Stunden der Genanschaltung verschiedene, alternierende Aktivierungsund Repressionszyklen durchlaufen (Metivier et al. 2006).

1.6.5.4 HOX-Gene Homeobox- (Hox-)Gene wurden bei Drosophila aufgrund auffälliger Phänotypen im Falle einer Mutation entdeckt. Die Phänotypen zeigten eindeutig, dass die Gene nicht für Strukturproteine kodieren, sondern vielmehr Regulationsfaktoren bilden, die die Identität einzelner Segmente festlegen. Bei einer Mutation führt das dazu, dass einzelne Segmente eine falsche Identität aufweisen. Diesen Regulationsfaktoren ist gemeinsam, dass sie mittels einer bestimmten DNA-Bindedomäne (der Homeobox) an DNA-Sequenzen binden können. Die Homeobox-Gene sind in ihrer Struktur und in ihrer Funktion bei allen tierischen Lebewesen hoch konserviert. Die HOX-Gene des Menschen umfassen 39 Mitglieder, die in vier Gruppen im Genom vorliegen. Fehlregulationen der HOX-Gene beim Menschen können zu Entwicklungsstörungen führen, besonders bei der Ausbildung der Extremitäten. Darüber hinaus wurden veränderte HOX-Gene im Zusammenhang mit akuter myeloischer Leukämie gefunden (Lappin et al. 2006).

1.6.5.5 Imprinting Der englische Begriff „Imprinting“ beschreibt eine genomische Prägung, die darin besteht, dass väterliche und mütterliche Allele unterschiedlich exprimiert werden. Dieser Unterschied ist unabhängig von der Nukleotidsequenz, da selbst bei völlig gleichen Sequenzen die elterlichen Allele verschieden exprimiert werden. Solch ein Phänomen wird auch allgemein als Epigenetik beschrieben. Die große Bedeutung des Imprinting wird im Falle von Fehlverteilungen von Chromosomen deutlich. Die sog. uniparentale Disomie (UPD) beschreibt eine Situation, in der eines der Chromosomen in einem homologen Chromosomenpaar verloren gegangen ist und durch eine Verdopplung des verbliebenen Chromosoms ersetzt wurde. Hier liegen also zwei völlig identische Chromosomen vor, die beide entweder ursprünglich von der Mutter oder vom Vater stammten. Liegt z. B. eine mütterliche UPD des Chromosoms 15 vor, so ist das die Ursache für das Auftreten des sog. Prader-Willi-Syndroms (Robertson 2005). Dieses Syndrom ist durch mentale Retardierung und Obesitas gekennzeichnet. Tritt jedoch eine UPD des ursprünglich väterlichen Chromosoms 15 auf, so entwickelt sich das Angelman-Syndrom. Dieses verursacht erhebliche mentale Retardierung und viele andere pathologische Merkmale. In beiden Fällen liegt die vollständige Anzahl aller diploiden Gene vor. Dennoch zeigen diese uniparentalen Disomien, dass offensichtlich einige der Gene der Mutter, bzw. einige der Gene des Vaters auf dem Chromosom 15 nicht exprimiert sind. Der molekulare Mechanismus des Abschaltens eines der beiden elterlichen Allele erfolgt in der Regel über DNA-Methylierung (7 1.6.2). So führt nicht nur eine UPD zu pathologischen Situationen, sondern auch ein „loss-of-imprinting“ (LOI) kann zu ähnlichen Phänotypen führen. Die Ursache für LOI ist in der Regel der Verlust der DNA-Methylierung an bestimmten Genen. Viele der Gene, die eine genomische Prägung aufweisen, spielen eine Rolle im Wachstum und der Zellproliferation. Daher ist es nicht verwunderlich, dass LOI-Situationen auch in Verbindung mit Tumorereignissen gefunden wurden. Man kennt ca. 80 Gene, die ein elterliches Imprint aufweisen. Diese Gene sind häufig in Gruppen organisiert, wobei jeweils mütterlich und väterlich geprägte Gene in diesen Gruppen gemischt vorliegen. Exemplarisch wird das am chromosomalen Locus 11p15.5 verdeutlicht, der im Falle einer paternalen UPD oder eines LOI zum Beckwith-Wiedemann-Syndrom mit überhöhtem Geburtsgewicht, erhöhter embryonaler Tumorrate und vielen anderen Merkmalen führt (Robertson 2005) (> Abb. 1.6.10). Ein weiteres auffälliges, aber für solche Regionen typisches Merkmal ist darin zu sehen, dass eine große Anzahl der Gene mit einem Imprint nicht für ein Protein kodieren, sondern

135 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

1.6

. Abb. 1.6.10. Chromosomale Region 11p15.5 mit pathologischen Imprinting-Defekten. Eine Gruppe von 15 Genen ist in Form von Pfeilen dargestellt, die die Transkriptionsrichtung anzeigen. Aktive Gene (grün) und inaktive Gene (rot) sind sowohl auf dem väterlichen Chromosom (oben), als auch auf dem mütterlichen Chromosom (unten) angegeben. Wichtige Regionen mit methylierten CpG-Sequenzen (rote Kreise) bzw. unmethylierten CpG-Sequenzen (weiße Kreise) zeigen die differenzielle Methylierung beider elterlicher Chromosomen. Der Faktor CTCF kann nur an die unmethylierten DNA-Sequenzen

binden und führt zu einer Abschaltung von Genen durch die Blockade benachbarter Enhancer-Sequenzen. Interessanterweise enthält das Gen KCNQ1 ein Antisense-Transkript (KNCQ1OT1). Dieses Antisense-Transkript scheint nicht für ein Protein zu kodieren. Auch das Gen H19 bildet eine nichtkodierende RNA. Sowohl Tumorereignisse als auch das Beckwith-Wiedemann-Syndrom werden durch Mutationen und Translokationen in dieser Region, durch uniparentale Disomie, sowie durch Loss-of-Imprinting verursacht

eine nichtkodierende RNA produzieren (7 auch 1.6.4). Die molekulare Wirkungsweise dieser nichtkodierenden RNA ist noch unbekannt. Die allelspezifische DNA-Methylierung ist Ursache für die jeweilige An- oder Abschaltung von Genen. Am Locus 11p15.5 war gezeigt worden, dass ein DNA-bindender Faktor, CTCF, an spezifische Sequenzen bindet und für die Abschaltung einiger Gene sorgt (Ohlsson et al. 2001). Der Mechanismus beruht auf der Blockade der Enhancer-Wirkung auf diese Gene (7 1.6.1.5). Im Falle der DNA-Methylierung kann CTCF nicht binden und ermöglicht so die Anschaltung der Gene.

eine bestimmte Gengruppe falsch reguliert erscheint, wird man Regulationsmechanismen nur dann aufklären können, wenn gezeigt wurde, an welcher Stelle der Regulationskontrolle ein Defekt vorliegt. So wird die Zukunft der Analyse von Regulationsvorgängen sicherlich in einer Kombination der funktionellen Untersuchung einzelner Gene, der funktionellen Genomik aller Gene und der Bioinformatik bestehen.

1.6.6 Ausblick Die Sequenzierung des menschlichen Genoms hat zur Identifizierung aller proteinkodierenden Gene geführt. Der Nachweis möglicher zusätzlicher, nichtkodierender Gene, die RNA-Produkte mit regulatorischen Funktionen produzieren, ist sicherlich eine wichtige Herausforderung der Bioinformatik. Jedoch wird die Bioinformatik nie alleine in der Lage sein, weder die Funktion der proteinkodierenden noch der nichtkodierenden RNA-Gene vorherzusagen. Vielmehr zeigt sich immer wieder, dass für eine immer noch sehr große Anzahl von Genen experimentelle Untersuchungen notwendig sind, um etwas über ihre Funktion zu lernen. In diesem Bereich der Zuordnung von Funktionen zu einzelnen Genen wird ein großer Anteil zukünftiger Forschungsaktivitäten liegen. Die funktionelle Genomik (7 Kap. 1.4) wird neben der potenziellen Möglichkeit zur Prognose und Therapie von Erkrankungen einen wichtigen Beitrag zum Verständnis der Genfunktion liefern. Allerdings wird diese Technik immer nur den Aktivitätszustand einzelner, vieler oder aller Gene beschreiben können. Wenn es jedoch darum geht herauszufinden, warum

1.6.7 Literatur Bowen NJ, Fujita N, Kajita M, Wade PA (2004) Mi-2/NuRD: multiple complexes for many purposes. Biochim Biophys Acta 1677: 52–57 Buratowski S (2005) Connections between mRNA 3c end processing and transcription termination. Curr Opin Cell Biol 17: 257–261 Cremer T, Cremer C (2001) Chromosome territories, nuclear architecture and gene regulation in mammalian cells. Nat Rev Genet 2: 292–301 Glass CK (2006) Going nuclear in metabolic and cardiovascular disease. J Clin Invest 116: 556–560 Gronemeyer H, Gustafsson JA, Laudet V (2004) Principles for modulation of the nuclear receptor superfamily. Nat Rev Drug Discov 3: 950–964 Hess J, Angel P, Schorpp-Kistner M (2004) AP-1 subunits: quarrel and harmony among siblings. J Cell Sci 117: 5965–5973 Johnson GL, Lapadat R (2002) Mitogen-activated protein kinase pathways mediated by ERK, JNK, and p38 protein kinases. Science 298: 1911–1912 Karin M, Hunter T (1995) Transcriptional control by protein phosphorylation: signal transmission from the cell surface to the nucleus. Curr Biol 5: 747–757 Kornblihtt AR, de la Mata M, Fededa JP, Munoz MJ, Nogues G (2004) Multiple links between transcription and splicing. RNA 10: 1489–1498 Lappin TR, Grier DG, Thompson A, Halliday HL (2006) HOX genes: seductive science, mysterious mechanisms. Ulster Med J 75: 23–31 Lewis BA, Reinberg D (2003) The mediator coactivator complex: functional and physical roles in transcriptional regulation. J Cell Sci 116: 3667–3675

136

Sektion 1 · Allgemeine Grundlagen

Luo JL, Kamata H, Karin M (2005) IKK/NF-kappaB signaling: balancing life and death--a new approach to cancer therapy. J Clin Invest 115: 2625–2632 Lusser A, Kadonaga JT (2003) Chromatin remodeling by ATP-dependent molecular machines. Bioessays 25: 1192–1200 Meinhart A, Kamenski T, Hoeppner S, Baumli S, Cramer P (2005) A structural perspective of CTD function. Genes Dev 19: 1401– 1415 Mendes Soares LM, Valcarcel J (2006) The expanding transcriptome: the genome as the‚Book of Sandc. Embo J 25: 923–931 Metivier R, Reid G, Gannon F (2006) Transcription in four dimensions: nuclear receptor-directed initiation of gene expression. EMBO Rep 7: 161–167 Ohlsson R, Renkawitz R, Lobanenkov V (2001) CTCF is a uniquely versatile transcription regulator linked to epigenetics and disease. Trends Genet 17: 520–527 Perissi V, Rosenfeld MG (2005) Controlling nuclear receptors: the circular logic of cofactor cycles. Nat Rev Mol Cell Biol 6: 542–554 Peterson CL, Laniel MA (2004) Histones and histone modifications. Curr Biol 14: R546–551

Privalsky ML (2004) The role of corepressors in transcriptional regulation by nuclear hormone receptors. Annu Rev Physiol 66: 315–360 Roberts CW, Orkin SH (2004) The SWI/SNF complex-chromatin and cancer. Nat Rev Cancer 4: 133–142 Robertson KD (2005) DNA methylation and human disease. Nat Rev Genet 6: 597–610 Roeder RG (2005) Transcriptional regulation and the role of diverse coactivators in animal cells. FEBS Lett 579: 909–915 Silverstein RA, Ekwall K (2005) Sin3: a flexible regulator of global gene expression and genome stability. Curr Genet 47: 1–17 Strahl BD, Allis CD (2000) The language of covalent histone modifications. Nature 403: 41–45 Watson JJ, Baker TA, Bell SP, Gann A, Levine M, Losick R (2004) Molecular biology of the gene: Cold Spring Harbor Laboratory Press West AG, Fraser P (2005) Remote control of gene transcription. Hum Mol Genet 14 Spec No 1: R101–111

137 1.6 · Regulationsmechanismen der Transkription in Eukaryonten

1.6.8 Zeittafel 1953

Watson, Crick, Franklin und Wilkins: Aufklärung der Struktur der DNA-Doppelhelix (Watson u. Crick 1953).

1959

Weiss und Gladstone weisen die enzymatische Aktivität der RNA-Polymerase nach (Weiss u. Gladstone 1959).

1960

Jacob und Monod postulieren das Operon-Modell, das die Regulation des lac-Operon in Bakterien beschreibt (Jacob et al. 1960).

1961

Lyon findet die Erklärung für die Dosiskompensation der beiden X-Chromosomen in weiblichen Säugern im Vergleich zum einzelnen X-Chromosom in männlichen Säugern. Die Dosiskompensation beruht auf der Inaktivierung eines der beiden X-Chromosomen (Lyon 1961).

1966

Scaife und Beckwith gelingt der Nachweis einer Promotor-Region als Startstelle der Transkription (Scaife u. Beckwith 1966).

1973

Cohen, Chang, Boyer und Helling zeigen, dass DNA-Moleküle neu kombiniert und kloniert werden können (Cohen et al. 1973).

1974

Kornberg entwickelt das Konzept von Nukleosomen, die aus Histonen bestehen, um die eukaryote DNA herumgewickelt ist (Kornberg 1974).

1975

Riggs, Holliday and Pugh postulieren eine wichtige Rolle für die DNA-Methylierung in Eukaryonten, die zur Repression der Genaktivität führt (Holliday u. Pugh 1975; Riggs 1975).

1977

Gilbert und Sanger entwickeln Methoden zur Sequenzierung von DNA (Maxam u. Gilbert 1977; Sanger et al. 1977).

1978

Tjian gelingt der Nachweis von Transkriptionsfaktoren, die sequenzspezifisch an DNA binden (Tjian 1978).

1981

Schaffner identifiziert Enhancer-Elemente, die Gene regulieren können, selbst wenn sie mehrere Tausend Basenpaare oberhalb oder sogar unterhalb des Gens liegen (Banerji et al. 1981).

1984

Surani, McGrath und Solter weisen nach, dass sowohl das mütterliche, als auch das väterliche Genom für die Embryonalentwicklung notwendig sind. Sie konnten zeigen, dass die Genome beider Eltern nicht gleich sind, sondern eine genetische Prägung (Imprint) enthalten (McGrath u. Solter 1984; Surani et al. 1984).

1994

Peterson, Kingston und Green isolieren Chromatin-Remodeling-Komplexe (Cote et al. 1994; Kwon et al. 1994).

1994

Kornberg et al. beschreiben einen Mediatorkomplex (Kim et al. 1994).

1995

Brown et al. produzieren einen ersten Microarray, mit dem gleichzeitig die Aktivität vieler Gene bestimmt werden konnte (Schena et al. 1995).

1996

Allis und Schreiber zeigen, dass die Acetylierung und Deacetylierung von Histonen Gene reguliert (Mizzen et al. 1996; Taunton et al. 1996).

1998

Fire, Mello et al. zeigen, dass die durch doppelsträngige RNA verursachte RNA-Interferenz bei beliebigen Genen sequenzabhängig funktioniert (Fire et al. 1998).

1999

Die Struktur der RNA-Polymerase wird von Darst und Kornberg aufgeklärt (Fu et al. 1999; Zhang et al. 1999).

2001

Die Sequenzierung des humanen Genoms durch zwei unterschiedliche Konsortien, die von Venter und von Collins geleitet wurden, führt zur vollständigen Genomsequenz (Lander et al. 2001; Venter et al. 2001).

2006

Andrew Z. Fire (Stanford University, School of Medicine, Stanford, CA, USA) und Craig C. Mello (University of Massachusetts, Medical School, Worcester, MA, USA) erhielten für ihre bahnbrechenden Arbeiten zum spezifischen Abbau der mRNA im Jahre 2006 den Nobelpreis für Physiologie und Medizin. Mit diesem Nobelpreis wird nicht nur ihre Leistung im Rahmen der Grundlagenforschung gewürdigt, sondern auch das Potenzial der von ihnen charakterisierten Mechanismen zur möglichen zukünftigen Therapie von Patienten (Fire et al. 1998). Roger D. Kornberg (Stanford University, School of Medicine, Stanford, CA, USA) erhielt im Jahre 2006 den Nobelpreis für Chemie für seine grundlegenden Arbeiten über die Mechanismen der Transkription. Besonders die kristallographischen Aufklärungen der Struktur der DNA-abhängigen RNA-Polymerase waren ein wichtiger Durchbruch im Verständnis des Transkriptionsvorgangs (Fu et al. 1999; Zhang et al. 1999).

1.6

138

Sektion 1 · Allgemeine Grundlagen

Literatur zur Zeittafel Banerji J, Rusconi S, Schaffner W (1981) Expression of a beta-globin gene is enhanced by remote SV40 DNA sequences. Cell 27: 299–308 Cohen SN, Chang AC, Boyer HW, Helling RB (1973) Construction of biologically functional bacterial plasmids in vitro. Proc Natl Acad Sci U S A 70: 3240–3244 Cote J, Quinn J, Workman JL, Peterson CL (1994) Stimulation of GAL4 derivative binding to nucleosomal DNA by the yeast SWI/ SNF complex. Science 265: 53–60 Fire A, Xu S, Montgomery MK, Kostas SA, Driver SE, Mello CC (1998) Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature 391: 806–811 Fu J, Gnatt AL, Bushnell DA, Jensen GJ, Thompson NE, et al (1999) Yeast RNA polymerase II at 5 A resolution. Cell 98: 799–810 Holliday R, Pugh JE (1975) DNA modification mechanisms and gene activity during development. Science 187: 226–232 Jacob F, Perrin D, Sanchez C, Monod J (1960) [Operon: a group of genes with the expression coordinated by an operator.]. C R Hebd Seances Acad Sci 250: 1727–1729 Kim YJ, Bjorklund S, Li Y, Sayre MH, Kornberg RD (1994) A multiprotein mediator of transcriptional activation and its interaction with the C-terminal repeat domain of RNA polymerase II. Cell 77: 599–608 Kornberg RD (1974) Chromatin structure: a repeating unit of histones and DNA. Science 184: 868–871 Kwon H, Imbalzano AN, Khavari PA, Kingston RE, Green MR (1994) Nucleosome disruption and enhancement of activator binding by a human SW1/SNF complex. Nature 370: 477–481 Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, et al (2001) Initial sequencing and analysis of the human genome. Nature 409: 860–921 Lyon MF (1961) Gene action in the X-chromosome of the mouse (Mus musculus L.). Nature 190: 372–373

Maxam AM, Gilbert W (1977) A new method for sequencing DNA. Proc Natl Acad Sci U S A 74: 560–564 McGrath J, Solter D (1984) Inability of mouse blastomere nuclei transferred to enucleated zygotes to support development in vitro. Science 226: 1317–1319 Mizzen CA, Yang XJ, Kokubo T, Brownell JE, Bannister AJ, et al (1996) The TAF(II)250 subunit of TFIID has histone acetyltransferase activity. Cell 87: 1261–1270 Riggs AD (1975) X inactivation, differentiation, and DNA methylation. Cytogenet Cell Genet 14: 9–25 Sanger F, Nicklen S, Coulson AR (1977) DNA sequencing with chainterminating inhibitors. Proc Natl Acad Sci U S A 74: 5463–5467 Scaife J, Beckwith JR (1966) Mutational alteration of the maximal level of Lac operon expression. Cold Spring Harb Symp Quant Biol 31: 403–408 Schena M, Shalon D, Davis RW, Brown PO (1995) Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science 270: 467–470 Surani MA, Barton SC, Norris ML (1984) Development of reconstituted mouse eggs suggests imprinting of the genome during gametogenesis. Nature 308: 548–550 Taunton J, Hassig CA, Schreiber SL (1996) A mammalian histone deacetylase related to the yeast transcriptional regulator Rpd3p. Science 272: 408–411 Tjian R (1978) The binding site on SV40 DNA for a T antigen-related protein. Cell 13: 165–179 Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, et al (2001) The sequence of the human genome. Science 291: 1304–1351 Watson JD, Crick FH (1953) Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid. Nature 171: 737–738 Weiss S, Gladstone LA (1959) A mammalian system for the incorporation of cytidine triphosphate into ribonucleic acid. Journal of the American Chemical Society 81: 4118–4119 Zhang G, Campbell EA, Minakhin L, Richter C, Severinov K, Darst SA (1999) Crystal structure of Thermus aquaticus core RNA polymerase at 3.3 A resolution. Cell 98: 811–824

1.7 1.7 Mechanismen der Translationskontrolle in Eukaryonten Martina U. Muckenthaler und Thomas Preiss

1.7.1

Der Ablauf der Translation

1.7.1.1 1.7.1.2 1.7.1.3 1.7.1.4

Die Translationsmaschinerie – 140 Translationsinitiation – 140 Translationselongation – 141 Translationstermination – 141

1.7.2

Globale Kontrolle der Translationsinitiation

1.7.2.1 1.7.2.2 1.7.2.3 1.7.2.4

Regulation der Initiation durch Phosphorylierung – 142 Regulation durch molekulares Mimikry – 145 Proteolyse von eIF4G – 146 Zelluläre Stresszustände regulieren die Translation – 146

1.7.3

mRNA-spezifische Translationskontrolle

1.7.3.1 1.7.3.2

5‘-UTR-vermittelte Translationskontrolle – 147 3‘-UTR-vermittelte Kontrolle der Translation – 151

1.7.4

Ausblick

– 154

1.7.5

Literatur

– 155

1.7.6

Zeittafel

– 140

– 142

– 147

– 156

Literatur zur Zeittafel

– 157

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

140

Sektion 1 · Allgemeine Grundlagen

Das Ribosom ist eine komplexe, biologische Maschine, die den genetischen Kode der mRNA in Proteine übersetzt. Dieser mehrstufige Prozess wird Translation genannt und ist ein essenzieller Schritt in der Genexpression. Die Translation kann durch diverse, physiologische und pathophysiologische Faktoren reguliert werden. Dieses Kapitel bietet eingangs einen Überblick über den Vorgang der Translation und die daran beteiligten Komponenten. Der Schwerpunkt des Kapitels liegt jedoch auf den verschiedenen Mechanismen zur Regulation der Translation und insbesondere der Translationsinitiation.

1.7.1 Der Ablauf der Translation 1.7.1.1 Die Translationsmaschinerie In der Translation muss der Kode der aus 4 Nukleotiden (A, U, C und G) bestehenden mRNA in eine Abfolge von 20 Aminosäuren übersetzt werden. 3 Nukleotide (ein Triplett) stehen dabei für eine Aminosäure. Manche Aminosäuren wie Serin, Leucin oder Arginin werden von sechs verschiedenen Tripletts kodiert; für Tryptophan oder Methionin gibt es nur ein Triplett. Die Translation beginnt in der Regel an einem für Methionin kodierenden AUGTriplett, dem sog. Startkodon. Die Tripletts UAG, UAA und UGA sind, von bestimmten Ausnahmen abgesehen, die Stoppsignale der Translation. Für die Übersetzung eines Nukleotidtripletts in eine Aminosäure bedarf es eines Adaptermoleküls, der Transfer-RNA (tRNA). Dabei handelt es sich um 75–80 Nukleotide lange RNA-Moleküle, die eine kleeblattähnliche Sekundärstruktur ausbilden. Mit dem sogenannten Antikodon-Arm erkennt die tRNA über Basenpaarung den genetischen Kode der mRNA. Am Aminoacyl-Arm der tRNA ist die entsprechende Aminosäure kovalent gekoppelt. Für jede tRNA gibt es ein spezifisches Enzym, welches diese mit einer Aminosäure belädt. Für den mechanischen Rahmen der Translation, das Ablesen der mRNA und die Bildung von Peptidbindungen sind die Ribosomen zuständig. Eukaryote zytoplasmatische Ribosomen bestehen aus über 80 ribosomalen Proteinen und vier verschiedenen ribosomalen RNA-Molekülen (rRNA). Unterscheiden lassen sich zwei Untereinheiten, die 40S- und die 60S-Untereinheit (die Einheit „S“ steht für Svedberg und ist ein Maß für das Sedimentationsverhalten bei Gradientenzentrifugationen). Meist werden mRNAs von mehreren Ribosomen gleichzeitig translatiert, man spricht dann von Polysomen. Die Translation wird generell in 3 Phasen eingeteilt: 1. die Initiation, 2. die Elongation und 3. die Termination (Sonenberg et al. 2000).

Jede Phase benötigt sowohl eine Reihe an spezifischen Proteinen, als auch ATP bzw. GTP als Energieträger.

1.7.1.2 Translationsinitiation Unter der Translationsinitiation versteht man Vorgänge, die dazu führen, dass die 40S- und 60S-ribosomalen Untereinheiten nahe dem 5c-Ende der mRNA zusammengeführt werden, sodass die Proteinsynthese am Startkodon, in den meisten Fällen dem ersten AUG-Triplett, beginnen kann. Während in Bakterien die kleine ribosomale Untereinheit über Basenpaarung der 16S-rRNA mit der komplementären Shine-Dalgarno-Sequenz in der Nähe des AUG direkt an die mRNA binden kann, wird in eukaryoten Zellen die kleine ribosomale Untereinheit mithilfe mehrerer Translationsinitiationsfaktoren an die mRNA rekrutiert. Vereinfachend kann man die Initiation an einer typischen mRNA in drei Abschnitte unterteilen (> Abb. 1.7.1): 1. die Bindung der 40S-ribosomalen Untereinheit und damit assoziierter Faktoren nahe des 5c-Endes der mRNA; 2. ein „Scanning“ dieses Präinitiationskomplexes entlang der mRNA; 3. Erkennen des Startkodons und Anlagerung der 60S-Untereinheit zur Bildung des 80S-Ribosoms. Die Bindung der 40S-Untereinheit wird entscheidend durch die beiden, im Nukleus angefügten, posttranskriptionellen Modifikationen an den Enden der mRNA – die Cap-Struktur (m7GpppN) und den Poly(A)-Schwanz – beeinflusst (Preiss u. Hentze 2003; Sachs u. Varani 2000; Sonenberg et al. 2000). Der eukaryote Initiationsfaktor (eIF) 4F bindet an die Cap-Struktur der mRNA. eIF4F besteht aus dem Cap-bindenden Protein eIF4E, welches die interagierenden Proteine eIF4G und eIF4A an das 5c-Ende der mRNA bringt. eIF4A ist eine ATP-abhängige Helikase und kann, stimuliert durch den Translationsfaktor eIF4B, Sekundärstrukturen in der Cap-nahen Region der mRNA auflösen. eIF4G ist ein multifunktioneller Adapter, der verschiedene Komponenten des Translationsinitiationsapparats zusammenführt. eIF4G bindet weiterhin an das Poly(A)-bindende Protein (PABP). Die daraus folgende Zirkularisierung ist bedeutsam für die effiziente mRNA-Translation. eIF4G kann auch an eIF3 binden und so die 40S-Untereinheit an die mRNA rekrutieren. Die 40S-Untereinheit bindet in Form des sog. 43S-Präinitiationskomplexes an die mRNA, der weiterhin auch eIF3 und den ternären Komplex enthält. Der ternäre Komplex besteht aus der beladenen Initiator-Methionyl-tRNA (Met-tRNAiMet), eIF2 und GTP. Ein gängiges Modell der Translationsinitiation besagt, dass sich dann der 43S-Komplex in 3c-Richtung an

141 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

1.7

einheit an. Das 80S-Ribosom ist jetzt bereit für die erste Peptidbindung. Die Proteinsynthese beginnt meist (zu etwa 95%) am ersten Initiationskodon nach der CapStruktur.

1.7.1.3 Translationselongation

. Abb. 1.7.1. Die Initiationsphase der Translation. Gezeigt ist eine eukaryote mRNA mit den zwei typischen, posttranskriptionellen Modifikationen, der Cap-Struktur (m7Gppp) und dem Poly(A)Schwanz (AAA). Das proteinkodierende offene Leseraster ist durch ein Start- und ein Stoppkodon markiert. In einem ersten Schritt bindet ein Proteinkomplex (eIF4F), der aus eIF4E, eIF4G und eIF4A besteht, an die Cap-Struktur. Die Bindung des Poly(A)-bindenden Proteins (PABP) an eIF4G führt zur Zirkularisierung der mRNA. Im Folgenden wird die kleine ribosomale Untereinheit (40S) mit den Initiationsfaktoren eIF3 und dem ternären Komplex, bestehend aus eIF2, der Met-tRNAiMet und GTP, an die mRNA rekrutiert. Dieser sog. 43S-Präinitiationskomplex bewegt sich dann in einem Scanningvorgang in 3c-Richtung entlang der mRNA. Die Kodon-Antikodon-Interaktion der Initiator-tRNAMet identifiziert das Startkodon AUG. Daraufhin erfolgen die Freisetzung der eIFs und die Bindung der großen ribosomalen Untereinheit (60S). Dieses 80S-Ribosom kann die Proteinbiosynthese nach Maßgabe der kodierenden Region der mRNA beginnen

der mRNA entlang bewegt (Kozak 1999). Dieses „Scanning“ der mRNA benötigt ATP-Hydrolyse und endet mit dem Erreichen des Startkodons. Dort bindet die Met-tRNAiMet über ihr Antikodon an das AUG. Das im ternären Komplex gebundene GTP wird durch eIF2 hydrolysiert. Daraufhin wird eIF2-GDP und eIF3 von der 40S-ribosomalen Untereinheit freigesetzt. eIF2-GDP ist inaktiv und muss zu eIF2-GTP regeneriert werden, um wieder an einem neuen Translationsinitiationszyklus teilnehmen zu können. Dieser Schritt wird durch den Guanin-Nukleotid-Austauschfaktor eIF2B katalysiert und ist ein wichtiger Kontrollpunkt der Translationsinitiation (7 1.7.2.1). Unter dem Einfluss von eIF5B und der Spaltung eines weiteren GTPs lagert sich die 60S-Unter-

Die Translationselongation besteht aus drei, immer wiederkehrenden Schritten (Sonenberg et al. 2000). Sobald sich das 80S-Ribosom am Initiationskodon ausgebildet hat, kann die Proteinbiosynthese beginnen. Die Met-tRNAiMet ist an der Peptid- (P-)Stelle des Ribosoms gebunden. Die Aminoacyl-tRNA, die zum zweiten Kodon gehört, bindet mit ihrem Antikodon an die mRNA, und zwar so, dass sie an der Eingangsstelle (A-Stelle) des Ribosoms sitzt. Daran beteiligt ist der Elongationsfaktor 1 (eEF1). Katalysiert durch die 60Sribosomale Untereinheit kommt es zur Peptidbindung zwischen dem Initiator-Methionin und der darauf folgenden Aminosäure. Das entstandene Dipeptid befindet sich vorerst noch an der A-Stelle des Ribosoms und wird dann in dem 3. Schritt zusammen mit der mRNA an die P-Stelle transloziert. Dieser Schritt benötigt eEF2. Durch diese Bewegung wird die A-Stelle für die Bindung der nächsten (dritten) Aminoacyl-tRNA freigemacht. Der Zyklus beginnt wieder mit Schritt 1 – und zwar so lange, bis die mRNA Triplett für Triplett dekodiert wurde und das Ribosom auf ein Stoppkodon trifft (UAG, UAA oder UGA). Jedes einzelne Triplett muss exakt in die richtige Aminosäure übersetzt werden – nur so ist gewährleistet, dass ein funktionstüchtiges Protein entsteht. Die Elongationsfaktoren führen dazu Qualitätskontrollen durch, die Energie benötigen, und zwar zwei Moleküle GTP pro Ausbildung einer Peptidbindung. Mutationen in der DNA, die durch Einfügung oder Deletion von Nukleotiden entstehen, können das Leseraster verschieben („Frameshift“). Dies führt zum Einbau von falschen Aminosäuren und meist zum baldigen Abbruch der Translation, da das Ribosom auf ein verfrühtes Stoppkodon trifft. In seltenen Fällen können von Ribosomen ausgeführte Frameshifts aber auch gezielt für die Regulation der Genexpression eingesetzt werden (7 1.7.3.1 und > Abb. 1.7.5).

1.7.1.4 Translationstermination Sobald sich ein Stoppkodon an der A-Stelle befindet, bindet dort ein Komplex aus den Releasefaktoren (RF) 1 und 3. RF1 ist in seiner Struktur einer tRNA ähnlich. Er besetzt die A-Stelle und katalysiert die Freisetzung des fertigen Polypeptids von der letzten tRNA. Das Ribosom

142

Sektion 1 · Allgemeine Grundlagen

zerfällt dann wieder in 40S- und 60S- Untereinheiten (Sonenberg et al. 2000). In bestimmten Fällen kann aber ein Stoppkodon einfach überlesen werden, was dann zu einem verlängerten Protein führt (7 1.7.3.1 und > Abb. 1.7.5). Auch in Proteinen, die die seltene Aminosäure Selenocystein enthalten, wird die Funktion des Stoppkodons verändert (Sonenberg et al. 2000). Die mRNA für die selenabhängige Glutathion-Peroxidase 1 (Se-GPX1) oder die im Schilddrüsenstoffwechsel wichtige Deiodase enthält ein UGAKodon, welches für Selenocystein kodiert. Dies wird gesteuert durch eine sekundärstrukturreiche Sequenz in der 3c-nichttranslatierten Region („untranslated region“, UTR) der Se-GPX1-mRNA, der „selenocystein insertion sequence“ (SECIS). Bei geringen Selenmengen in der Zelle wird dieses UGA als frühzeitiges Stoppkodon gelesen. Die mRNA wird dann über den „nonsense-mediated decay“- (NMD-)Weg abgebaut (7 1.7.1.4). „Nonsense-mediated decay“ (NMD) NMD ist ein Überwachungsmechanismus in der Zelle, der aktiviert wird, wenn Ribosomen auf ein frühzeitiges Stoppkodon („nonsense codon“) stoßen. Solche Stoppkodons können z. B. durch Leserasterverschiebungen oder Punktmutationen entstehen und führen potenziell zu einem carboxyterminal-verkürzten Polypeptid. Die Identifizierung eines Nonsense-Kodons führt zum Abbau der mRNA, dem „nonsense-mediated decay“. Damit wird verhindert, dass funktionsuntüchtiges Protein hergestellt wird. Für die Unterscheidung zwischen einem regulären und einem frühzeitigen Stoppkodon ist sowohl der Spleißvorgang als auch die Translation von Bedeutung. Ein kritischer Punkt für die Auslösung von NMD ist, ob weiter als 50 Nukleotide vom 3c-Ende des Stoppkodons entfernt ein Exon-ExonÜbergang in der mRNA vorliegt. Exon-Exon-Übergänge werden im Nukleus während des Spleißvorgangs sequenzunabhängig durch einen Multiproteinkomplex, den sog. „Exon-junction-complex“ markiert und dann im Zytoplasma während der Translation erkannt (Holbrook et al. 2004). Nonsense-Mutationen sind ursächlich an über 240 verschiedenen Erbkrankheiten beteiligt (z. B. Zystische Fibrose, Hämophilie, Duchenne-Muskeldystrophie und Marfan-Syndrom). Zusätzlich werden viele Formen von Kolon-, Brust- und Blasenkrebs durch Leserasterverschiebungen in regulatorischen Genen verursacht (z. B. p53, BRCA1, BRCA2) (McKusick u. Amberger 1994). Anhand von Nonsense-Mutationen im β-globin-Gen lässt sich die Bedeutung des NMD veranschaulichen. Unterliegt die mutierte mRNA dem NMD, dann folgt die resultierende E-Thalassämie einem rezessiven Vererbungsmuster. Andere Nonsense-Mutationen im βGlobin-Gen, deren mRNAs dem NMD entgehen, führen

schon bei Patienten mit heterozygotem Genotyp zu klinisch signifikanten Ausprägungen der Erkrankung.

1.7.2 Globale Kontrolle der Translationsinitiation Die Synthese von Proteinen verbraucht etwa 5% der menschlichen Kalorienaufnahme und ca. 30–50% der Energie eines wachsenden Bakteriums (Meisenberg u. Simmons 1998). Viele Ressourcen werden in das Translationssystem investiert – in die Ribosomen, tRNAs und beteiligte Faktoren. Der Translationsprozess ist daher streng reguliert, und zwar überwiegend im ersten Schritt – der Translationsinitiation (Gebauer u. Hentze 2004). Die Anbindung der 40S-ribosomalen Untereinheit an die mRNA kann auf vielfältige Weise kontrolliert werden: durch die Phosphorylierung von Initiationsfaktoren (7 1.7.2.1), deren Interaktion mit Repressorpeptiden (7 1.7.2.2) oder deren Proteolyse (7 1.7.2.3). Als Konsequenz dieser Vorgänge ändert sich in erster Linie die generelle Translationsaktivität in der Zelle. Dies schließt jedoch nicht spezifische Effekte auf einzelne mRNASpezies aus, die drastisch von diesem generellen Trend abweichen können (Dever 2002).

1.7.2.1 Regulation der Initiation durch Phosphorylierung Eine wichtige Strategie, die Translation zu regulieren, besteht in der Phosphorylierung von beteiligten Proteinen, beispielsweise während des Zellzyklus, Virusinfektionen oder Zellstress. Viele der eIFs (eIF4E, -4G, -4B, -2, und -3) können phoshoryliert werden (Dever 2002; Gingras et al. 1999; Proud 2005). Die Phosphorylierung der 4E-Bindeproteine (4E-BP) (7 1.7.2.2), von eIF3, -4B, -4E, -G und dem ribosomalen Protein S6 korreliert mit der Aktivierung der Proteinsynthese, während eine Phosphorylierung der D-Untereinheit von eIF2 (eIF2D zur Hemmung der Translation führt (7 1.7.2.1). Die Phosphorylierung der eIFs wird hauptsächlich über zwei Signaltransduktionswege reguliert (> Abb. 1.7.2). Beide führen, stimuliert durch Mitogene, Wachstumsfaktoren, Hormone oder Zytokine, zur Aktivierung der Proteinbiosynthese. Diese Signaltransduktionswege sind 1. der Ras-/MAPK-Signalweg, der zur Aktivierung von Mnk-1, einer an eIF4G-gebundenen eIF4E-Kinase führt und 2. der PI3-K-(Phosphatidylinositol-3-Kinase-)/Akt-/ mTOR-(mammalian Target Of Rapamycin-)Signalweg, der zur Phosphorylierung des ribosomalen Proteins S6, eIF4B, eIF4G und den 4E-BPs führt (7 1.7.2.2).

143 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

1.7

. Abb. 1.7.2. Intrazelluläre Signalwege zur Regulation der Translation. In diesem Modell sind der RAS-Signalweg durch türkisfarbene Ovale und der TOR-Signalweg durch graue Ovale dargestellt. Rezeptoren erkennen extrazelluläre Signale wie Wachstumsfaktoren, Hormone oder Zytokine. Weiterhin ist ein Kanal für den Transport von Aminosäuren (AS) und ein Signalweg über Phosphatidyl-inositol-4,5-bisphosphat [PtdIns(4,5)P2] und Phosphatidyl-inositol3,4,5-trisphosphat [PtdIns(3,4,5)P3] gezeigt. Die Translationsinitiationsfaktoren sind als orangefarbene Rauten und das ribosomale Protein S6 als orangefarbenes Quadrat dargestellt

Ein Seitenarm des zweiten Signaltransduktionswegs führt auch zur Phosphorylierung der H-Untereinheit von eIF2B, einem Faktor, der für das Recycling von eIF2 zwischen seiner GTP- und GDP-Form verantwortlich ist (7 1.7.1.2). Andere Signalwege führen zur Veränderung von IP3 (Inositoltriphosphat) und der Calciumionenkonzentration und beeinflussen somit die Proteinkinase C (PKC) und die doppelsträngige RNA-abhängige eIF2D-Kinase (PKR) (7 1.7.2.1). Translationskontrolle und Krebs Der PI3-K-/Akt-/mTOR-Signalweg ist bei mehreren Krebsarten fehlreguliert. Krebsauslösende Mutationen wurden an Schlüsselstellen dieses Signalweges gefunden und beinhalten sowohl Protoonkogene als auch Tumorsuppressorgene (Bader et al. 2005). Die große Bedeutung dieses Signalwegs für die Krebsentstehung wird weiterhin dadurch deutlich, dass der mTOR-Inhibitor Rapamycin das Tumorwachstum bei verschiedenen Krebsarten hemmt. Zielgene des PI3-K-/Akt-/mTOR-Signalwegs sind bei Krebs überexprimiert und schließen sowohl den Pol1-Transkriptionsfaktor TIF-1A ein, der eine erhöhte rRNA-Synthese induziert, als auch ribosomale Proteine (z. B. des S6-ribosomalen Proteins; 7 1.7.3.1) und eIFs. So führt die Fehlregulierung der Phosphorylierung von eIF4E und der 4E-BP (7 1.7.2.2) zu erhöhtem Zellwachstum und vermehrter Zellproliferation. Weitere Zielproteine, die mTOR-abhängig phosphoryliert werden, sind eIFs, die zur Bindung der klei-

nen ribosomalen Untereinheit an die mRNA führen (7 1.7.1.2). Darüber hinaus regulieren Onkogene wie C-MYC, ras oder virale Onkogene Teile des Translationsapparats. Eine Schlüsselfrage ist, ob die erhöhte Proteinsyntheserate selbst Krebs verursachen kann, oder ob die erhöhte Translationsrate in der malignen Zelle eine nötige Konsequenz der erhöhten Zellproliferation ist. Mehrere Befunde weisen darauf hin, dass eIF4E als Onkogen wirkt und damit ursächlich an der Krebsentstehung beteiligt sein kann (Bader et al. 2005). Am deutlichsten wurde diese Rolle von eIF4E in eIF4E-überexprimierenden, transgenen Mäusen gezeigt. Diese Mäuse entwickeln Tumore diversen histologischen Ursprungs wie B-Zell-Lymphome, Angiosarkome oder hepatozelluläre Adenome. In diesem Tiermodell ist die onkogene Aktivität von eIF4E deutlich damit verknüpft, den programmierten Zelltod zu hemmen. So führt die eIF4E-Überexpression dazu, dass eine durch C-MYC induzierte Apoptose bei der Entstehung von Lymphomen aufgehoben werden kann, was zur Beschleunigung der Tumorentstehung führt. Interessanterweise sind eIF4E- und C-MYC-überexprimierende Tumore gegen Rapamycin resistent. Daraus lässt sich schlussfolgern, dass eIF4E ein „downstream target“ von mTOR ist und ein antiapoptotisches Signal von Akt ausführt (Ruggero u. Sonenberg 2005). Überdurchschnittlich erhöhte eIF4E-Mengen liegen beispielsweise in Brustkarzinomen vor. Auch hier führt die konstitutive Aktivierung des eIF4F-Komplexes zur erhöhten Resistenz gegenüber

144

Sektion 1 · Allgemeine Grundlagen

der Apoptose. Auch andere eIFs findet man in Tumoren in erhöhter Konzentration. Erhöhte eIF4A-Werte wurden z. B. in menschlichen Melanomen nachgewiesen, erhöhte eIF4G-Werte in 30% der Fälle von Lungenkarzinomen und verschiedene Untereinheiten von eIF3 sind in mehreren Krebsarten überexprimiert (Rosenwald 2004). Wie kann eine veränderte Proteinsyntheserate zur Regulation der Zellproliferation führen? Eine weitgehend akzeptierte Hypothese ist die folgende: Ist das Potenzial zur Translationsinitiation hoch, d. h., alle Komponenten des Translationsapparates sind in ausreichender Menge vorhanden, dann wird die Translationsrate von schlecht translatierbaren mRNAs stärker stimuliert im Vergleich zu gut translatierbaren mRNAs. Ist dagegen das Translationspotential durch einen Mangel an Translationsinitiationsfaktoren begrenzt, trifft dies insbesondere schlecht translatierbare mRNAs. Diese können unter Wettbewerbsbedingungen nur unzureichend den Translationsapparat an sich rekrutieren. Ineffizient translatierbare mRNAs haben oft lange, stark strukturierte 5c-UTRs, die möglicherweise die Bindung oder das Scanning der 40S-ribosomalen Untereinheit hemmen. In diese Kategorie fallen viele Wachstumsfaktoren, Rezeptoren und Tyrosinkinasen. Eine Aktivierung der Translationsinitiation führt daher zur verstärkten Translation speziell dieser mRNAs. Diese Hypothese wird z. B. durch folgende Befunde unterstützt: Die Ornithindecarboxylase-(ODC-)mRNA hat ausgeprägte Sekundärstrukturen in ihrem 5c-UTR. ODC ist das limitierende Enzym für die Polyaminsynthese, und Polyamine sind wichtig für den Eintritt in die S-Phase des Zellzyklus. In mit eIF4E transformierten Zellen wird die ODC-mRNA mit höherer Effizienz translatiert, und zwar am Übergang von G1 zur S-Phase des Zellzyklus. Eine Überexpression der eIF4E-BPs dagegen hemmt die ODC-Synthese (Pyronnet et al. 2000). Ein alternativer Translationsmechanismus (IRES-abhängig; 7 1.7.3.1) führt dagegen zur verstärkten Expression der ODC-mRNA am G2-/M-Übergang des Zellzyklus, ein Zeitpunkt, an dem die generelle Proteinbiosynthese herunterreguliert ist. Weitere, in eIF4Etransformierten Zellen überexprimierte mRNAs sind Zyklin D1 (involviert in der Regulation einer Kinase, die den Übergang von der G1- zur S-Phase im Zellzyklus steuert); C-MYC (Transkriptionsfaktor) und der Fibroblasten-Wachstumsfaktor FGF2 (Zimmer et al. 2000). Weiterhin zeigen neuere Daten, dass nach Aktivierung von Ras und Akt etwa 200 mRNAs übermäßig translatiert werden (Bader et al. 2005). Die funktionelle Charakterisierung dieser Gene wird Aufschluss über weitere Zielgene geben, die durch eine Überexpression von Translationsinitiationsfaktoren verstärkt exprimiert werden.

Regulation der Initiation durch Phosphorylierung von eIF2α Ein weitere, wichtige Kontrollstelle in der Regulation der globalen Proteinsynthese ist die Phosphorylierung von eIF2D das an der Ausbildung des ternären Komplexes beteiligt ist (7 1.7.1.2). Vier eIF2D-phosphorylierende Kinasen sind bekannt. Sie hemmen die zelluläre Proteinsynthese als Antwort auf Virusinfektionen, bei Eisenmangel in den erythroiden Vorläuferzellen, bei Aminosäuremangel und bei zellulären Stresszuständen (Dever 2002; Gebauer u. Hentze 2004; Holcik u. Sonenberg 2005; Sonenberg et al. 2000): 1. Die doppelsträngige RNA-(dsRNA-)abhängige eIF2DKinase (PKR), die durch doppelsträngige RNA, wie z. B. die genomische RNA von Viren, aktiviert wird. Die Bindung von dsRNA an PKR induziert eine Dimerisierung und Autophosphorylierung der Kinase, was diese in die katalytisch aktive Form bringt. PKR ist in der Zelle assoziiert mit Ribosomen. Auch führt eine virale Infektion zur Ausschüttung von IFN-β, welches die Transkription von PKR stimuliert. 2. Die durch Häm regulierte eIF2D-Kinase oder Hämregulierter Inhibitor (HRI); HRI spielt eine wichtige Rolle in der eisenabhängigen Regulation der Translation in erythroiden Vorläuferzellen. Eisen, ein zentraler Bestandteil des Häms, wird im letzten Schritt der Hämbiosynthese durch die Ferrochelatase in das Protoporphyrin eingebaut. Bei normaler Eisenverfügbarkeit bindet Hämin (die oxidierte Form von Häm mit Fe3+) an HRI und hemmt sowohl die Autophosphorylierung, als auch die Phosphorylierung von eIF2D. Eisenmangel aktiviert HRI und führt zur Hemmung der Translation und der Bildung von hypochromischen, mikrozytären Erythrozyten. 3. Die GCN2-Proteinkinase wird durch Aminosäuremangel aktiviert. 4. Die im endoplasmatischen Retikulum (ER) lokalisierte PKR-ähnliche ER-Kinase (PERK); PERK wurde vor kurzem in der Maus identifiziert. Diese Kinase vermittelt das Abschalten der Proteinbiosynthese, wenn im ER viele Proteine vorliegen, die nicht korrekt gefaltet werden können. Ein menschliches Homolog von PERK ist die im Pankreas vorkommende eIF2D-Kinase (PEK). Mutationen in PEK konnten in zwei Familien mit Wolcott-Rallison-Syndrom nachgewiesen werden (Delepine et al. 2000). Diese seltene, autosomal rezessiv vererbte Erkrankung zeichnet sich durch einen permanenten, neonatal bzw. früh in der Kindheit einsetzenden insulinabhängigen Diabetes aus. Die oben genannten Kinasen zeigen große Homologie in ihren katalytischen Domänen. Die regulatorischen Do-

145 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

1.7

. Abb. 1.7.3a,b. Der Initiationsfaktor eIF4G und homologe Proteine. a eIF4G kommt in menschlichen Zellen in zwei Isoformen vor (eIF4GI und II), die beide die gleiche Domänenstruktur aufweisen und in analoger Weise an weitere Initiationsfaktoren binden. Die beiden mit den mRNA-Enden interagierenden Proteine eIF4E und PABP binden an das N-terminale Drittel von eIF4G, während das zentrale Drittel mit eIF3 und eIF4A interagiert. Das C-terminale Drittel enthält eine weitere Bindestelle für eIF4A sowie für die Kinase Mnk-1 (nicht dargestellt). Viele Picornaviren spalten eIF4G mithilfe eigener Proteasen zwischen dem ersten und zweiten Drittel (dargestellt ist hier die Spaltstelle der Poliovirus-Protease 2A, 7 4.1). Drei eng verwandte eIF4E-Bindeproteine, 4E-BP1, 2 und 3, sind molekulare Ebenbilder

der eIF4E-bindenden Region von eIF4G. Das Protein 4E-T besitzt am N-Terminus ein ähnliches Modul und weist an anderen Stellen in seiner Polypeptidsequenz nukleäre Import- (NLS) bzw. Exportsignale (NES) auf, die für seine Funktion bedeutsam sind (7 Text). Zwei unterschiedliche Proteine mit Homologie zum zentralen Drittel von eIF4G sind ebenfalls bekannt: p97/NAT1/DAP-5 sowie Paip-1. Paip-1 besitzt außerdem eine PABP-bindende Domäne, die jedoch auf der Ebene der Aminosäuresequenz keine Ähnlichkeit mit der entsprechenden Domäne von eIF4G hat. b Extrazelluläre Stimuli können durch Regulierung des Phosphorylierungsstatus der 4E-BPs die Menge an verfügbarem eIF4F-Komplex beeinflussen und so die Translation steuern

mänen und die Regulationskreise, die zu ihrer Aktivierung führen, sind aber unterschiedlich. Allen gemeinsam ist die Fähigkeit durch eIF2D-Phosphorylierung am Ser-51 eine Inaktivierung von eIF2B herbeizuführen – dem Faktor, der für den Austausch von GDP zu GTP an eIF2 verantwortlich ist (7 1.7.2.1). Dies führt zu einer Reduzierung der Konzentration an ternärem Komplex (Met-tRNAiMet-eIF2-GTP) und damit einer Hemmung der Translation. Ein weiterer Beleg für die Wichtigkeit dieses Kontrollmechanismus ist, dass eine experimentelle Blockade der eIF2D-Phosphorylierung zur malignen Transformation von Zellen führt (Clemens 2004).

1.7.2.2 Regulation durch molekulares Mimikry

2003) die Interaktionen mit diesen Faktor zu einem bevorzugten Objekt für regulative Eingriffe. Dies spielt etwa für die Insulinwirkung in Zielzellen eine Rolle und ist beim apoptotischen Zelltod sowie in der Krebsentstehung bedeutsam. eIF4G kann in drei etwa gleich große Regionen unterteilt werden (> Abb. 1.7.3a): 1. An das aminoterminale Drittel bindet das Poly(A)Schwanz-bindende Protein PABP und eIF4E. 2. An das mittlere Drittel binden eIF4A und eIF3. 3. An das carboxyterminale Drittel binden ein zweites eIF4A-Molekül und die Proteinkinase Mnk-1. Zur Steuerung der eIF4G-Funktionen besitzt die Zelle eine Reihe von Proteinen, die zu Teilbereichen von eIF4G homolog sind und daher in Konkurrenz zu eIF4G an Initiationsfaktoren binden können (> Abb. 1.7.3a) (Sonenberg et al. 2000).

In der frühen Initiationsphase der Translation macht die zentrale Adapterfunktion von eIF4G (Preiss u. Hentze

Die bereits erwähnten 4E-BPs regulieren die Bindung zwischen eIF4G und eIF4E (> Abb. 1.7.3b). Die drei

146

Sektion 1 · Allgemeine Grundlagen

4E-BPs in Säugerzellen besitzen eine Molekularmasse von etwa 10–12 kDa und sind untereinander zu etwa 40–56% identisch (> Abb. 1.7.3a). Alle drei Isoformen enthalten ein hochkonserviertes eIF4E-Bindungsmotiv, wie es auch in eIF4G vorkommt. Die 4E-BPs imitieren so die eIF4E-bindende Region von eIF4G auf molekularer Ebene und inhibieren die Aktivität von eIF4E, indem sie dessen Bindung an eIF4G blockieren (Gingras et al. 1999). Insulin sowie eine Vielzahl anderer extrazellulärer Stimuli kann über den PI3-K-Weg eine Phosphorylierung der 4E-BPs bewirken (7 1.7.2.1). Die hypophosphorylierten 4E-BPs binden gut an eIF4E, während hyperphosphorylierte Proteine keine eIF4E-Bindung zeigen (> Abb. 1.7.3b). Somit kann Insulin die Translationsrate in insulinsensitiven Zellen stimulieren. Ein weiteres eIF4E-bindendes Protein ist 4E-T (für eIF4E-Transporter, > Abb. 1.7.3). 4E-T ist ein Protein von etwa 108 kDa und alterniert zwischen Nukleus und Zytoplasma. Es sorgt für den Import eines Anteils der eIF4E-Moleküle in den Zellkern, aber auch in die zytoplasmatischen „processing bodies“ (7 1.7.3.2). Die Rolle der nukleären Subpopulation von eIF4E ist ungeklärt; sie könnte zur Integration von nukleären und zytoplasmatischen Schritten der Genexpression beitragen. Ein Protein mit weitreichender Homologie zu eIF4G wurde in ganz unterschiedlichen Studien beschrieben (Holcik et al. 2000). So wurde es unter dem Namen p97 durch seine Homologie zu eIF4G identifiziert, als NAT1 fiel es als bevorzugtes Ziel für mRNA-Editierung in Leberkarzinomzellen auf, und ein Fragment des Proteins wurde als DAP-5 in einem Screen für Apoptoseblocker gefunden. p97/NAT1/DAP-5 ist zu 28% identisch mit den C-terminalen zwei Dritteln von eIF4G und bindet eIF3 und eIF4A (> Abb. 1.7.3a). Erwartungsgemäß bindet es jedoch nicht an eIF4E und inhibiert damit die zelluläre Translation. Die zelluläre Rolle von p97/NAT1/ DAP-5 könnte die eines proapoptotischen Faktors sein (7 1.7.2.3); die Editierung (und damit Inaktivierung) der p97-mRNA in Leberkrebszellen könnte eine Verbindung zu malignem Wachstum bedeuten (7 auch 1.7.2.1). PAIP-1 („Poly(A)-Binding-Protein-Interacting Protein“) ist ein Protein mit Homologie zum mittleren Drittel von eIF4G und interagiert mit eIF4A (> Abb. 1.7.3a) (Sachs u. Varani 2000). Entdeckt wurde es jedoch durch die Fähigkeit, über seinen C-Terminus an das menschliche Poly(A)-Bindeprotein zu binden. PAIP-1 hat kein Bindungsmotiv für eIF4E, kann aber dennoch als Koaktivator für die Cap-abhängige Translation fungieren.

1.7.2.3 Proteolyse von eIF4G Eine Reihe von Picornaviren nutzt die proteolytische Spaltung von eIF4G als Teil ihrer Infektionsstrategie.

Dies fördert die virale Translation und inhibiert zugleich die zelluläre Translation (7 1.7.3.1). Mittlerweile gibt es Hinweise darauf, dass dies in mancher Hinsicht zellulären Prozessen nachempfunden ist. So wird während der Apoptose eIF4G durch Caspase-3 gespalten (Morley et al. 2005). Die resultierenden Fragmente unterscheiden sich jedoch von denen, die durch eine virale Infektion hervorgerufen werden. Ein 76 kDa großes Fragment mit der Fähigkeit an eIF4E, -4A und -3 zu binden, kann in apoptotischen Zellen akkumulieren. Es ist unklar, ob dieses Fragment eine translationale Aktivität besitzt. In vielen Fällen korreliert die Spaltung von eIF4G während der Apoptose zeitlich mit der Verminderung der zellulären Proteinsynthese. In späteren Stadien der Apoptose werden noch weitere Initiationsfaktoren proteolytisch gespalten. Es ist daher nicht sicher, ob die Spaltung von eIF4G eine aktive Rolle in der Apoptose spielt oder eher eine Begleiterscheinung darstellt. Auch p97/NAT1/ DAP-5 wird während der Apoptose an einem Caspasemotiv gespalten. Das C-terminal verkürzte Rumpfprotein von 86 kDa kann weiterhin eIF3 und -4A binden und ist möglicherweise verantwortlich für die fortgesetzte IRES-abhängige Translation (7 1.7.3.1) einiger mRNAs während der Apoptose (Holcik u. Sonenberg 2005; Holcik et al. 2000).

1.7.2.4 Zelluläre Stresszustände regulieren die Translation Verschiedene physiologische oder umweltbedingte Stresszustände wie UV-Strahlung, Temperaturschwankungen, Schwermetalle, Glucosemangel, Hypoxie, oxidativer Stress oder Behandlung mit Medikamenten oder Toxinen führen zur einer adaptiven Antwort der Zellen, die eine Reduktion der generellen Translationsrate mit einschließt (Holcik u. Sonenberg 2005). Das vermeidet den Verbrauch zellulärer Ressourcen zur Synthese von Proteinen, die entweder unnötig sind oder sogar schädlich für die zelluläre Stressantwort. Ein Großteil der stressbedingten Änderungen der Translation lassen sich auf eine Hemmung der eIF2-Aktivität durch die eIF2D-Kinasen zurückführen (Dever 2002; Proud 2005) sowie auf die Hemmung der eIF4F-Funktion durch verminderte Aktivität der Ras-/MAPK- und PI3-K/Akt-/ mTOR-Signalwege (7 1.7.2.1). Die Hemmung der Translation führt zur Bildung sog. „stress-granules“ (SG), die aus mRNAs mit blockierten Initiationskomplexen (40S-ribosomale Untereinheit, eIF2, -3, -4E, -4G und PABP) sowie weiteren Komponenten (etwa die Helikase p54/Rck und die RNA-bindenden Proteine TIA-1 und TIAR) bestehen (Kedersha et al. 2005). Man nimmt an, dass die SG die meisten zellulären mRNAs enthalten außer jenen, die die für die Stressantwort benötigten

147 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

Proteine kodieren. Die SG fungieren daher als eine Art stressaktivierte Sortierstation, in der mRNAs vorübergehend gelagert werden, bis sie entweder wieder zur aktiven Translation zurückgeführt oder schließlich abgebaut werden. Die verschiedenen Stressarten haben gemeinsam, dass sie zur vermehrten Expression von „Heat shock“Proteinen führen (Schneider 2000). Heat-shock-Proteine (Hsp) können die Zelle vor dem Zelltod bewahren. Die meisten Mitglieder der Hsp-Familie sind molekulare Chaperone, die eine Rolle in der Proteinfaltung, im Proteintransport und dem Zusammenbau von Multiproteinkomplexen spielen. Während eines Zellstresses schützen sie die Proteine, spielen eine Rolle in der Reparatur von geschädigten Proteinen und beim Abbau von zerstörten Proteinen durch den Ubiquitin-Proteasom-Weg. Wie die Hsp-Proteine selbst während eines zellulären Stresszustandes weiterhin translatiert werden, ist nicht genau geklärt. Die 150–200 Nukleotide langen 5c-UTRs der Hsp-mRNAs weisen kaum Sekundärstruktur auf. Mechanismen, wie „Ribosome shunting“ und IRES-vermittelte Translation (7 1.7.3.1) wurden in einigen Fällen als alternativer Translationsinitiationsmechanismus vorgeschlagen. Zelluläre Stresszustände sind von medizinischer Relevanz, da sie bei verschiedenen Erkrankungen, wie Diabetes, Alzheimer, viralen Infekten, Schlaganfall, Herzerkrankungen und Krebs eine Rolle spielen (Holcik u. Sonenberg 2005). Zusätzlich hat man auch eine Konditionierung von Zellen mit einem subletalen Stress beobachtet, die einen Schutz gegen spätere, sonst letale Attacken bietet (McDunn u. Cobb 2005). Ein Ziel der pharmakologischen Forschung ist es daher, diese Konditionierungseffekte zur besseren Verträglichkeit von chirurgischen Eingriffen, wie etwa Organtransplantationen, zu nutzen.

1.7.3 mRNA-spezifische Translationskontrolle Während bei der globalen Translationskontrolle die meisten mRNAs in einer Zelle reguliert werden, kommt es bei der mRNA-spezifischen Translationskontrolle zur Regulation einzelner Klassen an mRNAs. Gut verstandene Beispiele für diesen Typ von Translationskontrolle findet man in der Regulation des Eisenmetabolismus, im Zellwachstum und der Zelldifferenzierung, und auch in der Embryogenese. Regulatorische Steuerelemente befinden sich oft in den 5c- und 3c-nichttranslatierten Regionen. Diese Steuerelemente binden häufig Proteine, welche dann die Translation regulieren.

1.7

1.7.3.1 5‘-UTR-vermittelte Translationskontrolle Im 5c-UTR der mRNA beginnt die Translation. Dort kommt es zur Bindung der 40S-ribosomalen Untereinheit, dem Scanningprozess und dem Anfügen der 60S-ribosomalen Untereinheit. Diese Vorgänge können gestört werden durch stabile RNA-Sekundärstrukturen in der 5c-UTR, wie man sie häufig in den mRNAs von Wachstumsgenen findet (7 1.7.2.1). Alternativ kann die Bindung von Repressorproteinen an Steuerelemente in der mRNA die Translation blockieren. Mehrere Beispiele einer 5c-UTR-vermittelten Translationskontrolle sind im Folgenden aufgeführt. Die IRE-/IRP-vermittelte Translationskontrolle Ein gut verstandenes Beispiel einer 5c-UTR-vermittelten Translationskontrolle ist die Biosynthese des intrazellulären Eisenspeicherproteins Ferritin. Überschüssiges Eisen wird durch Ferritin gebunden und so entgiftet. Ein erhöhter zellulärer Eisengehalt führt zu vermehrter Ferritinproduktion. Bei geringem Eisengehalt wird die Ferritinproduktion vermindert. Maßgebend für diese Regulation ist eine Sekundärstruktur in der 5c-UTR, das Iron-Responsive Element (IRE) (Hentze et al. 2004). Bei niedriger intrazellulärer Eisenmenge bindet daran das Iron Regulatory Protein 1 oder 2 (IRP-1 oder IRP-2) und blockiert die Translation des Ferritins. Eine Voraussetzung dafür ist, dass das IRE nicht weit von der Cap-Struktur entfernt lokalisiert ist. IREs, die mehr als 100 Nukleotide vom Cap entfernt sind, hemmen die Translation nur eingeschränkt. Dieser Befund stimmt damit überein, dass ein früher Schritt in der Translationsinitiation gehemmt wird, nämlich die Anbindung des 43S-Präinitiationskomplexes an den Cap-Bindekomplex eIF4F (> Abb. 1.7.4a). Steigt der Eisengehalt in der Zelle, so fällt das IRP von der mRNA ab, und das jetzt benötigte Eisenspeicherprotein kann wieder translatiert werden (> Abb. 1.7.4b). Mutationen im IRE des L-Ferritins, welche die IRP-Bindung verhindern, führen beim Menschen zum erblichen Hyperferritinämie-Katarakt-Syndrom. Diese Erkrankung ist durch erhöhte Werte an Serum-Ferritin und eine frühe Katarakterkrankung gekennzeichnet (Beaumont et al. 1995; Girelli et al. 1995). Neben der Eisenspeicherung werden auch der Eisenverbrauch und die zelluläre Eisenaufnahme über das IRE-/IRP-System reguliert. Ähnlich wie das Ferritin wird auch die Translation des Enzyms eALAS, das den ersten Schritt der erythroiden Hämbiosynthese katalysiert, eisenabhängig reguliert. Dagegen trägt der Transferrinrezeptor (TfR) fünf IREs im 3c-UTR. In eisendefizienten Zellen führt dort die IRP-Bindung zur Stabilisierung der TfR-mRNA durch die Blockade einer

148

Sektion 1 · Allgemeine Grundlagen a

b

. Abb. 1.7.4a,b. Translationale Regulation des Eisenspeicherproteins Ferritin. In der 5c-UTR der Ferritin-mRNA befindet sich ein regulatorisches RNA-Steuerelement, das IRE („iron-responsive element“). a Bei niedrigem zellulären Eisenspiegel bindet daran IRP-1 („iron regu-

latory protein“). Der IRE-/IRP-1-Komplex hemmt die Translation in der Initiationsphase, weil der eIF4F-Komplex den Präinitiationskomplex nicht mehr an die mRNA rekrutieren kann. b Bei hohem Eisenspiegel kann die Ferritin-mRNA ungehemmt translatiert werden

Schnittstelle für eine Endonuklease. Durch die verstärkte Transferrinrezeptorsynthese wird dem Eisenmangel entgegengesteuert.

selektiven Phosphorylierung des ribosomalen Proteins S6 bei der Translationskontrolle von TOP enthaltenden mRNAs (Ruvinsky et al. 2005).

Translationskontrolle der 5‘-TOP-mRNAs Für das Wachstum einer Zelle ist es wichtig, dass die Bestandteile des Translationsapparats in ausreichender Menge vorhanden sind. Die Expression der ribosomalen Proteine, Elongationsfaktor 1A und 2 (nur in hämatopoetischen Zellen), oder des Poly(A)-bindenden Proteins werden wachstumsabhängig auf Translationsebene reguliert. In wachsenden Zellen befinden sich diese mRNAs in Polysomen und in ruhenden Zellen in der subpolysomalen Population. Sie haben gemeinsam, dass sie im 5c-UTR einen terminalen Oligopyrimidintrakt (5c-TOP) haben. Auf den ersten Blick scheint es, dass eine ruhende Zelle viele Vorräte und Energie verschwendet, indem sie sich ein Reservoir an ineffizient translatierten mRNAs leistet. Dies hat aber den Vorteil, dass die Zelle schnell auf eine beginnende Zellteilung reagieren kann. An dieser Stelle wird plötzlich eine große Translationskapazität benötigt (Meyuhas u. Hornstein 2000). Bemerkenswerterweise folgt in allen mRNAs dieser Familie ein Cytosin direkt auf die Cap-Struktur. Das ist vergleichsweise selten – nur etwa 17% der eukaryoten mRNAs haben an dieser Position ein Cytosin – der weitaus größere Teil der mRNAs beginnt mit einem Adenosin. Dann folgt eine Reihe von 4–14 Pyrimidinen – das 5c-TOP-Motiv (Meyuhas u. Hornstein 2000). Die Position des 5c-TOP, gleich anschließend an das Cap, ist von großer Bedeutung. Unbekannt sind sowohl Faktoren, die an ein 5c-TOP binden, als auch Signaltransduktionskaskaden, die Wachstumssignale an die Translationsmaschinerie übermitteln (Meyuhas u. Hornstein 2000). Neuere Befunde widerlegen auch die seit langem postulierte Rolle einer

Upstream-ORFs In einigen mRNAs findet man im 5c-UTR vor dem Startkodon für den eigentlichen kodierenden Bereich noch weitere AUGs – sog. „upstream“ AUGs (uAUG) (Meijer und Thomas 2002). Befindet sich das uAUG in einem anderen Leseraster mit eigenem Stoppkodon, so spricht man von einem „upstream open reading frame“ (uORF). Je nach Lage des Stoppkodons kann der uORF auch teilweise mit dem eigentlichen kodierenden Bereich überlappen. Befindet sich das uAUG im gleichen Leseraster wie das übliche Startkodon, dann können zwei Proteine entstehen, wobei das eine um eine zusätzliche aminoterminale Domäne verlängert ist. Die Benutzung der verschiedenen AUGs ist in solchen Fällen streng reguliert. Meist schwächen vorgeschaltete uORFs die Translation am eigentlichen kodierenden Bereich ab. Das liegt daran, dass eukaryote Ribosomen nach der Termination kaum dazu in der Lage sind, mit einer neuen Translationsrunde am folgenden Startkodon zu beginnen. Dies ist ein Unterschied zu Bakterien, in deren mRNAs oft mehrere Leseraster hintereineinandergeschaltet sind. Beispiele für regulatorische uORFs sind die mRNAs für CLN3, bcl-2 und c-mos. Eine Mutation, die den uORF in der mRNA von G1-Zyklin aufhebt, führt zu einem beschleunigten Zellzyklus. Oft ist die Kodierungskapazität des uORFs unwichtig, aber die Länge und Position des uORFs oder die Zusammensetzung der Sequenz, die sich zwischen dem uORF und dem eigentlichen kodierenden Bereich befindet, sind bedeutsam. All diese Parameter beeinflussen die Re-Initiationsrate am eigentlichen Startkodon. In einigen Fällen ist die Funktion des uORFs von dessen Kodierungskapazität mitbestimmt. Man vermutet,

149 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

dass das Peptid, welches durch die Translation des uORFs entsteht, die Translationstermination am Ende des uORF beeinflusst. Beispiele für peptidspezifische uORFs sind die S-adenosyl-methionine decarboxylase (AdoMetDC) oder der zweite uORF im gp48-Transkript des menschlichen Zytomegalievirus. Wie in Abschnitt „Nonsensemediated decay“ bereits besprochen, können sich uORFs auch auf die mRNA Stabilität auswirken. Unkonventionelle Translationsinitiationsmechanismen Viren verfolgen eine Vielzahl von unkonventionellen Strategien, mit denen sie sich den zellulären Translationsapparat zunutze machen (> Abb. 1.7.5) (Hellen u. Sarnow 2001; Sonenberg et al. 2000). Die meisten bisher untersuchten zellulären mRNAs hingegen folgen dem in Abschnitt 1.7.1.2 beschriebenen Scanningmodell für Cap-stimulierte Translationsinitiation. Die Ursachen für diesen Unterschied liegen wohl in den Beschränkungen, denen die virale Genexpression unterliegt. So ist es etwa besonders ökonomisch, durch den Gebrauch von „Frameshifting“ oder „Readthrough“ die Kodierungskapazität eines größenlimitierten Genoms zu erweitern. Charakteristisch für den Verlauf vieler viraler Infektionen ist auch eine selektive Inhibierung der

1.7

Translation von zellulären mRNAs zugunsten der viralen mRNAs. Virale mRNAs weisen zum Teil keine Cap-Struktur am 5c-Ende auf oder besitzen keinen Poly(A)-Schwanz. Die untranslatierten Regionen der viralen mRNA können darüber hinaus Strukturelemente enthalten, die für die Replikation oder Verpackung benötigt werden, jedoch mit konventioneller Translationsinitiation unvereinbar sind. Diese Nachteile muss das Virus in geeigneter Form kompensieren und im Verlauf der Infektion in einen Vorteil für die virale Genexpression wandeln. Dazu greift das Virus häufig in den zellulären Translationsablauf ein, indem es Vorgänge wie die Rekrutierung der 40S-Untereinheit, das Scanning oder die Startkodonauswahl in „seinem Sinne“ modifiziert. Die Untersuchung dieser Translationsinitiationsvarianten trägt daher sowohl zum Verständnis der viralen als auch der konventionellen zellulären Mechanismen bei. Im Folgenden soll dies durch einige prägnante Beispiele von viralen Translationsstrategien illustriert werden. Interne Ribosomenplatzierung

„Internal ribosome entry sites“ (IRES) sind RNA-Strukturen, die Translationsinitiationskomplexe ohne Beteiligung des mRNA-5c-Endes direkt an interne Positionen . Abb. 1.7.5. Virale Translationsstrategien. Viren verwenden eine Vielfalt von translationalen Strategien zur Expression ihres Genoms. Im oberen Teil der Abbildung ist eine hypothetische virale mRNA dargestellt. Sie enthält insbesondere mehrere, überlappende kodierende Bereiche. Darunter befindet sich eine ausführliche Sammlung von Translationsmechanismen, die zur Expression der unterschiedlichen genetischen Informationen führen können. Dazu gehören unorthodoxe Translationsinitiationsmechanismen, aber auch Vorgänge während der Elongationsphase, die von dem normalen Dechiffrieren der proteinkodierenden Regionen abweichen. Ein Virus bedient sich typischerweise einer Kombination einiger (jedoch nicht aller) dieser Mechanismen. Weitere Informationen im Text

150

Sektion 1 · Allgemeine Grundlagen a

b

. Abb. 1.7.6a,b. Translation durch interne Platzierung von Ribosomen. a Der experimentelle Test eines RNA-Elements auf IRES-Aktivität („Internal Ribosome Entry Site“) erfolgt üblicherweise durch Einfügen in den intercistronischen Bereich einer bicistronischen ReportermRNA. In dieser Anordnung wird das zweite Cistron durch eukaryote Ribosomen normalerweise nicht translatiert. Eine authentische IRES

aktiviert jedoch selektiv dieses zweite Cistron. b Schematische Darstellung der Genomstruktur eines Picornavirus. In der 5c-untranslatierten Region der viralen mRNA befindet sich ein komplex strukturiertes RNA-Element mit IRES-Funktion. Dieses Element steuert die Translation eines viralen Polyproteins, das durch Proteaseaktivität in die einzelnen funktionellen Einheiten gespalten wird

auf der mRNA rekrutieren können. Der übliche Labortest auf eine Funktion als IRES besteht daher darin, die zu untersuchende Sequenz zwischen zwei kodierende Bereiche einer bicistronischen Reporter-mRNA zu bringen (> Abb. 1.7.6a). Normalerweise wird in dieser Anordnung das zweite Cistron nicht translatiert. Eine authentische IRES besitzt jedoch gerade diese Eigenschaft, selektiv die Translation des stromabwärts gelegenen zweiten Cistrons zu stimulieren. IRES-Elemente können die sonst notwendige Cap-Struktur funktionell ersetzen, und viele virale IRES-Elemente benötigen zur Funktion nur eine Auswahl der sonst erforderlichen Initiationsfaktoren. Die IRES-Elemente des Hepatitis-C-Virus (HCV) und der verwandten Pestiviren zeigen eine besonders weitgehende Umsetzung dieses Prinzips. Das HCVIRES-Element ist eine komplexe RNA-Struktur, die aus ca. 350 Nukleotiden der untranslatierten Region sowie etwa 30–50 Nukleotiden des kodierenden Bereichs besteht. Die HCV-IRES kann Ribosomen ohne jede Beteiligung der eIF4-Gruppe von Initiationsfaktoren rekrutieren. Zu den Picornaviren gehören einige bedeutende Krankheitserreger von Mensch und Tier. Picornavirale RNA besitzt am 3c-Ende einen Poly(A)-Schwanz, während das 5c-Ende zunächst kovalent an das virale Protein VPg gebunden ist (> Abb. 1.7.6b). Dieses Protein wird jedoch offenbar kurz nach der Ankunft in der Zelle abgetrennt, sodass die virale RNA effektiv als mRNA ohne Cap-Struktur translatiert wird. Alle picornaviralen RNAs besitzen ein ca. 450 Nukleotide langes IRESElement mit extensiver Sekundärstruktur. Anhand der Struktur ihrer IRES-Elemente können die Picornaviren in 3 Gruppen eingeteilt werden: 1. das Hepatitis-A-Virus, 2. die Kardio- und Aphthoviren und 3. die Enteroviren, etwa das Poliovirus, oder die Rhinoviren.

Das Enzephalomyokarditis-Virus (EMCV) ist ein typisches Beispiel aus der 2. Gruppe. Das EMCV-IRESElement kann die 40S-ribosomale Untereinheit nicht direkt binden, sondern benötigt dafür nahezu alle eIFs außer dem Cap-Bindeprotein eIF4E. Neben einer unterschiedlichen Auswahl an zellulären eIFs benötigen die verschiedenen IRES-Typen zudem verschiedene weitere zelluläre RNA-Bindeproteine, denen eine Rolle bei der Stabilisierung der probaten Tertiärstruktur des IRES zukommt. Die meisten Picornaviren blockieren die Translation von zellulären mRNAs, indem sie Modifikationen an Initiationsfaktoren induzieren. So steuern Kardioviren die Dephosphorylierung der 4E-BPs und begünstigen so die Inaktivierung von eIF4E (7 1.7.2.2). Entero-, Rhinound Aphthovirusinfektionen führen zu einer proteolytischen Spaltung von eIF4G in ein N-terminales Drittel mit den Bindestellen für eIF4E und PABP sowie ein größeres C-terminales Fragment mit Bindungsstellen für eIF3 und -4A. Diese Modifikationen sind verantwortlich für die drastische Reduktion der Translation von zellulärer mRNA, während picornavirale, IRESs enthaltende RNAs (mit Ausnahme von HAV) dadurch in ihrer Funktion nicht beeinträchtigt werden. Ursprünglich dachte man, dass IRES-Elemente eine Eigenheit von Viren wären. Doch eine wachsende Zahl von Publikationen beschreibt IRES-Elemente auch in regulären zellulären mRNAs. Diese Befunde werden noch kontrovers diskutiert, und es ist bisher recht wenig über die Mechanismen bekannt, die der Funktion von zellulären IRES-Elementen zugrunde liegen (Holcik et al. 2000; Komar u. Hatzoglou 2005; Kozak 2003; Merrick 2004). In einigen Fällen ist dokumentiert, dass die Translation dieser mRNAs selektiv an die zellulären Bedingungen angepasst werden kann. Zwei Beispiele dafür sind die mRNAs für Ornithindecarboxylase sowie p58PITSLRE, deren IRES jeweils nur beim Übergang von der G2- zur M-Phase im Zellzyklus aktiviert werden (7 1.7.2.1).

151 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

Ribosomen-Shunt

„Shunting“ ist eine Form des diskontinuierlichen Scannings, bei dem 40S-ribosomale Untereinheiten das Scanning vom 5c-Ende aus beginnen, aber dann an einer Shuntdonorstelle zum Überspringen des restlichen 5c-UTRs ansetzen und dann an einer Shuntakzeptorstelle in der Nähe des Startkodons „landen“ (Ryabova et al. 2002) (> Abb. 1.7.5). Die 35S-RNA der Pflanzenpararetroviren weist eine ca. 600 Nukleotide lange 5c-UTR auf. Mit Ausnahme der ersten 80 Nukleotide und des Bereichs um das Startkodon faltet sich diese Region in eine komplexe Haarnadelstruktur, die an das virale Coat-Protein bindet. Translation eines dicht stromaufwärts der Haarnadelbasis gelegenen uORF A, gefolgt von einer partiellen Aufschmelzung der Haarnadelbasis durch das terminierende Ribosom, lösen den Sprung in die Nähe des authentischen Startkodons aus. Ein ähnlicher Shuntmechanismus findet auch an dem „tripartite leader“ der Adenovirus-mRNA statt. Initiierende 40S-Untereinheiten können hier das authentische Startkodon sowohl durch konventionelles Scanning als auch durch einen sORF-unabhängigen Shunt erreichen. Letzteres bedarf dreier Regionen mit Komplementarität zum 3c-Ende der 18S-rRNA, obwohl eine direkte Basenpaarung nicht gezeigt worden ist. Shunting ist der vorherrschende Mechanismus im späten Infektionsstadium, wenn die Aktivität von eIF4F stark reduziert ist. Ähnliche 5c-UTR-Regionen mit 18S-rRNAKomplementarität wurden auch in menschlichen hsp70und c-fos-mRNAs gefunden. Tatsächlich werden diese mRNAs unter zellulären Hitzeschockbedingungen (und einhergehender eIF4F-Inaktivierung, 7 1.7.2.4) vorwiegend über einen Shuntmechanismus translatiert.

1.7.3.2 3‘-UTR-vermittelte Kontrolle der Translation In den ersten Stunden des Lebens ist eine präzise, zeitliche und räumliche Kontrolle der Genexpression besonders wichtig. Dieser Zeitraum ist jedoch gleichzeitig durch weitgehende Abwesenheit von mRNA-Transkription gekennzeichnet. Entscheidende Vorgänge in dieser Phase beruhen daher auf Substanzen, mit denen die Eizelle bereits zuvor ausgestattet wurde. Maternale mRNAMoleküle und die Steuerung ihrer Expression spielen eine herausragende Rolle während der Eizellreifung und frühen Embryogenese (Sonenberg et al. 2000). Fehler in der posttranskriptionalen Steuerung der maternalen mRNA-Expression führen meist zu drastischen Fehlentwicklungen des Embryos. Es hat sich herausgestellt, dass die 3c-UTRs vieler mRNAs in der Embryonalentwicklung eine zentrale Bedeutung haben, da sie cis-agierende Elemente beherbergen, die Lokalisierung, Stabilität oder

1.7

Translation der mRNA regulieren. Translationskontrolle durch 3c-UTR-Elemente ist aber auch in späteren zellulären Differenzierungsvorgängen zu beobachten und findet auch in somatischen Zellen mit aktivem Nukleus statt. Kontrollierte Translation ermöglicht besonders schnelle und große Anpassungen in der Synthese von Proteinen, wie sie beispielsweise für die neuronale Plastizität erforderlich sind. Bei erster Betrachtung erscheint die translationale Kontrolle, ausgehend von der 3c-UTR, als wenig elegante Lösung. Ein Vorteil der 3c-UTR ist jedoch, dass regulative Elemente in diesem Bereich keine anderen Funktionen der mRNA beeinträchtigen. Die 5c-UTR ist durch die Erfordernisse des Scanningprozesses und der translatierte Bereich durch seinen Informationsgehalt für die Polypeptidsynthese eingeschränkt. Regulation über 3c-UTR-Elemente kann außerdem über eine Beeinflussung der Poly(A)-Schwanz-Funktion auf die Kommunikation zwischen den mRNA-5c- und -3c-Enden während der Translationsinitiation wirken (7 1.7.1.2). Im Folgenden sollen die oben eingeführten Konzepte anhand einiger Beispiele weiterentwickelt und erläutert werden. mRNA-Maskierung und Polyadenylierung Die Vorgänge bei der regulierten Translation maternaler mRNAs sind großenteils im Frosch Xenopus laevis untersucht worden. Nach ihrer Entstehung während der Embryogenese werden Eizellen in der Prophase ihrer ersten meiotischen Teilung arretiert, und die Gentranskription wird weitgehend eingestellt. Die spätere Eizellreifung ist dann gekennzeichnet durch eine Fortführung der Meiose und wird in Xenopus durch Progesteron stimuliert. Reife Eizellen stoppen dann ein weiteres Mal in der Metaphase ihrer zweiten meiotischen Teilung. Nach der Befruchtung beginnen die ersten mitotischen Zellteilungen, und nach 12 Teilungen im Froschembryo wird dann die zygotische Transkription aktiviert. Ein komplexes hierarchisch organisiertes Netzwerk der kontrollierten Translation maternaler mRNAs steuert die notwendigen Vorgänge während dieser Phase der transkriptionalen Inaktivität. Regulierte Polyadenylierung ist der am besten bekannte Mechanismus zur Steuerung der maternalen mRNA-Translation. Die mRNA für die c-mos-Kinase ist hierfür ein gutes Beispiel. Die c-mos-mRNA 3c-UTR weist ein „cytoplasmic polyadenylation element“ (CPE) auf, eine U-reiche Sequenz, die als Bindestelle für das Protein CPEB dient (> Abb. 1.7.7). CPEB ist sowohl an der Repression von CPE-enthaltenden mRNAs vor der Eizellreifung, als auch an der späteren Aktivierung ihrer Translation beteiligt. Translational inaktive mRNA liegt zunächst in weitgehend deadenylierter Form in sog. „germ cell granules“ vor, die Ähnlichkeiten mit den zuvor erwähnten SG (7 1.7.2.4), aber auch mit den im

152

Sektion 1 · Allgemeine Grundlagen

a

b

was wiederum zur Rekrutierung von eIF4G und Auflösung der repressiven Maskin-/eIF4E-Interaktion führt (> Abb. 1.7.7b). Das CPE-Element und CPEB spielen eine wichtige Rolle in der Regulierung vieler maternaler mRNAs. Mittlerweile sind allerdings neben CPEB noch weitere RNA-bindende Proteine (Pumillio, DAZL) bekannt, die teils gemeinsam und in verschiedenen mRNA-spezifischen Kombinationen die maternale mRNA-Expression regulieren. Untersuchungen etwa in Mäusen weisen darauf hin, dass die im Xenopus-Modellsystem gewonnenen Erkenntnisse im Wesentlichen auch für Säugetiere gültig sind. Translationale Alternativen zum Poly(A)-Schwanz

. Abb. 1.7.7a,b. Translationale Kontrollfunktion der 3c-untranslatierten Region während der Oogenese und frühen embryonalen Entwicklung. „Cytoplasmic polyadenylation elements“ (CPEs) befinden sich in der 3c-UTR vieler maternaler mRNAs und steuern deren translationale Aktivität, indem sie die Initiation der Translation am 5c-Ende direkt oder durch Einflussnahme auf den Polyadenylierungsstatus kontrollieren (7 Text). a CPEs sind Bindestellen für das CPEB-Protein, welches weiterhin Maskin rekrutiert. Das Maskin-Protein weist Homologien zu eIF4G auf und hemmt so die produktive Interaktion zwischen eIF4E und eIF4G, was zur Hemmung der Translationsinitiation führt. b Während der Eizellreifung wird CPEB phosphoryliert und wird somit zum Aktivator der mRNA-Polyadenylierung und Translation. Dafür rekrutiert phosphoryliertes CPEB, das an das Polyadenylierungssignal bindende CPSF und die Poly(A)-Polymerase GLD2, die den Poly(A)-Schwanz verlängert (Sternensymbol). Dies führt zur verstärkten Bindung des Poly(A)-bindenden Proteins ePABP und zur Verstärkung der Translation (Sternensymbol)

Folgenden beschriebenen „processing bodies“ haben (7 1.7.3.2). Für die Repression der Translation rekrutiert CPEB das Maskin-Protein, welches ein eIF4E-interagierendes Motiv ähnlich dem in eIF4G aufweist. Maskin kann über dieses Motiv an Cap-gebundenes eIF4E binden und dessen produktive Interaktion mit eIF4G blockieren (> Abb. 1.7.7a). Als Teil der hierarchischen Aktivierungskaskade während der Eizellreifung wird CPEB dann durch die Kinase Aurora-A/Eg2 phosphoryliert und wird zu einem Aktivator der mRNA-Polyadenylierung und -Translation. Dazu rekrutiert CPEB einen Komplex, bestehend aus dem „cleavage and polyadenylation specificity factor“ (CPSF) und der Poly(A)-Polymerase „germline development deficient 2“ (GLD2), der den Poly(A)-Trakt verlängert. Der längere Poly(A)Schwanz bindet dann verstärkt embryonales (e)PABP,

Rotaviren sind eine Hauptursache für Diarrhö bei Kindern und tragen in erheblichem Maße zur weltweiten Kindersterblichkeitsrate bei. Rotavirale mRNAs besitzen eine Cap-Struktur, aber keinen Poly(A)-Schwanz. Stattdessen enden ihre 3c-UTRs in einer kurzen, konservierten Sequenz, die an das reovirale „nonstructural protein“- (NSP-)3 bindet (Sachs 2000). Mithilfe von NSP3 verfolgen die Rotaviren eine translationale Strategie, die besonders auf die Funktion der 3c-Enden der mRNA abzielt. NSP3 bindet nämlich auch an den zellulären Faktor eIF4G und unterbricht dadurch dessen Interaktion mit dem Poly(A)-Bindeprotein PABP. Das Virus erzielt damit eine zweifache Wirkung: Einerseits wird so die PABP-abhängige zelluläre Translation selektiv inhibiert (7 1.7.1.2); andererseits kann die Bindung von NSP3 an eIF4G eine Brücke zwischen den Enden der Rotavirus-mRNAs aufbauen und so die Translation von Rotavirus-mRNAs spezifisch stimulieren. Ein zelluläres Gegenstück zu dieser Strategie könnten die S-Phase-spezifischen Histon mRNAs in Metazoen sein. Sie enden mit einer konservierten Haarnadelschleife, die viele Funktion eines Poly(A)-Schwanzes übernimmt (Jaeger et al. 2005). So ist sie essenziell für die Histon-mRNA-Translation und bindet in somatischen Säugerzellen den Faktor SLBP („stem loop binding protein“). Erythropoese: 15-Lipoxygenase-mRNA Während der Reifung von Säugetier-Retikulozyten zu Erythrozyten werden die Mitochondrien abgebaut (> Abb. 1.7.8a). Das Enzym 15-Lipoxygenase (LOX) ist an der Zerstörung von internen Membranen und Mitochondrien beteiligt. LOX-mRNA wird in frühen Reifestadien – vor Ausstoß des Zellkerns – transkribiert und zunächst in inaktiver Form im Zytoplasma gespeichert. Die 3c-UTR von Kaninchen LOX-mRNA enthält 10 annähernd identische Kopien einer Sequenz von 19 Nukleotiden (Gebauer u. Hentze 2004). Dieses „differentiation control element“ (DICE) vermittelt die translationale

153 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

1.7

a

b

. Abb. 1.7.8a,b. Translationale Regulation der 15-Lipoxygenase. Die Bildung des Enzyms 15-Lipoxygenase (LOX) wird während der Erythropoese auf der Ebene der Translation reguliert. a Schematische Darstellung der Erythropoese. Während der Reifung der roten Blutzellen stoßen die späten Normoblasten ihren Zellkern aus. Alle für die weiteren Schritte nötigen mRNA-Moleküle müssen zu diesem Zeitpunkt schon gebildet worden sein. Die mRNA für 15-Lipoxygenase

darf jedoch erst in reifen Retikulozyten translatiert werden, wenn das Enzym für den Abbau der Mitochondrien benötigt wird. b Die Translation der LOX-mRNA wird durch das DICE-Element im 3c-UTR reguliert. Die Proteine hnRNP K und –E1 binden an dieses Element und verhindern die Bildung ribosomaler 80S-Komplexe am 5c-Ende der mRNA. Dazu blockieren sie die Anlagerung der 60S-Untereinheit nach erfolgter Bindung der 40S-Untereinheit

Repression in frühen erythroiden Zellen durch Bindung an die heteronukleären Ribonukleoproteine (hnRNP) K und E1. Das DICE kann in die 3c-UTR anderer mRNAs „transplantiert“ werden und benötigt für seine Funktion in vitro weder eine 5c-Cap-Struktur noch einen Poly(A)Schwanz. hnRNP K und E1 inhibieren die Initiation der LOX-mRNA Translation auf der Ebene der Anlagerung der 60S-ribosomalen Untereinheit (> Abb. 1.7.8b). Eine offene Frage ist, ob Störungen in der Kontrolle der 15-LOX-Synthese als Ursache für klinische Befunde infrage kommen. Die Untersuchung von Anämieformen, die mit einer gestörten Reifung der erythroiden Vorläuferzellen einhergehen, könnte darüber Aufschluss geben.

complex“) binden miRNAs durch Basenpaarung an spezifische Ziel-mRNAs. Ist die Komplementarität zwischen miRNA und mRNA nahezu vollständig, dann kommt es zur endonukleolytischen Spaltung der Ziel-mRNA. Bei geringerer Komplementarität dagegen wird vorwiegend die Translation der Ziel-mRNA gehemmt. Obwohl man für die meisten miRNAs noch keine Ziel-mRNA mit Sicherheit kennt, geht man davon aus, dass meist mehrere (gleiche oder verschiedene) miRNAs an die 3c-UTR der Ziel-mRNA binden, sodass komplexe kombinatorische Effekte den Wirkmechanismus der miRNAs bestimmen (Bartel u. Chen 2004). Studien zum Mechanismus der Translationskontrolle durch miRNAs liefern bisher kontroverse Ergebnisse (Valencia-Sanchez et al. 2006). Eine Hemmung der Translationsinitiation ähnlich der Situation mit maternalen mRNAs (7 1.7.3.2) wurde vor kurzem beschrieben (> Abb. 1.7.9). Dieses Modell ist auch kompatibel mit der Beobachtung, dass miRNAs zur Anreicherung ihrer Ziel-mRNAs in „processing bodies“ (PB) führen. PB bestehen zum Teil aus den gleichen Komponenten wie die oben beschriebenen „germ cell granules“, und mRNA-Assoziierung mit PB erfordert einen Block der Translationsinitiation. Im Gegensatz zu diesem Modell wurde in einer weiteren Studie eine miRNA-stimulierte Dissoziation der Ribosomen während der Translationselongation an der Ziel-mRNA beobachtet. Bedingt durch die weitreichende Rolle von miRNAs in diversen zellulären Prozessen ist zu vermuten, dass eine Fehlsteuerung der miRNA-Expression auch kausal an einer Vielzahl von Erkrankungen beteiligt ist. So ist fast die Hälfte der bekannten miRNAs in krebsassoziier-

Kontrolle der mRNA-Expression durch mikroRNAs Mikro- (mi-)RNAs sind nichtkodierende RNAs von etwa 21 Nukleotiden Länge, die regulatorisch in Entwicklungsprozesse, Zelldifferenzierung und Metabolismus eingreifen. miRNA Klonierungsstrategien und bioinformatische Analysen führten zu der Hypothese, dass die Expression von bis zu 30% der menschlichen Gene durch miRNAs reguliert wird. miRNAs werden zunächst als längere RNAs (pri-miRNAs) transkribiert und noch im Nukleus durch den Ribonukleasekomplex Drosha auf etwa 70–100 Nukleotide große, sekundärstrukturreiche RNAs (pre-miRNAs) verkürzt. Nach dem Transport in das Zytoplasma werden die pre-miRNAs durch Dicer, einen weiteren Multiproteinkomplex, erkannt, der sie in die etwa 22 Nukleotide lange, reife Form überführt. Eingebettet in RISC („RNA-induced silencing

154

Sektion 1 · Allgemeine Grundlagen . Abb. 1.7.9. Translationsregulation durch miRNAs. miRNA-Bindung an partiell komplementäre 3c-UTRSequenzen führt zur Inhibition der Translation. Aktuelle Untersuchungen beschreiben dies entweder als die Folge einer Hemmung der Translationsinitiation oder einer Dissoziation der Ribosomen während der Elongation

ten chromosomalen Regionen lokalisiert, z. B. an sog. „fragile sites“, also an bekannten chromosomalen Bruchstellen, die bei bestimmten malignen Erkrankungen entweder deletiert („minimal regions of loss of heterozygosity“) oder amplifiziert („minimal amplicons“) sind. So ist beispielsweise das miR15a-16-Cluster in der chromosomalen Region 13q14 lokalisiert, das bei der chronischen lymphatischen Leukämie (CLL) häufig deletiert ist. Für die beiden darin enthaltenen miRNAs konnte gezeigt werden, dass sie die zelluläre Apoptose verstärken, indem sie die Expression des antiapoptotischen Gens BCL-2 verringern. miRNAs können auch selbst Onkogene sein: Das mir-17-92-Cluster führt zur verstärkten Ausprägung des B-Zell-Lymphoms im Tiermodell (Esquela-Kerscher u. Slack 2006; Hammond 2006). Weiterhin spielen miRNAs eine Rolle bei der Insulinsekretion, im Fettsäurestoffwechsel und bei Neurodegenerativen Erkrankungen. Darüber hinaus sind zelluläre miRNAs wichtig für die Replikation von pathogenen Viren, und miRNAs sind auch in den Genomen von Viren kodiert. So braucht beispielsweise das den Menschen infizierende Hepatitis-C-Virus die zelluläre miRNA (miR-122a), um die eigene Replikation zu erleichtern. Die bisher beschriebenen Funktionen einzelner miRNAs scheint allerdings nur die berühmte „Spitze des Eisbergs“ zu sein – es ist zu erwarten, dass miRNAs nicht nur auf fundamentale Weise die Expression des zellulären Transkriptoms kontrollieren, sondern auch als Folge von Fehlregulationen bei vielen verschiedenen Erkrankungen eine Rolle spielen.

1.7.4 Ausblick Der Aufbau eines komplexen Organismus und dessen Fähigkeit, mit der sich ständig verändernden Umwelt zu interagieren, erfordert präzise Kontrollmechanismen

zur Steuerung der Genexpression. In zunehmendem Maße zeigt sich, dass die Kontrolle der mRNA-Translation dazu einen wichtigen Beitrag liefert. Die molekularen Mechanismen der Translationsinitiation und ihre Steuerung sind Gegenstand intensiver Untersuchungen in der Grundlagenforschung, aber auch in der Molekularen Medizin. Es zeigt sich an vielen Stellen, dass durch zunehmende Detailkenntnisse in einem Teilbereich Querverbindungen zu anderen Aspekten dieses Forschungszweigs entstehen. Die Erforschung der Wechselwirkungen zwischen Translationsinitiationsfaktoren und der Regulation ihrer Funktion hat mittlerweile ein hohes Niveau erreicht. Dadurch werden Vorgänge wie die Aktivierung von Zielzellen durch Insulin oder die Zusammenhänge zwischen Translation und natürlichem sowie malignem Zellwachstum auf molekularer Ebene transparent. Aktuelle Beschreibungen des Translationsinitiationsmechanismus am 5c-Ende einer typischen mRNA beziehen mittlerweile eine wichtige Rolle des am 3c-Ende gelegenen Poly(A)-Schwanzes mit ein. Gemeinsam mit den in der 3c-untranslatierten Region gelegenen Steuerelementen regelt der Poly(A)-Schwanz zentrale Vorgänge der Genexpression während der Embryogenese auf translationaler Ebene. Immer mehr Steuerelemente zur posttranskriptionalen Kontrolle der Genexpression werden in 5c- und 3c-untranslatierten mRNA-Regionen identifiziert. Dies hat mittlerweile auch zur der Erkenntnis geführt, dass Krankheiten auf Mutationen in solchen Steuerelementen beruhen können. Das Studium der vielfältigen viralen Strategien zur Nutzung der zellulären Translationsmaschinerie ist ein wichtiger Aspekt der Erforschung der viralen Pathogenese und kann zur Entwicklung von neuen Therapieansätzen führen. Erkenntnisse in diesem Bereich erlauben aber auch ein besseres Verständnis der Translationsmechanismen an zellulären mRNA-Molekülen.

155 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

Danksagung Die Arbeit von T. P. wird durch die Sylvia & Charles Viertel Charitable Foundation, den Australian Research Council und den National Health & Medical Research Council gefördert. Die Arbeit von M. U. M. wird durch die Deutsche Forschungsgemeinschaft, das Bundesministerium für Forschung und Technik und die Landesstiftung Baden-Württemberg gefördert.

1.7.5

Literatur

Bader AG, Kang S, Zhao L und Vogt PK (2005) Oncogenic PI3K deregulates transcription and translation. Nat Rev Cancer 5: 921–9 Bartel DP und Chen CZ (2004) Micromanagers of gene expression: the potentially widespread influence of metazoan microRNAs. Nat Rev Genet 5: 396–400 Beaumont C, Leneuve P, Devaux I, et al. (1995) Mutation in the iron responsive element of the L ferritin mRNA in a family with dominant hyperferritinaemia and cataract. Nat. Genet. 11: 444–446 Clemens MJ (2004) Targets and mechanisms for the regulation of translation in malignant transformation. Oncogene 23: 3180–8 Delepine M, Nicolino M, Barrett T, Golamaully M, Lathrop GM und Julier C (2000) EIF2AK3, encoding translation initiation factor 2-alpha kinase 3, is mutated in patients with Wolcott-Rallison syndrome. Nat Genet 25: 406–9 Dever TE (2002) Gene-specific regulation by general translation factors. Cell 108: 545–56 Esquela-Kerscher A und Slack FJ (2006) Oncomirs - microRNAs with a role in cancer. Nat Rev Cancer 6: 259–69 Gebauer F und Hentze MW (2004) Molecular mechanisms of translational control. Nat Rev Mol Cell Biol 5: 827–35 Gingras A-C, Raught B und Sonenberg N (1999) eIF4 initiation factors: effectors of mRNA recruitment to ribosomes and regulators of translation. Annu. Rev. Biochem. 68: 913–963 Gingras AC, Raught B und Sonenberg N (1999) eIF4 initiation factors: effectors of mRNA recruitment to ribosomes and regulators of translation. Annu Rev Biochem 68: 913–63 Girelli D, Corrocher R, Bisceglia L, et al. (1995) Molecular basis for the recently described hereditary hyperferritinemia-cataract syndrome: a mutation in the iron-responsive element of ferritin L-subunit gene. Blood 86: 4050–4053 Hammond SM (2006) MicroRNAs as oncogenes. Curr Opin Genet Dev 16: 4–9 Hellen CU und Sarnow P (2001) Internal ribosome entry sites in eukaryotic mRNA molecules. Genes Dev 15: 1593–612 Hentze MW, Muckenthaler MU und Andrews NC (2004) Balancing acts: molecular control of mammalian iron metabolism. Cell 117: 285–97 Holbrook JA, Neu-Yilik G, Hentze MW und Kulozik AE (2004) Nonsense-mediated decay approaches the clinic. Nat Genet 36: 801–8 Holcik M und Sonenberg N (2005) Translational control in stress and apoptosis. Nat Rev Mol Cell Biol 6: 318–27 Holcik M, Sonenberg N und Korneluk RG (2000) Internal ribosome initiation of translation and the control of cell death. Trends Genet 16: 469–73 Jaeger S, Barends S, Giege R, Eriani G und Martin F (2005) Expression of metazoan replication-dependent histone genes. Biochimie 87: 827–34 Kedersha N, Stoecklin G, Ayodele M, et al. (2005) Stress granules and processing bodies are dynamically linked sites of mRNP remodeling. J Cell Biol 169: 871–84

1.7

Komar AA und Hatzoglou M (2005) Internal ribosome entry sites in cellular mRNAs: mystery of their existence. J Biol Chem 280: 23425–8 Kozak M (1999) Initiation of translation in prokaryotes and eukaryotes. Gene 234: 187–208 Kozak M (2003) Alternative ways to think about mRNA sequences and proteins that appear to promote internal initiation of translation. Gene 318: 1–23 McDunn JE und Cobb JP (2005) That which does not kill you makes you stronger: a molecular mechanism for preconditioning. Sci STKE 2005: pe34 McKusick VA und Amberger JS (1994) The morbid anatomy of the human genome: chromosomal location of mutations causing disease (update 1 December. J Med Genet 31: 265–79 Meijer HA und Thomas AA (2002) Control of eukaryotic protein synthesis by upstream open reading frames in the 5c-untranslated region of an mRNA. Biochem J 367: 1–11 Meisenberg G und Simmons WH (1998). Principles of medical biochemistry. Mosby, St. Louis Missouri Merrick WC (2004) Cap-dependent and cap-independent translation in eukaryotic systems. Gene 332: 1–11 Meyuhas O und Hornstein E (2000). translational Control f TOP mRNAs. In: Sonenberg N, Hershey JW und Mathews B (Hrsg). Translational Control of Gene Expression. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York: 671–694 Morley SJ, Coldwell MJ und Clemens MJ (2005) Initiation factor modifications in the preapoptotic phase. Cell Death Differ 12: 571–84 Preiss T und Hentze MW (2003) Starting the protein synthesis machine: eukaryotic translation initiation. Bioessays 25: 1201–11 Proud CG (2005) eIF2 and the control of cell physiology. Semin Cell Dev Biol 16: 3–12 Pyronnet S, Pradayrol L und Sonenberg N (2000) A cell cycle-dependent internal ribosome entry site. Mol Cell 5: 607–16 Rosenwald IB (2004)The role of translation in neoplastic transformation from a pathologistcs point of view. Oncogene 23: 3230–47 Ruggero D und Sonenberg N (2005) The Akt of translational control. Oncogene 24: 7426–34 Ruvinsky I, Sharon N, Lerer T, et al. (2005) Ribosomal protein S6 phosphorylation is a determinant of cell size and glucose homeostasis. Genes Dev 19: 2199–211 Ryabova LA, Pooggin MM und Hohn T (2002) Viral strategies of translation initiation: ribosomal shunt and reinitiation. Prog Nucleic Acid Res Mol Biol 72: 1–39 Sachs AB (2000). Physical and functional interactions between the mRNA cap structure and the poly(A) tail. In: Sonenberg N, Hershey JBW und Mathews MB (Hrsg). Translational Control of Gene Expression. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York: 447–465 Sachs AB und Varani G (2000) Eukaryotic translation initiation: there are (at least) two sides to every story. Nat Struct Biol 7: 356–61 Schneider RJ (2000). Translational control during heat shock. In: Sonenberg N, Hershey JWB und Mathews MB (Hrsg). Translational Control of Gene Expression. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York: 581–593 Sonenberg N, Hershey JWB und Mathews MB, Eds. (2000). Translational Control of Gene Expression. Cold Spring Harbor, New York, Cold Spring Harbor Laboratory Press Valencia-Sanchez MA, Liu J, Hannon GJ und Parker R (2006) Control of translation and mRNA degradation by miRNAs and siRNAs. Genes Dev 20: 515–24 Zimmer SG, DeBenedetti A und Graff JR (2000) Translational control of malignancy: the mRNA cap-binding protein, eIF-4E, as a central regulator of tumor formation, growth, invasion and metastasis. Anticancer Res 20: 1343–51

156

Sektion 1 · Allgemeine Grundlagen

1.7.6 Zeittafel Der Umfang dieses Kapitels gestattete es nicht, auf die historische Entwicklung der Translationsforschung einzugehen. Für den interessierten Leser bieten sich als Einstieg zwei Übersichtsartikel von Autoren an, die dieses Feld maßgeblich mit beeinflusst haben. Die frühen biochemischen Experimente, die die Grundlagen für das

heutige Verständnis der Proteinsynthese etabliert haben, hat Paul Zamecnik zusammengefasst (Zamecnik 1979). Ein Buchbeitrag von Mathews, Sonenberg und Hershey beschreibt die Anfänge der Forschung zur Kontrolle der Translation (Mathews et al. 2000). Die folgende Tabelle listet darüber hinaus einige Wissenschaftler auf, deren Arbeiten maßgeblich zu den neueren Entwicklungen der Translationsforschung beigetragen haben.

Richard J. Jackson

Beschreibung effizienter zellfreier Translationssysteme aus Kaninchen-Retikulozyten, die breite Anwendung zum Studium der Translationsmechanismen fanden (Craig et al. 1992; Pelham u. Jackson 1976). Experimentelle und konzeptionelle Beiträge zu Mechanismen der Translationsinitiation (Jackson 2000).

Nahum Sonenberg

Beschreibung der Rolle der Cap-Struktur und assoziierter Proteine bei der Translationsinitiation (Sonenberg u. Shatkin 1977). Entdeckung der IRES-abhängigen Translationsinitiation (Pelletier u. Sonenberg 1988). Entdeckung einer Rolle von Translationsinitiationsfaktoren in der Zelltransformation (Lazaris-Karatzas et al. 1990). Beschreibung des Wirkmechanismus von Insulin auf die Proteinsynthese (Pause et al. 1994). Wichtige Beiträge zum Mechanismus der Cap-stimulierten, Poly(A)-stimulierten und IRES-abhängigen Translationsinitiation. Untersuchungen zur Signaltransduktion und Proteinsynthese (Sonenberg et al. 2000).

Hans Trachsel

Studien zur Regulation der Translation durch Phosphorylierung von Initiationsfaktoren (Farrell et al. 1977). Erkenntnisse zur Rolle der Cap-Struktur und interagierender Proteine bei der Translationsinitiation (Sonenberg et al. 1981).

Marylin Kozak

Aufstellung des Scanningmodells der Cap-abhängigen Translationsinitiation (Kozak 1978). Beschreibung der Kontexteffekte für die Erkennung des Startkodons (Kozak 1986).

Lynn E. Maquat

Abbau der β-Globin-mRNA in β-Thalassämie durch ein frühzeitiges Stoppkodon (Maquat et al. 1981).

Marvin Wickens

Beschreibung des Polyadenylierungssignals und des daran bindenden zytoplasmatischen CPSF. Wichtige Beiträge zur Translationskontrolle und Poly(A)-Schwanzlängenveränderung während der Oozytenreifung (Fox et al. 1989; Sheets et al. 1995; Wickens u. Stephenson 1984).

Matthias W. Hentze

Endeckung des »iron-responsive element« in der 5‘-UTR der Ferritin-mRNA (Hentze et al. 1987). Aufklärung von molekularen Mechanismen der Translationskontrolle durch RNA-Protein-Wechselwirkungen in der 5‘- und 3‘-UTR (Muckenthaler et al. 1998; Ostareck et al. 2001).

Joel D. Richter

Entdeckung eines zytoplasmatischen Polyadenylierungs-Kontrollelements (CPE) und daran bindender Faktoren (CPEB) (Hake u. Richter 1994; McGrew et al. 1989; Stebbins-Boaz et al. 1999).

Peter Sarnow

Entdeckung des ersten IRES-Elements in einer zellulären mRNA (Sarnow 1989; Macejak u. Sarnow 1991). Beschreibung des ersten zellfreien Systems zum Studium der translationalen Synergie zwischen CapStruktur und Poly(A)-Schwanz (Iizuka et al. 1994).

Anne Ephrussi

Lokalisierung und Translationskontrolle von oskar am posterioren Pol von Drosophila-Eizellen (Ephrussi et al. 1991; Ephrussi u. Lehmann 1992; Gunkel et al. 1998).

Marla J. Berry

Beschreibung eines 3‘-UTR-Elements, das die Dekodierung des Stoppkodons als Selenocystein-Kodon steuert (Berry et al. 1991 a,b).

Victor Ambros

Beschreibung der ersten miRNAs und ihres Regulationsmechanismus durch genetische Analyse der Entwicklung des Wurmes C. elegans (Lee u. Ambros 2001; Lee et al. 1993).

Elizabeth R. Gavis

Kontrolle der nanos-mRNA-Translation in Drosophila melanogaster (Crucs et al. 2000; Gavis et al. 1996).

Alan B. Sachs

Beschreibung eines molekularen Mechanismus für die Funktion des Poly(A)-Schwanzes in der Translationsinitiation (Tarun u. Sachs 1996; Wells et al. 1998).

Carlo Croce

Erste Befunde, dass miRNAs eng mit der Krebsentstehung verknüpft sein können (Calin et al. 2002; Calin et al. 2004).

Tom Tuschel David Bartel

Klonierungsstrategien und bioinformatische Analysen zeigen die weite Verbreitung von miRNAs in Tieren, Pflanzen und Viren (Jones-Rhoades u. Bartel 2004; Lagos-Quintana et al. 2002; Pfeffer et al. 2004).

157 1.7 · Mechanismen der Translationskontrolle in Eukaryonten

Literatur zur Zeittafel Berry MJ, Banu L, Chen YY, et al. (1991 a) Recognition of UGA as a selenocysteine codon in type I deiodinase requires sequences in the 3c untranslated region. Nature 353: 273–6 Berry MJ, Banu L und Larsen PR (1991 b) Type I iodothyronine deiodinase is a selenocysteine-containing enzyme. Nature 349: 438–40 Calin GA, Dumitru CD, Shimizu M, et al. (2002) Frequent deletions and down-regulation of micro- RNA genes miR15 and miR16 at 13q14 in chronic lymphocytic leukemia. Proc Natl Acad Sci U S A 99: 15524–9 Calin GA, Sevignani C, Dumitru CD, et al. (2004) Human microRNA genes are frequently located at fragile sites and genomic regions involved in cancers. Proc Natl Acad Sci U S A 101: 2999– 3004 Craig D, Howell MT, Gibbs CL, Hunt T und Jackson RJ (1992) Plasmid cDNA-directed protein synthesis in a coupled eukaryotic in vitro transcription-translation system. Nucleic Acids Res 20: 4987–95 Crucs S, Chatterjee S und Gavis ER (2000) Overlapping but distinct RNA elements control repression and activation of nanos translation. Mol Cell 5: 457–67 Ephrussi A, Dickinson LK und Lehmann R (1991) Oskar organizes the germ plasm and directs localization of the posterior determinant nanos. Cell 66: 37–50 Ephrussi A und Lehmann R (1992) Induction of germ cell formation by oskar. Nature 358: 387–92 Farrell PJ, Balkow K, Hunt T, Jackson RJ und Trachsel H (1977) Phosphorylation of initiation factor elF-2 and the control of reticulocyte protein synthesis. Cell 11: 187–200 Fox CA, Sheets MD und Wickens MP (1989) Poly(A) addition during maturation of frog oocytes: distinct nuclear and cytoplasmic activities and regulation by the sequence UUUUUAU. Genes Dev 3: 2151–62 Gavis ER, Curtis D und Lehmann R (1996) Identification of cis-acting sequences that control nanos RNA localization. Dev Biol 176: 36–50 Gunkel N, Yano T, Markussen FH, Olsen LC und Ephrussi A (1998) Localization-dependent translation requires a functional interaction between the 5c and 3c ends of oskar mRNA. Genes Dev 12: 1652–64 Hake LE und Richter JD (1994) CPEB is a specificity factor that mediates cytoplasmic polyadenylation during Xenopus oocyte maturation. Cell 79: 617–27 Hentze MW, Caughman SW, Rouault TA, et al. (1987) Identification of the iron-responsive element for the translational regulation of human ferritin mRNA. Science 238: 1570–1573 Iizuka N, Najita L, Franzusoff A und Sarnow P (1994) Cap-dependent and cap-independent translation by internal initiation of mRNAs in cell extracts prepared from Saccharomyces cerevisiae. Mol. Cell. Biol. 14: 7322–7330 Jackson RJ (2000). Comparative view of initiation site selection mechanisms. In: Sonenberg N, Hershey JBW und Mathews MB (Hrsg). Translational Control of Gene Expression. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York: 185– 244 Jones-Rhoades MW und Bartel DP (2004) Computational identification of plant microRNAs and their targets, including a stressinduced miRNA. Mol Cell 14: 787–99 Kozak M (1978) How do eucaryotic ribosomes select initiation regions in messenger RNA? Cell 15: 1109–1123

1.7

Kozak M (1986) Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes. Cell 44: 283–292 Lagos-Quintana M, Rauhut R, Yalcin A, Meyer J, Lendeckel W und Tuschl T (2002) Identification of tissue-specific microRNAs from mouse. Curr Biol 12: 735–9 Lazaris-Karatzas A, Montine KS und Sonenberg N (1990) Malignent transformation bya eukaryotic initiation factor subunit nthat binds to mRNA 5’cap. Nature 345: 544–547 Lee RC und Ambros V (2001) An extensive class of small RNAs in Caenorhabditis elegans. Science 294: 862–4 Lee RC, Feinbaum RL und Ambros V (1993) The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell 75: 843–54 Macejak DG und Sarnow P (1991) Internal initiation of translation mediated by the 5’ leader of a cellular mRNA. Nature 353: 90–94 Maquat LE, Kinniburgh AJ, Rachmilewitz EA und Ross J (1981) Unstable beta-globin mRNA in mRNA-deficient beta o thalassemia. Cell 27: 543–53 Mathews MB, Sonenberg N und Hershey JBW (2000). Origins and principles of translational control. In: Sonenberg N, Hershey JBW und Mathews MB (Hrsg). Translational Control of Gene Expression. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York: 1–31 McGrew LL, Dworkin-Rastl E, Dworkin MB und Richter JD (1989) Poly(A) elongation during Xenopus oocyte maturation is required for translational recruitment and is mediated by a short sequence element. Genes Dev 3: 803–15 Muckenthaler M, Gray NK und Hentze MW (1998) IRP-1 binding to ferritin mRNA prevents the recruitment of the small ribosomal subunit by the cap-binding complex eIF4F. Molecular Cell 1: 383–388 Ostareck DH, Ostareck-Lederer A, Shatsky IN und Hentze MW (2001) Lipoxygenase mRNA silencing in erythroid differentiation: The 3’UTR regulatory complex controls 60S ribosomal subunit joining. Cell 104: 281–90 Pause A, Belsham GJ, Gingras AC, et al. (1994) Insulin-dependent stimulation of protein synthesis by phosphorylation of a regulator of 5’-cap function [see comments]. Nature 371: 762–7 Pelham HR und Jackson RJ (1976) An efficient mRNA-dependent translation system from reticulocyte lysates. Eur J Biochem 67: 247–56 Pelletier J und Sonenberg N (1988) Internal initiation of translation of eukaryotic mRNA directed by a sequence derived from poliovirus RNA. Nature 334: 320–325 Pfeffer S, Zavolan M, Grasser FA, et al. (2004) Identification of virusencoded microRNAs. Science 304: 734–6 Sheets MD, Wu M und Wickens M (1995) Polyadenylation of c-mos mRNA as a control point in Xenopus meiotic maturation. Nature 374: 511–6 Sonenberg N, Guertin D, Cleveland D und Trachsel H (1981) Probing the function of the eucaryotic 5c cap structure by using a monoclonal antibody directed against cap-binding proteins. Cell 27: 563–72 Sonenberg N, Hershey JWB und Mathews MB, Eds. (2000). Translational Control of Gene Expression. Cold Spring Harbor, New York, Cold Spring Harbor Laboratory Press Sonenberg N und Shatkin AJ (1977) Reovirus mRNA can be covalently crosslinked via the 5’ cap to proteins in initiation complexes. Proc Natl Acad Sci U S A 74: 4288–92

158

Sektion 1 · Allgemeine Grundlagen

Stebbins-Boaz B, Cao Q, de Moor CH, Mendez R und Richter JD (1999) Maskin is a CPEB-associated factor that transiently interacts with elF- 4E [published erratum appears in Mol Cell 2000 Apr;5(4):following 766]. Mol Cell 4: 1017–27 Tarun SZ, Jr und Sachs AB (1996) Association of the yeast poly(A) tail binding protein with translation initiation factor eIF-4G. EMBO J. 15: 7168–7177

Wells SE, Hillner PE, Vale RD und Sachs AB (1998) Circularization of mRNA by eukaryotic translation initiation factors. Mol Cell 2: 135–40 Wickens M und Stephenson P (1984) Role of the conserved AAUAAA sequence: four AAUAAA point mutants prevent messenger RNA 3’ end formation. Science 226: 1045–51 Zamecnik PC (1979) Historical aspects of protein synthesis. Ann N Y Acad Sci 325: 268–301

1.8 1.8 Molekulare Grundlagen der Apoptose Peter Daniel

1.8.1

Eine biologische Rationale des programmierten Zelltods – 160

1.8.2

Kompartimentierung von Zelltodsignalen – 162

1.8.3

Zelltodsignalwege – 162

1.8.3.1 1.8.3.2 1.8.3.3 1.8.3.4 1.8.3.5

Extrinsischer Signalweg – 164 Intrinsischer Signalweg – 166 Caspasen - Effektormoleküle der Apoptose – 171 Endphase der Apoptose und Elimination apoptotischer Zellen – 174 Caspaseunabhängiger und nichtapoptotischer Zelltod – 175

1.8.4

Stressinduzierte Signalwege – 176

1.8.4.1 1.8.4.2 1.8.4.3 1.8.4.4

Die integrierte Stressantwort des endoplasmatischen Retikulums – 176 DNA-Schädigung, p53-Signalweg und nukleäre Stressantwort – 178 PI3-/Akt-Kinase-/mTOR-Signalweg – 180 Telomerverkürzung, DNA-Schädigung und Seneszenz – 181

1.8.5

Störungen der Zelltodregulation in der Pathogenese von Erkrankungen – 182

1.8.5.1 1.8.5.2 1.8.5.3 1.8.5.4 1.8.5.5

Immunsystem – 182 Infektionskrankheiten – 185 Herz-Kreislauf-Erkrankungen – 187 Degenerative Erkrankungen – 187 Tumorerkrankungen – 189

1.8.6

Ausblick

– 194

1.8.7

Literatur

– 194

1.8.8

Zeittafel

– 200

Literatur zur Zeittafel

– 202

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

160

Sektion 1 · Allgemeine Grundlagen

1.8.1 Eine biologische Rationale des programmierten Zelltods Mit der Evolution multizellulärer Organismen wurde es nötig, genetische Programme zu entwickeln, die soziale Interaktionen im Gewebsverband regulieren. Die Entwicklung spezialisierter Gewebe erfordert nicht nur Zellwachstum an der richtigen Stelle und Differenzierung in die entsprechenden spezialisierten Zelltypen, sondern auch die gezielte Elimination überflüssiger oder gar unerwünschter Zellen. Um diesen „altruistischen“ Zelltod zu regulieren, haben tierische Zellen genetisch determinierte Regulationsmechanismen entwickelt, die im entwicklungsbiologischen Kontext als „programmierter Zelltod“ bezeichnet werden, da der Zelltod durch genetisch determinierte Programme zu genau definierten Zeitpunkten in den zu eliminierenden Gewebsarealen induziert wird. Dieser Begriff umfasst verschiedene Zelltodtypen, von denen die Apoptose der am besten untersuchte Mechanismus ist (Golstein et al. 2003). Zelltod spielt jedoch nicht nur in der Embryonalentwicklung und Organogenese eine wesentliche Rolle (> Abb. 1.8.1a–c), sondern auch in der Aufrechterhaltung der Homöostase adulter, ausgereifter Gewebe. Einerseits werden hierdurch gealterte Zellen, z. B. in Haut und Schleimhäuten, aus dem Gewebsverband entfernt. Andererseits werden Zelltodsignalwege auch in gestressten Zellen aktiviert, z. B. nach oxidativem Stress oder auch Hypoxie, Wachstumsfaktorentzug, Überproduktion aberranter oder fehlgefalteter Proteine oder Aktivierung von Onkogenen oder Tumorsuppressorgenen im Rahmen einer gestörten Zellproliferation. Hierdurch werden geschädigte oder gar gefährliche Zellen aus dem Gewebsverband entfernt, und zwar gezielt und unter Vermeidung von Entzündungsreaktionen, d. h. ohne Gewebsschädigung. Erst durch solche exakt regulierten und gezielt aktivierbaren Zelltodmechanismen war die Entstehung multizellulärer Organismen mit komplexen Gewebs- und Organstrukturen möglich. Morphologisch und biochemisch können im Wesentlichen vier Zelltodformen unterschieden werden: Apoptose, Autophagie, mitotische Katastrophe und Nekrose (Clarke u. Clarke 1996). Apoptose (griech. „apo“ für „weg“ und „ptosis“ für „Fall“) wurde 1972 von den Pathologen Kerr, Wyllie und Currie als eigenständiges und bedeutendes zellbiologisches Phänomen definiert. Jedoch wurden bereits im 19. Jahrhundert Zelltodphänomene beschrieben, vorwiegend im Kontext von entwicklungsbiologischen Veränderungen von Geweben. Ein exzellenter Überblick zur Geschichte der Zelltodforschung, vor allem im 19. Jahrhundert, wurde von Clarke zusammengestellt (Clarke u. Clarke 1996). Durch die klassische Morphologie mit Kernschrumpfung, Kondensation des Chromatins im Zellkern, Frag-

a

d

b

c

. Abb. 1.8.1a–d. Entwicklungsbiologie und Morphologie des apoptotischen Zelltods. Für eine regelrechte Organentwicklung im Rahmen der Embryogenese müssen, neben der gezielten Zellvermehrung, ausgewählte Zellen und Gewebsareale aktiv entfernt werden. Gezeigt ist die Elimination von Zellen aus den Zehenzwischenräumen zwischen Tag 51 (a) und Tag 60 (b) der Embryogenese. In c sind apoptotische Zellen (tiefblau) in einem Querschnitt durch die Zehenknospen dargestellt. Wäre die Apoptose dieser Zellen behindert, dann würden schwimmhautartige Gewebsareale zwischen den Zehen verbleiben. d zeigt elektronenmikroskopische Aufnahmen einer normalen, vitalen Zelle (oben) im Vergleich zu einer apoptotischen Zelle (Mitte) mit kondensiertem, scholligem Chromatin (1), beginnender Fragmentierung des Zellkerns (2), Abschnürung von Zytosol enthaltenden Plasmamembranvesikeln (Blebbing, Zeiose; 3) und geschwollenen Mitochondrien und endoplasmatischem Retikulum (4). Bei Autophagie hingegen zeigt die sterbende Zelle (unten) eine Zunahme von Vesikeln im Zytosol, die Lysosomen entsprechen, die Zellbestandteile endophagozytiert haben und im Fall der Aufnahme von Organellen typische Doppelmembranen aufweisen (5). Sowohl bei Autophagie als auch bei Apoptose bleibt die Zellmembran, im Gegensatz zur Nekrose, über lange Zeiträume intakt

161 1.8 · Molekulare Grundlagen der Apoptose

mentierung des Zellkerns und Ausstülpung von Zellmembranblasen infolge der Zerstörung des Zytoskeletts bei gleichzeitig erhaltener Integrität der Plasmamembran, kann die Apoptose, die auch nach der Klassifikation von Schweichel und Merker als Typ I- (heterophagischer) Zelltod bezeichnet wird (Clarke 1990; Schweichel u. Merker 1973), einfach von der Autophagie (Typ II) und einem regulierten, nekroseähnlichen Zelltod (Typ III-, nichtlysosomaler Zelltod) mit Anschwellen der Organellen, der Zelle und Zerstörung der Plasmamembran abgegrenzt werden (> Abb. 1.8.1d). Durch Abschnürung von ausgestülpten Membrananteilen kommt es zur Bildung apoptotischer Körperchen, die auch Kernfragmente enthalten können. Apoptotische Zellen und apoptotische Körperchen werden durch Phagozytose von professionellen Phagozyten und auch benachbarten Gewebszellen rasch und ohne Entzündungsreaktion und Gewebsschädigung entfernt. Hingegen ist die Nekrose, wie bereits von Rudolf Virchow beschrieben, die schwerste Form der Zell- und Gewebszerstörung (griech. „nekros“ für „Tod“) und geht mit allenfalls defekter Gewebsregeneration und Narbenbildung einher. In nekrotischen Zellen kommt es sehr früh zur Permeabilisierung der Zellmembran, Zellkern und Organellen schwellen an, ohne dass es zur Chromatinkondensation kommt. Wesentlich für die Apoptosemorphologie ist die Aktivierung von Effektorproteasen, den Caspasen (7 1.8.3.3), welche die Zelle von innen heraus abbauen, sowie die Hemmbarkeit des apoptotischen Zelltods durch das antiapoptotische Protein Bcl-2 (7 1.8.3.2). Beides trifft für die Nekrose nicht zu. Während die Apoptose ein aktiv regulierter und energieabhängiger Vorgang ist, ist Nekrose für die betroffene Zelle ein passives Ereignis, das z. B. durch thermische, mechanische oder chemische Schädigung der Zelle ausgelöst werden kann. Autophagozytose, kurz Autophagie, die auch als Typ-II-Zelltod bezeichnet wird, ist eine Stress- und Anpassungsreaktion der Zelle auf Wachstumsfaktor-, Substrat- oder Energiemangel. Typischerweise kommt es zur Aufnahme von Zellbestandteilen, insbesondere auch Organellen, in Lysosomen, die dann als Autophagosomen in der Zelle nachweisbar sind und, im Fall der Autophagozytose von Organellen, elektronenmikroskopisch typische Doppelmembranstrukturen zeigen (> Abb. 1.8.1d). Durch den lysosomalen Abbau gelingt es der Zelle, den Energiestoffwechsel aufrechtzuerhalten, bis schließlich die ersten Zellfunktionen versagen. Autophagie geht nicht mit Caspaseaktivierung einher, und in gestressten Zellen wird Autophagie durch das apoptosehemmende Bcl-2 sogar begünstigt, da der Stressor in diesem Fall keine Apoptose auslösen kann und das Überleben der gestressten Zelle verlängert wird. Dies ist sinnvoll, da die Zufuhr von Wachstumsfaktoren, Sub-

1.8

straten und Energie den Autophagieprozess umkehren kann, um nach der Überwindung des Mangels klonogenes Überleben zu ermöglichen (Lum et al. 2005). Die mitotische Katastrophe ist ein archaischer Zelltodmechanismus, der in proliferierenden Zellen infolge von Fehlern in der mitotischen Zellteilung, z. B. Defekten im mitotischen Spindelapparat und aberranter Verteilung von Chromosomen in die Tochterzellen, ausgelöst werden kann. Sie wurde 1989 erstmals in der Spalthefe Schizosaccharomyces pombe als von der mitotischen p34cdc2- (CDK1-)Kinase-abhängiger Mechanismus beschrieben. Sie ist weder Bcl-2- noch caspasereguliert (Okada u. Mak 2004). Morphologisch geht sie mit einer Vergrößerung des Zellkerns und, aufgrund des Ausbleibens der Anaphase, mit Vermehrung des Chromosomensatzes, also Verlust von Euploidie (Diploidie) und Entwicklung einer Polyploidie, einher. Durch asymmetrische, abortive Mitosen kann es zur Bildung von Mikronuklei kommen. Erschwert wird die Betrachtung dieser Zelltodformen dadurch, dass es Mischformen geben kann, z. B. geht Apoptose nach längerer Zeit und Zusammenbruch des Energiemetabolismus, d. h. ATP-Depletion, in vitro in eine Nekrose über (Searle et al. 1975). In vivo wird dies nicht beobachtet, da apoptotische Zellen auf ihrer Oberfläche ein „Iss-mich“-Signal präsentieren und rasch, ohne Entzündungsreaktion, phagozytiert werden (Krysko et al. 2006). Ist die Mitochondrienfunktion und ATPSynthese gestört, dann kann regulierter Zelltod aber auch von vornherein in einem nekrotischen Phänotyp resultieren (Martinou u. Green 2001; Scholz et al. 2005; Zong et al. 2004). Im Organismus wäre dies fatal, da die Nekrose infolge der Freisetzung von Zellinhalten ein „Gefahr“-Signal darstellt und zur Aktivierung von Entzündungsreaktionen und resultierender Gewebeschädigung führen kann. Interessanterweise unterscheiden sich diese Signalwege und zellulären Reaktionsformen in tierischen Zellen fundamental von denen in Pflanzenzellen (Lam 2004). Entwicklungsgeschichtlich haben sich diese Programme also erst spät, nach Auftrennung in Tier- und Pflanzenwelt, entwickelt. Auch in Pilzen, z. B. Hefen, finden sich nicht sämtliche Komponenten von Zelltodsignalwegen wieder. Obwohl einzelne Arbeiten von regulierten Zelltodwegen schon in Bakterien wie Escherichia coli berichten, findet sich das evolutionär älteste Zelltodprogramm erst im fakultativen Vielzeller Dictyostelium. Um Zeiten knapper Ressourcen zu überstehen, bilden diese amöboiden Einzelzellen unter Nahrungsentzug einen multizellulären Organismus, der in der Bildung von Sporen resultiert. Hierfür sterben die Zellen im Stiel der Sporenkapsel über einen apoptoseähnlichen Mechanismus mit typischer Kernmorphologie und Chromatinkondensation (Golstein et al. 2003). Wesentlich fortschrittlichere

162

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.8.2. Evolutionär konservierte Apoptoseregulation. Apoptosesignalwege sind evolutionär konserviert. Die wesentlichen Komponenten des Bcl-2-regulierten intrinsischen Apoptosewegs finden sich sowohl beim Wurm C. elegans als auch beim Menschen und anderen Säugern: Egl-1 und BH3-only-Proteine, ced-4 und APAF-1, CED-3 und die Initiatorcaspase-9 bzw. Effektorcaspase-3. Allen Apop-

tosewegen ist zudem gemeinsam, dass es über Liganden zur Ausbildung signaltransduzierender Proteinkomplexe kommt. Diese Komplexe rekrutieren Adapterproteine, die wiederum Initiatorcaspasen binden und hierdurch deren Aktivierung auslösen. Dieses Prinzip findet sich auch beim extrinsischen, über Todesrezeptoren regulierten Signalweg

und denen des Menschen in weiten Zügen ähnliche Zelltodprogramme finden sich bei der Fruchtfliege Drosophila melanogaster und dem Wurm Caenorhabditis elegans. Für die Erforschung der Organentwicklung und des programmierten Zelltods in C. elegans erhielten Sidney Brenner, Robert Horvitz und John Sulston im Jahre 2002 den Nobelpreis für Medizin und Physiologie. Neben dem entwicklungsbiologisch programmierten Zelltod spielt der regulierte Zelltod eine zentrale Rolle bei der Reaktion der Zelle auf verschiedenste StressStimuli. Diese reichen von exogenen Noxen, wie z. B. Hypoxie, aber auch oxidativer Stress oder ionisierende Bestrahlung und die damit verbundene DNA-Schädigung, bakteriellen Infektionen oder die Attacke durch Killerzellen des Immunsystems bis hin zu endogen aktivierten Stressreaktionen, z. B. infolge von Störungen in der Zellzyklusregulation, Missfaltung von Proteinen im endoplasmatischen Retikulum oder der Elimination gealterter Zellen im Rahmen der Gewebserneuerung und Gewebshomöostase.

(Kischkel et al. 1995) bzw. des Apoptosoms (Li et al. 1997), an die sich eine kaskadenartig verstärkende Aktivierung einander nachgeschalteter apoptosefördernder Faktoren anschließt, welche die Aktivierung apoptoseausführender Enzyme, der Caspasen, vermitteln. Diese Nutzung von Proteinkomplexen zur Aktivierung von Effektormolekülen der Apoptose ist ein evolutionär konserviertes Prinzip, das zu solch archaischen Organismen wie C. elegans zurückverfolgt werden kann (> Abb. 1.8.2). Hierdurch wird nicht nur eine versehentliche Aktivierung potenziell letaler Signale minimiert, sondern auch eine Fokussierung von Signalkomplexen innerhalb der für den Signalweg wichtigen Kompartimente wie der Plasmamembran oder Zellorganellen erleichtert. Wird z. B. die Initiatorcaspase-8 zufällig außerhalb eines solchen Signalkomplexes proteolytisch in die theoretisch aktiven Untereinheiten gespalten, so zeigt sich dennoch keine wesentliche Enzymaktivität. Nur die innerhalb von Signalkomplexen wie dem DISC gebundene und durch das Prinzip der induzierten Nähe (7 1.8.3.1) aktivierte Initiatorcaspase kann ihre Funktion effizient entfalten (Shi 2004).

1.8.2 Kompartimentierung von Zelltodsignalen 1.8.3 Zelltodsignalwege Programmierter Zelltod, Apoptose, wird durch distinkte Signale und Signalwege reguliert. Ein diesen Signalwegen gemeinsames Prinzip ist die Ausbildung eines zytosolischen, todesinduzierenden Signaltransduktionskomplexes des DISC („death-inducing signaling complex“)

Konzeptionell können zwei wesentliche Apoptosesignalwege unterschieden werden (> Abb. 1.8.3). Der extrinsische Apoptoseweg dient der Erkennung regulierter Apoptosesignale aus der Zellumgebung. Über diesen

163 1.8 · Molekulare Grundlagen der Apoptose

1.8

. Abb. 1.8.3. Apoptosesignalwege. Zwei wesentliche Apoptosesignalwege werden voneinander unterschieden: Der extrinsische, durch Zelltodliganden und Todesrezeptoren aktivierte (linker Teil der Abbildung) und der intrinsische Signalweg, der durch Mitochondrien und das endoplasmatische Retikulum (ER) reguliert und durch intrazelluläre Stress-Signale, z. B. nach DNA-Schädigung im Zellkern oder ER-Stress, aktiviert wird. Gemeinsam ist beiden Apoptosewegen die Aktivierung von Effektorcaspasen über signalwegspezifische Initiatorcaspasen. Die Aktivierung der Initiatorcaspase erfolgt in einem Signalkomplex, wodurch eine Kompartimentierung von Zelltodsignalen an ausgewählten Orten in der Zelle erreicht wird. Im extrinsischen Signalweg erfolgt dies im DISC („death inducing signaling complex“), der aus Todesligand, -rezeptor, dem Adapter FADD und der Initiatorcaspase-8 (oder -10) gebildet wird und durch FLIP-Proteine gehemmt werden kann. Im intrinsischen Signalweg wird die Initiatorcaspase-9 im Apoptosom gebunden und aktiviert, das energieabhängig über einen dATP-abhängigen Mechanismus aus dem Adapter APAF-1 und Cytochrom c gebildet wird. Reguliert wird der intrinsische Weg über die Bcl-2-Genfamilie: BH3-only-Proteine inaktivieren antiapoptotische Bcl-2-Familienproteine oder binden direkt an Bax und/oder Bak. Hierdurch werden Bax und Bak aktiviert und permeabilisieren die äußere Mitochondrienmembran. Hierdurch werden der APAF-1-Aktivator Cytochrom c und Smac freigesetzt. Smac hemmt die IAP-Proteine, wodurch eine wirksame Aktivierung von Effektorcaspasen ermöglicht wird

Mechanismus können gezielt unerwünschte Zellen aus einem Gewebsverband eliminiert werden. Er wird durch Todesliganden aktiviert, die von benachbarten Zellen parakrin oder von der betroffenen Zelle selbst autokrin gebildet und freigesetzt werden. Die Todesliganden binden an Todesrezeptoren, die daraufhin oligomerisieren. Der durch Bindung des Todesliganden stabilisierte Komplex aus Ligand und Rezeptor bindet daraufhin Adaptermoleküle und kann hierdurch Effektormoleküle der Apoptose, Caspasen, im Komplex binden, die dann konsekutiv innerhalb des Komplexes aktiviert werden und die Endphase des Zelltods einleiten. Der intrinsische Zelltodsignalweg wird hingegen über intrazellulär erzeugte Signale eingeleitet, z. B. nach Schädigung der zellulären DNA (nukleärer Stress), massiver Akkumulation fehlgefalteter Proteine [endoplasmatisches-Retikulum- (ER-)Stress] oder unter nutritivem Stress bei Entzug von Wachstumsfaktoren (> Abb. 1.8.3).

Er wird durch die zelltodfördernden und zelltodhemmenden Mitglieder der Bcl-2-Genfamilie (7 1.8.3.2) kontrolliert (Daniel et al. 2003). Das wesentliche Charakteristikum des intrinsischen Wegs ist aber, dass er über spezifische, organellenvermittelte Signalwege ausgeführt wird. Dies erlaubt eine Kompartimentierung und subzellulär fokussierte Aktivierung und Regulation von Signalen. Wesentliche Organellensysteme hierfür sind die Mitochondrien, das endoplasmatische Retikulum, die Lysosomen und der Zellkern. Wie im Falle der Todesrezeptoren wird eine Kompartimentierung von Zelltodsignalen zudem durch die Bildung von Proteinsignalkomplexen erzielt. Im Fall des intrinsischen Signalwegs, der Mitochondrien zur Freisetzung proapoptotischer Faktoren in das Zytosol stimuliert, ist dies das Apoptosom, das analog zum DISC im Zytosol gebildet wird (Li et al. 1997).

164

Sektion 1 · Allgemeine Grundlagen

. Abb. 1.8.4. Genfamilie der TNF-ähnlichen Rezeptoren. Gemeinsam ist diesen Rezeptoren die Organisation in cysteinreiche extrazelluläre Domänen, die eine Trimerisierung der Rezeptoren ermöglichen. Stabilisiert werden diese Rezeptortrimere nach Bindung der spezifischen Liganden aus der TNF-Supergenfamilie (oberer Teil). Rot umrandet ist die Unterfamilie der Todesrezeptoren, die durch das

Vorhandensein einer Todesdomäne charakterisiert sind. Über die Todesdomäne werden über homotypische Interaktionen die Adapterproteine FADD und TRADD rekrutiert, die ebenfalls eine Todesdomäne tragen. Die anderen Rezeptorfamilienmitglieder aktivieren bevorzugt den NF-NB-Signalweg, wirken also eher zellaktivierend und antiapoptotisch

1.8.3.1 Extrinsischer Signalweg

ohne Transmembran- und zytosolische Signaltransduktionsdomänen oder um membrangebundene Rezeptoren ohne funktionelle zytosolische Todesdomänen handelt. Decoy-Rezeptoren werden z. B. durch alternatives Spleißen gebildet. Die biologische Funktion der Decoy-Rezeptoren für die Apoptoseregulation, vor allem in vivo und für experimentelle Tumortherapien mit Todesliganden, wie z. B. TRAIL, ist jedoch noch völlig ungeklärt. Dies gilt insbesondere für die Frage, ob durch diese Köderrezeptoren in malignen Tumoren Resistenzen gegenüber apoptoseinduzierenden Liganden ausgelöst werden können.

Todesrezeptoren Diese in der Plasmamembran lokalisierten Transmembranrezeptoren sind durch ihre Primärstruktur repetitiver cysteinreicher extrazellulärer Domänen charakterisiert, welche die Bindung der Liganden als Trimer ermöglichen und die Trimerisierung dieser Rezeptoren vermitteln (Daniel et al. 2001). Zusätzlich enthalten sie im intrazellulären Teil eine als Todesdomäne („deathdomain“, DD) bezeichnete Aminosäuresequenz, welche die Bindung von signaltransduzierenden Adapterproteinen und die Bildung des DISC ermöglicht (Medema et al. 1997). Gegenwärtig sind 6 Death-Rezeptoren bekannt: Der 55-kDa-TNF-Rezeptor (TNF-R1), CD95 (APO-1, Fas), die TRAIL-Rezeptoren DR4 (TRAIL-R1; „death receptor“, DR) und DR5 (TRAIL-R2), sowie DR3 und DR6 (> Abb. 1.8.4). Neben den Todesrezeptoren enthält diese Supergenfamilie aber eine Vielzahl von Rezeptoren ohne Todesdomäne, die in den jeweiligen Signalwegen und Geweben häufig wichtige Überlebenssignale vermitteln. Sog. Köderrezeptoren (Decoy-Rezeptoren) wiederum können Liganden der Death-Rezeptoren binden und sequestrieren, da es sich entweder um lösliche Moleküle

DISC-Bildung und das Prinzip der induzierten Nähe Die Bindung der entsprechenden Liganden (CD95-/ Fas-Ligand), TNF (Tumor Nekrose Faktor) oder TRAIL („TNF-related apoptosis inducing ligand“) induziert und stabilisiert die Trimerisierung der Todesrezeptoren und erhöht hierdurch die lokale Konzentration der Rezeptoren am Ort der Ligandenbindung. Durch das Prinzip der induzierten Nähe wird hierdurch auch die Bindung der Adapterproteine an die Todesdomäne (DD) des Rezeptor-Oligomers vermittelt (> Abb. 1.8.5). Als Adapterproteine wirken FADD („Fas associated death domain“)

165 1.8 · Molekulare Grundlagen der Apoptose

. Abb. 1.8.5. Biologisches Prinzip der induzierten Nähe. Durch Bildung von Proteinkomplexen wird in todesinduzierenden Signalkomplexen eine lokale Anreicherung und durch Adapterproteine vermittelte induzierte Nähe von Procaspase-Zymogenen erreicht, die sich hierdurch autokatalytisch selbst aktivieren und als aktive Caspasen dann nachgeschaltete Effektorcaspasen aktivieren. Gezeigt ist der TNF-induzierte DISC („death inducing signaling complex“, linker Teil der oberen Abbildung) und das mitochondriale APAF-1 Apoptosom, die eine Aktivierung der Procaspase-8 bzw. -9 vermitteln. Dieses Prinzip der induzierten Nähe (blaue Pfeile) ist sehr effektiv, um Signale lokal zu kompartimentieren, evolutionär konserviert und findet sich z. B. auch bei der Aktivierung des NF-NB-regulierenden IKK-Kinasekomplexes. Dort wird die IKK-Kinase am TNF-Rezeptor-/Adapterproteinkomplex oder NOD-Protein-Komplexen (z. B. Inflammasom) rekrutiert und vermittelt dort die Phosphorylierung und Hemmung des inhibitorischen INB-Proteins. Hierdurch wird die Aktivierung des dimeren Transkriptionsfaktors NF-NB ermöglicht

1.8

im TNF-R1, TRAIL und CD95-/Fas-Signalweg bzw. RIP1 („receptor interacting protein 1“) und RAIDD („RIP-associated ICH-1/Ced-3-homologous protein with a death domain“) im TNF-R1-Signalweg (Daniel et al. 2001). Im Fall der TRAIL-Rezeptoren und des CD95-Todesrezeptors bindet FADD direkt an die DD des Rezeptors, im Fall von TNF ist hierzu noch die Bindung des Adapterproteins TRADD (TNF-receptor associated DD) erforderlich. Dort vermittelt TRADD auch die Bindung der RIP-Kinase, welche die Aktivierung des NF-NB-Signalwegs über die INB-Kinase (IKK) vermittelt. Die zusammengelagerten Rezeptoren binden und aktivieren über diese Adapterproteine die als Inducerbzw. Initiatorcaspasen bezeichneten Effektorenzyme der Apoptose, die hierdurch zu den aktiven heterotetrameren Caspasen gespalten und prozessiert werden. Caspase-8 ist die dominante, durch den Todesrezeptor aktivierte Caspase und wird, über FADD, z. B. von den TRAILRezeptoren (DR3, 4 und 5), CD95/Fas und TNF-R1 gebunden und aktiviert. Die der Caspase-8 nahe verwandte Caspase-10 wirkt vorwiegend im TRAIL-Rezeptorweg, kann aber Caspase-8 auch im CD95-DISC funktionell komplementieren. Der TNF-R1 kann die Procaspase-2 über die TRADD-, RIP- und RAIDDAdapterproteine in den DISC binden. Kürzlich wurde auch eine Bindung der Procaspase-2 in den CD95-/ Fas-DISC beschrieben. Allerdings trägt die Procaspase-2 eine CARD- und keine DED-Domäne (7 1.8.3.3), und der Mechanismus der Bindung in den Komplex, insbesondere die Natur des beteiligten Adapterproteins, ist daher noch unklar (Riedl u. Shi 2004). Die Aktivierung dieser Initiatorcaspasen erfolgt durch das Prinzip der induzierten Nähe. Die Frage, ob hierzu die proteolytische Spaltung in die p10- und p20-Untereinheiten und Bildung von p20-/p10-Heterotetrameren erfolgen muss, wie sie im Fall der Effektorcaspasen zwingend erforderlich ist, wird kontrovers diskutiert (Shi 2004). Weiterhin konnte ein membranunabhängiger, zytosolischer Caspase-8/FADD-Komplex nach TNF-R1-Aktivierung nachgewiesen werden. Dieser als Komplex II bezeichnete DISC enthält auch den Adapter TRADD und die RIP1-Kinase und vermittelt, ebenfalls über das Prinzip der induzierten Nähe, die Aktivierung von Caspase-8 und NF-NB (Micheau u. Tschopp 2003). Gehemmt werden kann die Bindung in den DISC und Aktivierung von Caspase-8/-10 durch FLIP-Proteine (CD95/„Fas linked inhibitor protein“, > Abb. 1.8.3). FLIP kommt in Form von drei Spleißvarianten vor: die kurze („short“) Variante FLIPS, die lange Spleißvariante FLIPL und das kürzlich beschriebene FLIPR (Budd et al. 2006). FLIPL ähnelt in seiner Peptidsequenz stark der Procaspase-8 und enthält eine DED, sowie der p10 und p20 Untereinheit der Procaspase-8 homologe Abschnitte,

166

Sektion 1 · Allgemeine Grundlagen

jedoch kein aktives katalytisches Zentrum. FLIPL kann daher über seine DED in den DISC binden und die Procaspase-8 kompetitiv verdrängen. Des Weiteren interagiert FLIPL, wie auch FLIPS, wahrscheinlich im Sinne einer homotypischen Interaktion, mit der Procaspase-8 und wird als Substrat mit langsamer Kinetik gespalten, wirkt also als klassischer Substratinhibitor der Caspase-8-Enzymaktivität. Allerdings wurde kürzlich auch gezeigt, dass FLIPL-/Caspase-8-Heterodimere als DISC agieren können und durch Interaktion der DEDs in beiden Proteinen und sterische Interaktion mit den caspasehomologen Anteilen von FLIPL eine Aktivierung der Caspase-8 vermitteln können (Micheau et al. 2002). Ob die Caspase-8-Aktivierung durch FLIP-Proteine gehemmt wird, hängt somit sowohl vom Expressionsmuster der FLIP-Spleißvarianten ab als auch von deren Expressionsniveau, vor allem von FLIPL. In diesem Zusammenhang ist es von Interesse, dass z. B. beim Apoptoseschutz aktivierter T-Lymphozyten durch Kostimulation über CD28-Ligation bevorzugt FLIPS (und nicht FLIPL) induziert wird. Eine Hochregulation von FLIPL und FLIPR wurde bei malignen Tumoren beobachtet (Budd et al. 2006).

1.8.3.2 Intrinsischer Signalweg Die Bcl-2-Genfamilie Bcl-2 wurde aufgrund der krankheitscharakteristischen t(14;18)-Translokation in follikulären Lymphomen entdeckt (Tsujimoto et al. 1984). Diese Mutation bringt das Bcl-2-Gen unter die Kontrolle des IgH-Enhancers und führt zur Hochregulation der Bcl-2-Gen-Expression in den malignen B-Zellen (Tsujimoto u. Croce 1986). Bcl-2 war das erste Gen, für das eine zelltodregulierende Wirkung beschrieben wurde (Vaux et al. 1988). Es hemmt Apoptose und trägt hierdurch entscheidend zur Therapieresistenz und der schlechten klinischen Prognose follikulärer Lymphome und auch anderer Tumorerkrankungen mit deregulierter, hoher Bcl-2-Expression bei. Mittlerweile wurden eine Vielzahl Bcl-2-homologer Proteine entdeckt, die eine wesentliche Rolle bei der Regulation des intrinsischen Zelltodsignalwegs spielen (Daniel et al. 2003). Bcl-2-Familienmitglieder liegen, abhängig vom Vorhandensein einer Transmembrandomäne und dem Aktivierungszustand des Proteins, als zytosolische oder membranassoziierte Proteine vor. Bcl-2 ist (bis auf die Bcl-2D-Spleißvariante, die keine Transmembrandomäne trägt) an der äußeren Mitochondrienmembran, dem endoplasmatischen Retikulum (ER) und der Kernmembran lokalisiert. Das homologe und ebenfalls antiapoptotisch wirksame Bcl-xL liegt sowohl zytosolisch als auch membrangebunden vor und transloziert in apoptotischen Zellen zur äußeren Mitochondrien-

membran und dem ER. Nichtaktiviertes Bax ist zytosolisch, Bak hingegen konstitutiv in der äußeren Membran von Mitochondrien und der ER-Membran nachweisbar. Spezifische Organellenlokalisation wird durch C-terminale Signalsequenzen erzielt, über die z. B. Nbk in die ER-Membran, nicht jedoch in Mitochondrien lokalisiert wird. Die Aktivierung des mitochondrialen Apoptosesignalwegs (> Abb. 1.8.3) wird von Bcl-2, Bcl-xL, Bcl-w, Mcl-1, Bfl-1 und weiteren apoptosehemmenden Mitgliedern der Bcl-2-Genfamilie kontrolliert. Neben diesen Apoptosehemmern existieren jedoch auch proapoptotische Bcl-2-Familienproteine. Reguliert wird das Zusammenspiel dieser komplexen Genfamilie durch spezifische Proteininteraktionen zwischen den zelltodfördernden und den zelltodhemmenden Spielern (Chen et al. 2005). Diese Interaktionen werden wesentlich (jedoch nicht ausschließlich) durch evolutionär konservierte Domänen, die Bcl-2-Homologie- (BH-)Domänen, vermittelt (> Abb. 1.8.6). Alle antiapoptotischen Bcl-2-Homologen verfügen über die 4 α-helikalen BH-Domänen BH1 bis BH4 und eine Transmembrandomäne. Die zelltodfördernden Bcl-2-Proteine werden aufgrund ihrer Interaktion in zwei weitere Subfamilien unterteilt: die Bax-homologen Proteine Bax, Bak und Bok, sowie die wachsende Familie der BH3-only-Proteine (Fletcher u. Huang 2006). Während die Bax-Homologen eine BH1-, BH2- und BH3-Domäne sowie eine Transmembrandomäne tragen, findet sich in den BH3-only-Proteinen nur eine BH3-Domäne, die für die zelltodfördernde Wirkung dieser Proteine essenziell ist und daher namensgebend war. Überexpression von Bcl-2 oder dessen antiapoptotischen Homologen hemmt Zelltod durch Apoptose und blockiert die nachgeschaltete Aktivierung von Effektormechanismen der Apoptose, wie z. B. der Caspasen. Mitochondrien Mitochondrien enthalten und erzeugen eine Vielzahl toxischer Proteine und Substanzen aufgrund ihrer wichtigen Funktion als Energielieferanten der Zelle. Werden Mitochondrien im Rahmen der Apoptose permeabilisiert, dann gelangt der Inhalt des Intermembranraums zwischen innerer und äußerer Mitochondrienmembran in das Zytosol (Martinou u. Green 2001). Hierzu gehören das Cytochrom c, das, neben seiner Funktion beim Elektronentransport in der Atmungskette, eine wesentliche Funktion bei der Bildung und Aktivierung eines zytosolischen Signalkomplexes, des Apoptosoms, spielt und hierdurch die Aktivierung der Caspasekaskade auslöst. Neben Cytochrom c werden weitere caspaseaktivierende Proteine, Smac/Diablo („second mitochondrial activator of caspases/direct iAP binding protein with low pI“) und die Serinprotease Omi/HtrA2 freige-

167 1.8 · Molekulare Grundlagen der Apoptose

1.8

. Abb. 1.8.6. Bcl-2-Genfamilie. Durch DNA- bzw. Proteinsequenzvergleiche wurden vier D-helikale Homologiedomänen in Mitgliedern der Bcl-2-Genfamilie identifiziert, die als Bcl-2-Homologiedomänen (BH)1 bis 4 bezeichnet werden. In den antiapoptotischen Familienmitgliedern finden sich alle 4 BH-Domänen, außer in den Bak-In-

hibitoren Mcl-1 und Bfl-1 sowie den viralen Homologen. Die drei proapoptotischen Multidomänenproteine tragen die BH-Domänen 1 bis 3, während die proapoptotischen BH3-only-Proteine namensgebend nur die BH3-Domäne und teils eine Transmembrandomäne tragen

setzt (Daniel et al. 2003). Weitere proapoptotische Faktoren sind die Endonuklease G, die eine Rolle bei der Degradierung der zellulären DNA zu haben scheint und das Flavoprotein AIF („apoptosis inducing factor“), dessen Rolle in der Apoptoseregulation sehr umstritten ist. Weiterhin erzeugen Mitochondrien eine große Menge reaktiver Oxidantien, die potenziell DNA-schädigend wirken und hierdurch den p53-Signalweg aktivieren können (7 1.8.4.2). In C. elegans konnte durch genetische Analysen in Defektmutanten und gezielte Kreuzung von Mutanten mit mehreren derartigen genetischen Defekten in der Apoptosesignalkaskade eine Hierarchie der Apoptosesignaltransduktion erarbeitet werden (Lettre u. Hengartner 2006). Das Bcl-2-homologe C.-elegans-Todesgen 9 („C. elegans death gene 9, ced-9“) hemmt Apoptose und verhindert die Aktivierung der nachgeschalteten Caspase ced-3 (> Abb. 1.8.2). Interessanterweise kann humanes Bcl-2 in C. elegans Zelltod hemmen und umgekehrt. Diese Mechanismen sind somit evolutionär hoch-

gradig konserviert. Allerdings scheint in C. elegans ced-9 direkt mit ced-4 zu interagieren und dessen Aktivität zu hemmen. Eine solche direkte Hemmung des ced4-Homologs APAF-1 durch Bcl-2 findet jedoch in Säugern nicht statt. Dort entfaltet Bcl-2 seine zelltodhemmende Wirkung oberhalb der Aktivierung des Apoptosoms durch direkte Hemmung Bax-/Bak-abhängiger Signale, bevor es zur Freisetzung von Cytochrom c aus den Mitochondrien kommt. Modelle für die Aktivierung von Bax und Bak durch BH3-only-Proteine Bereits früh wurde eine wechselseitige Bindung von Bcl-2-Familienmitgliedern gezeigt, und mehrere dieser Proteine wurden aufgrund derartiger Interaktionen z. B. mittels des Yeast-2-Hybrid-Systems kloniert. Unter Nutzung von Bax- und Bak-defizienten Zellen wurde entdeckt, dass BH3-only-Proteine ihre zelltodfördernde Wirkung indirekt über einen Bax-/Bak-abhängigen Mechanismus entfalten und eine Konformationsänderung

168

Sektion 1 · Allgemeine Grundlagen

in diesen Proteinen auslösen, die mit deren Aktivierung und Oligomerisierung in der äußeren Mitochondrienmembran einhergeht. In der Folge konnte auch für das C.-elegans-System gezeigt werden, dass egl-1, eines der beiden bisher in C. elegans identifizierten BH3-onlyProteine, in seiner Aktivität durch ced-9 gehemmt wird. Allerdings besitzt C. elegans kein proapoptotisches Baxoder Bak-homologes Multidomänen-Bcl-2-Homolog. Daten aus humanen Systemen zeigten allerdings, dass Bcl-2 und Bcl-xL im Rahmen der Apoptose durch Caspasen zu Bax-ähnlichen proapoptotischen Proteinen konvertiert werden können. Eine solche Umkehrung der Funktion von ced-9 zu einem proapoptotischen Protein wurde auch in C. elegans gezeigt. Mittlerweile ist klar, dass BH3-only-Proteine als funktionelle Bindeglieder zwischen sehr diversen, übergeordneten Zelltodsignalen und der Aktivierung des mitochondrialen Apoptosewegs durch Bax und/oder Bak wirken (> Abb. 1.8.7a; Fletcher u. Huang 2006). Während das BH3-only-Protein Bid durch Spaltung zum trunkierten Bid (tBid) aktiviert wird und den Todesrezeptorweg mit dem mitochondrialen Weg verknüpft, agieren Puma, Noxa, Hrk und Nbk als Effektoren des p53-Signalwegs, der z. B. nach DNA-Schädigung oder durch Onkogene aktiviert wird. Dort führt p53 zur transkriptionellen Aktivierung der genannten BH3-only-Gene. Bad hingegen wirkt als Sensor für antiapoptotische Signale über die PI3- und die Akt-Kinase, die Bad in der BH3-Domäne phosphorylieren und hierdurch inaktivieren. Wachstumsfaktorentzug induziert in hämatopoetischen Zellen Apoptose durch Inaktivierung des PI3-Kinasewegs und resultierender Dephosphorylierung zum apoptosefördernden Bad. Bim und Bmf hingegen dienen als Sensoren für zytoskelettalen Stress, der Bim aus der Bindung an den Motor-DyneinKomplex bzw. Bmf aus der Bindung an das AktinZytoskelett freisetzt und hierdurch die Aktivierung des intrinsischen Apoptosewegs vermittelt (Daniel et al. 2003). Trotz der Etablierung der hierarchischen Aktivierung von Bax und Bak ist dennoch der exakte Mechanismus ungeklärt. Strukturanalysen zeigen, dass Peptide aus BH3-Domänen in eine Tasche, gebildet aus BH1, -2 und -3 Domäne, z. B. von Bcl-xL, Bcl-2 oder Bcl-w binden können (> Abb. 1.8.7b). Für die BH3-only-Proteine Bid, Bim und Puma konnte eine Bindung an Bax oder Bak nachgewiesen werden. Hieraus wurde das Modell einer direkten Aktivierung von Bax und Bak durch Bindung dieser BH3-only-Proteine postuliert (Aktivatormodell; Kuwana et al. 2005). Dieses Modell kann aber insofern nicht korrekt sein, als ein 3-facher Ausfall von Bid, Bim und Puma den apoptosedefizienten Phänotyp der Bax-/Bak-Defizienz vollständig imitieren müsste. Dies ist aber weder entwicklungsbiologisch im Maus-

modell nachweisbar noch in Zellkulturmodellen der Fall. Interessanterweise interagieren alle BH3-only-Proteine mit deutlich höherer Affinität mit antiapoptotischen Bcl-2-Familienmitgliedern und werden hierdurch in ihrer proapoptotischen Aktivität gehemmt. Hieraus leitet sich das Sensitizer-Modell ab, in dem BH3-only-Proteine durch Bindung an antiapoptotische Bcl-2-Familienmitglieder diese funktionell sequestrieren und hierdurch deren hemmende Wirkung auf Bax bzw. Bak aufheben (Chen et al. 2005; Fletcher u. Huang 2006). Dieses Modell lässt aber die Frage des Mechanismus der Bax-/Bak-Aktivierung offen und postuliert eine ständige spontane Aktivität von Bax und Bak. Interessanterweise binden antiapoptotische Bcl-2-Homologe wie Bcl-2, Bcl-xL oder Mcl-1 an aktiviertes Bax oder Bak und hemmen hierdurch die Permeabilisierung der äußeren Mitochondrienmembran und die Freisetzung von Cytochrom c. Eine solche doppelte Hemmebene, sowohl auf dem Niveau der BH3-only-Proteine als auch auf Ebene des aktivierten Bax und Bak ergibt angesichts einer solchen spontanen, für die Zelle gefährlichen Aktivierbarkeit von Bax und Bak, durchaus Sinn. Dennoch favorisieren die meisten Arbeitsgruppen derzeit noch ein „Mischmodell“ (Letai et al. 2002), in dem BH3-only-Proteine sowohl Bax/Bak aktivieren können (Bid, Puma, Bim) als auch Bcl-2 und dessen antiapoptotische Homologen sequestrieren können (alle BH3-only-Proteine). Eine Vielzahl funktioneller Daten besagt, dass Bax und Bak funktionell redundant sind. Neuere Daten zur Apoptoseinduktion durch BH3-only-Proteine belegen aber, dass die Regulation komplexer ist. Proteolytische Spaltprodukte von Bid, die durch Caspase-8 und -3 (15 kDa tBid) bzw. Granzym B (13 kDa tBid) aus dem 22-kDa-Bid-Protein gebildet werden, aktivieren differenziell Bax (13 kDa tBid) bzw. Bak (15 kDa tBid). Ebenso aktiviert Nbk einen Bax-abhängigen/Bak-unabhängigen Zelltodsignalweg (Gillissen et al. 2003). Die funktionelle Rationale dieser differenziellen Aktivierbarkeit von Bax und Bak ermöglicht eine feinere Regulierbarkeit des Systems durch BH3-only-Proteine, die durch unterschiedliche Zelltodstimuli differenziell induziert und aktiviert werden können und teils auch gewebespezifisch exprimiert werden. Ebenso inhibieren antiapoptotische Bcl-2-Familienmitglieder nicht alle BH3-only-Proteine und interagieren präferenziell mit Bax oder Bak. So vermitteln Mcl-1, Bfl-1 und Bcl-xL einen doppelten Schutz vor Aktivierung von Bak, während Bax nur durch Bcl-xL und dagegen kaum durch Mcl-1 oder Bfl-1 gehemmt wird (Willis et al. 2005).

169 1.8 · Molekulare Grundlagen der Apoptose

1.8

a

c

b

. Abb. 1.8.7a–c. Regulation des intrinsischen, mitochondrialen Apoptosewegs. a Funktionelle Analysen haben gezeigt, dass BH3-onlyProteine über einen indirekten Mechanismus den intrinsischen Apoptoseweg am Mitochondrium oder dem ER aktivieren, in dem sie Bax und/oder Bak aktivieren. Bax transloziert nach Aktivierung und hieraus resultierender Konformationsänderung aus dem Zytosol in die äußere Mitochondrienmembran. Bak ist hingegen konstitutiv dort lokalisiert und wird dort, neben der Hemmung durch Bcl-2/Bcl-xL zusätzlich über Mcl-1 und Bfl-1 gehemmt und abgesichert. BH-onlyProteine können diese Hemmung von Bax und Bak durch Bindung und Inaktivierung von antiapoptotischen Bcl-2-Familienmitgliedern entfalten. Des Weiteren wurde eine direkte Bindung von proteoly-

tisch gespaltenem, trunkiertem Bid (tBid), Bim und Puma an Bax bzw. Bak gezeigt. Da verschiedene BH3-only-Proteine durch sehr unterschiedliche Signalkaskaden aktiviert werden und differenziell Bax bzw. Bak aktivieren, wird hierdurch ein hohes Maß an Regulierbarkeit des intrinsischen Signalwegs erreicht. b 3D-Modell für die Bindung einer D-helikalen BH3-Domäne in die Bindetasche des antiapoptotischen Bcl-xL, die aus dessen BH1, BH2 und BH3-Domäne gebildet wird. c Strukturformel (oberer Teil) eines hochspezifischen Bcl-2-Inhibitors, ABT-737, der in die Bindetasche von Bcl-xL (und Bcl-2 und Bcl-w) bindet (unterer Teil) und es hierdurch inaktiviert und somit z. B. Tumorzellen für die Apoptose sensibilisiert

Mechanismen der Mitochondrienaktivierung durch Bax Der apoptoseregulierende Mechanismus der Bcl-2-Familienmitglieder ist, obwohl Bcl-2 als eines der ersten Gene in dieser Signalkaskade identifiziert wurde, immer noch nicht vollständig klar. Als gesichert gilt, dass Bax und dessen Homologe Bak und Bok direkt Mitochondrien aktivieren können, die daraufhin Cytochrom c und ATP aus dem Raum zwischen innerer und äußerer Mitochondrienmembran freisetzen (Daniel et al. 2003). Dieser Vorgang kann durch Bcl-2 gehemmt werden. Die

Aktivierung der Mitochondrien kann hierbei in distinkte Aktivierungsschritte unterteilt werden: 1. Die Konformationsänderung im N-Terminus von Bax löst die Translokation vom Zytoplasma in die äußere Mitochondrienmembran aus und geht mit der Insertion in die Membran und Bildung von alkaliresistenten Bax-Oligomeren einher. Der Bax N-Terminus scheint dabei eine hemmende Funktion zu haben, da Mutanten von Bax ohne N-Terminus oder die in malignen Gliomen nachgewiesene Bax- Abb. 3.1.1). Nach der Transkription der DNA in eine RNA können durch alternatives Spleißen unterschiedliche mRNAs entstehen, die nach der Translation zu unterschiedlichen Proteinen führen. Nach der Translation können die Proteine weiter stabil oder transient modifiziert werden. Über 200 posttranslationale Proteinmodifikationen wie Methylierungen und Phosphorylierungen wurden beschrieben, die Einfluss auf die Aktivität, Stabilität, Struktur, Lokalisation und Wechselwirkungen der Proteine haben (Meri u. Baumann 2001). Diese Modifikationen sind nicht von der DNA-Sequenz ablesbar und lassen sich nur durch eine Untersuchung der Proteine erfassen (7 3.1.2.3). Auch Fragen nach der subzellulären Lokalisation sowie nach Wechselwirkungspartnern der Proteine zur Erhellung zellulärer Strukturen können nicht aus der Kenntnis der DNA-Sequenz beantwortet werden und erfordern systematische Analysen auf der Proteinebene (7 3.1.2.5 und 3.1.2.6).

299 3.1 · Klinische Proteomik

3.1

. Abb. 3.1.1. Verschiedene Ebenen der Regulation auf dem Weg von der DNA zum funktionellen Protein

Nicht so sehr das genetische „Layout“ also, sondern vielmehr die komplexen Prozesse auf der Proteinebene bestimmen den Phänotyp einer Zelle. Deshalb ist die systematische Proteomanalyse unerlässlich für unser Verständnis der zellulären Funktion. Über die Grundlagenforschung hinaus wird sie die Identifizierung von neuen Biomarkern für die Diagnostik und von neuen Targets für die Therapie komplexer Erkrankungen ermöglichen.

3.1.2 Teilgebiete der Proteomik 3.1.2.1 Identifizierung von Proteinen Gewinnung, Handhabung und Lagerung von Proteinproben sind kritische Schritte bei der Identifizierung von Proteinen in großem Maßstab. Proben aus Geweben oder Zelllinien enthalten mehr als 10.000 verschiedene Proteine, die zum Teil mittels ein- bzw. zweidimensionaler Elektrophorese (2DE) aufgetrennt werden können. Nach der Trennung lassen sich die Proteine in den Gelen

mit Silber oder Coomassie anfärben. Die Spots werden ausgeschnitten, das enthaltene Protein wird enzymatisch (oft mit der Protease Trypsin) zu Peptiden verdaut, die durch MS bestimmbar sind. Für die massenspektrometrische Proteinidentifizierung stehen zwei Verfahren bereit: Bei der Erfassung der Peptidmassen nach Henzel („peptide mass mapping“) (Henzel et al. 1993) wird das Massenspektrum der Peptide mittels MALDI-TOF („matrix-assisted laser desorption/ionisation – time of flight“) bestimmt. Durch die Automatisierung der MALDI-Identifizierung können mittlerweile Hunderte von Proteinspots parallel ausgeschnitten, enzymatisch verdaut und analysiert werden (Berndt et al. 1999). Das experimentell ermittelte Massenspektrum der analysierten Peptide wird mit theoretischen Peptidmassen aus Protein- oder Nukleotidsequenzdatenbanken verglichen. So lässt sich in vielen Fällen das Protein bereits identifizieren („MALDI fingerprinting“). Das Prinzip der Peptidfragmentierung („peptidefragmentation“) beruht auf der Sequenzanalyse einzelner Peptide (Fenn et al. 1989) und wird über die ESI-MS/

300

Sektion 3 · Diagnostik

MS-Methode umgesetzt. Die Peptide werden mittels Elektrospray („electrospray ionisation“, ESI) direkt von der flüssigen Phase ionisiert und in ein Tandem-Massenspektrometer gesprüht, wo sie in N- oder C-terminale Fragmente aufgetrennt werden. ESI-MS/MS ist technisch komplizierter als MALDI-TOF, hat aber den großen Vorteil, dass zur Identifizierung der Proteine Sequenzinformationen der Peptide anstelle einfacher Peptidmassen verwendet werden, wodurch ein eindeutiger Nachweis der Proteine möglich wird. Die massenspektrometrischen Methoden zur Proteinidentifizierung entwickeln sich rasch weiter. Inzwischen gibt es Geräte, in denen eine MALDI-Ionenquelle mit Tandem-Massenspektrometern für die Fragmentierung von Peptiden kombiniert wird (Shevchenko et al. 2000). Die Verbindung der Hochdurchsatzkapazität der MALDI-Methode mit der Spezifität der Peptidsequenzierung ermöglicht eine automatisierte Ein-Schritt-Analyse. Neueste Bemühungen zielen auf Beschleunigung der Präparation und Auftrennung der Proben in integrierten Geräten ab. Die 2DE/MS-Methoden haben große Beiträge zur Identifizierung komplexer Proteome geleistet, unterliegen jedoch bestimmten Limitationen. Obwohl die besten 2D-Gele bis zu 10.000 verschiedene Proteinspots auflösen können (Klose u. Kobalz 1995), lassen sich nur die Proteine visualisieren, die im Proteinextrakt in den größten Mengen vorkommen. Die Konzentration vieler Proteine liegt unter der Nachweisgrenze der verwendeten Proteinfarbstoffe. Zur Überwindung dieses Problems können verschiedene Techniken zur subzellulären Fraktionierung bzw. zur Affinitätsreinigung angewandt werden, die zu einer Verringerung der Probenkomplexizität vor der Elektrophorese führen. Ein elegantes Beispiel für die Analyse eines Sub-Proteoms ist die 2DE-Untersuchung des Phagosoms, welche zur Identifizierung von mehr als 250 Proteinen dieser Organelle führte (Gagnon et al. 2002). In einem alternativen Ansatz werden komplexe Proteinmischungen ohne vorherige Gelelektrophorese mittels MS analysiert. Damit lassen sich gering konzentrierte Proteine identifizieren oder auch andere mittels gel-basierter Methoden nicht erfassbare, etwa hydrophobe, Proteine. Die „Multidimensionale Protein-Identifikationstechnologie“ („multidimensional protein identification technology“, MudPIT) (Link et al. 1999) beruht auf der Peptidtrennung mittels Flüssigchromatographie und anschließender MS. Komplexe Proteingemische werden zunächst verdaut und anschließend in zwei unabhängigen, nacheinander gereihten Flüssigchromatographiesystemen getrennt. Von der zweiten Säule werden die Peptide direkt in ein Ionenfallen-Massenspektrometer („ion trap mass spectrometer“) eluiert, wo sie vollautomatisch identifiziert werden.

3.1.2.2 Differenzielles Display und Quantifizierung von Proteinen 2DE-Methoden Zum Verständnis der molekularen Grundlagen von Erkrankungen und zur Aufdeckung von molekularen Markern (7 auch 3.1.3) ist die Analyse von Proteinprofilen und die Quantifizierung bestimmter Proteine in verschiedenen Zuständen (gesund/krank, behandelt/unbehandelt) zu verschiedenen Zeitpunkten (Verlaufsstudien) von großem Interesse. In den meisten Proteomiklaboratorien werden 2D-Gele verwendet, um Proteinprofile zu analysieren und damit Proteine zu identifizieren, deren Expression unter bestimmten Bedingungen hoch- oder herunterreguliert ist. Die Proteine aus den zu vergleichenden Proben werden mittels 2DE getrennt. Proteine, die nur in einem Zustand sichtbar oder deutlich stärker exprimiert sind, werden durch Analyse der Gelbilder selektiert und mit MS analysiert. 2DE-Experimente sind jedoch oft schwer reproduzierbar und erfordern viel praktische Erfahrung. Eine bedeutende Verbesserung wurde hier durch die Differenz-Gelelektrophorese („difference gel electrophoresis“, DIGE) erzielt, bei der zwei Pools von Proteinen aus zwei verschiedenen Zuständen mit verschiedenen Fluoreszenzfarbstoffen markiert werden und anschließend in ein und demselben 2D-Gel aufgetrennt werden (Unlu et al. 1997). Dadurch reduziert sich sowohl die Abhängigkeit von der Qualität der Präparation bzw. der Auftrennung als auch die Anzahl der zu analysierenden Gele. Ein weiterer Vorteil ist die hohe Sensitivität und der große dynamische Bereich der Fluoreszenzfarbstoffe. Damit ist es möglich, auch niedrig konzentrierte Proteine zu detektieren und vergleichend zu analysieren. Massenspektrometrische Methoden Eine aktuelle Übersicht zu MS-Methoden, die in der quantitativen Proteomik verwendet werden, wurde unlängst von Ong und Mann (2005) publiziert. Eine Kombination von radioaktiver Markierung und MS kann verwendet werden, um Proteine in Zellextrakten zu quantifizieren (Oda et al. 1999). Zu diesem Zwecke lässt man z. B. Bakterien in zwei verschiedenen Medien wachsen, eines davon weist natürliche Stickstoffisotope auf, das andere ist mit N15 angereichert. Die Bakterienproteine werden gemischt, aufgetrennt und mittels MS analysiert. Die beiden Versionen jedes Peptides werden als Doppel-Peak registriert und können über die Anzahl der Stickstoffatome detektiert werden. Das Verhältnis der Peak-Höhen erlaubt die relative Quantifizierung des dazugehörigen Proteins in den beiden Zuständen.

301 3.1 · Klinische Proteomik a

b

3.1

c

. Abb. 3.1.2a-c. Detektion von Proteinen in humanen Proben unter Verwendung verschiedener Typen von Protein-Mikroarrays. a Protein-Mikroarray, b Antikörper-Mikroarray, c reverser Protein-Mikro-

array. Ausführliche Erklärungen zu den dargestellten Methoden finden sich im Text (7 3.1.2.2)

Bei der sog. ICAT- („isotope-coded affinity tags“-) Methode werden von zwei Zuständen cysteinhaltige Peptide in vitro markiert und dann der MS zugeführt (Gygi et al. 1999a). Da die Markierung in vitro erfolgt, ist diese Methode auch zur Analyse humaner Proben anwendbar.

den die Mikroarrays mit entsprechenden Serumverdünnungen inkubiert. Die gebundenen Antikörper werden dann mithilfe von fluoreszenzmarkierten Zweitantikörpern detektiert (Robinson et al. 2002). Protein-Mikroarrays, auf denen Antikörper immobilisiert wurden (sog. Antikörper-Mikroarrays, AMAs), finden Anwendung bei der Quantifizierung von interessanten Proteinen in klinischen Proben oder können zum Vergleich von klinischen Proben eingesetzt werden (> Abb. 3.1.2b). Die zu vergleichenden Proben werden mit zwei unterschiedlichen Fluoreszenzfarbstoffen markiert und dann gleichzeitig auf einem AMA inkubiert (ähnlich der Bestimmung von mRNA-Profilen mittels DNA-Mikroarrays). Skreekumar et al. (2001) konnten mit dieser Methode die Auf- und Abregulation einiger Proteine in LoVo-Kolonkarzinom-Zellen unter Bestrahlung untersuchen, indem sie Proteinextrakte von bestrahlten und unbestrahlten Zellen mit Antikörper-Arrays testeten. In anderen Studien mit Antikörper-Arrays wurden kinetische Analysen zur Expression von Rezeptorkinasen (Nielsen et al. 2003) oder Zytokinen (Schweitzer et al. 2002) durchgeführt. Analytische Untersuchungen zur Proteinexpression in Zelllysaten oder Gewebeextrakten können auch

Analytische Anwendungen von ProteinMikroarrays Zur Herstellung von Protein-Mikroarrays können gereinigte Proteine, Antikörper oder Proteinlysate verwendet werden (> Abb. 3.1.2). Sie werden mithilfe von Robotern (Mikroarrayer: Kontakt-Arrayer oder Piezo-Arrayer) systematisch und in hoher Dichte auf beschichtete Glasobjektträger immobilisiert (Hultschig et al. 2006; Kersten et al. 2005; Labaer u. Ramachandran 2005; Zhu u. Snyder 2003). Hunderte bis Tausende adressierte Proteinproben lassen sich auf einem Mikroarray unterbringen und können dann parallel, in einem Experiment, analysiert werden. So können Protein-Mikroarrays (PMAs), die verschiedene Proteinantigene enthalten (> Abb. 3.1.2a), eingesetzt werden, um die Menge von bestimmten Autoantikörpern in Patientenseren semiquantitativ oder quantitativ zu bestimmen. Dabei wer-

302

Sektion 3 · Diagnostik

unter Verwendung sog. reverser Protein-Mikroarrays (RPMAs) durchgeführt werden. Bei dieser Art von Array werden nicht die Antikörper immobilisiert, sondern die Zelllysate (> Abb. 3.1.2c). Danach werden Antikörper, mit denen ein bestimmtes Protein in den Lysaten nachgewiesen werden soll, in Form einer Antikörperlösung auf die RPMAs gegeben. Der Nachweis gebundener Antikörpermoleküle erfolgt durch Inkubation der RPMAs mit einem fluoreszenzmarkierten Zweitantikörper. In einer weiteren eleganten Methode zur Analyse von Proteinprofilen wird die Chromatographie auf Chipoberflächen mit MALDI-TOF kombiniert. Diese als SELDI („surface-enhanced laser desorption/ionization – time of flight“) bezeichnete Methode hat bereits zur Aufdeckung zahlreicher diagnostischer Marker geführt (Tang et al. 2004). Ausgehend von biologischen Proben wie Serum oder Zelllysaten werden zunächst, je nach verwendeter chromatographischer Oberfläche, verschiedene Sub-Sets von Proteinen aus der Probe extrahiert und an der Chipoberfläche festgehalten. Nach Entfernung der ungebundenen Proteine von der Chipoberfläche werden die immobilisierten Proteine mittels MALDI-TOF identifiziert. Der Vergleich der Spektren, die aus Patientenproben gewonnen wurden, mit denen Gesunder kann zur Aufdeckung von Proteinen führen, die durch die Erkrankung hoch- oder herunterreguliert werden.

3.1.2.3 Proteinmodifikationen Posttranslationale Modifikation, wie Phosphorylierungen und Glykosylierungen sind nicht direkt an der DNA-Sequenz ablesbar. Sie modulieren jedoch die Aktivität vieler Proteine. Bis jetzt wurden etwa hundert unterschiedliche Typen von posttranslationalen Modifikationen beschrieben, und die Aufdeckung vieler weiterer wird erwartet (7 RESID-Datenbank: http://www.ebi.ac.uk/ RESID/). Die Proteintrennung mittels 2DE-Techniken liefert oft eine ausreichende Auflösung, um Modifikationsstadien eines Proteins direkt zu identifizieren. Einige dieser Modifikationen können auf dem 2D-Gel als Spot-Serien, die von einem Spot ausgehen („trains of spots“), identifiziert werden. Dabei handelt es sich um Gruppen von Spots, die einen regelmäßigen Abstand bezüglich ihres Molekulargewichtes oder ihres isoelektrischen Punktes aufweisen. Phosphorylierungen z. B. verändern die Proteinladung und sind als horizontale Spot-Serien erkennbar. Auch MS-Technologien kommen zum Einsatz (Reinders u. Sickmann 2005), wobei die Phosphoproteine einer Probe zuerst chromatographisch angereichert wer-

den. Markierung mit stabilen Isotopen kann in Kombination mit MS angewandt werden, um die Dynamik der Modifikationen zu studieren (Mann u. Jensen 2003). Phosphorylierte Proteine in Lysaten können auch durch Protein-Mikroarrays, AMAs und RPMAs (Sheehan et al. 2005) (7 auch 3.1.2.2) nachgewiesen werden. Einige Studien berichten vom erfolgreichen Einsatz von „sandwich“-Anordnungen auf AMAs (Nielsen et al. 2003). Zu diesem Zwecke wurden sog. Fängerantikörper („capture antibodies“) auf dem Array immobilisiert, die außerhalb der Phosphorylierungsstelle an die gesuchten Proteine binden und diese während der Inkubation mit dem Lysat an der Oberfläche „festhalten“. Anschließend wird der Array mit fluoreszenzmarkierten phosphospezifischen Antikörpern inkubiert, um den Phosphorylierungsstatus der gebundenen Proteine zu ermitteln. Inkubiert man die Arrays gleichzeitig mit einem dritten Antikörper, der ebenfalls außerhalb der Phosphorylierungsstelle bindet, so lässt sich auch die Menge des gebundenen Proteins ermitteln. Mit dieser Multiplexmethode wurden aus Zelllysaten erfolgreich Phosphorylierungsstatus und Menge von Signaltransduktionsproteinen bestimmt (Nielsen et al. 2003). Eine aktuelle Übersicht verschiedener Multiplexing-Verfahren mit Protein-Mikroarrays wurde kürzlich publiziert (Kersten et al. 2005). Ausgehend von Zell- oder Gewebslysaten zielen alle oben beschriebenen Methoden darauf ab, Phosphorylierungen zu erfassen. Phosphorylierungsstudien können aber auch in vitro durchgeführt werden, vor allem, wenn es darum geht, potenzielle Substrate von Kinasen zu finden. Dazu werden zunehmend Arrays mit rekombinanten Proteinen eingesetzt (Kramer et al. 2004; Zhu et al. 2000). Dieser Ansatz wurde unlängst angewandt, um im hohen Durchsatz nach neuen Substraten für Arabidopsis-MAP-Kinasen zu suchen (Feilner et al. 2005). Kurz danach wurde eine ähnliche Methode publiziert, mit der es gelang, im großen Maßstab Hefekinasen zu analysieren (Ptacek et al. 2005). Es ist zu erwarten, dass in naher Zukunft umfangreiche Studien zur Identifizierung von Substraten menschlicher Kinasen folgen werden.

3.1.2.4 Strukturelle Proteomik Ein wichtiger Schlüssel zum Verständnis der Funktion eines nicht charakterisierten Proteins ist die Analyse seiner Struktur, entweder experimentell oder ausgehend von Modellen. Die grundlegenden Methoden zur Strukturbestimmung, zu denen u. a. die Kristallstrukturanalyse und die kernmagnetische Resonanzspektroskopie gehören, werden im vorliegenden Buch ausführlich von Udo Heinemann beschrieben (7 Kap. 2.3).

303 3.1 · Klinische Proteomik

In den letzten Jahren wurden verschiedene Initiativen gestartet, um in hohem Durchsatz Proteinstrukturen zu untersuchen (Bussow et al. 2005; Sali et al. 2003). Von den zahlreichen Strukturen, die in verschiedenen Datenbanken abgelegt wurden, gehören nur wenige zu menschlichen Proteinen. Das ist vor allem auf die Probleme bei der In-vitro-Gewinnung zurückzuführen (Bussow et al. 2005). Systematische Expressionsstudien haben gezeigt, dass nur etwa 20% aller humanen Proteine in löslicher Form in E. coli produziert werden können (Bussow et al. 2004). Strukturbestimmungen erfordern aber das Vorhandensein löslicher, korrekt gefalteter Proteine. Die effektive Produktion von biologisch aktiven humanen Proteinen bleibt eine große Herausforderung für alle Initiativen zur strukturellen Proteomik.

3.1.2.5 Proteinlokalisation Eine Proteomikstrategie, die zunehmend an Bedeutung gewinnt, ist die systematische Analyse der Lokalisation der Proteine in den Zellen. In der Hefe S. cerevisiae wurde eine proteomweite Studie durchgeführt, in der die Lokalisation epitopmarkierter Proteine unter Verwendung von epitopspezifischen Antikörpern untersucht wurde (Kumar et al. 2002). Die subzelluläre Lokalisation von 2.744 Proteinen konnte bestimmt werden, für 955 dieser Proteine war zuvor keine Funktion bekannt. Die Integration der Ergebnisse mit schon publizierten Daten ließ eine deutliche Korrelation zwischen den Proteinfunktionen und der Lokalisation der Proteine in Hefe erkennen. Weitere groß angelegte Lokalisierungsstudien wurden in der Hefe S. pombe (Ding et al. 2000), in D. melanogaster (Morin et al. 2001) und in Säugerzellen (Simpson et al. 2000) unter Verwendung von GFP-markierten Proteinen durchgeführt. Für die Zukunft ist mit der Automatisierung von Proteinlokalisationsstudien zu rechnen. Sie werden bedeutende Einsichten in die subzelluläre Organisation und das Wechselspiel der Proteine auf dem molekularen Niveau in Raum und Zeit liefern.

3.1.2.6 Protein-Protein-Wechselwirkungen Auch die Identifizierung seiner Wechselwirkungspartner kann wertvolle Hinweise auf die Funktion eines Proteins liefern. Die systematische Untersuchung von Protein-Protein-Interaktionen ist deshalb eines der Schlüsselprojekte in der Proteomforschung. Von der Etablierung von Protein-Interaktionsnetzwerken werden umfangreiche Erkenntnisse zu zellbiologischen Funktionszusammenhängen und zur Identifizierung von neuen Zielmolekülen für Medikamente erwartet.

3.1

Isolierung und Charakterisierung von Proteinkomplexen Ein attraktiver Weg zum Studium von Protein-ProteinWechselwirkungen ist die Reinigung ganzer Proteinkomplexe aus Zellextrakten mittels Affinitätschromatographie (Rigaut et al. 1999). Das kann direkt über verschiedene Affinitäts-Tags des zu untersuchenden Proteins erfolgen, wie z. B. Glutathion-S-Transferase (GST) oder indirekt über Antikörper, DNA, RNA oder kleine Moleküle, die spezifisch an das zu untersuchende zelluläre Targetprotein binden. So wurde das humane Spleißosom unter Verwendung von biotinylierter RNA als Fängermolekül gereinigt (Barabino et al. 1989). Seine Komponenten wurden mit 2DE analysiert, wobei 19 neue Faktoren identifiziert werden konnten. In Kolokalisationsstudien mit Immunfluoreszenz- (IF-)Mikroskopie wurde dann bestätigt, dass viele der identifizierten Proteine in Zellen tatsächlich mit dem Spleißosom assoziiert sind. Verwendet man Affinitäts-Tags, so lässt sich über den Tag (z. B. GST) das zu analysierende Protein an Kügelchen („beads“) binden, und die Proteine, die ihrerseits mit diesem Protein assoziieren, können aus dem Extrakt herausgezogen werden. Nach dem Waschen der Kügelchen zur Entfernung unspezifisch gebundener Proteine wird der Komplex eluiert und mittels Gelelektrophorese aufgetrennt. Die Proteine werden dann mit MS identifiziert. So ist es in einem einzelnen Experiment möglich, viele verschiedene Komponenten von Proteinkomplexen zu bestimmen. Mit dieser Strategie wurden Komplexe des humanen HIP1-Proteins untersucht (Waelter et al. 2001). Unter Verwendung von GST-HIP1 ließen sich Huntingtin, Clathrin und D-Adaptin in dem isolierten Komplex detektieren. Diese HIP1-Wechselwirkungspartner wurden dann mit zellbiologischen Methoden funktionell charakterisiert. Des Weiteren können Epitop-getaggte Proteine in einer Zelle überexprimiert werden. Unter Verwendung eines Antikörpers, der das jeweilige Epitop erkennt, wird dann der Komplex, bestehend aus dem getaggten Protein und seinen Wechselwirkungspartnern, immunopräzipitiert (Wen et al. 2003). Das erfordert zwar einen Expressionsklon, der das getaggte Protein überexprimiert, aber es ist nicht mehr erforderlich, spezifische Antikörper gegen jedes Fängerprotein zu gewinnen. Da bereits Full-length-cDNAs für viele menschliche Proteine zur Verfügung stehen, sollte es mit dieser Strategie schon in naher Zukunft möglich sein, viele unbekannte menschliche Proteinkomplexe systematisch aufzuschlüsseln. Die Analyse von Proteinkomplexen ermöglicht neue Arten von funktionellen Untersuchungen. Zum Beispiel konnten in einer Studie zu Profilin I und II viele unbekannte Signalmoleküle durch Affinitätschromatogra-

304

Sektion 3 · Diagnostik

phie/MS identifiziert werden, die die Aktinpolymerisation regulieren und in die Endozytose involviert sind (Witke et al. 1998). Eine Kombination aus Affinitätschromatographie und MS wurde auch zur systematischen Analyse des gesamten Hefe-Proteoms verwendet (Gavin et al. 2002). Mittels Tandem-Affinitätsreinigung („tandem affinity purification“, TAP) wurden 589 Proteinkomplexe gereinigt und hinsichtlich ihrer Zusammensetzung untersucht. Der Vergleich von Hefe- und humanen Proteinkomplexen zeigt Konservierungen zwischen den Arten und erlaubte die Generierung eines detaillierten Wechselwirkungsnetzwerks. In ähnlicher Weise wurde auch eine Interaktionskarte von 221 molekularen Wechselwirkungen der TNF-D/NF-NBSignalübertragungskette etabliert (Bouwmeester et al. 2004). Hefe-2-Hybrid System Die Entwicklung des Hefe-2-Hybrid-Systems („yeast two hybrid“, Y2H) ist eine der wichtigsten Entwicklungen zur effektiven Bestimmung von Protein-ProteinWechselwirkungen in Hefe (Fields u. Song 1989). In einem typischen Y2H-Ansatz wird das zu analysierende Protein als sog. Köderprotein („bait“) an die DNA-bindende Domäne (DBD) eines Transkriptionsfaktors fusioniert und in Hefe exprimiert. Mit diesem Köderprotein wird eine Bibliothek von sog. Beuteproteinen („preys“) durchmustert, welche mit der Aktivierungsdomäne (AD) eines Transkriptionsfaktors fusioniert sind (> Abb. 3.1.3). Kommt es zur Wechselwirkung des Köderproteins mit einem Beuteprotein, werden die DBD und die AD des Transkriptionsfaktors in enge räumliche Nähe gebracht. Damit wird der künstliche Transkriptionsfaktor rekonstruiert, was zur Aktivierung der Transkription eines Reportergens in der Hefe führt (> Abb. 3.1.3). Wechselwirkungen werden dann sowohl über das Wachstum der Hefen auf selektiven Platten als auch über die Blaufärbung der Hefen, bedingt durch die Aktivierung eines LacZ-Reporters und daraus resultierende E-Galaktosidaseaktivität der Hefen, detektiert (> Abb. 3.1.3). Derzeit wird das Y2H-System in einem array-basierten und einem bibliothekenbasierten Format angewandt. In der Arraymethode wird ein definiertes Set von Proteinen (Matrize) in Hefeklonen als AD-Fusionsproteine exprimiert und auf selektive Platten gespottet. Die gesamte Matrix wird dann mit dem zu testenden Köderprotein mittels Wechselwirkungs-„mating“ durchmustert (Goehler et al. 2004). Wenn einmal eine Matrix aus Hefeklonen, die AD-Fusionsproteine exprimieren, etabliert ist, können mit diesem Vorgehen hoch reproduzierbare Ergebnisse erzielt werden. Bei der Bibliothekenmethode wird eine Beuteproteinbibliothek hergestellt. Kleine Pools der Beute-

a

b . Abb. 3.1.3a,b. Das Hefe-2-Hybrid-System. a Schematische Darstellung des Prinzips der Methode. DBD, DNA-bindende Domäne eines Transkriptionsfaktors. AD, Aktivierungsdomäne eines Transkriptionsfaktors. b Beispiel für ein positives Testergebnis. Die erfolgte Wechselwirkung zwischen Protein A und Protein B wird sowohl über das Wachstum der Hefen auf selektiven Platten (Wachstum) als auch über die Blaufärbung der Hefen, bedingt durch die Aktivierung eines LacZ-Reporters und die daraus resultierende E-Galaktosidaseaktivität, detektiert (LacZ)

proteine (AD-Fusionen) werden dann gegen Köderproteine (DBD-Fusionen) getestet. Diese Methode ist relativ zeitaufwendig und erfordert das wiederholte Sequenzieren der Beuteklone nach jedem BibliothekenScreen. Die mittels Y2H-Methode gefundenen Wechselwirkungen sind potenzieller Natur und müssen mit anderen Techniken oder funktionellen Methoden verifiziert werden. Der große Vorteil der Methode liegt in ihrer Eignung zum hohen Durchsatz und zur Automatisierung. In den letzten Jahren war es möglich, genomweite Y2H-Wechselwirkungsstudien für S. cerevisiae (Uetz et al. 2000), C. elegans (Li et al. 2004) und D. melanogaster (Giot et al. 2003) durchzuführen. Unlängst wurden auch die ersten großen humanen Protein-Protein-Interaktionsnetzwerke veröffentlicht, die mit Y2H erstellt wurden (Rual et al. 2005; Stelzl et al. 2005). Stelzl et al. (2005) analysierten systematisch Proteinmatrizen von 4.456 Köder- und 5.632 Beuteproteinen mit einem automatisierten Y2H-Interaktions-MatingScreen. Dabei wurden zwischen 1.705 verschiedenen Proteinen 3.186, meist bis dahin noch unbekannte, Wechselwirkungen identifiziert, die in ein großes Netzwerk mit vielen Verknüpfungen überführt wurden. Die Qualität der ermittelten Wechselwirkungen wurde mit unabhängigen In-vitro-Methoden, wie z. B. Immunopräzipitation, verifiziert. Protein-Arrays und Phage-Display Protein-Mikroarrays, PMAs, sind nicht nur zur Quantifizierung eines spezifischen Proteins in Zellextrakten

305 3.1 · Klinische Proteomik

oder Körperflüssigkeiten gut geeignet (7 3.1.2.2), sie lassen sich auch hervorragend für die globale Analyse von Protein-Protein-Wechselwirkungen nutzen (Ramachandran et al. 2004; Zhu et al. 2001). So verwendeten Zhu et al. (2001) PMAs mit etwa 5.600 gereinigten rekombinanten Hefeproteinen zur Identifizierung von Wechselwirkungspartnern von Calmodulin. Mit der Array-Methode lassen sich umfassende Sätze von Proteinen unter diversen Bedingungen direkt in vitro auf verschiedene funktionelle Aktivitäten untersuchen, auch auf Wechselwirkungen mit DNA, RNA und Lipiden (Feilner et al. 2004; Hultschig et al. 2006; Kersten et al. 2004; Merkel et al. 2005). In herkömmlichen Array-Studien wurden gereinigte Proteine verwendet, deren Herstellung mit einem gewissen Aufwand verbunden ist. In einer aktuellen Untersuchung gelang es, Arrays mit ungereinigten Proteinen einzusetzen, um neue Wechselwirkungen humaner Proteine aufzudecken (Grelle et al. 2006) (> Abb. 3.1.4). E.-coli-Klone aus einer menschlichen cDNA-Expressionsbibliothek (Bussow et al. 2000) wurden im 384-well-Format exprimiert. Zelllysate wurden dann auf Membranen immobilisiert. Nach der Inkubation der Membran mit dem zu untersuchenden GSTgetaggten Protein wurde gebundenes GST-Protein mit einem Zweitantikörper detektiert. So konnte Caytaxin als Wechselwirkungspartner des Proteins CHIP identifiziert werden. Für Caytaxin war bekannt, dass es in Patienten mit der sog. Cayman-Ataxie mutiert vorliegt (Bomar et al. 2003). Die weitere funktionelle Analyse dieser Wechselwirkung zeigte, dass Caytaxin vom CHIP in vitro ubiquitiniert wird (Grelle et al. 2006). Weitere funktionelle Zusammenhänge in Hinblick auf die Ataxie bleiben zu klären. Die sog. Phage-Display-Methode ist eine weitere interessante Methode, um Wechselwirkungspartner von Proteinen zu identifizieren (Winter et al. 1994). Hierbei werden Banken von Bakteriophagen generiert, die Peptide oder Proteine exprimieren, welche an ein Kapsidoder Hüllprotein fusioniert sind. Durch diese Fusion werden die Peptide bzw. Proteine auf der Oberfläche der Phagen präsentiert. Diese Phagenbibliotheken werden dann mit einem gewünschten Fängerprotein inkubiert und bindende Phagen, also solche die ein wechselwirkendes Protein auf ihrer Oberfläche tragen, in mehreren Selektionsrunden angereichert. Diese Methode ist sehr effizient, um sowohl nach Peptid-Protein- als auch Protein-Protein-Wechselwirkungen zu suchen. Wie das Y2H-System ist diese Methode einfach und hochdurchsatzfähig. Mit Phage-Displays konnten neue Moleküle in der Signalübertragungskette des epidermalen Wachstumsfaktors (Zozulya et al. 1999) und Antigen-Antikörper-Wechselwirkungen identifiziert werden (Hufton et al. 1999).

3.1

. Abb. 3.1.4. Detektion von Protein-Protein-Wechselwirkungen mit einer membranbasierten Proteomikmethode (Grelle et al. 2006). Die Abbildung zeigt ein Flussschema mit den wichtigsten Teilschritten der Methode. Die Klone einer humanen cDNA-Expressionsbibliothek werden in E. coli exprimiert. Nach der Lyse der Klone im 384-wellFormat werden die Lysate auf eine Nitrozellulosemembran gespottet (Doppelspots für jede Probe). Anschließend wird der Proteinfilter mit dem zu untersuchenden GST-getaggten Protein inkubiert. Nach dem Waschen der Membran werden gebundene GST-Proteinmoleküle mit einem anti-GST-Antikörper detektiert. PPIs werden durch Doppelspots angezeigt, die ein Signal über dem Hintergrundsignal liefern (siehe Image)

3.1.3 Klinische Proteomik Obwohl in den letzten Jahren große Fortschritte bei der Aufklärung der molekularen Grundlagen verschiedener Erkrankungen erzielt wurden, ist unser Wissen zur Pathogenese noch immer sehr lückenhaft. Proteomische Ansätze können helfen, diese Lücken zu schließen. Von besonderem Interesse für die Medizin sind dabei die Beiträge der Proteomforschung zur Untersuchung veränderter Proteinexpression in Körperflüssigkeiten und Geweben (7 3.1.3.1), bei der Entwicklung von Biomar-

306

Sektion 3 · Diagnostik

kern für die frühe Diagnostik (7 3.1.3.2) sowie die Identifizierung neuer Angriffspunkte für die therapeutische Intervention (7 3.1.3.3) (Vitzthum et al. 2005).

In vielen Studien der vergangenen Jahre wurde 2DE verwendet, um differenzielle Proteinexpression zu analysieren (7 3.1.2.2). Inzwischen existieren zahlreiche Datenbanken mit 2DE-Daten aus verschiedenen Geweben von Kranken und Gesunden. Einen übersichtlichen Zugang zu vielen dieser Banken findet man über den ProteomikServer von ExPASy („Expert Protein Analysis System“) des Schweizer Instituts für Bioinformatik unter folgender Internetadresse: http://www.expasy.org/ch2d/2d-index. html. > Abbildung 3.1.5 zeigt 2D-Bilder von Gewebsproben einer Brustkarzinompatientin und einer Gesunden. Eines der im kranken Gewebe überexprimierten Proteine, GRP4, wurde in der Abbildung markiert (Bini et al. 1997). In einer weiteren Studie konnten 170 differenziell exprimierte Proteine bei Brustkrebspatientinnen identifiziert werden (Page et al. 1999). Mit der vergleichenden 2DE-Methode konnte eine Klassifizierung von Leukämie in verschiedene Subtypen vorgenommen werden (Hanash et al. 2002). Auch wurden mit 2DE und MS Proteine gefunden, die kritisch für den akuten Beginn einer Herzerkrankung sind (Arnott et al. 1998).

Eine bedeutende Verbesserung der 2D-Methodik vor allem für vergleichende Analysen wurde durch die Einführung der DIGE erzielt (7 3.1.2.2). Zhou et al. (2002) untersuchten mit DIGE Unterschiede in der Proteinexpression zwischen Speiseröhrenkarzinomzellen und gesundem Gewebe. In den Krebszellen waren zahlreiche Proteine hoch- oder herunterreguliert. Ein Problem mit 2DE in klinischen Anwendungen ist oft, dass relativ große Proteinmengen benötigt werden, Gewebsprobenmaterial meist aber nur in kleinen Mengen zugänglich ist. Für bestimmte Methoden zur Isolierung von Zellen aus bestimmten Zelltypen wie die Laser-Mikrodissektion („laser-capture micro-dissection“), liefern klinische Proben nicht ausreichend Proteinmaterial, um mittels 2DE analysiert zu werden. Proteinexpressionsprofile können alternativ mit analytischen Protein-Mikroarrays (7 3.1.2.2) erstellt werden. Für das Objektträgerformat wird deutlich weniger Gewebematerial benötigt. Die vergleichende Proteinprofilierung mit ProteinMikroarrays hat in den letzten Jahren deutlich zugenommen. Knezevic et al. untersuchten mit Antikörper-Mikroarrays spezielle Krebszellpopulationen, die mittels Laser-Mikrodissektion gewonnen wurden, und identifizierten Proteine, deren Expression mit der Tumorprogression korreliert. Viele dieser Proteine sind in Signalwege involviert (Knezevic et al. 2001). In anderen Studien wurden reverse Protein-Mikroarrays, RPMAs (7 3.1.2.2), zur semiquantitativen oder quantitativen

. Abb. 3.1.5. Gelbilder nach 2DE-Analyse und nachfolgender Silberfärbung von einer Patientenprobe aus Brustkarzinomgewebe (krank) und einer entsprechenden Gewebsprobe einer gesunden Frau (gesund). Das Gelbild aus der 2D-PAGE-Datenbank an der Uni-

versität in Sienna ist öffentlich zugänglich (http://www.expasy.org/ ch2d/2d-index.html). Der Pfeil zeigt als Beispiel einen Spot, in dem das Protein GRP4 (94 KDa Glucose-regulated protein) mittels MS nachgewiesen wurde. GRP4 ist im Karzinomgewebe überexprimiert

3.1.3.1 Protein-Expressionsprofile bei verschiedenen Erkrankungen

307 3.1 · Klinische Proteomik

Proteinanalyse verwendet (Nishizuka et al. 2003; Paweletz et al. 2001). Paweletz et al. z. B. spotteten Proteinextrakte aus Geweben direkt auf Mikroarrays, um verschiedene Phosphoproteine mittels phosphorspezifischer Antikörper im Extrakt nachzuweisen und zu quantifizieren. Es wurde gezeigt, dass das Voranschreiten der Krebserkrankung mit zunehmender Phosphorylierung der Serin/Threonin-Kinase Akt und abnehmender Phosphorylierung der extrazellulären signalregulierten Kinase ERK einhergeht. Für das Auffinden von Proteinen, die eine Immunantwort bei verschiedenen Autoimmunerkrankungen induzieren, werden PMAs mit Proteinantigenen verwendet (7 3.1.2.2) und mit entsprechenden Patientenseren inkubiert. Der Nachweis von Antikörpern einer bestimmten Klasse (z. B. IgG), die aus dem Serum an bestimmte Antigen-Spots auf dem Mikroarray gebunden haben, erfolgt mittels fluoreszenzmarkierter Zweitantikörper, die spezifisch für die jeweilige Antikörperklasse sind. Mit dieser Methode wurden Autoantigene identifiziert, die bei Patienten mit rheumatoider Arthritis eine verstärkte Immunantwort auslösen (Robinson et al. 2002). Neben der Anwendung im Rahmen von Autoimmunerkrankungen lassen sich diese Mikroarrays auch einsetzen, um die Immunantwort bei anderen Erkrankungen wie Krebs (Imafuku et al. 2004) oder Allergien (Harwanegg u. Hiller 2005) zu untersuchen. Auch im Zusammenhang mit infektiösen Erkrankungen werden zunehmend PMAs eingesetzt (Kreutzberger 2006). Hierbei verwendet man Arrays mit bakteriellen oder viralen Proteinen, um im Rahmen der Serumdiagnostik Antikörper gegen die Erreger nachzuweisen. Diese Methoden werden dazu beitragen, diagnostische Marker für verschiedene Infektionen zu finden und geeignete Vakzinen gegen die Infektionen zu entwickeln.

3.1.3.2 Aufdeckung von Biomarkern bei verschiedenen Erkrankungen Es besteht substanzielles Interesse an der Anwendung von Proteomikmethoden für die Identifizierung von Krankheitsmarkern. Das kann, wie soeben beschrieben, mit vergleichender Expressionsprofilierung geschehen, des Weiteren sind Ansätze zur Analyse von sezernierten Proteinen und zur direkten Proteinprofilierung von Seren („serum profiling“) von Interesse (Ludwig u. Weinstein 2005). Ostergaard et al. (1999) fanden mittels 2DE im Urin von Patienten mit Blasenzellkarzinom den Marker Psoriasin, der sich sehr gut zum Verfolgen des Krankheitsverlaufs eignet. Auch die bereits erwähnte SELDI-Technik (7 3.1.2.2) erfreut sich zunehmender Anwendung, um Biomarker

3.1

zu identifizieren. Dabei werden Sub-Sets von Proteinen aus biologischen Proben durch Chromatographie an Chipoberflächen immobilisiert und dann der MS-Analyse zugeführt. Auf diese Weise konnten unterschiedliche Peptidmuster von Krebspatienten und Gesunden gewonnen werden (Petricoin u. Liotta 2004). Ein weiterer sehr effektiver Ansatz zum Auffinden von Krebsmarkern ist die Identifizierung von Autoantikörpern gegen Tumorproteine in Patientenseren (Imafuku et al. 2004). So konnte eine Reihe von Markerantigenen dadurch aufgedeckt werden, daß Expressionsbibliotheken (Hanash 2003) oder Peptidbibliotheken (Mintz et al. 2003) mit Patientenseren durchmustert wurden. Verschiedene Proteomikmethoden werden zur Aufdeckung von Protein-Protein-Wechselwirkungen verwendet (7 3.1.2.6). Mithilfe eines Y2H-Systems konnte z. B. ein Netzwerk von mehr als 180 Wechselwirkungen für Chorea Huntington erstellt werden (Goehler et al. 2004). Basierend auf den gewonnen Daten konnte ein potenzieller Modulator für die Pathogenese der Erkrankung gefunden werden. Ein unlängst beschriebenes Netzwerk von humanen Proteinwechselwirkungen (7 3.1.2.6) bezog bekannte Krankheitsproteine ein und wurde im Kontext beschriebener Signalwege analysiert (Stelzl et al. 2005). So konnten neue Wechselwirkungen von Krankheitsproteinen, die sich bestimmten Signalwegen zuordnen lassen, mit bisher uncharakterisierten Proteinen identifiziert werden. Damit ließen sich nunmehr auch diese theoretisch dem Signalweg zuordnen. Praktisch wurde die Zuordnung für zwei neue Wechselwirkungspartner von Axin-1, einem Protein des WntSignalwegs, bestätigt. Diese beiden neuen Wechselwirkungspartner, ANP32A und CRMP1, modulierten die Aktivität von Wnt in In-vitro-Experimenten und spielen damit sehr wahrscheinlich auch in vivo eine Rolle in diesem Signalweg. Dieser Ansatz, Y2H-Daten bioinformatisch mit bekannten Signalwegen zu verknüpfen, ist sehr vielversprechend und eröffnet neue Möglichkeiten für die Markersuche.

3.1.3.3 Proteomik und Medikamentenentwicklung Zurzeit ist die pharmazeutische Industrie sehr daran interessiert, moderne Proteomiktechnologien in ihre Programme zu integrieren, um damit die Erforschung von Zielmolekülen und Kandidatensubstanzen für Medikamente zu beschleunigen (Calvo et al. 2005; Ilag 2005). Zahlreiche Studien zeigen die Anwendung funktioneller Proteomik zur Identifizierung von potenziellen Medikamenten-Targets in spezifischen Signalwegen. Lewis et al. entdeckten Proteine, die durch die Signalkaskade der mitogenaktivierten Proteinkinase-Kinase (MKK)/

308

Sektion 3 · Diagnostik

ERK reguliert werden (Lewis et al. 2000). 45 Targets wurden identifiziert, von denen zuvor nur 5 als MKK/ERKEffektoren bekannt waren. In einem anderen Projekt wurden verschiedene Proteasen identifiziert, die möglicherweise als Zielmoleküle geeignet sind. Dabei wurden Biopsien von Patienten mit Kolonkarzinom in Mikrotiterplatten hinsichtlich verschiedener Proteaseaktivitäten untersucht, wobei in den Tumorbiopsien erhöhte Werte bestimmter Metallproteasen gefunden wurden (McKerrow et al. 2000). Viele Studien, die im Rahmen von Medikamentenentwicklungen durchgeführt werden, konzentrieren sich auf zelluläre, nukleäre oder membranassoziierte Rezeptoren, weil diese die häufigsten Targets für Medikamente darstellen. Diese Rezeptoren können in Signalwege, Zellwachstum, Genexpression und metabolische Veränderungen involviert sein. Neben Transkriptionsfaktoren und nukleären Rezeptoren sind die sogenannten G-Protein-gekoppelten Rezeptoren (GPCRs) von besonderem Interesse, weil sie die größte Familie von Rezeptoren und die größte Klasse von Zielmolekülen im menschlichen Genom darstellen (Neumann et al. 2002). Sie vermitteln den Hauptteil der zellulären Antworten auf Hormone, Neurotransmitter, Nahrungsmittel und andere bioaktive Substanzen. Aus diesen Gründen konzentrieren sich viele Proteomikstudien auf GPCRs (Thomsen et al. 2005). So publizierten Neumann et al. eine einfache Methode, um funktionelle GPCRs, die zuvor mit Detergenzien solubilisiert wurden, auf Mikroarrays zu immobilisieren (Neumann et al. 2002). In einer anderen PMAStudie wurde das Bindungsverhalten von GPCRs analysiert, indem die Bindung von Neurotensin an verschiedene GPCRs untersucht wurde (Fang et al. 2003). Weitere Möglichkeiten zum Auffinden von pharmakologisch wirksamen Substanzen können sich aus Strukturanalysen ergeben („structure-based drug design“). Zum Auffinden von Substanzen können Substanzbibliotheken gescreent werden. In einem iterativen Prozess kann die Struktur bindender Substanzen dahingehend optimiert werden, dass die Substanz exakt in die Bindungsstelle des Proteins passt, was entscheidend für die Inhibition der Funktion des Proteins ist.

3.1.4 Ausblick Die Proteomik stellt uns ein breites Spektrum nützlicher Methoden zur Verfügung, um Proteinfunktionen in hohem Durchsatz zu untersuchen. Eine zukunftsweisende Technologie sind Proteom-Chips, die alle Proteine eines Organismus im Mikroarray-Format für verschiedenste funktionelle Analysen zur Verfügung stellen (Kung u. Snyder 2006). Des Weiteren wird die MS-Analyse von aufgetrennten Proteinen zu einem besseren Verständnis

funktioneller Komplexe und ihrer Veränderungen im physiologischen Kontext führen. Wir postulieren, dass sich die Proteomforschung in der Zukunft neben der Expressionsanalyse durch 2DE mehr und mehr auf sensitivere Techniken, wie z. B. verschiedene Protein-Array-Technologien konzentrieren wird. Diese Techniken erlauben eine schnelle und zuverlässige Quantifizierung kleiner Mengen von Proteinen in Geweben Gesunder und Kranker. Wir nehmen an, dass sowohl systematische als auch hypothesengesteuerte Studien zu ProteinProtein-Wechselwirkungen, Koimmunopräzipitationen und Kolokalisationen eine zentrale Rolle in der Proteomikforschung der nächsten 10 Jahre spielen werden. Die Entwicklung von Hypothesen für diese Untersuchungen und die umfangreichen Daten, die in solchen Studien generiert werden, stellen eine große Herausforderung für die Bioinformatik dar. Aus diesen Studien werden umfassende neue Informationen zu Signalübertragungswegen und zu funktionellen Proteinkomplexen gewonnen werden, die einen großen Gewinn für die biomedizinische Forschung mit sich bringen werden. Da es in absehbarer Zeit Volle-Länge-cDNAs für alle humanen Proteine geben wird, werden sich die proteomischen Studien der nächsten Jahre auf das humane Proteom konzentrieren. Das Verständnis komplexer physiologischer Prozesse in einer Zelle wird wichtige Informationen und Impulse für die Systembiologie liefern, die neue Hypothesen sowohl mit traditionellen genomischen und proteomischen Methoden als auch mit bioinformatischen Ansätzen testen kann.

3.1.5 Literatur Anderson NG, Anderson NL (1996) Twenty years of two-dimensional electrophoresis: past, present and future. Electrophoresis 17: 443–53 Anderson NG, Matheson A, Anderson NL (2001) Back to the future: the human protein index (HPI) and the agenda for post-proteomic biology. Proteomics 1: 3–12 Arnott D, O‘Connell KL, King KL, Stults JT (1998) An integrated approach to proteome analysis: identification of proteins associated with cardiac hypertrophy. Anal Biochem 258: 1–18 Barabino SM, Sproat BS, Ryder U, Blencowe BJ, Lamond AI (1989) Mapping U2 snRNP-pre-mRNA interactions using biotinylated oligonucleotides made of 2‘-OMe RNA. Embo J 8: 4171–8 Berndt P, Hobohm U, Langen H (1999) Reliable automatic protein identification from matrix-assisted laser desorption/ionization mass spectrometric peptide fingerprints. Electrophoresis 20: 3521–6 Bini L, Magi B, Marzocchi B, Arcuri F, Tripodi S, Cintorino M, Sanchez JC, Frutiger S, Hughes G, Pallini V, Hochstrasser DF, Tosi P (1997) Protein expression profiles in human breast ductal carcinoma and histologically normal tissue. Electrophoresis 18: 2832–41 Bomar JM, Benke PJ, Slattery EL, Puttagunta R, Taylor LP, Seong E, Nystuen A, Chen W, Albin RL, Patel PD, Kittles RA, Sheffield VC, Burmeister M (2003) Mutations in a novel gene encoding a CRAL-TRIO domain cause human Cayman ataxia and ataxia/ dystonia in the jittery mouse. Nature Genetics 35: 264–9

309 3.1 · Klinische Proteomik Bouwmeester T, Bauch A, Ruffner H, Angrand PO, Bergamini G, Croughton K, Cruciat C, Eberhard D, Gagneur J, Ghidelli S, Hopf C, Huhse B, Mangano R, Michon AM, Schirle M, Schlegl J, Schwab M, Stein MA, Bauer A, Casari G, Drewes G, Gavin AC, Jackson DB, Joberty G, Neubauer G, Rick J, Kuster B, SupertiFurga G (2004) A physical and functional map of the human TNF-alpha/NF-kappa B signal transduction pathway. Nature Cell Biology 6: 97–105 Bussow K, Nordhoff E, Lubbert C, Lehrach H, Walter G (2000) A human cDNA library for high-throughput protein expression screening. Genomics 65: 1–8 Bussow K, Quedenau C, Sievert V, Tischer J, Scheich C, Seitz H, Hieke B, Niesen FH, Gotz F, Harttig U, Lehrach H (2004) A catalog of human cDNA expression clones and its application to structural genomics. Genome Biol 5: R71 Bussow K, Scheich C, Sievert V, Harttig U, Schultz J, Simon B, Bork P, Lehrach H, Heinemann U (2005) Structural genomics of human proteins--target selection and generation of a public catalogue of expression clones. Microb Cell Fact 4: 21 Calvo KR, Liotta LA, Petricoin EF (2005) Clinical proteomics: from biomarker discovery and cell signaling profiles to individualized personal therapy. Biosci Rep 25: 107–25 Ding DQ, Tomita Y, Yamamoto A, Chikashige Y, Haraguchi T, Hiraoka Y (2000) Large-scale screening of intracellular protein localization in living fission yeast cells by the use of a GFP-fusion genomic DNA library. Genes Cells 5: 169–90 Fang Y, Lahiri J, Picard L (2003) G protein-coupled receptor microarrays for drug discovery. Drug Discov Today 8: 755–61 Feilner T, Hultschig C, Lee J, Meyer S, Immink RG, Koenig A, Possling A, Seitz H, Beveridge A, Scheel D, Cahill DJ, Lehrach H, Kreutzberger J, Kersten B (2005) High throughput identification of potential Arabidopsis mitogen-activated protein kinases substrates. Molecular and Cellular Proteomics 4: 1558–68 Feilner T, Kreutzberger J, Niemann B, Kramer A, Possling A, Seitz H, Kersten B (2004) Proteomic studies using microarrays. Current Proteomics 1: 283–295 Fenn JB, Mann M, Meng CK, Wong SF, Whitehouse CM (1989) Electrospray ionization for mass spectrometry of large biomolecules. Science 246: 64–71 Fields S, Song O (1989) A novel genetic system to detect proteinprotein interactions. Nature 340: 245–6 Gagnon E, Duclos S, Rondeau C, Chevet E, Cameron PH, SteeleMortimer O, Paiement J, Bergeron JJ, Desjardins M (2002) Endoplasmic reticulum-mediated phagocytosis is a mechanism of entry into macrophages. Cell 110: 119–31 Gavin AC, Bosche M, Krause R, Grandi P, Marzioch M, Bauer A, Schultz J, Rick JM, Michon AM, Cruciat CM, Remor M, Hofert C, Schelder M, Brajenovic M, Ruffner H, Merino A, Klein K, Hudak M, Dickson D, Rudi T, Gnau V, Bauch A, Bastuck S, Huhse B, Leutwein C, Heurtier MA, Copley RR, Edelmann A, Querfurth E, Rybin V, Drewes G, Raida M, Bouwmeester T, Bork P, Seraphin B, Kuster B, Neubauer G, Superti-Furga G (2002) Functional organization of the yeast proteome by systematic analysis of protein complexes. Nature 415: 141–7 Giot L, Bader JS, Brouwer C, Chaudhuri A, Kuang B, Li Y, Hao YL, Ooi CE, Godwin B, Vitols E, Vijayadamodar G, Pochart P, Machineni H, Welsh M, Kong Y, Zerhusen B, Malcolm R, Varrone Z, Collis A, Minto M, Burgess S, McDaniel L, Stimpson E, Spriggs F, Williams J, Neurath K, Ioime N, Agee M, Voss E, Furtak K, Renzulli R, Aanensen N, Carrolla S, Bickelhaupt E, Lazovatsky Y, DaSilva A, Zhong J, Stanyon CA, Finley RL, Jr., White KP, Braverman M, Jarvie T, Gold S, Leach M, Knight J, Shimkets RA, McKenna MP, Chant J, Rothberg JM (2003) A protein interaction map of Drosophila melanogaster. Science 302: 1727–36

3.1

Goehler H, Lalowski M, Stelzl U, Waelter S, Stroedicke M, Worm U, Droege A, Lindenberg KS, Knoblich M, Haenig C, Herbst M, Suopanki J, Scherzinger E, Abraham C, Bauer B, Hasenbank R, Fritzsche A, Ludewig AH, Buessow K, Coleman SH, Gutekunst CA, Landwehrmeyer BG, Lehrach H, Wanker EE (2004) A Protein Interaction Network Links GIT1, an Enhancer of Huntingtin Aggregation, to Huntington‘s Disease. Mol Cell 15: 853–65 Gonczy P, Echeverri C, Oegema K, Coulson A, Jones SJ, Copley RR, Duperon J, Oegema J, Brehm M, Cassin E, Hannak E, Kirkham M, Pichler S, Flohrs K, Goessen A, Leidel S, Alleaume AM, Martin C, Ozlu N, Bork P, Hyman AA (2000) Functional genomic analysis of cell division in C. elegans using RNAi of genes on chromosome III. Nature 408: 331–6 Grelle G, Kostka S, Otto A, Kersten B, Genser KF, Muller EC, Walter S, Boddrich A, Stelzl U, Hanig C, Volkmer-Engert R, Landgraf C, Alberti S, Hohfeld J, Strodicke M, Wanker EE (2006) Identification of VCP/p97, Carboxyl Terminus of Hsp70-interacting Protein (CHIP), and Amphiphysin II Interaction Partners Using Membrane-based Human Proteome Arrays. Molecular and Cellular Proteomics 5: 234–44 Gygi SP, Rist B, Gerber SA, Turecek F, Gelb MH, Aebersold R (1999a) Quantitative analysis of complex protein mixtures using isotope-coded affinity tags. Nat Biotechnol 17: 994–9 Gygi SP, Rochon Y, Franza BR, Aebersold R (1999b) Correlation between protein and mRNA abundance in yeast. Mol Cell Biol 19: 1720–30 Hanash S (2003) Disease proteomics. Nature 422: 226–32 Hanash SM, Madoz-Gurpide J, Misek DE (2002) Identification of novel targets for cancer therapy using expression proteomics. Leukemia 16: 478–85 Harwanegg C, Hiller R (2005) Protein microarrays for the diagnosis of allergic diseases: state-of-the-art and future development. Clin Chem Lab Med 43: 1321–6 Henzel WJ, Billeci TM, Stults JT, Wong SC, Grimley C, Watanabe C (1993) Identifying proteins from two-dimensional gels by molecular mass searching of peptide fragments in protein sequence databases. Proc Natl Acad Sci U S A 90: 5011–5 Hufton SE, Moerkerk PT, Meulemans EV, de Bruine A, Arends JW, Hoogenboom HR (1999) Phage display of cDNA repertoires: the pVI display system and its applications for the selection of immunogenic ligands. J Immunol Methods 231: 39–51 Hultschig C, Kreutzberger J, Seitz H, Konthur Z, Bussow K, Lehrach H (2006) Recent advances of protein microarrays. Current Opinion in Chemical Biology 10: 4–10 Ilag LL (2005) Functional proteomic screens in therapeutic protein drug discovery. Curr Opin Mol Ther 7: 538–42 Imafuku Y, Omenn GS, Hanash S (2004) Proteomics approaches to identify tumor antigen directed autoantibodies as cancer biomarkers. Dis Markers 20: 149–53 Kersten B, Possling A, Blaesing F, Mirgorodskaya E, Gobom J, Seitz H (2004) Protein microarray technology and ultraviolet crosslinking combined with mass spectrometry for the analysis of protein-DNA interactions. Analytical Biochemistry 331: 303– 313 Kersten B, Wanker EE, Hoheisel J, Angenendt P (2005) Multiplex approaches in protein microarray technology. Expert Review of Proteomics 2: 499–510 Klose J, Kobalz U (1995) Two-dimensional electrophoresis of proteins: an updated protocol and implications for a functional analysis of the genome. Electrophoresis 16: 1034–59 Knezevic V, Leethanakul C, Bichsel VE, Worth JM, Prabhu VV, Gutkind JS, Liotta LA, Munson PJ, Petricoin EF, 3rd, Krizman DB (2001) Proteomic profiling of the cancer microenvironment by antibody arrays. Proteomics 1: 1271–8

310

Sektion 3 · Diagnostik

Kramer A, Feilner T, Possling A, Radchuk V, Weschke W, Burkle L, Kersten B (2004) Identification of barley CK2alpha targets by using the protein microarray technology. Phytochemistry 65: 1777–84 Kreutzberger J (2006) Protein microarrays: a chance to study microorganisms? Applied Microbiology and Biotechnology Kumar A, Agarwal S, Heyman JA, Matson S, Heidtman M, Piccirillo S, Umansky L, Drawid A, Jansen R, Liu Y, Cheung KH, Miller P, Gerstein M, Roeder GS, Snyder M (2002) Subcellular localization of the yeast proteome. Genes Dev 16: 707–19 Kung LA, Snyder M (2006) Proteome chips for whole-organism assays. Nat Rev Mol Cell Biol, in press Labaer J, Ramachandran N (2005) Protein microarrays as tools for functional proteomics. Curr Opin Chem Biol 9: 14–9 Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W, Funke R, Gage D, Harris K, Heaford A, Howland J, Kann L, Lehoczky J, LeVine R, McEwan P, McKernan K, Meldrim J, Mesirov JP, Miranda C, Morris W, Naylor J, Raymond C, Rosetti M, Santos R, Sheridan A, Sougnez C, Stange-Thomann N, Stojanovic N, Subramanian A, Wyman D, Rogers J, Sulston J, Ainscough R, Beck S, Bentley D, Burton J, Clee C, Carter N, Coulson A, Deadman R, Deloukas P, Dunham A, Dunham I, Durbin R, French L, Grafham D, Gregory S, Hubbard T, Humphray S, Hunt A, Jones M, Lloyd C, McMurray A, Matthews L, Mercer S, Milne S, Mullikin JC, Mungall A, Plumb R, Ross M, Shownkeen R, Sims S, Waterston RH, Wilson RK, Hillier LW, McPherson JD, Marra MA, Mardis ER, Fulton LA, Chinwalla AT, Pepin KH, Gish WR, Chissoe SL, Wendl MC, Delehaunty KD, Miner TL, Delehaunty A, Kramer JB, Cook LL, Fulton RS, Johnson DL, Minx PJ, Clifton SW, Hawkins T, Branscomb E, Predki P, Richardson P, Wenning S, Slezak T, Doggett N, Cheng JF, Olsen A, Lucas S, Elkin C, Uberbacher E, Frazier M, et al. (2001) Initial sequencing and analysis of the human genome. Nature 409: 860–921 Laurell T, Marko-Varga G (2002) Miniaturisation is mandatory unravelling the human proteome. Proteomics 2: 345–51 Lewis TS, Hunt JB, Aveline LD, Jonscher KR, Louie DF, Yeh JM, Nahreini TS, Resing KA, Ahn NG (2000) Identification of novel MAP kinase pathway signaling targets by functional proteomics and mass spectrometry. Mol Cell 6: 1343–54 Li S, Armstrong CM, Bertin N, Ge H, Milstein S, Boxem M, Vidalain PO, Han JD, Chesneau A, Hao T, Goldberg DS, Li N, Martinez M, Rual JF, Lamesch P, Xu L, Tewari M, Wong SL, Zhang LV, Berriz GF, Jacotot L, Vaglio P, Reboul J, Hirozane-Kishikawa T, Li Q, Gabel HW, Elewa A, Baumgartner B, Rose DJ, Yu H, Bosak S, Sequerra R, Fraser A, Mango SE, Saxton WM, Strome S, Van Den Heuvel S, Piano F, Vandenhaute J, Sardet C, Gerstein M, Doucette-Stamm L, Gunsalus KC, Harper JW, Cusick ME, Roth FP, Hill DE, Vidal M (2004) A map of the interactome network of the metazoan C. elegans. Science 303: 540–3 Link AJ, Eng J, Schieltz DM, Carmack E, Mize GJ, Morris DR, Garvik BM, Yates JR, 3rd (1999) Direct analysis of protein complexes using mass spectrometry. Nat Biotechnol 17: 676–82 Ludwig JA, Weinstein JN (2005) Biomarkers in cancer staging, prognosis and treatment selection. Nature Reviews Cancer 5: 845– 56 Mann M, Jensen ON (2003) Proteomic analysis of post-translational modifications. Nat Biotechnol 21: 255–61 McKerrow JH, Bhargava V, Hansell E, Huling S, Kuwahara T, Matley M, Coussens L, Warren R (2000) A functional proteomics screen of proteases in colorectal carcinoma. Mol Med 6: 450–60 Meri S, Baumann M (2001) Proteomics: posttranslational modifications, immune responses and current analytical tools. Biomol Eng 18: 213–20

Merkel JS, Michaud GA, Salcius M, Schweitzer B, Predki PF (2005) Functional protein microarrays: just how functional are they? Current Opinion in Biotechnology 16: 447–52 Morin X, Daneman R, Zavortink M, Chia W (2001) A protein trap strategy to detect GFP-tagged proteins expressed from their endogenous loci in Drosophila. Proc Natl Acad Sci U S A 98: 15050–5 Neumann L, Wohland T, Whelan RJ, Zare RN, Kobilka BK (2002) Functional immobilization of a ligand-activated G-protein-coupled receptor. Chembiochem 3: 993–8 Nielsen UB, Cardone MH, Sinskey AJ, MacBeath G, Sorger PK (2003) Profiling receptor tyrosine kinase activation by using Ab microarrays. Proc Natl Acad Sci U S A 100: 9330–5 Nishizuka S, Charboneau L, Young L, Major S, Reinhold WC, Waltham M, Kouros-Mehr H, Bussey KJ, Lee JK, Espina V, Munson PJ, Petricoin E, 3rd, Liotta LA, Weinstein JN (2003) Proteomic profiling of the NCI-60 cancer cell lines using new high-density reverse-phase lysate microarrays. Proc Natl Acad Sci U S A 100: 14229–34 Oda Y, Huang K, Cross FR, Cowburn D, Chait BT (1999) Accurate quantitation of protein expression and site-specific phosphorylation. Proc Natl Acad Sci U S A 96: 6591–6 O‘Farrell PH (1975) High resolution two-dimensional electrophoresis of proteins. J Biol Chem 250: 4007–21 Ong SE, Mann M (2005) Mass spectrometry-based proteomics turns quantitative. Nat Chem Biol 1: 252–62 Orchard S, Hermjakob H, Apweiler R (2005) Annotating the human proteome. Molecular and Cellular Proteomics 4: 435–40 Ostergaard M, Wolf H, Orntoft TF, Celis JE (1999) Psoriasin (S100A7): a putative urinary marker for the follow-up of patients with bladder squamous cell carcinomas. Electrophoresis 20: 349–54 Page MJ, Amess B, Townsend RR, Parekh R, Herath A, Brusten L, Zvelebil MJ, Stein RC, Waterfield MD, Davies SC, O‘Hare MJ (1999) Proteomic definition of normal human luminal and myoepithelial breast cells purified from reduction mammoplasties. Proc Natl Acad Sci U S A 96: 12589–94 Pandey A, Lewitter F (1999) Nucleotide sequence databases: a gold mine for biologists. Trends Biochem Sci 24: 276–80 Pandey A, Mann M (2000) Proteomics to study genes and genomes. Nature 405: 837–46 Paweletz CP, Charboneau L, Bichsel VE, Simone NL, Chen T, Gillespie JW, Emmert-Buck MR, Roth MJ, Petricoin IE, Liotta LA (2001) Reverse phase protein microarrays which capture disease progression show activation of pro-survival pathways at the cancer invasion front. Oncogene 20: 1981–9 Petricoin EF, Liotta LA (2004) SELDI-TOF-based serum proteomic pattern diagnostics for early detection of cancer. Curr Opin Biotechnol 15: 24–30 Phizicky E, Bastiaens PI, Zhu H, Snyder M, Fields S (2003) Protein analysis on a proteomic scale. Nature 422: 208–15 Ptacek J, Devgan G, Michaud G, Zhu H, Zhu X, Fasolo J, Guo H, Jona G, Breitkreutz A, Sopko R, McCartney RR, Schmidt MC, Rachidi N, Lee SJ, Mah AS, Meng L, Stark MJ, Stern DF, De Virgilio C, Tyers M, Andrews B, Gerstein M, Schweitzer B, Predki PF, Snyder M (2005) Global analysis of protein phosphorylation in yeast. Nature 438: 679–84 Ramachandran N, Hainsworth E, Bhullar B, Eisenstein S, Rosen B, Lau AY, Walter JC, LaBaer J (2004) Self-assembling protein microarrays. Science 305: 86–90 Reinders J, Sickmann A (2005) State-of-the-art in phosphoproteomics. Proteomics 5: 4052–61 Rigaut G, Shevchenko A, Rutz B, Wilm M, Mann M, Seraphin B (1999) A generic protein purification method for protein complex characterization and proteome exploration. Nat Biotechnol 17: 1030–2

311 3.1 · Klinische Proteomik Robinson WH, DiGennaro C, Hueber W, Haab BB, Kamachi M, Dean EJ, Fournel S, Fong D, Genovese MC, de Vegvar HE, Skriner K, Hirschberg DL, Morris RI, Muller S, Pruijn GJ, van Venrooij WJ, Smolen JS, Brown PO, Steinman L, Utz PJ (2002) Autoantigen microarrays for multiplex characterization of autoantibody responses. Nature Medicine 8: 295–301 Rual JF, Venkatesan K, Hao T, Hirozane-Kishikawa T, Dricot A, Li N, Berriz GF, Gibbons FD, Dreze M, Ayivi-Guedehoussou N, Klitgord N, Simon C, Boxem M, Milstein S, Rosenberg J, Goldberg DS, Zhang LV, Wong SL, Franklin G, Li S, Albala JS, Lim J, Fraughton C, Llamosas E, Cevik S, Bex C, Lamesch P, Sikorski RS, Vandenhaute J, Zoghbi HY, Smolyar A, Bosak S, Sequerra R, Doucette-Stamm L, Cusick ME, Hill DE, Roth FP, Vidal M (2005) Towards a proteome-scale map of the human protein-protein interaction network. Nature 437: 1173–1178 Sali A, Glaeser R, Earnest T, Baumeister W (2003) From words to literature in structural proteomics. Nature 422: 216–25 Schindewolf C, Lobenwein K, Trinczek K, Gomolka M, Soewarto D, Fella C, Pargent W, Singh N, Jung T, Hrabe de Angelis M (2000) Comet assay as a tool to screen for mouse models with inherited radiation sensitivity. Mamm Genome 11: 552–4 Schweitzer B, Roberts S, Grimwade B, Shao W, Wang M, Fu Q, Shu Q, Laroche I, Zhou Z, Tchernev VT, Christiansen J, Velleca M, Kingsmore SF (2002) Multiplexed protein profiling on microarrays by rolling-circle amplification. Nature Biotechnology 20: 359–65 Sheehan KM, Calvert VS, Kay EW, Lu Y, Fishman D, Espina V, Aquino J, Speer R, Araujo R, Mills GB, Liotta LA, Petricoin EF, 3rd, Wulfkuhle JD (2005) Use of reverse phase protein microarrays and reference standard development for molecular network analysis of metastatic ovarian carcinoma. Molecular and Cellular Proteomics 4: 346–55 Shevchenko A, Loboda A, Ens W, Standing KG (2000) MALDI quadrupole time-of-flight mass spectrometry: a powerful tool for proteomic research. Anal Chem 72: 2132–41 Simpson JC, Wellenreuther R, Poustka A, Pepperkok R, Wiemann S (2000) Systematic subcellular localization of novel proteins identified by large-scale cDNA sequencing. EMBO Rep 1: 287– 92 Sreekumar A, Nyati MK, Varambally S, Barrette TR, Ghosh D, Lawrence TS, Chinnaiyan AM (2001) Profiling of cancer cells using protein microarrays: discovery of novel radiation-regulated proteins. Cancer Res 61: 7585–93 Stelzl U, Worm U, Lalowski M, Haenig C, Brembeck FH, Goehler H, Stroedicke M, Zenkner M, Schoenherr A, Koeppen S, Timm J, Mintzlaff S, Abraham C, Bock N, Kietzmann S, Goedde A, Toksöz E, Droege A, Krobitsch S, Korn B, Birchmeier W, Lehrach H, Wanker EE (2005) A human protein-protein interaction network: A resource for annotating the proteome. Cell 122: 957– 968 Tang N, Tornatore P, Weinberger SR (2004) Current developments in SELDI affinity technology. Mass Spectrom Rev 23: 34–44 Thomsen W, Frazer J, Unett D (2005) Functional assays for screening GPCR targets. Curr Opin Biotechnol 16: 655–65 Uetz P, Giot L, Cagney G, Mansfield TA, Judson RS, Knight JR, Lockshon D, Narayan V, Srinivasan M, Pochart P, Qureshi-Emili A, Li Y, Godwin B, Conover D, Kalbfleisch T, Vijayadamodar G, Yang M, Johnston M, Fields S, Rothberg JM (2000) A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae.[comment]. Nature 403: 623–7 Unlu M, Morgan ME, Minden JS (1997) Difference gel electrophoresis: a single gel method for detecting changes in protein extracts. Electrophoresis 18: 2071–7

3.1

Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M, Evans CA, Holt RA, Gocayne JD, Amanatides P, Ballew RM, Huson DH, Wortman JR, Zhang Q, Kodira CD, Zheng XH, Chen L, Skupski M, Subramanian G, Thomas PD, Zhang J, Gabor Miklos GL, Nelson C, Broder S, Clark AG, Nadeau J, McKusick VA, Zinder N, Levine AJ, Roberts RJ, Simon M, Slayman C, Hunkapiller M, Bolanos R, Delcher A, Dew I, Fasulo D, Flanigan M, Florea L, Halpern A, Hannenhalli S, Kravitz S, Levy S, Mobarry C, Reinert K, Remington K, Abu-Threideh J, Beasley E, Biddick K, Bonazzi V, Brandon R, Cargill M, Chandramouliswaran I, Charlab R, Chaturvedi K, Deng Z, Di Francesco V, Dunn P, Eilbeck K, Evangelista C, Gabrielian AE, Gan W, Ge W, Gong F, Gu Z, Guan P, Heiman TJ, Higgins ME, Ji RR, Ke Z, Ketchum KA, Lai Z, Lei Y, Li Z, Li J, Liang Y, Lin X, Lu F, Merkulov GV, Milshina N, Moore HM, Naik AK, Narayan VA, Neelam B, Nusskern D, Rusch DB, Salzberg S, Shao W, Shue B, Sun J, Wang Z, Wang A, Wang X, Wang J, Wei M, Wides R, Xiao C, Yan C, et al. (2001) The sequence of the human genome. Science 291: 1304–51 Vitzthum F, Behrens F, Anderson NL, Shaw JH (2005) Proteomics: from basic research to diagnostic application. A review of requirements & needs. Journal of Proteome Research 4: 1086–97 Waelter S, Scherzinger E, Hasenbank R, Nordhoff E, Lurz R, Goehler H, Gauss C, Sathasivam K, Bates GP, Lehrach H, Wanker EE (2001) The huntingtin interacting protein HIP1 is a clathrin and alphaadaptin-binding protein involved in receptor-mediated endocytosis. Hum Mol Genet 10: 1807–17 Wen YD, Cress WD, Roy AL, Seto E (2003) Histone deacetylase 3 binds to and regulates the multifunctional transcription factor TFII-I. J Biol Chem 278: 1841–7 Wilkins MR, Sanchez JC, Gooley AA, Appel RD, Humphery-Smith I, Hochstrasser DF, Williams KL (1996) Progress with proteome projects: why all proteins expressed by a genome should be identified and how to do it. Biotechnol Genet Eng Rev 13: 19– 50 Winter G, Griffiths AD, Hawkins RE, Hoogenboom HR (1994) Making antibodies by phage display technology. Annu Rev Immunol 12: 433–55 Witke W, Podtelejnikov AV, Di Nardo A, Sutherland JD, Gurniak CB, Dotti C, Mann M (1998) In mouse brain profilin I and profilin II associate with regulators of the endocytic pathway and actin assembly. Embo J 17: 967–76 Zhou G, Li H, DeCamp D, Chen S, Shu H, Gong Y, Flaig M, Gillespie JW, Hu N, Taylor PR, Emmert-Buck MR, Liotta LA, Petricoin EF, 3rd, Zhao Y (2002) 2D differential in-gel electrophoresis for the identification of esophageal scans cell cancer-specific protein markers. Mol Cell Proteomics 1: 117–24 Zhu H, Bilgin M, Bangham R, Hall D, Casamayor A, Bertone P, Lan N, Jansen R, Bidlingmaier S, Houfek T, Mitchell T, Miller P, Dean RA, Gerstein M, Snyder M (2001) Global analysis of protein activities using proteome chips. Science 293: 2101–5 Zhu H, Klemic JF, Chang S, Bertone P, Casamayor A, Klemic KG, Smith D, Gerstein M, Reed MA, Snyder M (2000) Analysis of yeast protein kinases using protein chips. Nature Genetics 26: 283–289 Zhu H, Snyder M (2003) Protein chip technology. Current Opinion in Chemical Biology 7: 55–63 Zozulya S, Lioubin M, Hill RJ, Abram C, Gishizky ML (1999) Mapping signal transduction pathways by phage display. Nat Biotechnol 17: 1193–8

312

Sektion 3 · Diagnostik

3.1.6 Zeittafel 1975

Entwicklung der 2DE-Technologie, Beginn der Katalogisierung von Mustern exprimierter Proteine (Klose 1975; O’Farrell 1975)

1989

Entwicklung des Hefe-2-Hybrid-Systems zur systematischen Analyse von Protein-Protein-Wechselwirkungen (Fields u. Song 1989)

1993

Entwicklung der hochsensitiven Massenspektroskopie und des Peptidmassen-Fingerabdrucks, MALDI-TOF („matrix-assisted laser desorption/ionisation – time over flight“) (Henzel et al. 1993)

1993

Entwicklung der MS-basierten Peptidsequenzierung mittels Peptidfragmentierung (Fenn 1993); Peptide werden mittels ESI (Elektrospray,„electrospray ionisation“) direkt von der flüssigen Phase ionisiert.

1996

Einführung des Proteom-Begriffs durch Mark Wilkins (Wilkins et al. 1996)

1996

Einführung des Proteomik-Begriffs (Anderson u. Anderson 1996); dieser Begriff wurde ursprünglich benutzt, um die Auftrennung von Proteinen aus komplexen Gewebs- oder Zellextrakten mittels 2DE zu beschreiben.

1997

Entwicklung der differenziellen Gelelektrophorese („difference gel electrophoresis“, DIGE) zur vergleichenden Untersuchung von Proteinextrakten zweier Zustände in einem 2D-Gel (Unlu et al. 1997)

1999

Einführung der multidimensionalen Protein-Identifikationstechnologie („multidimensional protein identification technology“) (Link et al. 1999)

2001

Sequenzierung des humanen Genoms (Lander et al. 2001; Venter et al. 2001)

2001

Design des ersten Hefe-Proteom-Mikroarrays für die Analyse von Protein-Protein- und Protein-Lipid-Wechselwirkungen (Zhu et al. 2001)

2004

Entwicklung einer Methode zur Herstellung von Protein-Mikroarrays durch In-vitro-Expression der Proteine auf dem Mikroarray (Ramachandran et al. 2004)

2004

Entwicklung und Anwendung reverser Protein-Mikroarrays zur quantitativen Erfassung von Proteinmodifikationen im Rahmen von Signalübertragungsketten (Chan et al. 2004)

2005

Erste Hochdurchsatzanalysen von In-vitro-Proteinphosphorylierungen mit Protein-Mikroarrays zum Auffinden neuer Kinasesubstrate (Feilner et al. 2005; Ptacek et al. 2005)

2005

Erstellung der ersten humanen Protein-Protein-Interaktionsnetzwerke (Rual et al. 2005; Stelzl et al. 2005)

Literatur zur Zeittafel Anderson NG, Anderson NL (1996) Twenty years of two-dimensional electrophoresis: past, present and future. Electrophoresis 17: 443–53 Chan SM, Ermann J, Su L, Fathman CG, Utz PJ (2004) Protein microarrays for multiplex analysis of signal transduction pathways. Nat. Med. 10: 1390–6 Feilner T, Hultschig C, Lee J, Meyer S, Immink RG, Koenig A, Possling A, Seitz H, Beveridge A, Scheel D, Cahill DJ, Lehrach H, Kreutzberger J, Kersten B (2005) High throughput identification of potential Arabidopsis mitogen-activated protein kinases substrates. Molecular and Cellular Proteomics 4: 1558–68 Fenn JB (1993) Ion formation from charged droplets: Roles of geometry, energy, and time. Am Soc Mass Spectrom 4: 524– 35 Fields S, Song O (1989) A novel genetic system to detect proteinprotein interactions. Nature 340: 245–6 Henzel WJ, Billeci TM, Stults JT, Wong SC, Grimley C, Watanabe C (1993) Identifying proteins from two-dimensional gels by molecular mass searching of peptide fragments in protein sequence databases. Proc Natl Acad Sci U S A 90: 5011–5

Klose J (1975) Protein mapping by combined isoelectric focusing and electrophoresis of mouse tissues. A novel approach to testing for induced point mutations in mammals. Humangenetik 26: 231–43 Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W, Funke R, Gage D, Harris K, Heaford A, Howland J, Kann L, Lehoczky J, LeVine R, McEwan P, McKernan K, Meldrim J, Mesirov JP, Miranda C, Morris W, Naylor J, Raymond C, Rosetti M, Santos R, Sheridan A, Sougnez C, Stange-Thomann N, Stojanovic N, Subramanian A, Wyman D, Rogers J, Sulston J, Ainscough R, Beck S, Bentley D, Burton J, Clee C, Carter N, Coulson A, Deadman R, Deloukas P, Dunham A, Dunham I, Durbin R, French L, Grafham D, Gregory S, Hubbard T, Humphray S, Hunt A, Jones M, Lloyd C, McMurray A, Matthews L, Mercer S, Milne S, Mullikin JC, Mungall A, Plumb R, Ross M, Shownkeen R, Sims S, Waterston RH, Wilson RK, Hillier LW, McPherson JD, Marra MA, Mardis ER, Fulton LA, Chinwalla AT, Pepin KH, Gish WR, Chissoe SL, Wendl MC, Delehaunty KD, Miner TL, Delehaunty A, Kramer JB, Cook LL, Fulton RS, Johnson DL, Minx PJ, Clifton SW, HawkinsT, Branscomb E, Predki P, Richardson P, Wenning S, Slezak T, Doggett N, Cheng JF, Olsen A, Lucas S, Elkin C, Uberbacher E, Frazier M, et al. (2001) Initial sequencing and analysis of the human genome. Nature 409: 860–921.

313 3.1 · Klinische Proteomik Link AJ, Eng J, Schieltz DM, Carmack E, Mize GJ, Morris DR, Garvik BM, Yates JR, 3rd (1999) Direct analysis of protein complexes using mass spectrometry. Nat Biotechnol 17: 676–82 O‘Farrell PH (1975) High resolution two-dimensional electrophoresis of proteins. J Biol Chem 250: 4007–21 Ptacek J, Devgan G, Michaud G, Zhu H, Zhu X, Fasolo J, Guo H, Jona G, Breitkreutz A, Sopko R, McCartney RR, Schmidt MC, Rachidi N, Lee SJ, Mah AS, Meng L, Stark MJ, Stern DF, De Virgilio C, Tyers M, Andrews B, Gerstein M, Schweitzer B, Predki PF, Snyder M (2005) Global analysis of protein phosphorylation in yeast. Nature 438: 679–84 Ramachandran N, Hainsworth E, Bhullar B, Eisenstein S, Rosen B, Lau AY, Walter JC, LaBaer J (2004) Self-assembling protein microarrays. Science 305: 86–90 Rual JF, Venkatesan K, Hao T, Hirozane-Kishikawa T, Dricot A, Li N, Berriz GF, Gibbons FD, Dreze M, Ayivi-Guedehoussou N, Klitgord N, Simon C, Boxem M, Milstein S, Rosenberg J, Goldberg DS, Zhang LV, Wong SL, Franklin G, Li S, Albala JS, Lim J, Fraughton C, Llamosas E, Cevik S, Bex C, Lamesch P, Sikorski RS, Vandenhaute J, Zoghbi HY, Smolyar A, Bosak S, Sequerra R, Doucette-Stamm L, Cusick ME, Hill DE, Roth FP, Vidal M (2005) Towards a proteome-scale map of the human protein-protein interaction network. Nature 437: 1173–1178 Stelzl U, Worm U, Lalowski M, Haenig C, Brembeck FH, Goehler H, Stroedicke M, Zenkner M, Schoenherr A, Koeppen S, Timm J, Mintzlaff S, Abraham C, Bock N, Kietzmann S, Goedde A, Toksöz E, Droege A, Krobitsch S, Korn B, Birchmeier W, Lehrach H, Wanker EE (2005) A human protein-protein interaction network: A resource for annotating the proteome. Cell 122: 957– 968

3.1

Unlu M, Morgan ME, Minden JS (1997) Difference gel electrophoresis: a single gel method for detecting changes in protein extracts. Electrophoresis 18: 2071–7 Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M, Evans CA, Holt RA, Gocayne JD, Amanatides P, Ballew RM, Huson DH, Wortman JR, Zhang Q, Kodira CD, Zheng XH, Chen L, Skupski M, Subramanian G, Thomas PD, Zhang J, Gabor Miklos GL, Nelson C, Broder S, Clark AG, Nadeau J, McKusick VA, Zinder N, Levine AJ, Roberts RJ, Simon M, Slayman C, Hunkapiller M, Bolanos R, Delcher A, Dew I, Fasulo D, Flanigan M, Florea L, Halpern A, Hannenhalli S, Kravitz S, Levy S, Mobarry C, Reinert K, Remington K, Abu-Threideh J, Beasley E, Biddick K, Bonazzi V, Brandon R, Cargill M, Chandramouliswaran I, Charlab R, Chaturvedi K, Deng Z, Di Francesco V, Dunn P, Eilbeck K, Evangelista C, Gabrielian AE, Gan W, Ge W, Gong F, Gu Z, Guan P, Heiman TJ, Higgins ME, Ji RR, Ke Z, Ketchum KA, Lai Z, Lei Y, Li Z, Li J, Liang Y, Lin X, Lu F, Merkulov GV, Milshina N, Moore HM, Naik AK, Narayan VA, Neelam B, Nusskern D, Rusch DB, Salzberg S, Shao W, Shue B, Sun J, Wang Z, Wang A, Wang X, Wang J, Wei M, Wides R, Xiao C, Yan C, et al. (2001) The sequence of the human genome. Science 291: 1304–51 Wilkins MR, Sanchez JC, Gooley AA, Appel RD, Humphery-Smith I, Hochstrasser DF, Williams KL (1996) Progress with proteome projects: why all proteins expressed by a genome should be identified and how to do it. Biotechnol Genet Eng Rev 13: 19– 50 Zhu H, Bilgin M, Bangham R, Hall D, Casamayor A, Bertone P, Lan N, Jansen R, Bidlingmaier S, Houfek T, Mitchell T, Miller P, Dean RA, Gerstein M, Snyder M (2001) Global analysis of protein activities using proteome chips. Science 293: 2101–5

3.2 Pharmakogenetik und Pharmakogenomik Ivar Roots, Gabriele Laschinski und Urs A. Meyer

3.2.1

Individualisierte Arzneitherapie – 315

3.2.2

Pharmakogenomik

3.2.2.1 3.2.2.2

Das Genom und seine Diversität – 316 Multifaktorielle und multigene Aspekte der Arzneimittelwirkung

3.2.3

Genvarianten arzneimittelmetabolisierender Enzyme, die zu Änderungen der Pharmakokinetik führen – 317

3.2.3.1 3.2.3.2 3.2.3.3 3.2.3.4 3.2.3.5 3.2.3.6

CYP2C19-abhängige Response auf Protonenpumpenhemmer – 319 Substrate von CYP2C9 – 319 Codein und Morphin – 320 Cyclophosphamid und Tamoxifen – 321 Östrogenmetabolismus über CYP1A1-Varianten – 322 Genotyp-basiertes Versagen einer antiemetischen Therapie mit 5-Hydroxytryptamin-Typ-3-Rezeptor-Antagonisten – 323

3.2.4

Genetische Varianten von Arzneimitteltransportern – 324

3.2.5

Genotyp-basierte Dosisempfehlungen – 325

3.2.6

Ausblick auf künftige Implementierung der Pharmakogenetik bei der Krankenversorgung – 327

3.2.7

Literatur

– 328

3.2.8

Zeittafel

– 330

– 315 – 317

Literatur zur Zeittafel – 331

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

315 3.2 · Pharmakogenetik und Pharmakogenomik

3.2.1 Individualisierte Arzneitherapie Pharmakogenetik ist ein Teilgebiet der klinischen Pharmakologie. Es befasst sich mit genetischen Faktoren, die Einfluss auf erwünschte und unerwünschte Wirkungen von Arzneimitteln haben. Durch Berücksichtigung der pharmakogenetischen Eigenschaften eines Patienten bei der Auswahl und Dosierung von Arzneimitteln soll die Arzneitherapie wirksamer und zugleich sicherer werden. Dem Arzt wird damit kein neues Behandlungskonzept an die Hand gegeben, vielmehr hilft ihm die Pharmakogenetik, dem Ideal einer Arzneitherapie nach Maß näherzukommen. Dem Ziel einer individualisierten Therapie dient darüber hinaus auch die Berücksichtigung zahlreicher weiterer beim Patienten vorliegender Faktoren (> Abb. 3.2.1). Die Pharmakogenetik hat von den Fortschritten der molekularen Biologie in den späten 1990er Jahren profitiert, vor allem vom Humanen Genomprojekt. Pharmakogenetische Phänomene waren jedoch seit langem bekannt (Meyer 2004), so z. B. die hämolytische Anämie, unter der Menschen mit angeborenem Glucose-6-Phosphat-Dehydrogenasemangel nach Einnahme bestimmter Lebensmittel und Medikamente leiden. Schon vor 50 Jahren wurde die Polyneuropathie bei Langsamacetylierern im Rahmen einer Behandlung mit Isoniazid entdeckt (Bönicke u. Lisboa 1957). In diese Reihe gehört auch die verlängerte Apnoe nach Gabe von Succinylcholin bei Trägern einer besonderen Cholinesterasevariante (Kalow 1956).

3.2

Heute kennt man eine Vielzahl von genetischen Varianten, die die Funktion von Rezeptoren und anderen Zielstrukturen für Arzneimittel in klinisch relevantem Ausmaß verändern. Es waren jedoch die arzneimittelabbauenden Enzyme, die zuerst als mögliche Ursache für die interindividuelle Variationsbreite bei der Reaktion auf einzelne Wirkstoffe erkannt wurden und die demzufolge bisher auch am besten untersucht sind. Nahezu alle wichtigen Enzyme im Arzneimittelstoffwechsel weisen genetische Variationen auf. Die Folgen, die sich daraus für die Enzymaktivität ergeben, können von einer kaum messbaren Erniedrigung bis zur völligen Defizienz reichen; in wenigen Fällen, wie bei den sog. ultraschnellen Metabolisierern bezüglich Cytochrom P450-2D6 (CYP2D6), kann es aber auch zu einer stark erhöhten Enzymaktivität kommen. Diese Unterschiede in der Aktivität sind bei heterozygoten Merkmalsträgern im Sinne einer Gen-Dosis-Beziehung weniger ausgeprägt als bei homozygoten. Genetische Polymorphismen bei arzneimittelmetabolisierenden Enzymen und Arzneimitteltransportern wirken sich in erster Linie auf die Pharmakokinetik eines Wirkstoffs aus.

3.2.2 Pharmakogenomik Im Kontext der Sequenzierung des menschlichen Genoms ist der Begriff Pharmakogenomik entstanden. Pharmakogenomik bezieht sich auf die Auswirkungen der Gesamtheit der Gene – eben des Genoms – auf die

. Abb. 3.2.1. Ursachen für die individuelle Variabilität der Arzneimittelwirkung

316

Sektion 3 · Diagnostik

Wechselwirkungen zwischen Arzneimitteln und Organismus, d. h. auf die Entwicklung, Wirksamkeit und Toxizität von Arzneimitteln. Der Begriff Pharmakogenetik wurde bis jetzt viel enger als die Auswirkung der Variabilität einzelner Gene auf die Arzneimittelwirkung angewendet. Die Unterscheidung der Begriffe Pharmakogenetik und Pharmakogenomik ist aber letztlich arbiträr, und sie werden oft nebeneinander für die gleichen Inhalte verwendet.

3.2.2.1 Das Genom und seine Diversität Das Jahr 2001 wird in die Geschichte der Biologie und Medizin eingehen als das Jahr, in dem das menschliche Genom, über 90% der DNS-Sequenz von 3,2 Milliarden Basen, aufgeklärt und der Öffentlichkeit zugängig gemacht wurde (Venter et al. 2001, Int. Human Genome Sequencing Consortium 2001). Diese erste Sequenz hatte noch viele Lücken und Fehler und basierte auf der DNS nur weniger Individuen. In kurzer Zeit wurden die noch bestehenden Lücken aber geschlossen und seit Oktober 2004 liegt eine praktisch vollständige Genomsequenz vor (Int. Human Genome Sequencing Consortium 2004). Diese rasante Entwicklung wurde durch technische Fortschritte in der Sequenzierung und der Bioinformatik möglich. Die Aufklärung der Sequenz der insgesamt ca. 20.000 bis 25.000 menschlichen Gene, d. h. der funktionellen Abschnitte des Genoms, die Informationen für RNS und Proteine enthalten, ist allerdings nur der erste Schritt zum Verständnis, was uns Menschen von anderen Spezies und untereinander unterscheidet. Bereits jetzt spricht man von der „post-genome era“, der Nach-Genom-Zeit, in der wir verstehen lernen, in welcher Art einzelne Gene reguliert sind und Funktionen beeinflussen. Die Komplexität der Genexpression ist allerdings groß. Etwa 60% der aus der DNS-Sequenz des Genoms abgeleiteten Proteine können heute schon einer bestimmten funktionellen Gruppe, z. B. einer Rezeptorenfamilie, zugeteilt werden. Viele Gene können aber auf verschiedene Weise in Proteine umgesetzt werden, pro Gen entstehen durchschnittlich 3–4 verschiedene Boten-Ribonukleinsäuren und Proteine, dies führt zu zusätzlicher Diversität der Funktion von Proteinen. Dies und die große kombinatorische Vielfalt der Architektur vieler Proteine und Proteinkomplexe und deren funktionelle Veränderung durch weitere Prozesse (z. B. Phosphorylierung, Glykosylierung) lässt vermuten, dass die 20.000 bis 25.000 Gene ein menschliches Proteom von möglicherweise bis zu einer Million verschiedener Proteine erzeugen. Da es diese Proteine sind, die schlussendlich für Funktionen verantwortlich sind, ist die Proteomik von essenzieller Bedeutung, um die komplexen zellulären

Regulationen oder eben das Funktionieren von Zellen, Organen und Organismen zu verstehen. Ein weiter Weg liegt vor uns bis zu diesem Ziel. So hat man in den letzten Jahren neue Funktionen kleiner einsträngiger und doppelsträngiger RNS-Abschnitte in der Genregulation entdeckt, die die Translation von mRNS, die Stabilität von mRNS oder auf anderen Wegen die Genexpression verändern. Ein wichtiges Ziel des humanen Genomprojekts ist die Erfassung von DNS-Sequenzunterschieden zwischen Individuen und Populationen. Was macht uns Menschen verschieden voneinander, nicht nur in Bezug auf äußere Eigenschaften (Haare, Augenfarbe, Körpergröße, Intelligenz etc.), sondern auch auf das vererbte Risiko, eine bestimmte Krankheit zu entwickeln (z. B Krebs) oder eben auf Arzneimittel mit einer gefährlichen Nebenwirkung zu reagieren? Auch die Wirkungslosigkeit eines Arzneimittels kann vererbt sein: Die analgetische Wirkung von Codein fehlt bei langsamen Metabolisierern mit Mutationen des Cytochrom-P450-Enzyms CYP2D6 (siehe unten). Zwei nichtverwandte Menschen unterscheiden sich in ihrer Genomsequenz insgesamt nur durch ca. 3–10 Millionen Basen, d. h. nur durch etwa 0,1% der Sequenz; 99,9% der Sequenz sind damit bei allen Menschen identisch. Die häufigsten Sequenzunterschiede sind sog. „SNPs“ oder „single nucleotide polymorphisms“, d. h. Unterschiede in einzelnen Basenpaaren. Sie treten je nach Art der Sequenz alle 300 bis 3.000 Basen auf. Von einem Polymorphismus spricht man, wenn der Unterschied an dieser Stelle bei mindestens 1% der untersuchten Bevölkerung vorkommt. SNPs, die in noch größerer Häufigkeit vorkommen, z. B. bei 10–20% der Bevölkerung, können als genetische Marker ähnlich einem Fingerabdruck dienen, um die Beteiligung multipler Genvarianten an einem Krankheitsrisiko oder einer Prädisposition zu einer unerwünschten Arzneimittelwirkung zu erfassen (Evans u. Relling 1999; Roses 2000). Zurzeit werden von einem internationalen Konsortium SNPs in möglichst hoher Dichte bei größeren Populationen untersucht (http://snp.cshl.org), um möglichst alle SNPs zu erfassen. Obschon in der Praxis noch nicht eindeutig nachgewiesen, ist das Konzept glaubwürdig, dass SNPs als Marker für multigene Krankheiten und Arzneimittelantworten dienen können, d. h. ein komplexes Muster genetischer Marker weist auf die genetische Prädisposition zu einer Krankheit oder zu einer fehlenden oder zu starken Arzneimittelwirkung hin. In den letzten 2 Jahren wurden zusätzlich beträchtliche strukturelle Unterschiede beim Vergleich individueller Genomsequenzen entdeckt. Diese betreffen Unterschiede in der Zahl von Genkopien sowie größere Insertionen und Deletionen ganzer Sequenzsegmente. Deshalb ist die gesamte Sequenzvariation zwischen 2 Individuen wohl eher in der

317 3.2 · Pharmakogenetik und Pharmakogenomik

Größenordnung von 20–30.000.000 Basenpaaren oder ungefähr 1% des Genoms zu sehen (Khaja et al. 2006; Wong et al. 2007). Eine Gruppe von benachbarten SNPs auf dem gleichen Chromosom wird oft zusammen als sog. „Haplotypen-Block“ vererbt und vereinfacht die Genotypisierung, da in diesem Fall nur einige wenige SNPs repräsentativ sind für den Haplotyp (www.hapmap.org). Genetisch bedingte Ursachen für die Unterschiede zwischen weißen und afroamerikanischen Patienten in Bezug auf die Wirkung von Arzneimitteln zur Behandlung von Herzinsuffizienz (Wood 2001) könnten so erfasst werden. Falls ein SNP-Muster oder Haplotyp mit veränderter Arzneimittelwirkung einhergeht und sich diese SNPs in der kodierenden oder flankierenden Sequenz bekannter Gene befinden, können die Ursachen der Unterschiede als sog. Kandidatengene angegangen werden.

3.2.2.2 Multifaktorielle und multigene Aspekte der Arzneimittelwirkung Die genannten Beispiele genetischer Einflüsse auf die Arzneimittelwirkung sind vorwiegend Situationen, bei denen einzelne (z. B CYP2D6) oder mehrere Gene [z. B CYP2C9 und VKORC1 (Gen der Vitamin-K-Epoxid-Reduktase)] einen wichtigen Einfluss auf die Kinetik oder Dynamik eines bestimmten Arzneimittels ausüben. Interindividuelle Unterschiede in der Wirkung einer Arzneimitteltherapie entstehen aber viel häufiger durch komplexe Interaktionen zwischen Patienten-(host-) Faktoren, Umwelteinflüssen und genetischer Variabilität (> Abb. 3.2.1). So kann ca. 60–70% der Variation in der Dosis von Warfarin oder Acenocoumarol vorausgesagt werden, die eine definierte Wirkung auf die Gerinnung hat, wenn Patientenfakten wie Alter, Körpergewicht zusammen mit Ernährungsfakten (Vitamin K), anderen Arzneimitteln und den genetischen Polymorphismen von CYP2C9 und VKORC1 berücksichtigt werden (Takahashi et al. 2006; Rieder et al. 2005). Die große Herausforderung für die Zukunft ist die Erfassung dieser kombinierten Einflüsse und von multiplen Genvarianten, um die Arzneimittelwirkung bei einem individuellen Patienten vorauszusagen und die Wahl und Dosierung eines Arzneimittels entsprechend individuell anzupassen. Maßgeschneiderte Arzneimittel, individualisierte oder persönliche Medizin sind einige der Schlagworte, die in diese Zukunft weisen.

3.2

3.2.3 Genvarianten arzneimittelmetabolisierender Enzyme, die zu Änderungen der Pharmakokinetik führen Arzneimittel werden, wie andere Fremdstoffe (Xenobiotika) auch, über sog. Phase-I- und Phase-II-Reaktionen metabolisiert. Hierbei verlieren sie meist ihre pharmakodynamische Wirkung und werden hydrophiler, was ihre Elimination aus dem Körper erheblich erleichtert. Bei Phase-I-Reaktionen erfolgen häufig nur kleine Molekülmodifikationen, in erster Linie Oxidation oder Reduktion des Substrates. Für die Oxidation sind die Cytochrom-P450-Enzyme maßgebend. > Tabelle 3.2.1 zeigt, dass eine Vielzahl von Cytochrom-P450-Enzymen existiert, die sich durch Substratspezifität, Molekulargewicht, Induzierbarkeit und spezifische Hemmbarkeit unterscheiden. Die betreffenden Gene liegen meist auf unterschiedlichen Chromosomen. In der Bevölkerung findet man bei allen Cytochrom-P450-Enzymen genetisch bedingte Varianten, die zum Teil große Aktivitätsänderungen nach sich ziehen. Die Häufigkeit dieser Varianten variiert oft interethnisch ganz erheblich (> Tab. 3.2.1). Bei der sog. Phase II des Fremdstoffmetabolismus laufen synthetische Reaktionen ab. So kann ein Substrat z. B glukuronidiert, acetyliert oder mit einer Methylgruppe versehen werden. Wie > Tabelle 3.2.2 zeigt, sind auch diese Reaktionen genetisch variabel, mit teils erheblichen Auswirkungen auf die Pharmakokinetik und die daraus resultierende Wirksamkeit des betreffenden Medikamentes. Die bimodale Verteilung der ArylaminN-Acetyltransferase-Aktivität (NAT2) veranschaulicht deutlich, dass sich in einer Population phänotypisch zwei klar voneinander abgrenzbare Untergruppen befinden (> Abb. 3.2.2). Die Genotypisierung erlaubt eine weitere Aufgliederung in homozygote und heterozygote Merkmalsträger (Blum et al. 1991). Innerhalb der Langsamacetylierer lassen sich verschiedene Haplotypen differenzieren, die mit unterschiedlichen phänotypischen Aktivitäten assoziiert sind. Während in der weißen Bevölkerung der Langsamacetylierer knapp überwiegt, findet man bei den fernöstlichen Völkern ganz überwiegend den schnellen Acetylierertyp. Diese interethnischen Unterschiede haben auch Folgen für den durchschnittlichen Dosisbedarf solcher Medikamente, die maßgeblich über NAT2 verstoffwechselt werden. Unabhängig von der ethnischen Zugehörigkeit kann durch eine Bestimmung des Acetylierertyps ein Patient seine individuelle Dosis erhalten, die im therapeutischen Bereich liegt.

318

Sektion 3 · Diagnostik

. Tab. 3.2.1. Genetische Polymorphismen von Cytochrom-P450-Enzymen als wichtige Enzyme im oxidativen Arzneimittel- und Fremdstoff-Stoffwechsel und deren klinische Auswirkungen (Roots et al. 2004) Phase-I-Enzyme

Häufigkeit genetischer Varianten *

Betroffene Wirkstoffe (Beispiele)

CYP1A2

Europäer: 46% stark induzierbar

Coffein, Clozapin, Imipramin, Lidocain, Paracetamol, Theophyllin

CYP2A6

Europäer: 1% reduzierte Aktivität

Fadrazol, Losigamon, Halothan, Nikotin, Tegafur

CYP2B6

Europäer: ca. 2% reduzierte Aktivität

Bupropion, Propofol

CYP2C8

Europäer: ca. 1,7% reduzierte Aktivität

Carbamazepin, Cerivastatin, Paclitaxel, Pioglitazon, Rosiglitazon, Verapamil, Warfarin

CYP2C9

Europäer: 1–3% reduzierte Aktivität

Celecoxib, Clopidogrel, Diclofenac, Fluvastatin, Glibenclamid, Ibuprofen, Losartan, Nateglinid, Phenprocoumon, Phenytoin, Piroxicam, Sildenafil, Tolbutamid, Torasemid, Warfarin

CYP2C19

Europäer: 3% keine Aktivität Asiaten: 14–20% keine Aktivität

Cyclophosphamid, Diazepam, Lansoprazol, Omeprazol, Pantoprazol, Proguanil, Propranolol, Rabeprazol

CYP2D6

Europäer: 7% keine Aktivität Asiaten, Fernost: 1% keine Aktivität Europäer: 2–3% sehr hohe Aktivität Araber und Äthiopier: 5–25% sehr hohe Aktivität

Ajmalin, Amitriptylin, Carvedilol, Codein, Flecainid, Fluoxetin, Galanthamin, Haloperidol, Metoprolol, Mexiletin, Ondansetron, Propafenon, Propranolol, Tamoxifen, Timolol, Tropisetron

CYP3A4, CYP3A5, CYP3A7

Mehrere Mutationen sind bekannt, einige davon sind selten und führen zu einer reduzierten Enzymaktivität; CYP3A7 wird bei einigen Erwachsenen exprimiert.

Cyclosporin A, Cortisol, Dapson, Diltiazem, Erythromycin, Lidocain, Midazolam, Nifedipin, Paclitaxel, Sildenafil, Simvastatin, Tacrolimus, Triazolam, Verapamil, Zolpidem

* Häufigkeit homozygoter Genotypen.

Langsamacetylierer Schnellacetylierer

. Abb. 3.2.2. Histogramm der Arylamin-N-Acetyltransferase-2-Aktivität, gemessen anhand des Verhältnisses der Coffeinmetaboliten 5-Acetylamino-6-formylamino-3-methyluracil (AFMU) und 1-Methylxanthin (1X). 795 gesunde Freiwillige und Patienten (alle deutscher Abstammung) erhielten entweder eine Tasse Kaffee oder 100 mg Coffein als Tablette. Der Urin wurde über 5 h gesammelt. Die genann-

ten beiden Metaboliten wurden mittels Hochdruckflüssigkeitschromatographie (HPLC) quantifiziert. Es ergibt sich eine bimodale Verteilung mit 45,3% phänotypischen Schnellacetylierern und 54,7% Langsamacetylierern. Diese Aufteilung wurde bei der Genotypisierung bestätigt. Es finden sich 5,7% diskrepanter Fälle (Cascorbi et al. 1999)

319 3.2 · Pharmakogenetik und Pharmakogenomik

3.2

. Tab. 3.2.2. Genetische Polymorphismen wichtiger Enzyme im Arzneimittel- und Fremdstoff-Stoffwechsel (Phase I und Phase II) und deren klinische Auswirkungen (Roots et al. 2004) Phase-I-Enzyme (außer CYP)

Häufigkeit genetischer Varianten *

Betroffene Wirkstoffe (Beispiele)

Flavinabhängige Monoxygenase 3

Europäer: 9% reduzierte Aktivität

Albendazol, Benzydamin, Perazin, Sulindac

Butyrylcholinesterase

Europäer: 0,03% keine Aktivität

Succinylcholin

Dihydropyrimidin-Dehydrogenase

Heterozygote: 1% reduzierte Aktivität

5-Fluoruracil

Arylamin-N-Acetyltransferase 2 (NAT2)

Europäer: 55% Langsamacetylierer Asiaten, Fernost: 17% Langsamacetylierer

Dapson, Isoniazid, Hydralazin, Procainamid, Sulfonamide

UDP-Glucuronosyltransferase 1A1

Europäer: 10,9% reduzierte Aktivität Asiaten: 1–4% reduzierte Aktivität

Irinotecan

Glutathion-S-Transferase GST M1

Europäer: 55% keine Aktivität

Erhöhtes Risiko für Blasenkrebs

Catechol-O-Methyltransferase

Europäer: 25% reduzierte Aktivität

Amphetamin, Östrogen, L-Dopa, α-Methyldopa

Thiopurin-S-Methyltransferase

Europäer: 0,3% keine Aktivität

Azathioprin, 6-Mercaptopurin

Phase-II-Enzyme

* Häufigkeit homozygoter Genotypen.

3.2.3.1 CYP2C19-abhängige Response auf Protonenpumpenhemmer Im Folgenden soll anhand einiger klinischer Beispiele die Bedeutung von Polymorphismen arzneimittelmetabolisierender Enzyme für die Therapie dargelegt werden. Ein gutes Beispiel für eine nach pharmakogenetischen Gesichtspunkten optimierte Therapie ist der Protonenpumpenhemmer Omeprazol. Der Wirkstoff wird zu etwa 80% über CYP2C19 metabolisiert (Rost u. Roots 1996). Menschen mit einer CYP2C19-Defizienz („poor metabolizer“, PM) verstoffwechseln Omeprazol über CYP3A4, jedoch wesentlich langsamer als Individuen mit normal hoher Enzymaktivität (extensiver Metabolisierer, EM). Bei ihnen wurden im Plasma Flächen unter der Konzentrations-Zeit-Kurve (AUC) gemessen, die zehnmal höher als bei EMs sind (> Abb. 3.2.3). Der Erfolg einer Eradikationstherapie scheint vom CYP2C19-Genotyp abzuhängen, was verständlich ist in Anbetracht der sehr unterschiedlichen Exposition gegenüber dem Wirkstoff Omeprazol bei Individuen mit unterschiedlichem CYP2C19-Genotyp. Mehrere klinische Studien konnten zeigen, dass die Eliminationsquote von Helicobacterpylori bei Patienten mit CYP2C19Defizienz höher ist als bei Menschen, die zwei normal aktive Gene aufweisen (Übersicht bei Roots et al. 2004),

die Erfolgsrate von heterozygoten Merkmalsträgern liegt zwischen diesen beiden Gruppen. Die überwiegende Mehrzahl dieser Untersuchungen wurde in Japan und Korea durchgeführt. Dort betrifft CYP2C19-Defizienz ca. 15–20% der Bevölkerung, sie ist damit fünfmal so häufig wie bei weißen Europäern. Omeprazol hat offenbar eine große therapeutische Breite, auch relativ hohe Plasmaspiegel sind nicht toxisch. Wenn der Arzt den CYP2C19-Genotyp seines Patienten kennt, könnte er diesen bei der Therapie berücksichtigen, also z. B. einem Schnellhydroxilierer die doppelte Dosis geben. Es sollte jedoch nicht vergessen werden, dass auch andere Faktoren den Erfolg einer Eradikationstherapie maßgeblich mitbestimmen, z. B. Resistenzen von Helicobacter pylori oder Polymorphismen in Interleukin-1β (Take et al. 2003). Auch die anderen Protonenpumpenhemmer – Pantoprazol, Lansoprazol und Rabeprazol – unterliegen dem CYP2C19-Polymorphismus.

3.2.3.2 Substrate von CYP2C9 Das CYP2C-Cluster auf Chromosom 10q24 enthält nicht nur das Gen für CYP2C19, sondern auch die Gene für CYP2C9 und CYP2C8. Auch bei den letzteren beiden handelt es sich um hochpolymorphe Enzyme,

320

Sektion 3 · Diagnostik

a

b . Abb. 3.2.3a,b. a Plasmakonzentrations-Zeit-Kurve bei gesunden Probanden mit unterschiedlichem CYP2C19-Genotyp nach oraler Gabe von 40 mg Omeprazol p.o. Die folgenden Genotypen wurden getestet (fünf Probanden pro Gruppe): * homozygot mutiert (CYP2C19*2/*2), Phänotyp: Metabolismus defizient, da keine CYP2C19-Aktivität („poor metabolizer“, PM); – heterozygot Wildtyp/Mutation (CYP2C19*1/*2), Phänotyp: intermediärer Metabolisierer, da Metabolisierungskapazität reduziert; – homozygot Wildtyp (CYP2C19*1/*1), Phänotyp: Schneller Metabolisierer, EM (Brockmöller et al. 2000). b Eradikationsrate von Helicobacter pylori bei 62 Patienten mit peptischem Ulkus nach sog. Eradikationstherapie (Omeprazol und Antibiotika). Die Patienten sind entsprechend ihrem CYP2C19-Genotyp gruppiert (Furuta et al. 2001)

die eine Reihe von klinisch wichtigen Wirkstoffen als Substrate haben, darunter auch orale Antidiabetika (> Tab. 3.2.1). Träger des Allels CYP2C9*3 haben eine erheblich herabgesetzte Enzymaktivität, die zu einer verlangsamten Clearance bestimmter Antidiabetika führt. Der größte Effekt zeigt sich bei Glibenclamid (Glyburide) (Kirchheiner et al. 2005). Etwa 0,4% der weißen Bevölkerung weisen den homozygoten Genotyp CYP2C9*3/*3 auf. Bei Individuen mit dem Genotyp CYP2C9*2/*2 (ca. 0,9% bei Weißen) ist die Enzymaktivität mäßiggradig verringert. Bei Schwarzafrikanern und den Völkern des fernen Ostens sind diese varianten Allele sehr selten. Die reduzierte Aktivität von CYP2C9 kommt klinisch hauptsächlich bei der Therapie mit Warfarin zum Tragen (Takahashi et al. 2006). Inwieweit sie bei der Behandlung mit oralen Antidiabetika oder nichtsteroidalen Antirheumatika berücksichtigt werden muss, steht noch nicht fest. Bei der Therapie von Epileptikern mit Phenytoin ist schon seit Jahrzehnten bekannt,

. Abb. 3.2.4. Codein wird im Körper über CYP2D6 durch O-Demethylierung zum pharmakodynamisch wirksamen Morphin metabolisiert. Bei homozygoten Trägern der Defizienz von CYP2D6 ist die Wirksamkeit von Codein nur sehr gering, wohingegen Träger der Genduplikation eine besonders starke Wirkung aufweisen

dass ca. 1% dieser Patienten mit einer vergleichsweise niedrigen Dosis von 50–100 mg/Tag auskommt, statt wie die meisten mit 300–400 mg/Tag. Die Ursache liegt in der langsamen Verstoffwechselung von Phenytoin bei homozygoten Trägern der CYP2C9*3-Variante.

3.2.3.3 Codein und Morphin Nicht immer führt die Metabolisierung zur Inaktivierung der Medikamente. Im Falle der sog. Pro-Drugs wird eine pharmakologisch inaktive Substanz erst im Körper zum eigentlichen Wirkstoff umgesetzt. So wird Codein über CYP2D6 O-demethyliert, es entsteht Morphin, welches selbst, aber vor allem als Morphin6β-Glucuronid, hustenstillend und analgetisch wirksam ist (> Abb. 3.2.4). Bei Menschen mit homozygoter CYP2D6-Defizienz ist Codein weitgehend unwirksam. Das Codein-6-glucuronid ist jedoch ein von CYP2D6 unabhängig gebildeter Metabolit, der eine schwache Wirksamkeit besitzt (Lötsch et al. 2006). Patienten mit einer CYP2D6-Genduplikation („ultraschnelle Metabolisierer“) weisen eine weit überdurchschnittliche Bildung von Morphin auf und reagieren nicht selten mit Nebenwirkungen (Kirchheiner et al. 2006). Ein anderes Beispiel für ein Pro-Drug ist das Antimalariamittel Proguanil. Es wird über CYP2C19 zum aktiven Wirkstoff Cycloguanil metabolisiert. Individuen mit CYP2C19-Defizienz verstoffwechseln Proguanil über CYP3A4, allerdings nur zu einem geringeren Teil, daher ist die Wirksamkeit von Proguanil bei diesen Patienten reduziert. Morphin wirkt natürlich nicht nur als Metabolit von Codein, sondern bildet als eigenständiges Medikament die tragende Säule der Opioidtherapie. Die bekannte Varianz von Person zu Person im Dosisbedarf von Morphin hat viele Gründe, hauptsächlich liegt ihr die Tole-

321 3.2 · Pharmakogenetik und Pharmakogenomik

3.2

. Abb. 3.2.5. Individueller Morphinbedarf bei Patienten unter Berücksichtigung spezifischer genetischer Varianten, die Einfluss auf die Wirksamkeit von Morphin haben. Bei diesem Vergleich wurden

Patienten, die keine der drei aufgeführten Mutationen besaßen, in ihrem relativen Morphinbedarf gleich 1 gesetzt. Modifiziert nach Lösch u. Geisslinger (2006a)

ranzentwicklung zugrunde. Auch pharmakogenetische Ursachen sind von Bedeutung (Lötsch u. Geisslinger 2006, 2006a). So ist die Wirksamkeit von Morphin bei Patienten mit einer bestimmten Mutation am Opioidrezeptor μ (OPRM1 118G) auf die Hälfte herabgesetzt, was durch Verdopplung der Dosis kompensiert werden muss. Die Mutationen COMT 472A an der Catechol-O-Methyltransferase und MC1R 29insA am Melanocortin-1-Rezeptor steigern die Wirksamkeit von Morphin um ca. ein Drittel. > Abbildung 3.2.5 zeigt den individuellen Morphin-Dosisbedarf bei Vorliegen bestimmter Kombinationen der drei genannten Mutationen beim Patienten.

Wir haben die Plasmaeliminationskonstante (ke) bei 49 Krebspatienten berechnet, die ≤1000 mg Cyclophosphamid pro m2 Körperoberfläche erhielten, meist zusammen mit anderen Zytostatika (Timm et al. 2005). > Abbildung 3.2.6 zeigt, dass bei der Eliminationskonstanten ein deutlicher Gen-Dosis-Effekt besteht, wenn die Ergebnisse den CYP2C19-Genotypen zugeordnet werden. „Poor metabolizer“ zeigen erwartungsgemäß die langsamste Elimination [Genotyp CYP2C19*2/*2; ke=0,076 (SD=0,014) h-1]. Bei homozygoten Trägern des Wildtypallels erfolgte die Elimination um ca. 50% schneller [CYP2C19*1/*1; ke=0,113 (SD=0,028) h–1]. Künftige Studien sollten zeigen, inwieweit ein Zusammenhang mit dem Therapieerfolg besteht. Dabei müsste auch der Genotyp der anderen am Stoffwechsel von Cyclophosphamid beteiligten Enzyme berücksichtigt werden. Eines der Standardmedikamente zur adjuvanten Behandlung von Mammakarzinomen ist Tamoxifen, ein Östrogenrezeptorantagonist. Auch Tamoxifen ist als Pro-Drug anzusehen. Zwei aktive Metaboliten, Endoxifen und 4-Hydroxy-Tamoxifen, besitzen in vitro eine ca. 100fach höhere Aktivität als die Muttersubstanz. Endoxifen ist der weitaus bedeutendere Metabolit der beiden (> Abb. 3.2.7). Er wird über zwei sequenzielle CYP-Reaktionen gebildet. Der erste Schritt erfolgt mit großer Kapazität über CYP3A4. Diese Reaktion kann z.B. durch Enzyminduktoren stimuliert oder durch eine inhibitorische Komedikation gehemmt werden, wodurch die

3.2.3.4 Cyclophosphamid und Tamoxifen Cyclophosphamid ist ein breit eingesetztes Zytostatikum, das von einer Vielzahl polymorpher Enzyme, vor allem aus der Familie der CYP-Enzyme, metabolisiert wird. Klinikern ist bekannt, dass die Wirksamkeit und Verträglichkeit von Cyclophosphamid große interindividuelle Unterschiede aufweist. Cyclophosphamid ist ein Pro-Drug. Es wird durch CYP2C9, CYP2B6, CYP2C19 und CYP3A in 4-Hydroxy-Cyclophosphamid umgewandelt und damit metabolisch aktiviert. Dieser Metabolit ist der Vorläufer einer Reihe alkylierender Produkte, wie z. B des Phosphoramidmustard.

322

Sektion 3 · Diagnostik

der aktive Metabolit Endoxifen deutlich vermindert entsteht. Die klinisch entscheidende Varianz zur Bildung von Endoxifen liegt aber im genetischen Polymorphismus von CYP2D6. Es konnte gezeigt werden, dass homozygote Träger der CYP2D6-Defizienz („poor metabolizer“) eine deutlich schwächere Wirksamkeit von Tamoxifen aufwiesen (Goetz et al. 2005; Jin et al. 2005). Umgekehrt dürfte die Wirksamkeit von Tamoxifen bei Trägern der Genduplikation besonders gut sein.

3.2.3.5 Östrogenmetabolismus über CYP1A1-Varianten

Wirksamkeit schwanken kann. Große genetische Einflüsse auf CYP3A4 sind nicht bekannt. Das über CYP3A4 entstehende N-Desmethyl-Tamoxifen ist nunmehr Substrat für CYP2D6. Dieses Enzym kann durch andere gleichzeitig gegebene Substrate, wie z. B. Paroxetin oder trizyklische Antidepressiva, gehemmt werden, sodass

Auch endogene Substrate wie 17β-Estradiol und Östron können über polymorphe Enzyme des Fremdstoff-Stoffwechsels metabolisiert werden (Kisselev et al. 2005). > Abbildung 3.2.8 zeigt die Genotyp-Phänotyp-Korrelation verschiedener CYP1A1-Varianten, die – zusammen mit Cytochrom-P450-Reduktase – in Spodoptera-frugiperda- (Sf9-)Insektenzellen exprimiert wurden. Im Vergleich zum Wildtypprotein (CYP1A1.1) ist die Metabolitenbildung bei der Enzymvariante CYP1A1.2 deutlich höher, vor allem, was die Bildung von 2-OH-Produkten betrifft. Da die verschiedenen Östrogenmetaboliten unterschiedliche pharmakodynamische Profile haben, kann diese Änderung im Metabolitenmuster auch die Suszeptibilität gegenüber Krankheiten beeinflussen, die von Östrogenen beeinflusst werden. Dazu gehören Osteoporose, Brustkrebs, Ovarialkrebs und Arteriosklerose.

. Abb. 3.2.7. Bildung des aktiven Metaboliten Endoxifen aus Tamoxifen über zwei sequenzielle CYP-Reaktionen. Man erkennt, dass hierbei die CYP2D6-Reaktion bei homozygoten Trägern der Defizienz ein

Nadelöhr darstellt. Die In-vitro-Wirksamkeit der beiden aktiven Metaboliten ist als Vielfaches derjenigen der Muttersubstanz Tamoxifen angegeben (Jin et al. 2005)

. Abb. 3.2.6. Plasmaeliminationskonstante (ke) von Cyclophosphamid in Abhängigkeit vom CYP2C19-Genotyp. 49 onkologische Patienten wurden mit Cyclophosphamiddosen unter 1.000 mg/m2 Körperoberfläche behandelt. Die Ergebnisse sind als Box-Plots dargestellt. Patienten mit CYP2C19-Defizienz (CYP2C19*2/*2) weisen die langsamste Elimination auf (Timm et al. 2005)

323 3.2 · Pharmakogenetik und Pharmakogenomik

. Abb. 3.2.8. Genetische Varianz im Metabolitenmuster von 17βEstradiol und Estron. Die CYP1A1-Varianten wurden – zusammen mit Cytochrom-P450-Reduktase – in Sf9-Insektenzellen exprimiert (Kisselev et al. 2005). Das Diagramm zeigt die katalytische Effi-

3.2

zienz (Vmax/Km). CYP1A1.1 entspricht dem Wildtypprotein; CYP1A1.2 (Ile462Val) wird durch CYP1A1*2 kodiert; CYP1A1.4 (Thr461Asn) wird durch CYP1A1*4 kodiert

3.2.3.6 Genotyp-basiertes Versagen einer antiemetischen Therapie mit 5-Hydroxytryptamin-Typ-3-RezeptorAntagonisten 5-HT3-Antagonisten wie Ondansetron und Tropisetron haben die Therapie von Erbrechen unter Zytostatika einen bedeutenden Schritt vorwärts gebracht. Dennoch leiden 20–30% der Patienten immer noch unter Übelkeit und Erbrechen. 5-HT3-Antagonisten sind Substrate von CYP2D6. Es hat sich herausgestellt, dass bei Trägern der CYP2D6-Genduplikation Tropisetron und Ondansetron nur wenig wirksam sind (> Abb. 3.2.9) (Kaiser et al. 2002). Offenbar erreichen bei ultraschnellen Metabolisierern die Plasmaspiegel nicht den therapeutischen Bereich. Die betreffenden Patienten sollten deshalb eine erheblich höhere Dosis von Tropisetron oder Ondansetron erhalten. Unter europäischen Kaukasiern gibt es nur 2–3% ultraschnelle Metabolisierer, bei Arabern und in der Bevölkerung Nordostafrikas beläuft sich deren Anteil jedoch auf 5–25% (vgl. > Tab. 3.2.1). Die Wirksamkeit einer antiemetischen Therapie mit 5-HT3-Antagonisten hängt – außer von der Aktivität von CYP2D6 – auch von einer Rezeptorvariante ab. Tremblay et al. (2003) haben beobachtet, dass eine AAGDeletion in der Promotor-Region des 5-HT3-Rezeptors (-100_-102 nucleotide position) bei Patienten mit unbefriedigender Kontrolle von Übelkeit und Erbrechen signifikant häufiger war. Homozygote Träger der Dele-

. Abb. 3.2.9. Anzahl der Episoden von Erbrechen innerhalb der ersten 5 h nach Verabfolgung einer emetogenen zytostatischen Therapie bei Patienten mit unterschiedlichem CYP2D6-Genotyp. Die Abbildung zeigt, dass Träger der CYP2D6-Genduplikaton (überwiegend CYP2D6*1/*2x2, d. h. Träger von 3 aktiven Genen) im Durchschnitt 2,3 Episoden hatten und damit beträchtlich über den entsprechenden Werten von Wildtypallelträgern bzw. Trägern der CYP2D6-Defizienz (Träger von 0, 1 oder 2 aktiven CYP2D6-Genen) lagen (Kaiser et al. 2002)

324

Sektion 3 · Diagnostik

tion erwiesen sich als Nonresponder. Da dieser Genotyp aber nur bei 1,5% der Patienten auftritt, ist sein Beitrag zur Gesamtzahl der Therapieversager doch eher gering.

3.2.4 Genetische Varianten von Arzneimitteltransportern Gemäß der klassischen Lehrmeinung verteilen sich Pharmaka im Gewebe mittels passiver Diffusion. Nach der Entdeckung und Beschreibung einer Reihe von Transmembrantransportern ist jedoch klar, dass viele Arzneimittel auch aktiv durch biologische Membranen geschleust werden. Transmembrantransporter sind integrale Proteine der Zellmembran. Sie kommen in Organen vor, die an der Absorption und Exkretion beteiligt sind, wie z. B. Darm, Leber und Niere. Außerdem sind sie ein wichtiger Teil der Barriere zwischen Blut und Gewebe (Blut-Hirn-Schranke, Blut-Plazenta-Schranke etc.), die empfindliche Gewebe gegen toxische Fremdstoffe schützt. Ähnlich wie fremdstoffmetabolisierende Enzyme können auch die Transporter durch Transkriptionsfaktoren in ihrer Aktivität reguliert werden (Podvinec u. Meyer 2006). Nach der Transportrichtung unterscheidet man Aufnahme- und Effluxtransporter. Zu den Aufnahmetransportern gehören die Familien organische anionentransportierende Polypeptide (OATP, Gen: SLC21A, solute carrier family 21A), organische Kationentransporter (OCT, Gen: SLC22A) und Peptidtransporter (PEPT, Gen: SLC15A). Effluxtransporter der ABC-Familie („adenosin-triphosphat-binding cassette“), zu denen auch P-Glykoprotein zählt, spielen eine wichtige Rolle bei der Ausscheidung von Arzneimitteln. OATP-Proteine bilden eine große Transporterfamilie, die in zahlreichen Geweben des menschlichen Körpers (z. B Leber, Niere, Gehirn, Darm) exprimiert wird. In der Leber beteiligen sich diese Polypeptide an der Extraktion von Fremdstoffen und Arzneimitteln aus dem Blut der Pfortader. Zu den klinisch wichtigen Substraten gehören u. a. der Hydroxymethylglutaryl(HMG)-CoAReduktasehemmer Pravastatin (Hsiang et al. 1999), das Antihistaminikum Fexofenadin und die ACE-Hemmer Enalapril und Temocaprilat. OATP-C (SLC21A6, SLCO1B1, ABC1B1) kommt ausschließlich in den basolateralen Membranen der Hepatozyten vor. In den Exons des OATP-C-Gens wurde eine Reihe von SNPs gefunden (Tirona et al. 2001; Nozawa et al. 2002; Michalski et al. 2002), wobei die meisten selten vorkommen. Zu den häufigsten SNPs gehören A388G, C463A und T521C, die als OATP-C*1b, *4 bzw. *5 bezeichnet werden. Allerdings war die Allelfrequenz bei US-Amerikanern europäischer Abstammung, US-Amerikanern afrikanischer Abstam-

mung und bei Japanern deutlich unterschiedlich (Tirona et al. 2001; Nozawa et al. 2002). Die meisten Varianten führten bei In-vitro-Experimenten zu einer Änderungen der OATP-C-Transportfunktion. Unterschiedliche OATP-C-Haplotypen haben Einfluss auf die Pharmakokinetik von Pravastatin (Mwinyi et al. 2004). Statistisch signifikante Effekte der OATP-CAllele *1a, *1b, und *5 zeigten sich in einer klinischen Studie mit gesunden männlichen Probanden deutscher Abstammung, in der die Kinetik von Pravastatin nach einer oralen Einzeldosis von 40 mg untersucht wurde (> Abb. 3.2.10) (Mwinyi et al. 2004). OATP-C*5 scheint zu einer verzögerten Aufnahme von Pravastatin in die Leberzelle zu führen, die Plasmakonzentrationen bleiben daher hoch. Das Vorhandensein des OATP-C*1bAllels beschleunigt anscheinend die Aufnahme des Wirkstoffs, sodass die Konzentration im Plasma niedrig ist. Aus diesen Ergebnissen schon den Schluss zu ziehen, dass die Pravastatindosen entsprechend dem OATP-CGenotyp zu variieren seien, erscheint voreilig, bevor nicht der Einfluss auf die Zielgröße Cholesterolkonzentration belegt ist. Erste Untersuchungen zeigen, dass auch Cholesterolvorstufen, wie z. B das Lathosterol, von dem OATP-C-Polymorphismus betroffen sind (Gerloff et al. 2006). Die meisten Effluxtransporter, die am Transport von Arzneimitteln beteiligt sind, gehören der ABC-Familie an. P-Glykoprotein, das Genprodukt von MDR1 („multidrug resistance gen 1“, ABCB1), ist der derzeit am besten untersuchte Effluxtransporter, es folgen Mitglieder der MRP- („multidrug resistance associated protein“, ABCC-)Unterfamilie. P-Glykoprotein wurde zuerst als der Faktor identifiziert, der in der Krebszelle zur Arznei-

. Abb. 3.2.10. Plasmakonzentrations-Zeit-Kurve nach oraler Gabe von 40 mg Pravastatin bei verschiedenen OATP-C-Haplotypen. Der Kruskal-Wallis-Test ergab einen Wert von P=0,006 für die Unterschiede der AUC-Werte zwischen den drei Gruppen. Im Mann-Whitney-Test ergab der Vergleich zwischen den Gruppen *1a/*1a und *1a/*5 einen P-Wert von 0,049 (Mwinyi et al. 2004)

325 3.2 · Pharmakogenetik und Pharmakogenomik

mittelresistenz führt. Durch seine Lokalisation in Geweben mit exkretorischer oder absorptiver Funktion, wie z. B. den kanalikulären (apikalen) Membranen der Hepatozyten, den Bürstensäumen in proximalen Tubuluszellen der Niere und den apikalen Polen der Enterozyten (Tanigawara 2000), wurde aber sehr schnell klar, dass P-Glykoprotein auch für die Pharmakokinetik von Arzneimitteln entscheidend sein kann. Allgemein kann man sagen, dass P-Glykoprotein als Effluxtransporter die Arzneimittelresorption vermindert und die Arzneimittelexkretion begünstigt. Während funktionell wichtige Mutationen bei arzneimittelmetabolisierenden Enzymen schon sehr lange bekannt waren und auch frühzeitig Methoden zu ihrer Genotypisierung entwickelt wurden (Blum et al. 1991; Heim u. Meyer 1991), erfolgten vergleichbare Schritte bei den Transportern erst vor wenigen Jahren. Den Anfang bildete die systematische Sequenzierung des Gens von P-Glykoprotein durch Hoffmeyer et al. (2000), bei der sich eine Vielzahl von Mutationen ergab. Die polymorphe Expression von P-Glykoprotein könnte ein wichtiger Faktor bei der individuellen Response auf Arzneimittel sein. Zahlreiche Studien haben pharmakogenetische Effekte von SNPs im MDR1-Gen gezeigt (u. a. Hoffmeyer et al. 2000; Hauser et al. 2005; Fellay et al. 2002). Ein nicht kodierender Nukleotidaustausch in Exon 26 3435C>T ist mit einer signifikant niedrigeren Expression von P-Glykoprotein im intestinalen Gewebe assoziiert. Homozygote Träger des T-Allels haben daher höhere Steady-State-Digoxinspiegel als Heterozygote und als Träger zweier Wildtypallele (Hoffmeyer et al. 2000). Was jedoch den Einfluss einzelner SNPs auf die P-Glykoprotein-Funktion betrifft, so haben bisherige Studien auch zu widersprüchlichen Ergebnissen geführt (Siegmund et al. 2002; Gerloff et al. 2002). Eine Erklärung hierfür könnten unterschiedliche experimentelle Bedingungen, die Beteiligung anderer Transporter und die genetische Umgebung des MDR1Gens sein. Interessanterweise konnte eine Haplotypanalyse der MDR1-SNPs 2677G>T/A in Exon 21 und 3435C>T in Exon 26, die miteinander gelinkt sind, ein Teil der widersprüchlichen Ergebnisse früherer Studien erklären (Johne et al. 2002). Deshalb sollten künftige Studien stärker den Aspekt der Haplotypen berücksichtigen. Noch nicht abschließend geklärt ist die Frage, wie die stille, nichtkodierende Mutation 3435C>T in Exon 26 zu Aktivitätsänderungen von P-Glykoprotein führen kann. Das Linkage mit der Tripelmutation G2677T/A wurde schon erwähnt. 2677T und 2677A führen jeweils zu einem Aminosäureaustausch. Kürzlich zeigten Schaefer et al. (2006), dass die einzelnen Proteinvarianten eine signifikant unterschiedliche Transportkapazität für Vincristin aufweisen (> Abb. 3.2.11).

3.2

3.2.5 Genotyp-basierte Dosisempfehlungen Wenn bei einem arzneimittelmetabolisierenden Enzym eine eindeutige Korrelation zwischen Phänotyp und Genotyp besteht und der Genotyp des Patienten bekannt ist, kann der behandelnde Arzt die Dosierung von Arzneimitteln, die durch dieses spezielle Enzym verstoffwechselt werden, dem Genotyp entsprechend anpassen. Etwa 7% der weißen Bevölkerung sind homozygot defizient für CYP2D6, d. h., bei ihnen ist keine Enzymaktivität nachweisbar (Sachse et al. 1997) (> Tab. 3.2.1). Diese Menschen metabolisieren Substrate von CYP2D6 bedeutend langsamer und haben entsprechend höhere Plasmaspiegel. Eine Standarddosis zeigt eine unerwartet große Wirkung und eine erhöhte Nebenwirkungsrate, die auf eine relative Überdosierung zurückzuführen ist. Ungefähr 3% der weißen Bevölkerung tragen eine CYP2D6-Genduplikation. Hierbei handelt es sich um etwas Außergewöhnliches, denn diese Menschen haben drei aktive Allele und damit eine Enzymaktivität, die erheblich über der normaler Wildtypallelträger liegt. Klinische Studien legen nahe, dass durch eine genotypadaptierte Dosierung in den beiden genannten Fällen mangelnde Wirksamkeit und verstärkte Nebenwirkungen vermieden werden können. Polymorphismen arzneimittelabbauender Enzyme haben nicht bei allen Arzneimitteln klinisch messbare Auswirkungen, die Pharmakokinetik vieler Substanzen wird kaum dadurch beeinträchtigt. Die meisten Wirkstoffe werden über CYP3A4 verstoffwechselt. Dessen

. Abb. 3.2.11. Sättigungskinetik des ATP-abhängigen Vincristin[H3]-Transports in Membranvesikeln, isoliert aus HighFive-Insektenzellen, die P-Glykoprotein (ABCB1)-Varianten exprimieren. ABCB1893Ala entspricht dem Wildtyp an Exon 21 2677G. Die Mutation 2677T führt zu einem Aminosäureaustausch 893Ser. Am gleichen Genort kommt eine alternative Mutation 2677A vor, die zu 893Thr führt. Km= Michaelis-Menten-Konstante, Vmax= maximale Transportgeschwindigkeit [Vmax wurde auf die relative Proteinexpression bei Wildtyp (=1,0) normalisiert] (Schaefer et al. 2006)

326

Sektion 3 · Diagnostik

AUC

Clearance

. Abb. 3.2.12. Einfluss des CYP2D6-Polymorphismus auf die Elimination von Doxepin. Links: Plasmaspiegelverläufe bei gesunden Probanden mit den Genotypen homozygot Wildtyp (EM), heterozygot (intermediärer Metabolisierer, IM), homozygot defizient (PM) oder

Genduplikation (ultraschneller Metabolisierer, UM) nach Einnahme einer Einzeldosis von 75 mg razemischem E-, Z-Doxepin. Rechts: Orale Clearance des E-Enantiomers von Doxepin. (Kirchheiner et al. 2002, ergänzt mit Daten für UM)

Aktivität zeigt große interindividuelle Unterschiede; inwieweit dies genetische Hintergründe hat, ist allerdings noch nicht abschließend geklärt. Außerdem ist der Einfluss polymorpher Enzyme wie CYP2D6, CYP2C19 und CYP2C9 immer dann vernachlässigbar, wenn der Wirkstoff über alternative Stoffwechselwege abgebaut werden kann. Eine Dosierung entsprechend dem Genotyp ist nur sinnvoll, wenn das polymorphe Enzym für den Metabolismus einer Substanz mit kleiner therapeutischer Breite ausschlaggebend ist. Diese Bedingungen werden nur von wenigen der gebräuchlichen Wirkstoffe erfüllt.

Für eine Reihe von Wirkstoffen, die über polymorphe Enzyme verstoffwechselt werden, sind Dosierungsempfehlungen bereits entwickelt worden (Brockmöller et al. 2000; Kirchheiner et al. 2001, 2004). In > Abb. 3.2.12 kann man deutlich erkennen, wie sich der CYP2D6-Genotyp auf die systemische Clearance und die AUC des Antidepressivums Doxepin auswirkt (Kirchheiner et al. 2002). Ist der CYP2D6-Genotyp des Patienten bekannt, können die Plasmakonzentrationen durch entsprechende Dosierung im gewünschten Bereich gehalten werden (> Abb. 3.2.13).

. Abb. 3.2.13. Arzneimitteldosierung entsprechend Genotyp. Die Abbildung zeigt vier Patienten mit unterschiedlichem CYP2D6-Phänotyp (PM, homozygot defizient; IM, intermediärer Metabolisierer, EM, homozygot Wildtyp, UM, ultraschneller Metabolisierer) und die entsprechenden Genotypen. Die Standarddosis eines Arzneimittels führt bei den vier Patienten zu unterschiedlichen PlasmakonzentrationsZeit-Kurven (gepunktete Linie) und zu unterschiedlicher Wirksamkeit (z. B. Therapieversagen bei UM, Nebenwirkungen bei PM). Wenn die Arzneimitteldosis dem CYP2D6-Genotyp angepasst wird (die Säulen markieren die Dosisanpassung in Prozent), sind die Plasmakonzentrations-ZeitVerläufe bei allen Patienten gleich (durchgezogene Linie)

327 3.2 · Pharmakogenetik und Pharmakogenomik

3.2 ultrarapid metabolizer extensive metabolizer intermediate metabolizer poor metabolizer

. Abb. 3.2.14. Dosierungsempfehlungen für Antidepressiva entsprechend dem CYP2D6-Genotyp. Die Berechnungen haben die empfohlene Standarddosis des jeweiligen Wirkstoffes zur Grundlage. Anhand publizierter genotypspezifischer pharmakokinetischer Daten wurden Dosierungen berechnet, die bei allen Genotypen zu gleichen Plasmaspiegeln führen. PM, „poor metabolizer“ (CYP2D6

defizient); IM, „intermediate metabolizer“ (heterozygot Wildtyp mit einem defizienten Allel oder zwei Allelen, die zu einer reduzierten Aktivität führen); EM, „extensive metabolizer“ (homozygot Wildtyp); UM, „ultrafast metabolizer“ (ein Wildtypallel plus ein weiteres Wildtypallel, das eine Duplikation trägt) (Kirchheiner et al. 2001, 2004)

> Abbildung 3.2.14 zeigt Dosierungsempfehlungen für Antidepressiva, die an den CYP2D6-Genotyp angepasst sind. Bei der Berechnung wurde außerdem das pharmakodynamische Potenzial der Metaboliten berücksichtigt. Genetisch bedingte Differenzen der Enzymaktivität bleiben nämlich ohne klinische Auswirkungen, wenn der Metabolit genauso wirksam wie die Muttersubstanz ist. Doch das ist selten der Fall, die meisten Metaboliten haben keine therapeutischen Wirkungen.

eine bürokratische Forderung zu erfüllen. So kann die notwendige Reduktion der Phenytoindosis bei Epileptikern mit dem seltenen Genotyp CYP2C9*3/*3 direkt aus vorhandenem Wissen abgeleitet werden (Brockmöller et al. 2000). Die Wirksamkeit dieser individualisierten Dosierung lässt sich dann leicht anhand klinischer Kriterien kontrollieren. Schwieriger ist es, wenn anhand des CYP2D6-Genotyps entschieden werden soll, ob ein Schizophrener mit Haloperidol behandelt wird oder nicht. Haloperidol wird zwar zum größten Teil über CYP2D6 verstoffwechselt, es gibt aber auch einen alternativen Weg über die Reduktion einer Carbonylgruppe, bei der ein pharmakologisch aktiver Metabolit entsteht. Eine klinische Studie konnte allerdings zeigen, dass die Wirksamkeit von Haloperidol tatsächlich vom CYP2D6Genotyp abhängt – sie war bei langsamen Metabolisierern am größten, während die Therapie bei ultraschnellen Metabolisierern versagte (Brockmöller et al. 2002). Die Pharmakogenetik ist Teil der künftigen Molekularen Medizin. Eine Diagnose auf molekularer Basis wird Hand in Hand gehen mit einer spezifischen, molekularen Arzneitherapie. Man kann erwarten, dass die Therapie dadurch effektiver und sicherer wird. Durch die Reduktion von Nebenwirkungen und die Vermeidung einer unwirksamen Therapie sollten auch die Kosten sinken. Die Einführung der Pharmakogenetik in die klinische Praxis wird beschleunigt werden, sobald pharmakogenetisches Wissen Eingang in die Computersoftware des Arztes am „point of drug prescription“ gefunden hat.

3.2.6 Ausblick auf künftige Implementierung der Pharmakogenetik bei der Krankenversorgung Die geschilderten Beispiele verdeutlichen, dass es unter bestimmten Bedingungen schon heute möglich ist, die Arzneitherapie an die genetische Ausstattung des Patienten anzupassen. Nach den Regeln der evidenzbasierten Medizin ist allerdings zu fordern, dass eine auf pharmakogenetischer Basis berechnete Dosierung sich in klinischen Studien als überlegen gegenüber Standardmethoden erweist. Einige Studien, u. a. mit Antidepressiva, Neuroleptika und Azathioprin, liegen bereits vor. Nur sollte sich die Forderung nach aufwendigen klinischen Prüfungen in vernünftigen Grenzen halten. Schlussfolgerungen, die sich direkt aus klinischer Beobachtung und wissenschaftlichen Erkenntnissen ableiten lassen, müssen nicht formal bestätigt werden, nur um

328

Sektion 3 · Diagnostik

3.2.7 Literatur Blum M, Demierre A, Grant DM, Heim M, Meyer UA (1991) Molecular mechanism of slow acetylation of drugs and carcinogens in humans. Proc Natl Acad Sci USA 88: 5237–5241 Bönicke R, Lisboa BP (1957) Über die Erbbedingtheit der intraindividuellen Konstanz der Isoniazidausscheidung beim Menschen (Untersuchungen an eineiigen und zweieiigen Zwillingen). Naturwissenschaften 44: 314 Brockmöller J, Kirchheiner J, Meisel C, Roots I (2000) Pharmacogenetic diagnostics of cytochrome P450 polymorphisms in clinical drug development and in drug treatment. Pharmacogenomics 1: 125–151 Brockmöller J, Kirchheiner J, Schmider J, Walter S, Sachse C, MüllerOerlinghausen B, Roots I (2002) The impact of the CYP2D6 polymorphism on haloperidol pharmacokinetics and on the outcome of haloperidol treatment. Clin Pharmacol Ther 72: 438–452 Cascorbi I, Brockmöller J, Mrozikiewicz PM, Müller A, Roots I (1999) Arylamine N-acetyltransferase activity in man. Drug Metab Rev 31: 489–502 Evans WE, Relling MV (1999) Pharmacogenomics: translating functional genomics into rational therapeutics. Science 286: 487– 491 Fellay J, Marzolini C, Meaden ER, Back DJ, Buclin T, Chave JP, Decoster LA, Furrer H, Opravil M, Pantaleo G, Retelska D, Ruiz L, Schinkel AH, Vernazza P, Eap CB, Telenti A (2002) Swiss HIV Cohort Study. Response to antiretroviral treatment in HIV-1-infected individuals with allelic variants of the multidrug resistance transporter 1: a pharmacogenetics study. Lancet 359: 30–36 Furuta T, Shirai N, Takashima M, Xiao F, Hanai H, Sugimura H, Ohashi K, Ishizaki T, Kaneko E (2001) Effect of genotypic differences in CYP2C19 on cure rates for Helicobacter pylori infection by triple therapy with proton pump inhibitor, amoxicillin, and clarithromycin. Clin Pharmacol Ther 69: 158–168 Gerloff T, Schaefer M, Johne A, Oselin K, Meisel C, Cascorbi I, Roots I (2002) MDR1 genotypes do not influence the absorption of a single oral dose of 1 mg digoxin in healthy white males. Br J Clin Pharmacol 54: 610–616 Gerloff T, Schaefer M, Mwinyi J, Johne A, Sudhop T, Lütjohann D, Roots I, von Bergmann K (2006) Influence of the SLCO1B1*1b and *5 haplotypes on pravastatin‘s cholesterol lowering capabilities and basal sterol serum levels. Naunyn Schmiedebergs Arch Pharmacol 373: 45–50 Goetz MP, Rae JM, Suman VJ, Safgren SL, Ames MM, Visscher DW, Reynolds C, Couch FJ, Lingle WL, Flockhart DA, Desta Z, Perez EA, Ingle JN (2005) Pharmacogenetics of tamoxifen biotransformation is associated with clinical outcomes of efficacy and hot flashes. J Clin Oncol 23: 9312–9318 Hauser IA, Schaeffeler E, Gauer S, Scheuermann EH, Wegner B, Gossmann J, Ackermann H, Seidl C, Hocher B, Zanger UM, Geiger H, Eichelbaum M, Schwab M (2005) ABCB1 genotype of the donor but not of the recipient is a major risk factor for cyclosporinerelated nephrotoxicity after renal transplantation. J Am Soc Nephrol 16: 1501–1511 Heim M, Meyer UA (1991) Predicting debrisoquine phenotype. Lancet 337: 363 Hoffmeyer S, Burk O, von Richter O, Arnold HP, Brockmöller J, Johne A, Cascorbi I, Gerloff T, Roots I, Eichelbaum M, Brinkmann U (2000) Functional polymorphisms of the human multidrug-resistance gene: multiple sequence variations and correlation of one allele with P-glycoprotein expression and activity in vivo. Proc Natl Acad Sci USA 97: 3473–3478

Hsiang B, Zhu Y, Wang Z, Wu Y, Sasseville V, Yang WP, Kirchgessner TG (1999) A novel human hepatic organic anion transporting polypeptide (OATP2). Identification of a liver-specific human organic anion transporting polypeptide and identification of rat and human hydroxymethylglutaryl-CoA reductase inhibitor transporters. J Biol Chem 274: 37161–37168 International Human Genome Sequencing Consortium (2001). Initial sequencing and analysis of the human genome. Nature 409: 860–921 International Human Genome Sequencing Consortium (2004) Finishing the euchromatic sequence of the human genome. Nature 431: 931–945 Jin Y, Desta Z, Stearns V, Ward B, Ho H, Lee KH, Skaar T, Storniolo AM, Li L, Araba A, Blanchard R, Nguyen A, Ullmer L, Hayden J, Lemler S, Weinshilboum RM, Rae JM, Hayes DF, Flockhart DA (2005) CYP2D6 genotype, antidepressant use, and tamoxifen metabolism during adjuvant breast cancer treatment. J Natl Cancer Inst 97: 30–39 Johne A, Köpke K, Gerloff T, Mai I, Rietbrock S, Meisel C, Hoffmeyer S, Kerb R, Fromm MF, Brinkmann U, Eichelbaum M, Brockmöller J, Cascorbi I, Roots I (2002) Modulation of steady-state kinetics of digoxin by haplotypes of the P-glycoprotein MDR1 gene. Clin Pharmacol Ther 72: 584–594 Kaiser R, Sezer O, Papies A, Bauer S, Schelenz C, Tremblay PB, Possinger K, Roots I, Brockmöller J (2002) Patient-tailored antiemetic treatment with 5-hydroxytryptamine type 3 receptor antagonists according to cytochrome P-450 2D6 genotypes. J Clin Oncol 20: 2805–2811 Kalow W (1956) Familial incidence of low pseudocholinesterase level. Lancet 2: 576–577 Khaja R, Zhang J, MacDonald JR, He Y, Joseph-George AM, Wei J, Rafiq MA, Qian C, Shago M, Pantano L, Aburatani H, Jones K, Redon R, Hurles M, Armengol L, Estivill X, Mural RJ, Lee C, Scherer SW, Feuk L (2006) Genome assembly comparison identifies structural variants in the human genome. Nat Genet 38: 1413–1418 Kirchheiner J, Brøsen K, Dahl M, Gram L, Kasper S, Roots I, Sjöqvist F, Spina E, Brockmöller J (2001) CYP2D6 and CYP2C19 genotype-based dose recommendations for antidepressants: a first step towards subpopulation-specific dosages. Acta Psychiatr Scand Suppl 104: 173–192 Kirchheiner J, Meineke I, Müller G, Roots I, Brockmöller J. Contributions of CYP2D6, CYP2C9 and CYP2C19 to the biotransformation of E- and Z-doxepin in healthy volunteers (2002) Pharmacogenetics 12: 571–580 Kirchheiner J, Nickchen K, Bauer M, Wong ML, Licinio J, Roots I, Brockmöller J (2004) Pharmacogenetics of antidepressants and antipsychotics: the contribution of allelic variations to the phenotype of drug response. Mol Psychiatry 9: 442–473 Kirchheiner J, Roots I, Goldammer M, Rosenkranz B, Brockmöller J (2005) Effect of genetic polymorphisms in cytochrome P450 (CYP) 2C9 and CYP2C8 on the pharmacokinetics of oral antidiabetic drugs: Clinical Relevance. Clin Pharmacokinet 44: 1209–1225 Kirchheiner J, Schmidt H, Tzvetkov M, Keulen JT, Lötsch J, Roots I, Brockmöller J (2006) Pharmacokinetics of codeine and its metabolite morphine in ultra-rapid metabolizers due to CYP2D6 duplication. Pharmacogenomics J, July 4, 2006, online Kisselev P, Schunck WH, Roots I, Schwarz D (2005) Association of CYP1A1 polymorphisms with differential metabolic activation of 17beta-estradiol and estrone. Cancer Res 65: 2972–2978 Lötsch J, Geisslinger G (2006) Relevance of frequent mu-opioid receptor polymorphisms for opioid activity in healthy volunteers. Pharmacogenomics 6: 200–210

329 3.2 · Pharmakogenetik und Pharmakogenomik Lötsch J, Geisslinger G (2006a) Current evidence for a genetic modulation of the response to analgesics. Pain 121: 1–5 Lötsch J, Skarke C, Schmidt H, Rohrbacher M, Hofmann U, Schwab M, Geisslinger G (2006) Evidence for morphine-independent central nervous opioid effects after administration of codeine: contribution of other codeine metabolites. Clin Pharmacol Ther 79: 35–48 Meyer UA (2004) Pharmacogenetics – five decades of therapeutic lessons from genetic diversity. Nat Rev Genet 5: 669–676 Michalski C, Cui Y, Nies AT, Nuessler AK, Neuhaus P, Zanger UM, Klein K, Eichelbaum M, Keppler D, König J (2002) A naturally occuring mutation in the SLC21A6 gene causing impaired membrane localization of the hepatocyte uptake transporter. J Biol Chem 277: 43058–43063 Mwinyi J, Johne A, Bauer S, Roots I, Gerloff T (2004) Evidence for inverse effects of OATP-C (SLC21A6) *5 and *1b haplotypes on pravastatin kinetics. Clin Pharmacol Ther 75: 415–421 Nozawa T, Nakajima M, Tamai I, Noda K, Nezu J, Sai Y, Tsuji A, Yokoi T (2002) Genetic polymorphisms of human organic anion transporters OATP-C (SLC21A6) and OATP-B (SLC21A9): allelic frequencies in the Japanese population and functional analysis. J Pharmacol Exp Ther 302: 804–813 Podvinec M, Meyer UA (2006) Prediction of cis-regulatory elements for drug activated transcription factors in the regulation of drug-metabolising enzymes and drug transporters. Expert Opin Drug Metab Toxicol 2: 367–379 Rieder MJ, Reiner AP, Gage BF, Nickerson DA, Eby CS, McLeod HL, Blough DK, Thummel KE, Veenstra DL, Rettie AE (2005) Effect of VKORC1 haplotypes on transcriptional regulation and warfarin dose. N Engl J Med 352: 2285–2293 Roots I, Gerloff T, Meisel C, Kirchheiner J, Goldammer M, Kaiser R, Laschinski G, Brockmöller J, Cascorbi I, Kleeberg U, Hildebrandt AG (2004) Pharmacogenetics-based new therapeutic concepts. Drug Metab Rev 36: 617–638 Roses AD (2000) Pharmacogenetics and the practice of medicine. Nature 405: 857–865 Rost KL, Roots I (1996) Nonlinear kinetics after high-dose omeprazole caused by saturation of genetically variable CYP2C19. Hepatology 23: 1491–1497 Sachse C, Brockmöller J, Bauer S, Roots I (1997) Cytochrome P450 2D6 variants in a Caucasian polulation: allele frequencies and phenotypic consequences. Am J Hum Genet 60: 265–271 Schaefer M, Roots I, Gerloff T (2006) In-vitro transport characteristics discriminate wild-type ABCB1 (MDR1) from ALA893SER

3.2

and ALA893THR polymorphisms. Pharmacogenet Genomics 16: 855–861 Siegmund W, Ludwig K, Giessmann T, Dazert P, Schroeder F, Sperker B, Warzok R, Kroemer HK, Cascorbi I (2002) The effects of the human MDR1 genotype on the expression of duodenal P-glycoprotein and disposition of the probe drug talinolol. Clin Pharmacol Ther 72: 572–583 Take S, Mizuno M, Ishiki K, Nagahara Y, Yoshida T, Inaba T, Yamamoto K, Okada H, Yokota K, Oguma K, Shiratori Y (2003) Interleukin-1β genetic polymorphism influences the effect of cytochrome P 2C19 genotype on the cure rate of 1-week triple therapy for Helicobacter pylori infection. Am J Gastroenterol 98: 2403–2408 Tanigawara Y (2000) Role of P-glycoprotein in drug disposition. Ther Drug Monit 22: 137–140 Takahashi H, Wilkinson GR, Nutescu E, Morita T, Ritchie MD, Scordo MG, Pengo V, Barban M, Padrini R, Ieiri I, Otsubo K, Kashima T, Kimura S, Kijima S, Echizen H (2006) Different contributions of polymorphisms in VKORC1 and CYP2C9 to intra- and inter-population differences in maintenance dose of warfarin in Japanese, Caucasians and African-Americans. Pharmacogenetics & Genomics 16: 101–110 Timm R, Kaiser R, Lötsch J, Heider U, Sezer O, Weisz K, Montemurro M, Roots I, Cascorbi I (2005) Association of cyclophosphamide pharmacokinetics to polymorphic cytochrome P450 2C19. Pharmacogenomics J 5: 365–373 Tirona RG, Leake BF, Merino G, Kim RB (2001) Polymorphisms in OATP-C: Identification of multiple allelic variants associated with altered transport activity among European- and AfricanAmericans. J Biol Chem 276: 35669–35675 Tremblay PB, Kaiser R, Sezer O, Rösler N, Schelenz C, Possinger K, Roots I, Brockmöller J (2003) Variations in the 5-hydroxytryptamine type 3B receptor gene as predictors of the efficacy of entiemetic treatment in cancer patients. J Clin Oncol 21: 2147– 2155 Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, et al. (2001) The sequence of the human genome. Science 291: 1304– 1351 Wong KK, deLeeuw RJ, Dosanjh NS, Kimm LR, Cheng Z, Horsman DE, MacAulay C, Ng RT, Brown CJ, Eichler EE, Lam WL (2007) A comprehensive analysis of common copy-number variations in the human genome. Am J Hum Genet 80: 91–104 Wood AJJ (2001) Racial differences in the response to drugs – pointers to genetic differences. N Engl J Med 344: 1394–1396

330

Sektion 3 · Diagnostik

3.2.8 Zeittafel „So musst du sein, dir kannst du nicht entfliehen, So sagten schon Sibyllen, so Propheten; Und keine Zeit und keine Macht zerstückelt Geprägte Form, die lebend sich entwickelt.“

Diese Zeilen aus Dämon, Urworte orphisch, sind eines von mehreren Beispielen, in denen Johann Wolfgang von Goethe sein Verstehen des Vererbungsmodus ausdrückte – lange, bevor Gregor Mendel 1866 seine Vererbungsregeln aufstellte. In der Mitte des 20. Jahrhunderts wird sich zeigen, dass diese Regeln sehr wohl auch auf die Reaktion eines Individuums auf Medikamente und andere Fremdstoffe zutreffen, also auf die Pharmakogenetik. Einige für die Entwicklung der Pharmakogenetik bedeutsame Entdeckungen und Ereignisse (Meyer 2004) seien im Folgenden genannt.

1932

Schmecken und Nichtschmecken von Phenylthiocarbamid wird auf eine monogenetisch übertragene Eigenschaft zurückgeführt (Snyder 1932).

1953

Die langsame und schnelle Acetylierung von Isoniazid wird von Bönicke und Reif (1953) sowie Hughes et al. (1953) beschrieben.

1956

Glucose-6-Phosphat-Dehydrogenase-Mangel in Erythrozyten wird von Alving et al. (1956) als Ursache der primaquininduzierten Hämolyse erkannt.

1957

Kalow und Staron (1957) finden die Defizienz der Pseudocholinesterase im Serum als Ursache der verlängerten Apnoe nach Gabe von Succinylcholin.

1959

Friedrich Vogel (1959) prägt den Begriff Pharmakogenetik.

1967

Sjöqvist et al. zeigen, dass der Stoffwechsel trizyklischer Antidepressiva unter genetischer Kontrolle ist (Alexanderson et al. 1969).

1975/77

Eichelbaum (Bonn) sowie Smith (London) und ihre Mitarbeiter entdecken unabhängig voneinander den Spartein/ Debrisoquin-Hydroxylierungs-Polymorphismus (Cytochrom P450 2D6) (Eichelbaum 1975; Eichelbaum et al. 1979; Mahgoub et al. 1977).

1980

Entdeckung des genetischen Polymorphismus der Thiopurin-S-Methyltransferase (TPMT) durch Weinshilboum und Sladek (Weinshilboum 2003).

1984

Beschreibung des Hydroxylierungspolymorphismus von Mephenytoin (CYP2C19) durch Küpfer und Preisig (1984).

1988

Gonzalez und Meyer (1988) klonieren das CYP2D6-Gen und charakterisieren den genetischen Defekt des SparteinDebrisoquin-Polymorphismus.

1990

Heim und Meyer (1990) publizieren den ersten allelspezifischen pharmakogenetischen Gentest für CYP2D6.

1991

Das Gen der Arylamin-N-Acetyltransferase-2 wird kloniert, einschließlich der mutierten Allele, die den langsamen Acetylierer-Phänotyp bedingen (Blum et al. 1991).

1999

Das SNP-Consortium, ein Zusammenschluss öffentlicher und industrieller Forschungseinrichtungen, liefert freiverfügbare Information über die Genomvielfalt (Masood 1999).

2000

Die erste umfangreiche pharmakogenetische Wissenssammlung (PharmGKB Internetseite) wird auf der Basis des National Institutes of Health Pharmacogenetics Research Network errichtet.

2000

Erstmalige systematische Suche nach funktionell wirksamen Mutationen in einem Arzneimittel-Transporter-Gen (P-Glykoprotein) (Hoffmeyer et al. 2000).

2001

Erste Analyse („draft“) des menschlichen Genoms (Venter et al. 2001, International Human Genome Sequencing Consortium 2001).

2003

Beginn des HapMap-Projektes zur Beschreibung der Haplotyp-Blöcke des Menschen.

2003

Die Food and Drug Administration (FDA) veröffentlicht einen Entwurf einer Guideline zur Bewertung pharmakogenetischer Daten im Rahmen der Arzneimittelentwicklung

2004

Publikation der weitgehend fehlerfreien Sequenz von 99% des euchromatischen menschlichen Genoms mit 20.000 bis 25.000 eiweißkodierenden Genen (International Human Genome Sequencing Consortium, 2004)

331 3.2 · Pharmakogenetik und Pharmakogenomik

Literatur zur Zeittafel Alexanderson B, Evans DA, Sjöqvist F (1969) Steady-state plasma levels of nortriptyline in twins: influence of genetic factors and drug therapy. Br Med J 4: 764–768 Alving AS, Carson PE, Flanagan CL, Ickes CE (1956) Enzymatic deficiency in primaquine-sensitive erythrocytes. Science 124: 484–485 Blum M, Demierre A, Grant DM, Heim M, Meyer UA (1991) Molecular mechanism of slow acetylation of drugs and carcinogens in humans. Proc Natl Acad Sci USA 88: 5237–5241 Bönicke R, Reif W (1953) Enzymatische Inaktivierung von Isonicotinsäure hydrizide im menschlichen und tierischen Organismus. Naunyn Schmiedebergs Arch Exp Pathol Pharmakol 220: 321–323 Eichelbaum M (1975) Ein neuentdeckter Defekt im Arzneimittelstoffwechsel des Menschen: Die fehlende N-Oxidation des Spartein. Habilitationsschrift, Medizinische Fakultät der Rheinischen Friedrich-Wilhelms-Universität Bonn Eichelbaum M, Spannbrucker N, Steincke B, Dengler HJ (1979) Defective N-oxidation of sparteine in man: a new pharmacogenetic defect. Eur J Clin Pharmacol 16: 183–187 Gonzalez FJ, Skoda RC, Kimura S, Umeno M, Zanger UM, Nebert DW, Gelboin HV, Hardwick JP, Meyer UA (1988) Characterization of the common genetic defect in humans deficient in debrisoquine metabolism. Nature 331: 442–446 Heim M, Meyer UA (1991) Predicting debrisoquine phenotype. Lancet 337: 363 Hoffmeyer S, Burk O, von Richter O, Arnold HP, Brockmöller J, Johne A, Cascorbi I, Gerloff T, Roots I, Eichelbaum M, Brinkmann U (2000) Functional polymorphisms of the human multidrug-re-

3.2

sistance gene: multiple sequence variations and correlation of one allele with P-glycoprotein expression and activity in vivo. Proc Natl Acad Sci USA 97: 3473–3478 Hughes HB (1953) On the metabolic fate of isoniazid. J Pharmacol Exp Ther 109: 444–452 International Human Genome Sequencing Consortium (2001). Initial sequencing and analysis of the human genome. Nature 409: 860–921 International Human Genome Sequencing Consortium (2004) Finishing the euchromatic sequence of the human genome. Nature 431: 931–945 Kalow W, Staron N (1957) On distribution and inheritance of atypical forms of human serum cholinesterase, as indicated by dibucaine numbers. Can J Biochem Physiol 35: 1305–1320 Küpfer A, Preisig R (1984) Pharmacogenetics of mephenytoin: a new drug hydroxylation polymorphism in man. Eur J Clin Pharmacol 26: 753–759 Mahgoub A, Idle JR, Dring LG, Lancaster R, Smith RL (1977) Polymorphic hydroxylation of debrisoquine in man. Lancet 2: 584–586 Masood E (1999) As consortium plans free SNP map of human genome. Nature 398: 545–546 Meyer UA (2004) Pharmacogenetics – five decades of therapeutic lessons from genetic diversity. Nat Rev Genet 5: 669–676 Snyder LH (1932) Studies in human inheritance IX. The inheritance of taste deficiency in man. Ohio J Sci 32: 436–468 Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, et al. (2001) The sequence of the human genome. Science 291: 1304–1351 Vogel F (1959) Moderne Probleme der Humangenetik. Ergebn Inn Med Kinderheilk 12: 52–125 Weinshilboum R (2003) Inheritance and drug response. N Engl J Med 348: 529–537

3.3 Bioinformatik Jens G. Reich

3.3.1

Einleitung

– 333

3.3.2

Das menschliche Genom als Textspeicher – 334

3.3.3

Sequenzanalyse als Basis der Bioinformatik – 336

3.3.3.1

Praktische Verfahren der Sequenzanalyse

3.3.4

Genomkartierung

3.3.5

Vergleichende Genomanalyse: Die evolutionäre Verwandtschaft allen Lebens – 340

3.3.6

„Transkriptom“: Expressionsanalyse des Genoms – 341

3.3.7

Proteomik: Das Eiweißprofil einer Zelle – 342

3.3.8

Strukturbiologie: Die Analyse der molekulären Raumstruktur von Proteinen und Nukleinsäuren – 342

3.3.9

Genetische Diversität des menschlichen Genoms – 343

3.3.10

Datenbanken und Analysewerkzeuge im World Wide Web (WWW) – 344

3.3.11

Weiterführende Literatur – 344

3.3.12

Zeittafel

– 338

– 339

– 345

Literatur zur Zeittafel – 345

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

333 3.3 · Bioinformatik

3.3.1 Einleitung Bioinformatik ist ein Wissenschaftszweig, dessen Methodik (molekulare und genetische Datenbanktechnologie) ganz überwiegend im Internet angesiedelt ist. Man findet zu jeder Fachfrage qualifizierte Abhandlungen und Serviceangebote, indem man entweder konkrete Webadressen eingibt oder sich mithilfe einer Suchmaschine (z. B. „google“) über Anfragestichworte in den entsprechenden Sachbereich „einwählt“. Aus diesem Grund kann die hier gegebene Darstellung sich auf die Einführung in die gedanklichen Grundbegriffe der Teildisziplin und auf einige praktische Ratschläge beschränken. Ebenso wird Originalliteratur, sonst in molekularund zellbiologischen Darstellungen unverzichtbar, hier nur an einigen Stellen zitiert. Mit dem Rückgriff der naturwissenschaftlichen Medizin auf die molekulare Architektur der menschlichen Organe und Zellen ist auch eine Wissenschaftsdisziplin in eine strategische Position gekommen, die sie so in den Jahrzehnten zuvor nicht besaß. Sie behandelt biomedizinische Sachverhalte mit den Methoden der Informatik und mathematischen Modellierung. Man kann sie als biomedizinische Informatik kennzeichnen, in handlicher, aber inhaltlich verkürzter Form auch als Bioinformatik. Andere Aspekte haben auch zu anderen Namensgebungen geführt, die jeweils besondere Facetten des Gebiets betonen: Biomathematische Modellierung, Molekulare Datenbanktechnologie, Bio-Computing u. a. Die strategische Rolle dieser Disziplin kann man so charakterisieren, dass sie nicht mehr im Nebenschluss, sondern nunmehr im Hauptschluss des Stromes medizinischen Erkenntnisgewinns liegt. Sie ist zwar immer noch eine Hilfswissenschaft des Biomediziners, in dem Sinne, dass die fundamentalen Erkenntnisse durch molekularbiologische und genetische Experimente sowie durch pathophysiologische Beobachtung von Labortieren gewonnen und durch Beobachtungen an Menschen bestätigt werden. Aber ihre Ergebnisse sind nicht mehr nur Erläuterungen, Modelle, Denkfiguren der biomedizinischen Forschung, also begleitende Erkenntnisse, sondern ohne den breiten Einsatz von Bioinformatik lässt sich neues Wissen oft überhaupt nicht mehr gewinnen. Man sieht das augenfällig daran, dass hochwertige Personalcomputer und Workstations in jedem einschlägigen Forschungslaboratorium benutzt werden, und zwar nicht nur wie einst für Textverarbeitung oder statistische Tabellenkalkulation, sondern als Modellierungsinstrument und über das Internet als Vernetzungswerkzeug mit den weltweiten Datenbanken, Bibliotheken und biomathematischen Software-Angeboten. Noch vor wenigen Jahren bestand die Hauptanwendung von Mathematik und Informatik vor allem in der medizinischen Biometrie. Deren Verfahren wurden im

3.3

Wesentlichen als heuristisches Instrument benutzt. Vor allem für die Frage, ob ein durch biomedizinische Experimente oder Beobachtungen gewonnener Sachverhalt als „signifikant“, also plausibel und überzeugend, beurteilt werden soll, leistete die mathematische Statistik wichtige Hilfsdienste. Aber es galt wohl stets, dass ein wesentlicher neuer Sachverhalt nur dann wirklich überzeugend war, wenn man ihn zumindest im Umriss „mit bloßem Auge“ erkennen konnte und nicht erst durch komplizierte mathematische Auswertung. Diese Hilfsrolle hat sich verändert. Bioinformatische Methoden sind heute unverzichtbare Werkzeuge, sowohl bei der physikochemischen Untersuchung von Biomakromolekülen und in den Fächern, die man mit Genomik, Proteomik, Metabolomik, Transkriptomik, „Interaktomik“ und einer ganzen Plejade weiterer „Omiks“ zu bezeichnen begonnen hat (es gibt sogar ein spezielles Journal „OMICS – A Journal of Integrative Biology“), als auch beim Studium der komplexen Vernetzungszusammenhänge in der Regulation von metabolischen und Differenzierungsprozessen. Und beides ist von einschneidender Bedeutung für die Medizin. Das all diesen „Omiken“ Gemeinsame, das dann auch diese Begriffswahl plausibel macht, ist die enorme numerische Vielfalt an Elementen (Gene, Genexpressionselemente, Boten-RNS-Spezies, Proteine in mannigfaltigen epigenetischen Modifikationen usw.) sowie das unglaublich verzweigte, bei der Beschreibung zu „kombinatorischer Explosion“ neigende System von gegenseitigen Interkonversionen und physikochemischen Interaktionen, die das molekularbiologisch modellierte organismische System auszeichnen. Konzeptionell neuartig ist die Betrachtungsweise dieser Phänomene vom Funktionsaspekt der biologischen Information her. Beide Phänomenklassen bedingen, dass Hochleistungscomputer und Internet unverzichtbare methodische Voraussetzungen für die erstrebte ganzheitliche Betrachtung sind. Die Bioinformatik hat ihre eigene Methoden- und Denkwelt, die sich sowohl vom Begriffs- und Faktenarsenal der Informatik einerseits als auch dem der Medizin, Biochemie und Biophysik andererseits stark unterscheidet, auf denen sie gleichwohl aufbaut und in die sie hineinwirkt. Das Gebiet, dessen Bezeichnung vom Gegenstandsbereich her eher zu weit ist („genomische und zellbiologische Informatik“ wäre präziser), ist gleichwohl heute so weit verzweigt, und seine Beherrschung verlangt so spezifische Methoden und Begriffe, dass man ein eigenes Ausbildungsfach dafür zu schaffen begonnen hat. Es wäre deshalb auch nicht zweckmäßig und aus Gründen der inneren Logik auch nicht sinnvoll, im Rahmen dieses einführenden Kapitels eine systematische Darstellung zu geben. Dafür gibt es geeignete Monographien, von denen wir einige bei den Literaturangaben aufführen. Es wird vielmehr um eine Übersicht gehen,

334

Sektion 3 · Diagnostik

die die Grundideen und begrifflichen Zusammenhänge des Fachs mit Zellbiologie, Pathophysiologie und Humangenetik klarstellt. Die zugrunde liegenden experimentell-methodischen Ansätze werden in den anderen Kapiteln dieses Buches genauer dargestellt.

3.3.2 Das menschliche Genom als Textspeicher Aus bioinformatischer Sicht enthält das menschliche Genom die Gesamtheit aller Baupläne, aller Strukturund Regulationsinformationen, die von jeder Zelle benötigt wird, um ihre Lebenstätigkeit aufrecht zu erhalten. Beim vielzelligen Organismus enthält es zudem die Informationen, die die notwendige Kommunikation und Steuerung zwischen den Zellen ermöglichen. Eine vollständige Kopie des Genoms wird bei jeder Zellteilung auf jede Tochterzelle übergeben. Auch bei der Entwicklung von Individuen einer neuen Generation, beginnend mit der Befruchtung der weiblichen Eizelle durch eine Spermazelle, wird ein voller Informationssatz aus den elterlichen Informationen gebildet und auf den zukünftigen Nachkommen übertragen. Das menschliche Genom lässt sich zum einen als materielle Struktur und zum anderen auch als Informationsbestand beschreiben. Sein wichtigster Bestandteil sind die 46 Chromosomen, die in jedem Kern einer Zelle mit diploidem Chromosomensatz in kondensierter Form vorhanden sind und mit speziellen Verfahren sichtbar gemacht werden können oder spontan bei der Zellteilung (Mitose) sichtbar werden. Jedes Chromosom besteht aus zwei fadenförmigen DNS-Molekülen, die als Doppelhelix verknäuelt und von zahlreichen Strukturproteinen umgeben als Nukleosomen vorliegen. Ein DNS-Faden wäre im aufgewickelten Zustand (was nur durch technische Tricks zu erreichen ist und in der Natur nicht vorkommt) einige Meter lang und besteht als Biopolymer aus einer Sequenz von einigen hundert Mio. Nukleotiden. Es gibt vier Arten von Nukleotiden, die mit chemischen und biochemischen Methoden an ihren Purin- bzw. Pyrimidinbasen erkennbar sind und mit den Buchstabenabkürzungen A und G sowie C und T bezeichnet werden. Dieser Übergang zur Abkürzung durch Buchstaben markiert den Übergang von der Biochemie zur Informatik und Textverarbeitung. Die Primärstruktur der DNS kann damit als Textfolge von entsprechend vielen Buchstaben verstanden werden. Die chemische Struktur sichert eine eindeutige Leserichtung des DNS-Textes: Man liest vom 5‘-Ende zum 3‘-Ende des Moleküls. Eine Sequenz, die in umgekehrter Reihenfolge gelesen würde, ergäbe ein anderes Molekül (so wie jeder unserer buchstabenkodierten Texte in der Schriftsprache nur in einer

definierten Leserichtung Sinn ergibt – von links nach rechts in lateinischer und von rechts nach links in arabischer und anderen Schriftsprachen). In der DNS-Doppelhelix sind zwei Fäden miteinander verwunden, die durch Wasserstoffbrücken zueinander komplementärer Nukleotide zusammengehalten werden. Zu jedem DNS-Text (z. B. 5‘}ATTTCG}3') gehört auf dem anderen Strang ein komplementärer Text (also in gegenläufiger Richtung gelesen: 5'} CGAAAT}3'), sodass die DNS üblicherweise komplementär gepaart auftritt: 5‘…A T T T C G…3‘ | | | | | | 3‘…T A A A G C…5‘

usw.

Das gesamte menschliche Genom befindet sich als Text kodiert in den 46 Chromosomen und umfasst ca. 3 Mrd. zueinander komplementärer Basenpaare (Nukleotidbausteine), als nahezu identische „Sicherungskopie“ jeweils doppelt vorhanden. Die Chromosomen sind nach ihrer Größe, der enthaltenen Textlänge und zahlreichen anderen Eigenschaften karyotypisch deutlich unterscheidbar. Es werden 44 Autosomen und zwei Geschlechtschromosomen unterschieden. Die Autosomen bilden 22 „homologe“ Paare von jeweils mikroskopisch sehr ähnlichen (gleich langen) und in ihrem molekularen Text nahezu gleichen Exemplaren (Unterschiede in der Textfolge zwischen homologen Autosomen treten nur alle 100 bis 1.000 Buchstaben auf). Die Autosomen werden nach ihrer Größe geordnet mit Nummern von 1 bis 22 versehen. Beim weiblichen Geschlecht finden sich weiterhin zwei wiederum zueinander sehr ähnliche X-Chromosomen, beim männlichen Geschlecht je ein X- und ein Y-Chromosom, die deutlich verschieden sind (das Y ist klein, während das X eines der größeren Chromosomen ist). Mit histologischen Methoden kann man auf den Chromosomen und damit auch auf dem zugehörigen DNS-Doppelfaden feiner unterteilte Abschnitte (Banden) unterscheiden, für die eine genau vereinbarte Nomenklatur vorliegt. So kann man DNS-Veränderungen (Deletionen, Translokationen) oft bereits mikroskopisch charakterisieren, ohne dass man alle Einzelheiten des zugehörigen Textes aufklären muss (analog wie bei einem Buch: wenn in einem Exemplar eine Seite oder ein ganzes Kapitel fehlt). Eine solche mikroskopisch nachweisbare Veränderung umfasst allerdings Hunderttausende, wenn nicht Millionen Buchstabenpaare des molekularen DNS-Textes. Geringfügigere Veränderungen lassen sich nur mit molekulargenetischen Methoden erfassen, indem man den Genomabschnitt kloniert und sequenziert. Neuerdings kann die Feinstruktur auch durch die PCR-Reaktion direkt und durch Hybridisie-

335 3.3 · Bioinformatik

rungs-Chips indirekt, aber fehlerfrei, nachgewiesen werden. Der Genomtext liegt im ruhenden Kern als DNSDoppelfaden in Eiweiß (Histon) verpackt vor und ist damit strukturell ganz analog wie ein informatisch kodierter Text z. B. im Plattenspeicher eines PCs. Und ebenso, wie ein Schaden im Plattenspeicher ärgerlich für den Nutzer ist, weil der Textabschnitt unlesbar wird, so kann ein Schaden im DNS-Text (durch chemische Mutagene, Röntgen- oder UV-Strahlung und andere Einwirkungen) die kodierte Information unlesbar machen und damit die zelluläre Funktion zerstören. Diese Analogie setzt sich auch dahingehend fort, dass man den Textinhalt eines Genomabschnitts in den Speicher eines Computers einschreiben kann. Verwendet man zur Speicherung eines Nukleotidpaars ein Byte (man kann natürlich einen 4-Buchstabentext auch dichter packen), dann passt das menschliche Genom in eine Datei von ca. 3 Gigabyte, also in den Speicher eines modernen PC’s. Einen Überblick über die moderne informatische Darstellung des menschlichen Genoms kann man sich auf der Website des European Bioinformatics Institute (EBI) verschaffen. Eine mögliche Einwahl ist über die Adresse www.ensembl.org/, und dort kann man dann das Icon von Homo sapiens anwählen und alle zusammengefassten Informationen aufsuchen. Eine alternative Darstellung, die durch ständigen Abgleich praktisch den gleichen Informationsgehalt hat, findet man bei einer Visite der Homepage des NCBI (National Center of Biotechnology Information) in den USA (www.ncbi.nih. gov/), von der aus man sich beispielsweise zu den Sequenzdaten für Homo sapiens durchwählen kann (http:// www.ensembl.org/Homo_sapiens/index.html). Allerdings ist die dargestellte Genomsequenz nicht diejenige eines bestimmten Individuums, sondern ein sog. Referenz- oder Standardgenom eines virtuellen Individuums. Will man alle individuellen Varianten erfassen, so braucht man bedeutend größere Speicherkapazitäten – für die nächsten Jahrzehnte ein sehr wahrscheinlicher Bedarf: Mit entsprechend gestalteten DNA-Chips wird man nämlich schon in naher Zukunft alle Unterschiede eines individuellen Genoms vom Standard feststellen können. Was man bisher über die Buchstabenunterschiede an einzelnen Positionen des Genomtextes gefunden hat, ist in der Datensammlung dbSNP („data base of SNPs“, „single nucleotide polymorphisms“) des NCBI einsehbar. Die Verschlüsselung der Genominformation als buchstabenkodierter Text ist selbstverständlich eine Umschreibung. Im Computer wird Text als Schaltzustand von Transistoren dargestellt; auf dem Bildschirm oder auf dem Papier sind es die geometrischen Formen von Schwärzungen auf einer ebenen Fläche. In der Zelle bestimmt die spezifische Nukleotidfolge der DNS über

3.3

physikochemische Wechselwirkungen die molekulare Feinstruktur des Moleküls. Der DNS-Doppelfaden bildet nämlich nur bei oberflächlicher Betrachtung eine homogene Wendeltreppe, während die spezifische Abfolge sich in Unterschieden der Feinstruktur widerspiegelt. Die Erkennung von Nukleotidfolgen in der geöffneten DNS erfolgt über diese Struktur: Ein Eiweißmolekül beispielsweise, das die Transkription eines DNS-Abschnitts reguliert, „erkennt“ die zugehörige Regulatorstelle der DNS, weil an sie seine regulierende Domäne mit deutlich höherer Affinität als für alle anderen DNS„Textstellen“ gebunden wird. Im Ergebnis erkennen alle Eiweißmoleküle, die in irgendeiner Form mit DNS interagieren (erkennen, spalten, ligieren, kopieren), den Text nach räumlichen physikochemischen Eigenschaften, aber im Prinzip analog wie die CPU eines Prozessors, freilich nicht immer mit gleicher Präzision. Die Mechanismen der DNS-Reparatur machen sich zumeist die Anwesenheit des komplementären Strangs zunutze, ähnlich wie man eine Computerdatei durch Mehrfachspeicherung oder selbstkorrigierende Verschlüsselung sichern kann. Die strukturelle Analogie zwischen DNS-Text und Computerdatei reicht noch weiter. So wie ein Text aus dem peripheren Speicher in die Zentraleinheit gelesen werden kann, so wird die Nukleotidsequenz eines Moleküls in RNS umgeschrieben. Sie liegt dann in gleicher Leserichtung als spezifische Nukleotidabfolge vor, mit dem Unterschied, dass das Thymidinnukleotid (T) durch ein Uracilnukleotid (U) ersetzt ist. Die RNS bildet auch keine Doppelhelix aus, sondern ist als Fadenmolekül direkt durch Enzyme zu bearbeiten (spleißen, spalten, verlängern usw.). Und so, wie ein Text aus dem Zentralspeicher auf den Bildschirm umgesetzt werden kann, so kann die Boten-RNS als Vorlage für die Synthese eines Eiweißmoleküls dienen, wobei nunmehr 3 Buchstaben (ein Kodon) für einen spezifischen Aminosäurebaustein kodieren. Ein ziemlich kleiner Anteil des menschlichen Genoms wird auf diese Weise als Bauvorschrift für Eiweiße der Zelle benutzt. Man kann diesen Anteil schätzen. Das menschliche Genom kodiert für (geschätzt) ca. 100.000 durch ihre Aminosäuresequenz unterschiedene Eiweiße. Manche Variation entsteht dabei durch Umorganisation von vorhandenen Genabschnitten, denn es gibt nur ca. 25.000 Gene (im Sinn von kodierenden DNS-Abschnitten). Ein Eiweißmolekül besteht im Mittel aus etwa 500 Aminosäuren, d. h., es ist durch 1.500 Nukleotide kodiert. Also kodieren mindestens 1.500 u25.000 = 37,5 Mio. DNS-Buchstaben für alle nachweisbaren Eiweiße, das sind 1,25% von 3 Mrd. DNS-Text-Buchstaben insgesamt. Es ist heute noch nicht klar, welche Funktion die 98,75% „Rest“-DNS erfüllen, wenn man von einem geringen Anteil an regulatorischen Orten in der Nähe von eiweißkodierenden

336

Sektion 3 · Diagnostik

Sequenzen absieht, mit denen Öffnung und Transkriptionsgeschwindigkeit solcher Sequenzen gesteuert wird. Es hat den Anschein, als ob große Teile des menschlichen Genomtextes sinnlos sind: vielleicht Platzhalter für evolutionär neue Information, ähnlich wie im Plattenspeicher eines Computers beliebiger „Müll“ stehen kann, bis eine bestimmte Instruktion ihn mit definiertem Inhalt versieht. Für die informatische Behandlung des menschlichen Genoms ist es eine entscheidende Komplikation, dass die kodierenden Textdateien keineswegs kompakt vorliegen, sondern weit verstreut über den Gesamtgenomtext und zudem noch in „zerhackter“ Form, also mit nichtkodierenden Textabschnitten (Introns) zwischen den kodierenden Teilstücken (Exons). So kann ein längeres Eiweißmolekül von z. B. 1.000 Aminosäuren gelegentlich durch z. B. 50 solcher Exonabschnitte unterschiedlichster Länge (im Mittel also 60 Nukleotide pro Exon) kodiert sein. Dazwischen sind dann z. B. 30.000 Buchstaben als Introns (also ein 10-facher Textumfang!) eingebaut. Auch für diese verteilte Speicherung gibt es eine Analogie bei der Speicherung von Dateien z. B. auf einer Diskette; allerdings gibt es für das Genom kein Dateiverzeichnis, nach dem man den sinntragenden Text ermitteln kann. Der zelluläre „Spleißmechanismus“ ist vielmehr aufgrund örtlicher Besonderheiten der Raumstruktur der DNS in der Lage, Exons und Introns zu unterscheiden und die Bruchstücke richtig zusammenzufügen. Der Molekularbiologe, dem ein Genomabschnitt als DNS-Text vorliegt, hat also die Aufgabe, diese Kodierungsstruktur zu entschlüsseln, wenn er erkennen will, was für ein Eiweiß oder was für eine Ribonukleinsäure in diesem Abschnitt kodiert und wie ihre Ablesung reguliert ist. Für diese Aufgabe steht ein ganzes Arsenal von Computerprogrammen zur Verfügung, die mit mathematischen Methoden in den vorliegenden Genabschnitten Exons, Introns, Promoter-Strukturen und andere Transkriptionsfaktorenbindungsorte, Spleißorte usw. vorherzusagen gestatten und damit die genaue experimentelle Aufklärung der genetischen Architektur durch geeignete Arbeitshypothesen erleichtern. Diese Methoden sind in den einschlägigen Darstellungen der Bioinformatik unter dem Allgemeinbegriff „gene prediction“ auffindbar (siehe z. B. Mount 2001).

3.3.3 Sequenzanalyse als Basis der Bioinformatik Historisch gesehen hat sich die Bioinformatik in den späten 1980er Jahren aus dem Spezialgebiet der Sequenzanalyse von Biomakromolekülen entwickelt. Seit den 1960er Jahren konnte man Aminosäuresequenzen von Eiweißen und seit den frühen 1980er Jahren Nukleotid-

sequenzen von Nukleinsäuren ermitteln, und das Wissen nahm sowohl dem quantitativen Ausmaß nach als auch hinsichtlich des qualitativen Verständnisses so stark zu, dass die klassischen Methoden der Papier- und Bleistiftanalyse von Sequenzen durch den Einsatz von Computerprogrammen ersetzt werden mussten. Alle bioinformatischen Verfahren, die das Genom als Text auffassen, arbeiten mit gemeinsamen Werkzeugen, die man als Ähnlichkeitsanalyse auffassen kann. Beispielsweise kann man DNS-Abschnitte verschiedener Arten als funktionsgleich nachweisen, wenn der Text übereinstimmt. Man gibt dem Computerprogramm für beide Genome einen Suchauftrag und findet identische oder fast identische Textstellen. Für die Auffindung von teilweise identischen Segmenten kann man entsprechende logische Ausdrücke bilden, ähnlich wie man in einem Text mit dem Suchmuster „Sonne“ Einträge wie „Sonnensegel“ und „Sonnenflecken“ gemeinsam heraussuchen kann. Auf diese Weise kann man in genomischen Datenbanken z. B. alle β-Globin-Sequenzen der verschiedensten Tierarten heraussuchen und danach einen Stammbaum aufstellen. Ähnlichkeit erscheint hier als Identität oder Nahezu-Identität von Buchstabenfolgen. Mit gewissen Einschränkungen kann man Textähnlichkeit als evolutionäre Verwandtschaft interpretieren: Man spricht von Homologie. Dazu allerdings reicht das Kriterium von anteiliger Identität der Buchstabenfolge nicht mehr aus. So sind im Deutschen die Worte „Drommete“ und „Trompete“ durchaus verschieden, sodass man sie in einem Lexikon nicht als Verwandte auffinden wird. Ihre hohe Ähnlichkeit wird man nur erkennen, wenn man sie untereinander anordnet (ein „alignment“ bildet), Drommete | | | | | ||| Tr om p et e, und dann berücksichtigt, dass die Paare D/T und M/P ähnliche Laute sind, die längerfristig über Aussprachevarianten ineinander übergehen können. Man erkennt dann die evolutionäre Verwandtschaft, die Homologie, beider Textstellen. Das ist auch ein Hinweis auf gleiche Bedeutung, allerdings kein zwingender: Auch verwandte und fast gleich klingende Wörter können verschiedene Bedeutung tragen („Post“ vs. „Posten“). Die Analyse von genomischen Sequenzen mithilfe von mathematischen Algorithmen ist zu einem wichtigen Werkzeug der molekularen Genetik geworden. Es gibt seit einigen Jahren Standardverfahren dieser Methode in zahlreichen Varianten (z. B. BLAST, FASTA). Sie sind über Internet für jeden Nutzer zugänglich, der einen Such- oder Analyseauftrag formuliert und eine Aufstellung der hinsichtlich Textähnlichkeit am meisten

337 3.3 · Bioinformatik

verwandten Sequenzen aus den Genomdatenbanken erhält. Im Zusammenhang mit dem Begriff der Homologie ist die statistische Signifikanz von Sequenzähnlichkeit von entscheidender Bedeutung. Das Grundprinzip hierfür lautet: Die Ähnlichkeit zweier Sequenzstücke ist signifikant, wenn ihr Auftreten durch Zufall zwar nicht unmöglich, aber doch außerordentlich überraschend wäre. Zur Illustration, wie dieses Prinzip eingesetzt wird, sei kurz die mathematische Behandlung eines einfachen Falles skizziert. Wir nehmen an, dass wir einen vorhandenen Textabschnitt Buchstabe für Buchstabe erwürfeln wollten. Die Wahrscheinlichkeit dafür, dass wir den jeweils richtigen Buchstaben treffen, sei mit p bezeichnet (für das 4-Buchstaben-Alphabet der DNS ist p ungefähr bei 0.25, wenn jeder Buchstabe etwa gleich häufig auftritt). Die Wahrscheinlichkeit, ein Wort der Länge L (z. B. aus L=10 Buchstaben) richtig zu erwürfeln, ist gleich dem Produkt aus den einzelnen Wahrscheinlichkeiten, also p up up u}up = pL. In einer Datenbank, die N+L Buchstaben enthält (z. B. N = 1 Mio.), suchen wir das Wort und nehmen an, dass wir mit einem Fenster mit der Buchstabenlänge L über die Buchstabenfolge gleiten und jedes Mal auf volle Übereinstimung testen. Es gibt N verschiedene Fensterpositionen mit Textausschnitten von jeweils L Buchstaben. Das bedeutet, dass wir den Versuch, das Wort zu erwürfeln, N mal unabhängig (nicht vollständig, wegen der Überlappung von Fenstern, aber praktisch unabhängig) wiederholen. Wie überraschend ist es nun, wenn ich das Wort in der Datenbank von 1 Mio. Textbuchstaben finde? Die Antwort erhält man durch eine indirekte Überlegung. Die Wahrscheinlichkeit Q, dass ich bei einmaligem Versuch das Wort verfehle (also wenigstens eine Abweichung zwischen Suchwort und Textausschnitt in einem Fenster von L Buchstaben registriere) ist gleich 1pL. Die Wahrscheinlichkeit, dass ich bei N Versuchen niemals das Wort treffe, ist das entsprechende Produkt von Einzelwahrscheinlichkeiten, also QN, wofür man als sehr gute Näherung die Exponentialfunktion QN # exp ( N upL) einführen kann. Die Wahrscheinlichkeit, wenigstens einmal das Wort zu treffen, ist wiederum das Komplement dazu: Wahrscheinlichkeit (Wort tritt t1-mal auf) = 1exp (NupL).

3.3

Für p = ¼, L = 10 und N = 106 ermittelt man auf dem Taschenrechner den Wert 0.61. Das bedeutet: Man hat eine gute Chance, das Wort der Länge L = 10 durch Zufall zu treffen; das Auftreten ist nicht überraschend. Beträgt L dagegen 16, dann ist die Wahrscheinlichkeit gleich 2 u104, also sehr klein, sodass der Treffer überraschend ist. Im ersteren Fall würden wir das Auftreten des 10-Buchstaben-Worts in der 1-Millionen-Datenbank als zufällig denkbar, nicht signifikant, im zweiten den 16-Buchstaben-Treffer als hochsignifikant, d. h. unter Zufallseinwirkung als sehr überraschend ausweisen. Diese Berechnungen werden komplizierter, wenn bei der Homologiesuche auch Abschnitte zugelassen sind, die nicht vollständig übereinstimmen, oder wenn Lücken und Einschübe erlaubt sind (s. Karlin u. Altschul 1990; Arratia u. Waterman 1994; Vingron u. Waterman 1994). Das Grundprinzip bleibt jedoch immer das gleiche: Die Wahrscheinlichkeit für das zufällige Auftreten eines Befundes geht mit der Größe der Datenbank (der Anzahl an wiederholten Suchvorgängen) exponentiell gegen Null. Damit einhergehend steigt die „Überraschung“. Man nützt dieses Prinzip für den Entwurf passender sog. Primer für die PCR-Reaktion aus: Ein Oligonukleotid der Länge 10 ist zum Aufsuchen eines bestimmten Genortes ungeeignet, weil es im 3-Milliarden-Genom des Menschen einige Tausend Mal vorkommen müsste. Ein Oligo der Länge 16 ist eher geeignet, da man es mit Wahrscheinlichkeit 0,5 mindestens einmal, aber nicht sehr oft im Genom finden wird. Ein Oligo der Länge 20 hingegen tritt durch Zufall nur mit geringer Wahrscheinlichkeit (0,0027) ein- oder mehrmals auf: Kennt man eine solche Sequenz am interessierenden Ort, dann kann man recht sicher sein, dass sie nicht noch an anderer Stelle durch reinen Zufall zu erwarten ist. In allen Fällen muss man sich aber bewusst bleiben, dass Überraschungseffekt und Signifikanz durch Vergleich mit einem idealisierten Zufallsmodell ermittelt werden. Dessen Grenzen mögen bei einem Umfang des menschlichen Genoms erreicht sein. Das Analogon des Münzwurfs zeigt, dass das Modell nicht mehr plausibel bleibt, wenn die Anzahl der Versuche alle Grenzen überschreiten würde. Die Theorie sagt z. B. für das wiederholte Münzenwerfen, dass man eine ununterbrochene Serie der Länge von 30-mal „Zahl oben“ wenigstens einmal erwarten kann, wenn man 1-Milliarde-mal würfelt – und trotzdem wird niemand mehr an unbeeinflussten Zufall glauben wollen, wenn man eine solche Serie erzielt hat. (Milliardenfacher Münzwurf ist allerdings auch nicht realisierbar; analoge „Zufalls“-Versuche könnte man jedoch z. B. bei radioaktivem Zerfall durchführen).

338

Sektion 3 · Diagnostik

3.3.3.1 Praktische Verfahren der Sequenzanalyse Ein historischer Meilenstein der Entstehung der Bioinformatik als Fach war die Publikation des NeedlemanWunsch-Algorithmus (Needleman u. Wunsch 1970), also einer programmierbaren Rechenvorschrift, mit der ein Computer die verwandtschaftlichen Ähnlichkeiten von Aminosäure- oder Nukleotidbuchstabensequenzen herausfiltern und numerisch bewerten konnte. Der Algorithmus wurde später verfeinert und schneller gestaltet (sog. Smith-Waterman-Verfahren), aber er bleibt weiterhin eines der wichtigsten Werkzeuge der Bioinformatik. In seiner Grundform ermöglicht er das Alignment (buchstabengerechte Anordnung) von ähnlichen Sequenzen und damit die Suche nach bestimmten Sequenzmotiven oder Sequenzen in umfangreichen Datenbanken. Die Suche nach Sequenzübereinstimmungen erfolgt mit den mathematischen Verfahren der dynamischen Programmierung. Die Grundidee ist sehr leicht zu verstehen. Sie wird in den Lehrbüchern der Bioinformatik dargestellt. Im Prinzip stellt man die zu vergleichenden Sequenzen als Buchstabenfolge in der ersten Reihe und der ersten Spalte einer rechteckigen Matrix dar, notiert in den Matrizenzellen den Grad der Übereinstimmung von zwei Buchstaben in den zugehörigen Positionen und sucht dann einen Weg durch die Matrix, bei dem die Übereinstimmung (z. B. die Summe der beieinander liegenden Sequenzabschnitte) möglichst groß wird. Das Aufsuchen ähnlicher Sequenzen oder Sequenzabschnitte aus umfangreichen Datenbanken wird heutzutage durch entsprechende Programme unterstützt. Nahezu alle Programme arbeiten entweder nach dem FASTA oder dem BLAST-Algorithmus, deren Unterschiede im Suchalgorithmus in den einschlägigen Lehrbüchern erklärt werden. BLAST („basic local alignment search tool“) steht dabei für eine Sammlung der am meisten genutzten Sequenzanalyseprogramme und wird vom bereits erwähnten National Center for Biotechnology Information betrieben. Prinzipiell geht es darum, experimentell ermittelte Sequenzen mit bereits in den BLAST-Datenbanken vorhandenen abzugleichen. Eine Suche in der Datenbank erfolgt entweder über ein Webinterface oder mithilfe von lokal installierten Programmen. Seit Mitte der 1980er Jahre werden DNS-Sequenzen in steigendem Maße aufgeklärt und „annotiert“ (d. h. mit ausführlicher Zusatzinformation versehen). Anfangs wurden sie noch in Originalarbeiten in Tabellenform mitgeteilt; aber davon ist man abgekommen, weil der Umfang an Genomtext nicht mehr mit traditionellem Tabellendruck zu bewältigen war. Heute werden neu entdeckte Nukleotidsequenzen in Sequenzdatenbanken gesammelt und über das Internet für die Nutzung zur

Verfügung gestellt. Sie sind untereinander vernetzt, sodass sie sich im Großen und Ganzen auf dem gleichen Informationstand befinden. Die gegenwärtig populärste Sammlung von Nukleotidsequenzen wird als „GenBank“ vom National Center for Biotechnology Information (NCBI) in Bethesda, Maryland (USA) unterhalten (http://www.ncbi.nlm.nih.gov/Genbank/index.html). Sie ist mit einem Kommunikationssystem ENTREZ verbunden (http://www.ncbi.nlm.nih.gov/gquery/gquery. fcgi), das die Vernetzung der zahlreichen Datenbanken durch den Nutzer ermöglicht. Über diese Internetdokumentation kann man auch relevante Literatur aussuchen lassen und hat Zugang anderen Datenbanken, in denen mehr als nur Sequenzen gespeichert und annotiert sind. Genbank wurde vor einigen Jahren mit der „EMBL Data Base“ des European Molecular Biology Laboratory in Heidelberg vereinigt, die jetzt in Hinxton (England) unter dem gemeinsamen Markenzeichen „ensembl“ lokalisiert ist: http://www.ebi.ac.uk/ensembl/). Die Nukleotidsequenzdatenbank enthält Sequenzabschnitte, z. T. vollständige Gene (also die regulatorischen Randabschnitte sowie alle Exons und Introns) und neuerdings in zunehmendem Maße ganze Genome (zunächst kleinere Genome von Mikroorganismen) in Buchstabenform. Neben den langen Nukleotidtexten enthält ein Eintrag (von dem es viele Zehntausende gibt – die Datenbanken wachsen mit hoher Geschwindigkeit) zahlreiche zusätzliche Klartextinformationen, sog. Annotationen, die in einem bestimmten Textformat abgelegt sind: x Zugangskodes für einen Eintrag x Querverweise auf andere Datenbanken, die das gleiche Objekt, oft unter anderen Aspekten, enthalten x Genaue Bezeichnung des Gens oder Genabschnitts x Angaben zur Funktion des zugehörigen Genprodukts (wenn der DNS-Text für ein solches kodiert) x taxonomische Quelle (von welcher Art die Sequenz ermittelt wurde – es wird ein Standardgenom dieser Art angenommen) x Angaben zur Genstruktur des beigefügten Genomtextes (z. B. Exon, Intron, repetitive Abschnitte) x Autorennamen und Referenzen auf Artikel, in denen die Entdeckung mitgeteilt wurde x Statistische Angaben (Länge, Buchstabenhäufigkeit u. a. ) Über diese globale Nukleotidsammlung hinaus gibt es auch Spezialdatenbanken für die genomischen Sequenzen bestimmter, häufig erforschter Arten, die dann auch speziellere Angaben zu diesen Objekten als nur Gensequenzen enthalten, z. B.: x Flybase, eine Datenbank für molekulargenetische Angaben über die Taufliege Drosophila (flybase.bio. indiana.edu)

339 3.3 · Bioinformatik

x ACEDB, die Datenbank für Angaben über den Rundwurm Caenorhabditis elegans, einschließlich seiner Genomsequenz (www.acedb.org, angesiedelt am EBI in Hinxton) x TIGR (The Institute for Genome Research) – enthält partielle und vollständige Genomsequenzen zahlreicher prokaryotischer, protozoischer und Pilzorganismen (www.tigr.org) x SGD (Saccharomyces Genome Database, www. yeastgenome.org/) enthält neben vielen spezifischen Angaben auch die vollständige Sequenz der Bäckerhefe. Neuere Entwicklungen dieser Datenbanken gehen in zwei Richtungen: x Sie werden mehr und mehr zu umfangreichen und komplexen Informationsdateien, bei denen die Gensequenz nur eine Teilinformation darstellt x Der Eintrag enthält nur noch einen geringen Teil der mitgeteilten Information. Er ist vielmehr mit zahlreichen Querverweisen (Links) ausgestattet, über die man Details anwählen kann.

3.3.4 Genomkartierung Bei der genomischen Textanalyse kommt es auf die Beschaffenheit der Sequenz an; bei der Kartierung hingegen geht es darum, wo im Genom sich eine gegebene Sequenz befindet. Ein Gen zu kartieren, d. h. festzustellen, auf welchem Abschnitt welchen Chromosoms sich die zugehörige Information als DNS-Sequenz befindet – das ist eine wesentliche Vorbedingung dafür, dass man ein Gen, das für ein bestimmtes Merkmal (z. B. hoher Cholesteringehalt im Blut) verantwortlich ist, klonieren (d. h. in Bakterien vermehren) und sequenzieren kann. Die Karte eines Genomabschnittes kann man vergleichen mit der Markierung eines Autobahnabschnitts im Autoatlas. In regelmäßigen Abständen entlang der Strecke sind Markierungen aufgestellt, die es z. B. gestatten, sehr genau die Position eines Fahrzeugs mitzuteilen, das liegen geblieben ist. Auf dem Genom spricht man von Markern, und die Abstände zwischen ihnen werden entweder genetisch oder physikalisch definiert. Der physikalische Abstand zwischen zwei Genorten ist definiert durch die Anzahl von Basenpaaren zwischen ihnen. Der genetische Abstand hingegen wird definiert durch die Häufigkeit, mit der es bei der meiotischen Keimzellreifung zum Austausch von genetischem Material zwischen den homologen Orten am Chromosom kommt (Rekombination). Der genetische Abstand wächst monoton, aber nicht streng proportional mit dem physikalischen Abstand. Im menschlichen Genom beträgt der genetische Abstand im Durchschnitt 1 cM (centimorgan),

3.3

wenn der physikalische eine Million Basenpaare (1 Mbp) beträgt. Das Centimorgan ist die Einheit der genetischen Distanz und ist definiert als Rekombinationswahrscheinlichkeit von 1% pro Meiose (man bezeichnet diese Wahrscheinlichkeit auch mit dem Buchstaben θ und definiert 1 cM durch θ = 0,01). Die Rekombinationswahrscheinlichkeit schwankt an verschiedenen Orten des Genoms erheblich um den genannten Durchschnittswert. Man spricht von „hot spots“ (heißen Flecken) und „cold spots“ (kalten Flecken). Zwischen zwei Hot spots kann es längere Abstände ganz geringer Rekombinationshäufigkeit geben. An solchen Abschnitten kommt es also selten zu Rekombination, und deshalb werden große Sequenzabschnitte als unveränderte Kopie weitervererbt. Wenn sich z. B. die DNSInformation für zwei Gene auf dem Chromosom in einem solchen „kalten“ Abschnitt befindet, dann werden die betreffenden Allele mit großer Wahrscheinlichkeit gemeinsam auf ein neues Chromosom übertragen und nicht durch Rekombination auf das homologe Chromosom neu zusammengesetzt. Man sagt, sie seien „gekoppelt“ („linked“). Von Kopplungsgleichgewicht („linkage equilibrium“) spricht man, wenn zwischen den beiden Genorten frei rekombiniert wird, während die mehr oder weniger starke Kopplung (also θ-Werte, die gegen null tendieren) als Kopplungsungleichgewicht („linkage disequilibrium“) bezeichnet wird. Bei der Rekombination werden also stets aus den zwei Ursprungstexten (auf den homologen Chromosomen an der gleichen Stelle befindlich) durch Vermischung zwei neue Texte erstellt, die aber gleich lang sind und im Prinzip den gleichen Inhalt aufweisen. Auf diese Weise kann es z. B. geschehen, dass zwei Buchstabenvarianten, die zuvor auf den verschiedenen Chromosomen auftraten, nach dem Überkreuz-Austausch nunmehr auf demselben vorhanden sind, während das zweite „neue“ gar keine Variante mehr trägt. Ein genetischer Marker war noch in gar nicht fernen Zeiten nicht etwa ein Genomabschnitt, sondern in der Regel eine phänotypisch feststellbare Eigenschaft, die von einem bestimmten Genort vererbbar bestimmt wird. Die zahlreichen Blutgruppen oder HLA-Antigene sind solche Marker, nämlich als Eiweiße sind sie Genprodukte von einem genau feststehenden Genort. Durch geschickte Untersuchungen gelang es, solche Marker zytogenetisch definierten Chromosomenorten zuzuordnen. Mit der technischen Realisierung der Gentextablesung wurden anstatt charakteristischer Genprodukte zunehmend gewisse DNS-Oligonukleotide der Primärstruktur als Marker benutzt, wenn sie nur einmal auf dem Genom vorkommen (im vorigen Abschnitt wurde das Abschätzungsprinzip dargestellt, mit dem man berechnet, wie lang sie sein müssen, damit sie mit hoher Sicherheit nur einmal vorkommen, also Unikate sind). Für jeden von ihnen ist die Position auf dem Chromo-

340

Sektion 3 · Diagnostik

som festzustellen, und dann dienen sie zur Kartierung weiterer Genomabschnitte. Oligos mit bekannter Lokalisierung auf Chromosomen und Abschnitten nennt man STS („sequence tagged site“). Zur Aufstellung einer Karte benutzt man 3 Methoden: x Isolierung eines bestimmten Chromosoms und Feststellung eines Satzes unikaler Markersequenzen auf ihm x Kartierung durch das Radiation-Hybrid-(RH-) Verfahren x Kartierung aus einem Satz von Familienstammbäumen Bei der Verwendung von Oligos als Marker hat man neben der Bedingung der Unikalität auch noch technische Gesichtspunkte zu berücksichtigen, beispielsweise, wie gut sie für die PCR-Reaktion (Enzym, das DNS-Segmente erkennt und kopiert) geeignet sein müssen. Die Kartierung durch Hybridisierung bestrahlter Genomabschnitte („radiation hybrid mapping“) ist eine physikalische und geschieht nach folgendem Prinzip: Der Genomabschnitt wird durch Klonierung vervielfältigt, und jeder Klon wird mit einer kräftigen Röntgendosis bestrahlt. Dadurch entstehen zahlreiche DNS-Bruchstücke unterschiedlicher Länge, die mit gewissen anderen teilweise überlappen. Jedes dieser Bruchstücke wird in die Zellen einer Zellkultur integriert und dadurch vermehrt. In jedem Klon kann man nun das Vorhandensein der Marker testen. Zwei Marker werden im intakten Genomabschnitt umso näher beieinander liegen, je seltener sie durch den zufälligen Schnitt getrennt wurden. Mithilfe dieses paarweisen Vorkommens und der Überlappungen auf verschiedenen Klonen kann ein entsprechend komplexer Computeralgorithmus die lineare Folge der Marker mit hoher Sicherheit feststellen: eine Art Puzzlespiel. Eine andere Variante der Entwicklung eines Panels geht von genetischen Abständen aus. Hier wird ausgenutzt, dass während der Reifungsteilung der Vorläufer der Geschlechtszellen die Chromosomen durch „crossing-over“ weitgehend nach dem Zufallsprinzip Genomabschnitte austauschen (rekombinieren). Hat man nun DNS-Proben von stark verzweigten und über viele Generationen erfassten Familien (wie in dem CEPH-Panel des französischen Centre des Ètudes de Polymorphisme Humain), dann liegen genug Platzwechsel auf andere Chromosomen vor, dass man wiederum nach dem gleichen Prinzip zwei Marker als umso näher beieinander definiert, je seltener die Allele durch Rekombination voneinander getrennt werden. Auch hier gibt es wahrscheinlichkeitstheoretische Algorithmen, die das notwendige Puzzlespiel aufzulösen helfen.

Die gegenwärtig am besten ausgearbeiteten RH-Karten werden von folgenden Institutionen im Internet angeboten: x Whitehead Institute /MIT Center for Genome Research x Stanford Human Genome Center. Das NCBI zeigt eine integrierte RH-Karte. Die populärste genetische Karte des Humangenoms wird vom französischen Généthon Centre entwickelt. Andere Karten sind die deCode Map und die Marshfield Map. Eine internationale Datenbank für die Annotation des humanen Genoms wird bei www.dbg.org betreut. Das bereits erwähnte, vom NCBI in Bethesda bei Washington unterhaltene Informationssystem bietet auch genetische und physikalische Karten an, die ebenso wie Nukleotid- und Proteindatensammlungen über die Suchmaschine ENTREZ angesprochen werden können. Zum System gehört ein grafisches Interface, das es gestattet, speziell Karten des humanen Genoms aufeinander abzubilden und, wo es möglich ist, auch Sequenzdatenbanken einzubeziehen. Schließlich ermöglicht das System auch Querverweise auf die Datenbank OMIM von humanen Krankheitsbildern, die nach den Mendelschen Gesetzen vererbt werden. Für all diese Vergleiche und Recherchen bietet das System ein verzweigtes Panel zur interaktiven Informationsrecherche an.

3.3.5 Vergleichende Genomanalyse: Die evolutionäre Verwandtschaft allen Lebens Nachdem Ende der 1980er Jahre zunächst die Idee vorherrschte, vor allem das menschliche Genom zu kartieren und zu sequenzieren, hat sich inzwischen die Erkenntnis durchgesetzt, dass viele molekulargenetische und medizinisch relevante Sachverhalte sich weit besser an sog. „Modellgenomen“ studieren lassen – das sind Genome von Spezies, die aufgrund ihrer Struktur leichter aufzuklären und außerdem direkter experimenteller oder züchterischer Bearbeitung zugänglich sind. Gegenwärtig stehen die Genome von Labormaus, Laborratte, Zebrafisch, Fugu-Fisch, Rundwurm Caenorhabditis elegans (C. elegans), Taufliege Drosophila melanogaster und Bäckerhefe S. cerevisiae im Vordergrund des komparativ ausgerichteten Forschungsinteresses. Das ganze Projekt ist deshalb fruchtbar, weil, wie sich inzwischen herausstellte, die Organisations- und Steuerungsprinzipien der Genome und sogar die Strukturen einzelner Gene im Tierreich nach einem einheitlichen Prinzip aufgebaut sind, was dem komparativen Ansatz für jeweils passende Fragestellungen hohe Aussagekraft verleiht. Das Maus-

341 3.3 · Bioinformatik

genom weist hohe Ähnlichkeit mit dem menschlichen Genom auf, und die Unterarten Mus musculus und Mus spretus sind (wegen der Möglichkeit der experimentellen Inzucht) genetisch weit besser charakterisiert als Homo sapiens. Der Zebrafisch Danio rero hat einen embryonalen Zyklus, der bei weitgehend durchsichtigem Körper im Aquarium (nicht im Ei oder in utero) stattfindet. Der japanische Fugu-Fisch hat ein sehr kompaktes Genom, das aber kartographische Ähnlichkeit mit dem menschlichen aufweist und als Studienmodell für den Nachweis von Genstrukturen (Exon-Intron) von Nutzen ist. Drosophila melanogaster schließlich ist seit hundert Jahren genetisch charakterisiert und kartiert worden, und es ist eine Fülle von Genen und Mutationen der Organdifferenzierung bekannt, wobei überraschend viele Analogien zu Homo sapiens nachgewiesen sind. Drosophila ist darüber hinaus hervorragend geeignet, um embryonale Entwicklungsprozesse zu studieren, z. B. die Ausprägung von Augen- oder Flügelanlagen als polygenes Phänomen. Die Hefe Saccharomyces ist das wichtigste Studienobjekt für die Erforschung des Wachstumszyklus der Zelle. Bei Caenorhabditis elegans tritt Eutelie auf, d. h., der reife Fadenwurm hat stets die gleiche Anzahl von 959 Körperzellen, von denen jede ganz individuell differenziert ist, wodurch man Prozesse der Genexpression gut studieren kann (abgesehen davon, dass das Tier leicht auf Agarkolonien von Bakterien zu züchten ist). An C. elegans hat man darüber hinaus den neuralen Entwicklungsprozess sowie die zelluläre Architektur der Apoptose genetisch aufgeklärt. Die Bedeutung für die medizinische Grundlagenforschung ist mit diesen kurzen Skizzen nur im Umriss erfasst. Wesentlich ist jedoch, dass für diese Modellorganismen die volle genomische und Genomexpressionsinformation ermittelt wird. Gerade der Vergleich der Genome zwischen so genau charakterisierten, aber in völlig verschiedenen Lebensbedingungen existierenden Arten (zu denen dann noch zahlreiche Bakterien- und Parasiten- sowie pflanzliche Genome kommen) hat einen sprunghaften Fortschritt in der Aufklärung auch des menschlichen Genoms hervorgebracht. Für Analysen dieser Art bietet das NCBI die Oberfläche ENTREZ an, in der neben vielen anderen Informationen auch die physikalischen und genetischen Karten verschiedener Organismen aufeinander abgebildet werden und verglichen werden können.

3.3.6 „Transkriptom“: Expressionsanalyse des Genoms Unter Genexpression versteht man die Transkription von DNS-Abschnitten in Struktur-RNS und Boten-RNS sowie die Umsetzung der Boten-RNS-Sequenzen in Pro-

3.3

tein. Das Genom enthält Bauplaninformation für Genprodukte (Eiweiße und manche RNS) und auch Steuerungsinformation für den Abgriff (Promoter-, Enhancer-Sequenzen usw.) und für die Spleißung (Donor- und Akzeptorstellen für das Spleißen). Da jede Körperzelle den gleichen Informationsbestand aufweist, unterliegt sowohl die Tatsache der Ablesung (jede Zelle liest überhaupt nur einen Teil der Information) als auch die dabei hergestellte Molekülzahl sorgfältiger Steuerung. Bei funktionellen oder entwicklungsdynamischen Änderungen des Zellstoffwechsels ändern sich diese Verhältnisse. Zum Beispiel hat eine Tumorzelle ein anderes mRNS-Profil als die zugehörige gesunde Zelle; ebenso ist das Genproduktspektrum vom Funktions- und Krankheitszustand einer Zelle abhängig. Wenn man berücksichtigt, dass jede Körperzelle einige Tausend bis mehrere Zehntausend verschiedener Genprodukte abgreift, dann wird die Komplexität dieser Vorgänge klar: Nach der elektrophoretischen Auftrennung markierter Transkriptsegmente oder Peptidspaltprodukte entstehen Muster mit Tausenden von Banden oder Flecken, deren unterschiedliche Farbintensität auf quantitative Unterschiede hinweist. Neuerdings ist es gelungen, das Prinzip der Hybridisierung, d. h., dass sich zueinander komplementäre Nukleinsäureabschnitte durch Wasserstoffbrückenbindung sehr spezifisch verbinden können, auch für die Analyse der Genexpression (d. h. Ablesung der Gene) in großem Maßstab verwendbar zu machen. Man stellt beispielsweise Mikrochips her, auf denen Oligonukleotide in mikroskopisch kleinen, aber sehr genau auffindbaren Abständen aufgebracht sind, sodass eine zu einem individuellen Oligonukleotid komplementäre mRNS-Sequenz (oder -teilsequenz) fest gebunden und mit Farbverfahren sichtbar gemacht wird. Auf diese Weise kann man ein quantitativ bewertbares Muster der in einer Zelle auftretenden individuellen mRNS-Moleküle gewinnen. Diese Transkriptomanalyse ist ein Zwischenschritt zur Proteomanalyse, da die mRNS nur ein Zwischenschritt zur Proteinsynthese ist und die Anzahl an mRNS-Molekülen aufgrund von weiteren Bearbeitungsprozessen noch nichts quantitativ Genaues über die letztlich in den Ribosomen gebildete Anzahl von Proteinmolekülen aussagt, deren Analyse das eigentliche Ziel der funktionellen Genomik ist. Gegenwärtig werden in großem Umfang Datenbanken von EST-Sequenzen angelegt. EST („expressed sequence tags“) werden gewonnen, indem man BotenRNS in DNS umschreibt (mit dem Enzym Transkriptase) und dann PCR-sequenziert. Im Ergebnis liegen „Genschnipsel“ der Länge von einigen Hundert Nukleotiden vor, von denen gewiss ist, dass sie transkribiert wurden. Oft lässt sich aus ihnen auch die Exonstruktur ableiten, wenn der zugehörige genomische Abschnitt

342

Sektion 3 · Diagnostik

ebenfalls vorliegt. Vor allem aber sind ESTs, wenn sie hinreichend deutlich auf das zugehörige Gen verweisen, ein Hinweis darauf, dass das Gen im gegebenen Funktionszustand der gegebenen Zelle exprimiert wird. EST-Datenbanken sind ein wertvolles Hilfsmittel in der bioinformatischen Analyse des menschlichen und anderer Genome.

3.3.7 Proteomik: Das Eiweißprofil einer Zelle Während bis in die 1980er Jahre das Studium des Genoms und des Zellstoffwechsels weitgehend voneinander getrennt verliefen und nur geringfügig integriert abliefen, hat sich neuerdings eine enge Verzahnung herausgebildet. Die mächtige methodische Kopplung besteht darin, dass heutzutage anstelle der direkten Sequenzierung der Primärstruktur eines Eiweißes die Sequenzierung der zugehörigen genomischen DNS und Übersetzung in die Proteomsprache weitaus einfacher ist. Die DNS-Sequenz-Datenbanken enthalten Angaben über die kodierenden Abschnitte, die sich einfach in Aminosäuresequenz umsetzen lassen. Die Mehrzahl der neu entdeckten Proteine, besonders solche, die nur in Spuren in der Zelle vorkommen, sind über den zugehörigen Sequenzbauplan im Genom gefunden worden. Man kennt auf diese Weise die Sequenz von Zehntausenden von „vermutlichen“ Proteinen, für die noch keine Funktion bekannt ist. In manchen Fällen lässt sich die Funktion durch „Knockout“-Versuche ermitteln: Man schaltet das zugehörige Gen ab oder inaktiviert es durch gezielte Mutagenese (Maus, Zebrafisch und Taufliege sind geeignete Modellorganismen) und ermittelt die Auswirkungen im Phänotyp. Leider sind diese oft nicht deutlich oder dadurch verdeckt, dass andere Genabschnitte für die Funktion kompensatorisch einspringen. Über das Studium von individuellen Protein-Protein-Wechselwirkungen im Hefemodell lassen sich mitunter erstaunlich präzise Vorhersagen über die funktionelle Rolle von Proteinen gewinnen. Als Informationsbestand darüber, welches Protein überhaupt zu welchem Protein „passt“, d. h. in Wechselwirkung treten könnte, weil sie sich aneinander binden können, ist die Analyse des Proteombestands von Zellen und Organen von eminenter Bedeutung. Das Gebiet der „Proteomik“, das sich mit dem Eiweißprofil von Zellen und Geweben in verschiedenen Entwicklungszuständen des Organismus (klassifizierbar nach Alter, Geschlecht und ggf. Krankheitszustand) oder physiologischen oder pathologischen Funktionszuständen von Zellen befasst, hat einen stürmischen Aufschwung durch den Ausbau neuer Nachweisverfahren

wie 2D-Gelektrophorese und durch den molekülgenauen Nachweis von Peptidfragementen mittels Massenspektroskopie genommen. Die Komplexität dieser zellbiologischen Zustandsbeschreibungen hat einen neuen Teilzweig der Bioinformatik mit wieder neuen Computerprogrammen und Auswertungsverfahren stimuliert. In dieser Situation kann die „In-silico“-Analyse (d. h. Computeranalyse) von Proteinsequenzen von großem heuristischen Wert sein. Speziell annotierte Datenbanken (z. B. die am EBI betreute Datenbank „SwissProt“ einer Genfer Forschergruppe) erlauben ein systematisches Studium von Proteinen anhand ihrer Sequenz. Es hat sich herausgestellt, dass es in den Hunderttausenden bekannter Proteinsequenzen nur einige Tausend unterschiedliche Sequenzdomänen gibt, die in der Evolution recht gut konserviert und daher an ihrer Homologie erkennbar sind. Das Universum von Proteinprimärstrukturen lässt sich so in einige Tausend Proteinfamilien und -superfamilien (bestehen aus Proteinen, die nur gewisse Domänen gemeinsam haben) klassifizieren. Es ist bereits heute ein häufiges Ereignis, dass eine neu abgelesene DNS-Sequenz durch Homologievergleich der zugehörigen Proteinsequenz funktionell eindeutig charakterisiert werden kann (z. B. als Hexokinase oder Tyrosinkinase). Die vergleichende Sequenzanalyse von Proteinen macht sich nicht nur die Familienähnlichkeit von Eiweißen bezüglich ihrer evolutionären Herkunft zunutze, sondern auch die Tatsache, dass auch die Raumstruktur von Proteinen gewissen Gesetzmäßigkeiten folgt, die auf der Sequenzebene erkennbar sind (allerdings nicht eindeutig, 7 3.3.8).

3.3.8 Strukurbiologie: Die Analyse der molekulären Raumstruktur von Proteinen und Nukleinsäuren Die Sequenz eines Proteins ist im Genom als DNS-Nukleotidfolge abgespeichert. Aber die biologische Bedeutung dieser Information realisiert sich in der Zelle nicht als Text, sondern als Raumstruktur, die die Proteinkette einnimmt. Dabei gibt es spontan entstehende Strukturen und solche, in die die Kette hineingeprägt wird. Spontan entstehen Raumstrukturen, wenn die Seitenketten der Aminosäuren untereinander oder mit dem wässrigen Milieu in Wechselwirkungen treten, die einen stabileren Zustand herstellen (Wasserstoffbrücken, hydrophobe Wechselwirkungen u. a. ). Den im Ribosom entstehenden Proteinfäden werden darüber hinaus gewisse Strukturen durch die zellulären Membranen aufgeprägt, in die sie hineingefaltet werden oder durch die sie geschleust werden, um an ihren Wirkort zu gelangen (z. B. Signalpeptide kanalisieren den Durchgang durch Membranen).

343 3.3 · Bioinformatik

Die Struktur von Proteinen im zellulären Milieu lässt sich aus ihren Kristallen durch Röntgenbeugung und bei kleineren Proteinen in Lösung durch magnetische Kernresonanzspektroskopie ermitteln. Mit weiteren physikalischen Methoden lässt sich die Dynamik dieser Raumstruktur bei der Ausübung der Funktion (z. B. der Katalyse oder der Bindung von Liganden) vermessen. Solche Raumstrukturen liegen bei vielen Hunderten von Proteinen vor, und die Zahl wächst stetig. Sie liegen als umfangreiche Sätze von relativen Raumkoordinaten jedes Atombestandteils, aus dem das Molekül besteht, vor. Die Datenbank PDB (http://www.rcsb.org/pdb/) des Research Collaboratory for Structural Bioinformatics (RCSB) stellt die weltweit ermittelten Raumstrukturen in kompakter Form vor. Neben den notwendigen Quellund Referenzannotationen und Hinweisen auf die zelluläre Funktion werden auch gewisse Charakterisierungen der Struktur vorgenommen. Beispielsweise wird aus dem Rückgrat der Raumstruktur (der fortlaufenden Kette von Peptidbindungen) auf die Sekundärstruktur (Helix, Faltblatt, Knäuel) des entsprechenden Abschnitts geschlossen. Wie bereit erwähnt, lassen sich auch schon aus der Primärstruktur mit gewisser Sicherheit die Sekundärstrukturen vorhersagen (z. B. falten sich Abfolgen hydrophober Aminosäuren gern zum Faltblatt). So gibt es Vorhersagealgorithmen für die wahrscheinliche Sekundärstruktur eines Sequenzabschnitts. Noch erfolgreicher ist es, für einen gegebenen Sequenzabschnitt (ein „Wort“) einen ähnlichen Abschnitt in der PDB aufzusuchen und aus dessen Struktur auf die der Testsequenz zu schließen. Der DALI-Server (http://www.ebi.ac.uk/dali/), von einer Forschergruppe in Helsinki entwickelt und betreut, ermöglicht eine solche Analyse (s. Holm u. Sander 1996). Dabei handelt es sich um einen Netzwerkdienst, der dreidimensionale Vergleiche von Proteinstrukturen ermöglicht. Man kann strukturell ähnliche Proteine zu einer gegebenen Sequenz mithilfe von Datenbankwerkzeugen identifizieren. Hierbei wird sowohl ein Arsenal von Faltungsmustern gängiger Proteinklassen als auch ein umfangreiches Programmsystem zur Identifizierung von Sekundärstrukturen bereitgehalten. Die theoretische Vorhersage der Sekundärstruktur eines Sequenzabschnitts ist gegenwärtig nicht mit überzeugender Sicherheit möglich. Gleichwohl ist sie ein wichtiges Element für die Vorhersage der 3D-Struktur eines Eiweißes. Die Raumstruktur eines Eiweißes kann mithilfe von Röntgenbeugungsdiagrammen und NMR-Spektren abgeleitet werden. Hierzu sind Computerprogramme für die Bewältigung der Auswertungen und der physikalischen Modellierung unabdingbar. Die Vorhersage von Proteinstrukturen, für die keine Raumstruktur eines verwandten Exemplars bekannt sind, ist gegenwärtig noch sehr unsicher, da eine umfassende physikalische

3.3

Theorie der Faltung fehlt. Die Vorhersage der 3D-Struktur aus der Primärstruktur ist eine der großen Herausforderungen für die Molekularbiologie des 21. Jahrhunderts.

3.3.9 Genetische Diversität des menschlichen Genoms Alle Menschen haben das gleiche Genom, aber jeder mit anderen, quantitativ relativ geringfügigen Varianten. Lediglich eineiige Zwillinge haben zumindest die Textinformation der DNS im Zellkern nahezu vollständig identisch. Kein konkretes menschliches Genom stimmt mit dem Standardgenom, das in den Datenbanken vertreten ist, genau überein. Die Unterschiede sind überwiegend Punktmutationen (in einzelnen Nukleotiden), und sie treten an manchen Genomorten zahlreich, an anderen selten auf. Das liegt daran, ob die Information überlebenswichtig ist oder nicht. Der rote Blutfarbstoff Hämoglobin verträgt nur an wenigen Stellen eine Variation, weil seine lebenswichtige Funktion keinesfalls behindert werden darf. An vielen Positionen wird die Funktionalität durch eine Mutation so eingeschränkt, dass die betreffende Person Nachteile bei der Weitergabe ihrer DNS an die Nachkommen hat: Die Mutation stirbt aus. An anderen, offenbar zahlreicheren Orten des Genoms ist der selektive Druck geringer: Zufällig als Kopierfehler entstehende Varianten bringen dort keinen Nachteil, sodass zwischen den Individuen einer Population im Laufe vieler Generationen Unterschiede entstehen. Die Anzahl variabler Positionen (d. h. die genetische Diversität) in unserem Genom ist noch nicht zuverlässig bestimmt worden – einfach weil noch nicht hinreichend viele Genomabschnitte für eine größere Anzahl von Personen exakt sequenziert wurden. Die bisherigen Ergebnisse besagen, dass die genetische Diversität beim Menschen je nach Genomort zwischen 1 auf 100 und 1 auf 5.000 Nukleotidbuchstaben beträgt. Ob das viel oder wenig ist, hängt vom Vergleichsmaßstab ab. Immerhin bedeutet es, dass zwischen zwei nicht verwandten Personen einige Millionen Unterschiede im Textbestand auftreten. Zweifellos trägt dieser Umstand zur genetischen Verschiedenheit innerhalb der menschlichen Art und ebenso zur konstitutionellen Disposition für bestimmte phänotypische Merkmale (u. a. Neigung zu Erkrankungen) erheblich bei. Auch hier werden DNA-Chips die genaue Vermessung der Diversität in größeren Probandenkollektiven möglich machen. Ihre Diagnostik wird in wenigen Jahren durch die Verbesserung der Methodik relativ billig sein. Diese genetische Aussage ist nahezu fehlerfrei, sodass individuelle genetische Profile für die Feststellung der Ätiologie und Pathogenese von definierten Erkrankungen, ja vielleicht

344

Sektion 3 · Diagnostik

sogar für die Nosologie (Krankheitslehre) allgemein von großer Bedeutung sein werden. In früheren Jahrzehnten konnte man lediglich den Phänotyp mit einiger Schwankung bestimmen, während die genetische Information sehr limitiert war – heute verhält es sich umgekehrt so, dass man das Genom einer Zelle im Prinzip genau entschlüsseln kann, während die Folgen im Metabolismus auch weiterhin nur schwer genau zu ermitteln sind. Erste Ansätze zu einer genetischen Charakterisierung von Krankheiten werden bereits bei der vererbten Disposition zu bestimmten Tumorerkrankungen und Stoffwechselerkrankungen (z. B. Cholesterinumsatz) diagnostisch benutzt, vom Einsatz der genetischen Diagnostik von zahlreichen Gendefekten abgesehen, die heutzutage klinische Standardverfahren sind. Es ist offensichtlich, dass auch auf diesem Gebiet die Bioinformatik zur Auswertung und Deutung der massenhaft anfallenden Daten von strategischer Bedeutung sein wird. Es sei nicht verschwiegen, dass diese Aussichten auf eine sehr genaue Aufschlüsselung des individuellen menschlichen Genoms (Stichwort „gläserner Mensch“) nicht nur Zustimmung, sondern auch Besorgnisse auslöst. Risiken und Chancen bei der Anwendung lassen sich jedoch auf einem Gebiet, auf dem mit so hoher Präzision Faktenanalyse möglich geworden ist, zuverlässig trennen und durch staatliche Regulation gestalten.

3.3.10 Datenbanken und Analysewerkzeuge im World Wide Web (WWW) Sinnvolle Startadresse für den Einstieg in die weltweit angebotenen Genomdatenbanken sind die Webseiten des European Bioinformatics Institute (EBI) und des National Center of Biotechnology Information, wobei der Vorzug individuell in der unterschiedlichen Gestaltung dieser Informationsangebote liegt: http://www.ensembl.org http://www.ncbi.nlm.nih.gov Beide Webseiten, die einander regelmäßig in den Leistungsangeboten (nicht in der Gestaltung) spiegeln, ermöglichen zu einer Reihe von Datenbanken und Werkzeugen: x Nukleotidsequenzen x SwissProt (Protein Sequenzen) x OMIM (Online Mendelain Inheritance in Man, eine Informationssammlung genetischer Defekte und ihrer molekularen Grundlage mit umfangreicher Hintergrundinformation) x MMDB (Molecular Modelling Database: kristallographisch bestimmte Strukturen von Proteinen und RNS) x dbEST [Sammlung von automatisch generierten ESTs (meist aus humaner Quelle)]

x dbSTS [Sammlung von kartierten Markerorten („sequence tagged sites“)] x dbSNP (Datenbank von Einzelnukleotidsequenzvarianten der Genome mehrerer Spezies) x UniGene [Sammlung von transkribierten Genabschnitten, die sich (durch Überlappung) zu längeren Einheiten (manchmal ganzen Genprodukten) vereinigen ließen] x HAPMAP [Datenbank genetischer Varianten beim Menschen] Ein für die tiefere Sequenzanalyse auch von Spezialdatenbanken nützliches Programm ist SRS (Sequence Retrieval System) des EMBL. Man wählt www.embl.de und fragt sich mit dem Stichwort SRS durch, um an den Server zu kommen, der entsprechende Dienste anbietet. Es wird ein Verzeichnis aller erreichbaren Datenbanken gezeigt. Das SRS erlaubt es, Sequenzsammlungen unterschiedlicher Formatierung miteinander vergleichbar zu machen. Im Internet werden auch zahlreiche weitere Analysewerkzeuge angeboten, für deren Beschreibung auf die Lehrbücher der Bioinformatik verwiesen werden muss.

3.3.11 Weiterführende Literatur Zunächst werden einige neuere Monographien zitiert, die einen Überblick über die Methoden und Ressourcen der Genom-Informatik anbieten: Rauhut R (2001) Bioinformatik: Struktur-Sequenz-Information. Wiley-VCH Weinheim etc Baxevanis AD und Ouellette BFF eds. (2005) Bioinformatics. A Practical Guide to the Analysis of Genes and Proteins. 3nd edition. Wiley-Interscience New York etc Mount DW (2001) Bioinformatics. Sequence and genome Analysis. Cold Spring Harbor Laboratory Press, New York Altschul SF, Gish W, Miller W, Myers EW und Lipman DJ (1990) Basic local alignment search tool. J. Mol. Biol. 215: 403–410 Arratia R und Waterman MS (1994) A phase transition for the score in matching random sequences allowing deletions. Ann. Appl. Prob. 4: 200–225 Dayhoff MO (1972) Atlas of protein sequence and structure. National Biomedical Research Foundation, Georgetown University, Washington D.C. Fleischmann RD et al. (1995) Whole genome random sequencing and assembly of Hemophilus influenzae. Science 269: 496–512 Holm L und Sander C (1996) Mapping the protein universe. Science 273: 595–603 Karlin, S und Altschul SF (1990) Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes. Proc. Natl. Acad. Sci. 87: 2264–2268 Needleman SB und Wunsch C (1970) A general method applicable to the search for similarities in the amino acid sequence of two proteins. J. Mol. Biol. 48: 443–453 Staden R (1984) Computer methods to locate signals in nucleic acid sequences. Nucleic Acids Res. 12: 505–519 Vingron M und Waterman MS (1994) Sequence alignment and penalty choice. Review of concepts, case studies and implications. J Mol Biol. 235: 1–12

345 3.3 · Bioinformatik

3.3

3.3.12 Zeittafel 1962

Zuckerkandl und Pauling publizieren erste evolutionäre Stammbaumanalysen auf der Grundlage von Eiweißsequenzen.

1970

Needleman und Wunsch publizieren ein Dynamic-programming-Verfahren für die Analyse von Sequenzpaaren.

1972

Margret Dayhoff publiziert erste Datensammlung (Protein Information Resource, PIR) von Eiweißsequenzen.

1979

Walter Goad gründet den Protoyp der DNS-Datensammlng GenBank.

1986

Beginn der Human Genome Projects zur Aufklärung des menschlichen Genoms

1986

Roger Staden (Cambridge, England) veröffentlicht eine Sammlung bioinformatischer Verfahren zur Sequenzanalyse.

1990

Stephen Altschul publiziert sein BLAST-Verfahren zur Ermittlung von Homologien in umfangreichen Sequenzdatenbanken.

1995

Publikation der ersten Genomsequenz eines Bakteriums (Hemophilus influenzae) (Fleischmann et al. 1995)

2000

Vollständiger Entwurf der DNS-Sequenz des menschlichen Genoms von zwei Konsortien gleichzeitig publiziert (Francis Collins und Craig Venter)

Literatur zur Zeittafel Altschul SF, Gish W, Miller W, Myers EW und Lipman DJ (1990) Basic local alignment search tool. J. Mol. Biol. 215: 403–410 Dayhoff MO (1972) Atlas of protein sequence and structure. National Biomedical Research Foundation. Georgetown University, Washington D.C. Fleischmann RD et al.(1995) Whole genome random sequencing and assembly of Hemophilus influenzae. Science 269: 496– 512

Needleman SB und Wunsch C (1970) A general method applicable to the search for similarities in the amino acid sequence of two proteins. J. Mol. Biol. 48, 443–453 Staden R (1984) Computer methods to locate signals in nucleic acid sequences. Nucleic Acids Res. 12: 505–519 Zuckerkandl E aund Pauling L (1962) Molecular Disease, Evolution, and Genic Heterogeneity. Horizons in Biochemistry, Eds. Michael Kasha and Bernard Pullman, pp. 189–225

3.4 Gendiagnostik Andrea Bauer, Sabina Solinas-Toldo und Jörg D. Hoheisel, Peter Schirmacher und Roland Penzel und Stefan Aretz

3.4.1

Methodische Grundlagen – 347 Andrea Bauer, Sabina Solinas-Toldo und Jörg D. Hoheisel

3.4.1.1 3.4.1.2 3.4.1.3 3.4.1.4 3.4.1.5 3.4.1.6 3.4.1.7 3.4.1.8

Einführung – 347 Nukleinsäurehybridisierung – 348 Amplifikation durch PCR – 350 Sequenzanalyse – 353 DNS-Chip-Technologie – 355 Ausblick – 359 Literatur – 360 Zeittafel – 362

3.4.2

Grundlagen der klinischen Anwendung – 363 Peter Schirmacher und Roland Penzel

3.4.2.1 3.4.2.2 3.4.2.3 3.4.2.4 3.4.2.5

Klinische Fragestellungen und Anwendungsbereiche Material und Aufarbeitung – 364 Diagnostische Verfahren – 365 Perspektiven – 369 Literatur – 369

3.4.3

Grundlagen der molekulargenetischen Diagnostik erblicher Krankheiten – 370 Stefan Aretz

3.4.3.1 3.4.3.2 3.4.3.3 3.4.3.4 3.4.3.5 3.4.3.6

Einführung – 370 Humangenetische Beratung – 372 Aussagekraft und Methodik – 372 Material und Untersuchungsauftrag – 372 Indikationen in der klinischen Diagnostik – 372 Literatur – 376

– 363

Ganten/Ruckpaul (Hrsg.) Grundlagen der Molekularen Medizin, 3. Auflage © Springer-Verlag Berlin Heidelberg 2008

347 3.4 · Gendiagnostik

3.4

3.4.1 Methodische Grundlagen Andrea Bauer, Sabina Solinas-Toldo und Jörg D. Hoheisel 3.4.1.1 Einführung Auf dem Gebiet der Medizin ist eine Revolution im Gange. Neue Erkenntnisse in der molekularen Genetik und Biotechnologie und speziell die Entwicklungen in der Genomforschung führen zu bisher nicht da gewesenen Erkenntnissen, Fertigkeiten und Perspektiven. Dabei finden diese rasanten Veränderungen parallel auf drei Ebenen statt. Zum einen vergrößert der enorme Erkenntnisgewinn aus den Untersuchungen der Genomanalyse das grundlegende, molekulare Verständnis biologischer Vorgänge und führt damit zu direkten Verbesserungen in medizinischen Anwendungen. Zweitens stehen als Ergebnis der methodischen Entwicklungen neue Verfahren zur Verfügung, die umwälzende Diagnose- und Behandlungsformen ermöglichen. Und drittens wandelt sich zumindest ein Teil der biomedizinischen Diagnostik von der Untersuchung von Einzelaspekten zu einer Analyse gesamtheitlicher zellulärer Zusammenhänge – eine Entwicklung, die auch ein Umdenken der Wissenschaftler und Ärzte erfordert. Zeitlich befinden sich die weltweiten Anstrengungen der Genomanalyse bereits in einer dritten Phase (> Tab. 3.4.1). Zu Beginn bestand der Hauptteil der Ar-

. Abb. 3.4.1. Aspekte funktioneller Studien im Bereich der grundlegenden Nukleinsäure- und Proteinanalytik

beit darin, grundlegende Konzepte zu entwickeln und in praktischer Anwendung zu bestätigen, die solche Studien überhaupt möglich machen, gefolgt von einer Periode, die stark durch die reine (Sequenz-)Datenproduktion geprägt war. Mittlerweile steht die Bestimmung der aus dieser Information abzuleitenden zellulären Funktionen im Mittelpunkt. Dies erfordert eine starke Ausweitung der Analysen auf die vielen molekularen Aspekte, die Einfluss auf die Regulation zellulärer Mechanismen nehmen, und eine Vernetzung mit den Ergebnissen aus anderen Molekülklassen (> Abb. 3.4.1). Die molekulare Diagnostik steht damit an der Schwelle zu einem Zeitalter, in dem für jeden Patienten eine individuelle Aussage getroffen werden kann.

. Tab. 3.4.1. Liste wegweisender Genomprojekte Sequenz

Länge

Contigs

Publikation

Menschliches Genom

ca. 3.286.000.000

viele

The International Genome Sequencing Consortium 2000

135.600.000

viele

Adams et al. 2000

Drosophila melanogaster Menschliches Chromosom 21q

33.827.000

5

Hattori et al. 2000

Menschliches Chromosom 22q

33.573.000

12

Dunham et al 1999

115.409.000

12

The Arabidopsis Genome Initiative 2000

wenige

The C. elegans Sequencing Consortium 1998

4.639.000

1

Blattner et al. 1997

12.068.000

4

Goffeau et al. 1996

Haemophilus influenzae Rd

1.830.138

1

Fleischmann et al. 1995

S. cerevisiae chromosome 3

315.339

1

Oliver et al. 1992

Human Cytomegalovirus

229.354

1

Chee et al. 1989

Epstein-Barr-Virus

172.281

1

Baer et al. 1984

Bacteriophage Lambda

48.502

1

Sanger et al. 1982

Menschliches Mitochondrium

16.569

1

Anderson et al. 1981

5.375

1

Sanger et al. 1977

Arabidopsis thaliana Caenorhabditis elegans Escherichia coli Saccharomyces cerevisiae

Bacteriophage phi X174

97.100.000

348

Sektion 3 · Diagnostik

Dieser Artikel behandelt grundlegende Techniken der molekularen Gendiagnostik und zeigt einige wichtige Anwendungen. Viele andere, zum Teil schon länger etablierte Methoden sind im Einsatz, und neue kommen ständig hinzu. Gleichzeitig gibt es eine Vielzahl an weiteren Anwendungen in Genomanalytik und Diagnostik. Aufgrund der rasanten Entwicklungen in diesem Feld, haben wir uns jedoch auf zentrale Themen konzentriert.

3.4.1.2 Nukleinsäurehybridisierung Hybridisierung ist die Ausnutzung des grundlegenden Merkmals von Nukleinsäuren, sich zu Doppelstrangstrukturen zusammenzulagern, wenn die beiden Einzelmoleküle eine komplementäre Sequenz aufweisen. Diese Eigenschaft ist essenziell für das Kopieren und Vererben genetischer Information. In der Molekularbiologie macht sie es möglich, eine bestimmte Sequenzfolge in einem Gemisch aus Nukleinsäuren nachzuweisen, indem ein komplementäres Fragment als markierte Sonde zugesetzt wird. Wichtig für die Stabilität eines DNS-Doppelstrangs sind aber nicht nur die Basenpaarungen, sondern auch die Stapelung der Basen, wie auch Effekte der Hydrathülle auf das Phosphat-Rückgrat. Daher wird die Spezifität einer Hybridisierung nicht nur durch den Grad der Komplementarität zwischen den Sequenzen, sondern auch durch Faktoren wie etwa chemische Modifikation der Nukleotide, Pufferzusammensetzung und Temperatur stark beeinflusst. Gleichzeitig kann über die Inkubationsdauer regulierend eingegriffen werden. Sequenzen, die in vielen Kopien vorliegen oder sich durch eine einfache und sich häufig wiederholende Basenabfolge wie etwa d(GT):d(CA) auszeichnen, finden schneller einen Partner als Sequenzen, die in nur geringer Kopienzahl vorhanden sind. Grundsätzlich basieren viele der nachfolgend beschriebenen Methoden auf dem Effekt der Doppelstrangbildung, sprich der Hybridisierung. Beispielsweise lagern sich zur Initiation der DNSAmplifikation (7 3.4.1.3) oder DNS-Sequenzierung (7 3.4.1.4) vor Beginn der Polymerasereaktion zuerst einzelsträngige Primer-Moleküle an einen vorliegenden Einzelstrang an. Bei vielen Hybridisierungstechniken ist eine der Nukleinsäuren auf einem Träger fixiert, während die andere als Probe frei in der Lösung vorliegt und eine Markierung – etwa in Form eines Fluoreszenzfarbstoffs – trägt. Ein klassisches Beispiel dafür ist die DNS-ChipTechnologie (7 3.4.1.5). Nach Inkubation unter Bedingungen, die eine mehr oder minder spezifische Hybridisierung erlauben, wird nicht oder unspezifisch gebundenes Probenmaterial weggewaschen. Die Position der

Markierung der auf dem Träger verbliebenen Probenmoleküle identifiziert die Nukleinsäuren, an die Probenmaterial binden konnte, und gibt durch die Signalintensität Auskunft über die Stärke der Bindung. Ein Vorteil der Hybridisierungstechnik ist die Tatsache, dass eine Vielzahl verschiedener Moleküle gleichzeitig untersucht werden kann. Falls sinnvoll, können bei geeigneten Bedingungen selbst ähnliche (homologe) Sequenzen identifiziert werden (etwa Genfamilien oder sich entsprechende Sequenzen zwischen verschiedenen Organismen). Da jede Nukleinsäure sowohl als Sonde als auch als Ziel einer Hybridisierung verwandt werden kann, können die Untersuchungen je nach Fragestellung so gestaltet werden, dass möglichst viel Information mit möglichst geringem Aufwand gewonnen wird. Southern- und Northern-Analysen Diese Technik repräsentiert einen Meilenstein in der Analyse von Nukleinsäuren und wurde 1975 von Edwin Southern eingeführt, dessen Name auch zum Synonym für die Methode wurde (Southern 1975). Soll beispielsweise die Kolinearität zwischen einer klonierten DNS und genomischer DNS überprüft werden, wird genomische DNS mit einem Restriktionsenzym geschnitten und gelelektrophoretisch aufgetrennt. Durch die Vielzahl der entstehenden Fragmente und ihre unterschiedliche Größe sind im Gel keine distinkten Banden zu erkennen, sondern ein DNS-„Schmier“. In diesem „Schmier“ verstecken sich allerdings alle Fragmente, die durch die Restriktionsnuklease produziert werden. Die DNS wird dann aus dem Gel auf einen Filter übertragen (Southern-Blot) und fixiert. Jetzt kann ein definiertes und markiertes DNA-Fragment auf diesen Filter hybridisiert werden. Da auf dem Filter die genomische DNS so fixiert ist, wie sie im Gel aufgetrennt wurde, kann die Größe der positiven genomischen Fragmente ermittelt werden. Über einen Vergleich der Fragmentgrößen mit denen der klonierten DNS lässt sich feststellen, ob diese mit dem genomischen Bereich identisch ist oder ob durch die Klonierung Veränderungen stattgefunden haben. In Anlehnung an die Bezeichnung Southern-Blot wurde der Transfer eines RNS-Gels als Northern-Blot bezeichnet. Das Prinzip entspricht vollständig dem eines Southern-Blot. Eine Anwendung sind Studien der Genexpression. RNS wird aus unterschiedlichen Geweben gewonnen und soll darauf untersucht werden, wie stark ein bestimmtes Gen jeweils transkribiert wurde. Dazu wird eine passende Sonde (z. B. die cDNS) auf die Gesamt-RNS eines Northern-Blots hybridisiert, um die individuelle RNS nachzuweisen. Durch den Vergleich der Signalstärken lassen sich Unterschiede in der RNSMenge feststellen.

349 3.4 · Gendiagnostik

Fluoreszenz-in-situ-Hybridisierung (FISH) Die In-situ-Hybridisierung ist eine seit längerem gut etablierte zytogenetische Technik, mit der die Lokalisierung von DNS-Sequenzen in ganzen Zellkernen der Interphase oder Chromosomen der Metaphase möglich ist. Eine DNS-Sonde wird auf die denaturierte Ziel-DNS der Zellpräparate hybridisiert und über eine Fluoreszenzmarkierung sichtbar gemacht (> Abb. 3.4.2). Diese Technik ist als Fluoreszenz-in-situ-Hybridisierung, oder FISH, bekannt (Lichter et al. 1990) und findet breite Anwendung in der molekularen Diagnostik. Die Verfügbarkeit verschiedener Fluorochrome erlaubt die gleichzeitige Verwendung multipler Sonden, die sich so differenziell darstellen lassen. Anwendungen sind beispielsweise der Nachweis numerischer und struktureller chromosomaler Aberrationen (> Abb. 3.4.3), die Detektion chromosomaler Imbalancen und Genamplifikationen, die Lokalisation viraler Integrationsorte und die Analyse der Nukleusorganisation. Untersuchungen erfolgen entweder an intakten und kondensierten Chromosomenstrukturen, die im Metaphasenstadium präpariert werden, oder am Kern von Zellen in der Interphase. Die Interphasezytogenetik bietet eine wichtige Alternative, wenn numerische oder strukturelle Aberrationen in Tumoren diagnostiziert werden sollen. Die Präparation der Metaphasespreitungen aus Tumormaterial ist beispielsweise häufig erfolglos oder bleibt von ungenügender Qualität für FISH-Experimente. Außerdem sind teilungsfähige Zellen, die in der Metaphase präpariert werden, oft nicht repräsentativ für die klonale Zusammensetzung der Zellpopulation in vivo.

. Abb. 3.4.2. Hybridisierung einer DNS Sonde auf menschliche Metaphasechromosomen. Das spezifische Hybridisierungssignal ist am Telomer beider homologen Chromosomen und auf den Interphasekernen zu erkennen

3.4

Ein weiteres wichtiges Verfahren ist die vergleichende genomische Hybridisierung („comparative genomic hybridisation“, CGH) (Kallioniemi et al. 1992). Sie ermöglicht eine umfassende Analyse des Zugewinns und Verlusts von chromosomalem Material etwa in einem Tumor. Die Analyse basiert auf dem Vergleich von Hybridisierungssignalen von Tumor-DNS und normaler Referenz-DNS. Die beiden DNS-Präparationen werden unterschiedlich markiert. Gleiche Mengen werden dann gemischt auf normale Metaphasechromosomen hybridisiert („chromosomale CGH”). Die Referenz-DNS zeigt die homogene Fluoreszenzfärbung auf allen Chromosomen. Teile des Genoms, die im Tumor in höherer (etwa Trisomien) oder niedrigerer Kopienanzahl (Deletionen) vorkommen, werden in der entsprechenden chromosomalen Region im Vergleich zur Referenz-DNS

. Abb. 3.4.3a–g. Beispiele numerisch und strukturell chromosomaler Aberrationen, die mittels Interphasezytogenetik nachgewiesen werden können. Links sind die Chromosomen und rechts die entsprechenden Hybridisierungssignale auf einem skizzierten Interphasekern nach FISH mit spezifischen DNS-Sonden gezeigt. a normale Zelle, b–d Veränderungen der Kopienzahl einer Sequenz. Bei Verwendung einer bruchpunktüberspannenden Sonde ändert sich durch das chromosomale Bruchereignis die Anzahl der Hybridisierungssignale auf den Interphasekernen, e, f bei Verwendung zweier den Bruchpunkt flankierenden Sonden, die mit 2 verschiedenen Fluorochromen nachgewiesen werden, ändert sich ihre gegenseitige Position auf dem Interphasekern

350

Sektion 3 · Diagnostik

dass die Hybridisierung von Oligonukleotiden für viele Anwendungen die im Allgemeinen beste Methodik darstellt.

. Abb. 3.4.4. Vergleichende genomische Hybridisierung (CGH) mit der DNS eines Pankreaskarzinoms. Grüne chromosomale Regionen zeigen überrepräsentierte, und rote Regionen zeigen unterrepräsentierte Regionen im Genom des Tumors. Eine gleichmäßige Rot-grünFärbung entspricht einem balancierten Karyotyp in der entsprechenden Region des Tumors

eine stärkere bzw. schwächere Fluoreszenzintensität aufweisen (> Abb. 3.4.4) und sind über das Verhältnis beider Fluorochrome erkennbar. Balancierte Veränderungen (z. B. balancierte Translokationen und Inversionen) können jedoch nicht erfasst werden. Die Auflösung der chromosomalen CGH ist allerdings begrenzt, kann jedoch bedeutend verbessert werden, indem man die Chromosomen durch definierte DNSFragmente ersetzt (7 3.4.1.5 „DNA-Chip-Technologie“). Oligomerhybridisierung Die Verwendung kurzer Oligomere ist in vieler Hinsicht ein spezielles Teilgebiet der Nukleinsäurehybridisierung. Meist sind Oligonukleotide synthetisch hergestellt, sodass ihre Sequenz vollständig bekannt und definiert ist. Der Einfluss der Hybridisationsbedingungen und damit die Selektivität eines Experiments sind wesentlich stärker als bei längeren Sonden. Liegt eine Basenfehlpaarung zur Ziel-DNS in der Mitte eines kurzen Oligonukleotids, ist die Duplexstabilität meist so stark reduziert, dass zwischen Oligomeren mit dieser Fehlpaarung oder einer vollständig komplementären Sequenz einfach diskriminiert werden kann. Liegt eine Fehlpaarung am Ende eines Moleküls, ist der Effekt schwächer; die Länge kontinuierlicher Sequenz bestimmt den Grad der Selektivität. Oligonukleotide erlauben außerdem, bestimmte, häufig vorkommende DNS-Motive zu vermeiden oder sie ganz gezielt zu suchen. Insgesamt lässt sich sagen,

Ligationsverstärkter Nachweis Bei diesem Nachweisverfahren werden zwei Oligonukleotide genutzt, die direkt nebeneinander an die ZielDNS binden. Die Oligonukleotide sind dabei so gewählt, dass der Ort der Mutation dem 3‘-Ende des ersten Oligonukleotids entspricht. Das 5‘-Ende des zweiten Oligomers kann nur dann an dieses 3‘-Ende ligiert werden, wenn die Ziel- und die Oligomersequenz an dieser Stelle zueinander komplementär sind. Bei einem Basenaustausch können die beiden Enden der Oligonukleotide nicht miteinander verbunden werden. Durch die Verwendung zweier Moleküle und der zusätzlichen Selektivität der Ligase erhöht sich die Spezifität des Nachweises wesentlich (Landegren et al. 1988). In Abwandlung dieses Ansatzes kann auch nur ein einzelnes, dafür längeres Oligonukleotid verwandt werden, von dem die beiden Enden zur Ziel-DNS komplementär sind und quasi den zwei getrennten Oligonukleotiden von oben entsprechen. Nur bei vollständig passender Sequenz werden beide Enden durch die Ligase verbunden, sodass ein zirkuläres Molekül entsteht. Über Rolling-circle-Amplifikation (Zhong et al. 2001) können dann von diesem Molekül viele Kopien hergestellt werden. Dabei wird der ehemalige Mittelteil des Oligonukleotids ebenfalls amplifiziert und kann als Zielsequenz für einen Nachweis verwandt werden. Dadurch ist es möglich, selbst die Bindung an Einzelmoleküle nachzuweisen (Larsson et al. 2004).

3.4.1.3 Amplifikation durch PCR Die Amplifikation von DNA durch eine Polymerasekettenreaktion („polymerase chain reaction“, PCR) (Saiki et al. 1985) hat sich in kürzester Zeit zu einem Grundbaustein molekularer Genetik entwickelt. Die PCR ist eine enzymatische Methode zur In-vitro-Amplifikation spezifischer DNS-Abschnitte (> Abb. 3.4.5). Synthetische Oligonukleotid-Primer, deren Sequenzen komplementär zu dem rechten und linken Ende eines DNS-Stückes sind, werden nach ihrer Bindung durch eine DNS-Polymerase verlängert. Anschließend werden die DNS-Moleküle durch eine Temperaturerhöhung in ihre Einzelstränge denaturiert, wodurch die Zielsequenzen wieder für neue Primer zugänglich werden und somit die Reaktion von vorne beginnen kann. Da jeder neu synthetisierte Strang in dem folgenden Zyklus als Vorlage zur Polymerasereaktion dient, kommt es jeweils zu einer Verdopplung der zwischen den Primern liegenden Sequenz. Durch mehrfaches Wiederholen erfolgt somit

3.4

351 3.4 · Gendiagnostik

. Abb. 3.4.5. Exponentielle DNS-Amplifikation durch PCR. Ein DNSDoppelstrang wird in Gegenwart eines Überschusses passender Primer-Moleküle (orange) thermisch denaturiert. Beim Abkühlen binden die Primer-Oligonukleotide an ihre Bindungsstellen und werden

anschließend durch eine hitzestabile DNS-Polymerase verlängert. Bei jedem Zyklus verdoppelt sich die Kopienzahl der DNS-Region, die zwischen den beiden Primer-Molekülen liegt (blau)

eine exponentielle Vervielfältigung. Dies macht die PCR so empfindlich, dass beispielsweise DNS-Sequenzen aus einem einzigen Haar amplifiziert und nachgewiesen werden können. Durch die Entdeckung und Einführung hitzestabiler DNS-Polymerasen – wie etwa die des thermophilen Bakteriums Thermus aquaticus (Taq-Polymerase) (Saiki et al. 1988) – ist die Anwendung stark vereinfacht, da zwischen den Zyklen keine frische Polymerase zugesetzt werden muss. In einer Standard-PCR wird in einem anfänglichen Denaturierungsschritt die DNS in ihre beiden Einzelstränge aufgeschmolzen, um die Bindungsstellen für die Primer zugänglich zu machen. Die Temperatur beträgt üblicherweise 93–97°C; je höher der GC-Gehalt der Zielsequenz ist, um so höher muss die Temperatur sein, um sie sicher zu denaturieren. Mit zunehmender Temperatur sinkt jedoch die Halbwertszeit der Polymeraseaktivität. Während sie für Taq-Polymerase bei 92,5°C noch mehr als 2 h beträgt, verringert sie sich bei einer Temperatur von 95°C auf 40 min und bei 97,5°C auf 5 min. Anschließend wird die Reaktion auf eine Temperatur abgekühlt, bei der beide Primer-Moleküle an die DNS binden können („annealing“). Sie ist sowohl von der Länge der Sequenz als auch von der Basenzusammensetzung der Primer abhängig. Danach wird die Temperatur üblicherweise auf etwa 72°C erhöht, um optimale Temperaturbedingungen für die Polymerisation zu schaffen. Trotz der relativ kurzen Zeit, in der die Reaktion auf diese Elongationstemperatur gebracht wird, kommt es

dabei nicht zu einem Wiederablösen der Primer, da sie während des Aufheizens bereits von der Polymerase verlängert werden. Die Dauer der Elongation richtet sich unter anderem nach der Größe der zu amplifizierenden DNS. Bei 72°C werden zwischen 35 und 100 Nukleotide pro Sekunde eingebaut. Somit sollte eine Minute Elongation für ein Fragment von 2 kb ausreichend sein. Man wählt jedoch üblicherweise eine Zeit von 1 min/kb, da in späteren Zyklen die Konzentration des Produkts im Verhältnis zur Konzentration des Enzyms ansteigt und sich dadurch auch die zur Verlängerung aller gebundener Primer benötigte Zeit erhöht. Im Anschluss an die Elongationsphase wird die Reaktion wieder auf die Schmelztemperatur erhitzt, und ein neuer Zyklus beginnt. Die Anzahl der Zyklen richtet sich hauptsächlich nach der Ausgangskonzentration der DNS: Anzahl der Zielmoleküle

105

104

103

50

Anzahl der Zyklen

25–30

30–35

35–40

40–45

Nachdem die gewünschte Zahl an Zyklen durchlaufen wurde, erfolgt meist eine abschließende Inkubation bei 72°C, um unvollständige Produktmoleküle noch fertigzustellen. Häufig wird auch die Zwei-Temperatur-PCR angewandt, bei der die Anlagerungstemperatur der Primer der Elongationstemperatur entspricht. Da pro Zyklus nur zwei statt drei Temperaturen erforderlich sind,

352

Sektion 3 · Diagnostik

wird die Gesamtdauer einer PCR durch dieses Verfahren wesentlich verkürzt.

Akzeptor ausreichend weit voneinander entfernt sind, um den Energietransfer zu unterbinden.

RT-PCR Prinzipiell ist die RT-PCR (Reverse Transkriptase-PCR) (Veres et al. 1987) eine Amplifikation von RNS-Sequenzen. Da jedoch RNS nicht als Matrize für die üblichen PCR-Polymerasen dient, wird der PCR eine Reverse Transkription vorangestellt. Die produzierte ErststrangcDNS kann in einer anschließenden PCR selektiv amplifiziert werden. Der Vorteil dieser Methode gegenüber anderen Techniken zur Untersuchung von RNS-Molekülen liegt in der für die PCR typischen Sensitivität. Durch RT-PCR können Transkripte nachgewiesen werden, die in einer nur sehr geringen Kopienzahl pro Zelle vorliegen.

In situ PCR Die In-situ-PCR kombiniert die extreme Empfindlichkeit der PCR mit der In-situ-Hybridisierung. Zunächst werden spezifische Sequenzen in einer einzelnen Zelle mittels PCR amplifiziert und anschließend direkt oder mittels Hybridisierung nachgewiesen (Haase et al. 1990). Die Schwierigkeit der Technik liegt darin, die Zellen bzw. das Gewebe so zu permeabilisieren, dass die PCR-Komponenten relativ frei, die DNS der Zelle und die PCRProdukte dagegen wenig diffundieren können. Man unterscheidet die In-situ-PCR in suspendierten intakten Zellen von der PCR auf Objektträgern. Ersteres wird wie ein normaler PCR-Ansatz in kleinen Reaktionsgefäßen durchgeführt, die zweite Methode dagegen direkt auf dem Objektträger. Dazu werden die Objekte mit dem PCR-Mix überschichtet und mit einem Deckglas abgedeckt. Im Vergleich zu einer normalen PCR ist der Amplifikationsgrad der Zielsequenzen bei einer In-situ-PCR sehr gering. Eine ausführliche Abhandlung über die In-situ-PCR ist bei Komminoth et al. (1995) zu finden.

Real-Time-PCR Bei der quantitativen Real-Time-PCR wird zu einer Amplifikationsreaktion ein Fluoreszenzfarbstoff zugegeben, dessen Signalintensität der Menge an PCR-Produkt äquivalent ist. So kann während der Amplifikation der Anstieg der Produktmenge verfolgt werden. Die einfachste Variante besteht darin, einen interkalierenden Fluoreszenzfarbstoff wie Ethidiumbromid oder SYBR Green zuzusetzen. Je mehr doppelsträngige DNS vorliegt, desto mehr Farbstoff kann interkalieren und dadurch seine Fluoreszenz steigern. Ein Nachteil ist, dass nur ein PCR-Produkt gleichzeitig verfolgt werden kann. In kommerziellen Systemen werden deshalb häufig speziell markierte Oligonukleotide genutzt. Pro PCR-Produkt kann dann ein spezifisches Oligonukleotid mit spezifischer Farbe verwandt werden, sodass vergleichende Messungen möglich sind. Der Nachweis nutzt meist den Energietransfer (Förster Resonanz Energietransfer, FRET) zwischen einem Donor-Fluorophor und einem Akzeptor-Fluorophor. Im LightCycler-System binden an die frisch synthetisierte DNS zwei Sonden, von denen eine mit dem Donor- und die andere mit dem Akzeptorfarbstoff markiert ist. Nur dadurch kommen die beiden Fluorophore in ausreichend physikalische Nähe, sodass der Akzeptor nach Anregung des Donors ein Lichtsignal aussendet. Bei TaqMan-Proben und Molecular Beacons dagegen sind beide Farbstoffe an die Enden eines Oligonukleotids gebunden. In dieser Konfiguration unterdrückt der Akzeptor durch den Energietransfer das Leuchten des Donors, der hier das Reportermolekül bildet. Bei TaqMan-Sonden wird nach der Bindung des Oligonukleotids an neu synthetisierte DNS der Akzeptor durch die Polymerase abgespalten, wodurch der zweite Fluoreszenzfarbstoff zu leuchten beginnt. Bei Molecular Beacons ändert sich beim Hybridisieren die Struktur des Moleküls. Die intramolekulare Faltung wird aufgehoben, wodurch im linearen Molekül Donor und

PCR und DNS-Sequenzierung Da die PCR nicht nur die Synthese von größeren DNSMengen ermöglicht, sondern auch bestimmte Sequenzen aus einem Gemisch heraus amplifiziert, ist sie eine Alternative zur konventionellen Klonierungsstrategie für die DNS, die sequenziert werden soll. Bei neueren Sequenziermethoden (7 3.4.1.4) wird ein Klonierungsschritt völlig umgangen und durch Molekülvereinzelung und anschließende PCR ersetzt. Obwohl prinzipiell ähnlich, besteht ein gravierender Unterschied zwischen der Sequenzierung klonierter DNS und nur PCR-amplifizierter DNS. Beim Sequenzieren klonierter DNS sind die analysierten Moleküle alle gleich; sie gehen aus einem einzigen Molekül hervor. Für PCR-Produkte trifft das nicht zu. Sie können durchaus verschiedene genomische Moleküle als Ursprung haben. Wird beispielsweise ein Bereich aus dem diploiden menschlichen Genom amplifiziert, der in zwei Allelen vorkommt, die sich in einer Base unterscheiden, so setzt sich das PCR-Produkt aus zwei unterschiedlichen DNS-Fragmenten zusammen, eine fehlerfreie Amplifikation vorausgesetzt. In der anschließenden Sequenzreaktion ist dann an der entsprechenden Stelle keine eindeutige Basenzuweisung möglich. Die Fehlerrate der Polymerase hat dagegen kaum einen Effekt auf das Sequenzergebnis. Liegt am Beginn der PCR nur ein einziges Molekül vor, und wird direkt im ersten Zyklus durch die Polymerase ein Nukleotid fehlerhaft eingebaut, so tragen am Ende der PCR ein Viertel aller Moleküle den Fehler. Meist wird jedoch von einer erheblich größeren Molekülzahl ausgegangen. Soll

353 3.4 · Gendiagnostik

beispielsweise ein einzelnes Gen aus einem Nanogramm menschlicher DNS heraus amplifiziert werden, so liegen zu Beginn der PCR etwa 500 Moleküle vor. Selbst, wenn ein Fehler im ersten Zyklus auftritt, so tragen am Ende der PCR weniger als 1% der Moleküle den Fehler. Genetic Fingerprinting; PCR in der forensischen Medizin In den letzten Jahren liest man in den Medien immer häufiger den Begriff des genetischen Fingerabdrucks („genetic fingerprinting“). Darunter versteht man die Analyse bestimmter genetischer Eigenschaften, deren Kombination für jedes Individuum einzigartig ist. Somit können, analog zum klassischen Fingerabdruck, unbekannte DNS-Proben (z. B. aus Blut, Knochen, Haut, Haaren oder Sperma) mit dem genetischen Material bekannter Personen verglichen werden. Die meisten Analysesysteme basieren auf der Tatsache, dass sich im menschlichen Genom viele nichtkodierende Bereiche befinden. Während Veränderungen in den Genen zu Defekten führen können, unterliegen diese Bereiche keinem starken Selektionsdruck. Veränderungen werden weitervererbt, ohne dass sich für den Träger daraus ein positiver oder negativer Effekt ergibt. Aus diesem Grund liegen nichtkodierende Bereiche in einer Population sehr heterogen vor. Ein Teil besteht aus wiederholten Sequenzen („repeats“). Ein spezieller Typ sind TandemRepeats, sich direkt mehrfach wiederholende Sequenzen. Sie liegen bei allen Individuen einer Population vor, unterscheiden sich jedoch individuell in der Anzahl der Repeat-Einheiten, die aufeinander folgen. Für die Analyse werden Primer verwendet, die spezifisch sind für bekannte Sequenzen direkt rechts und links solcher hypervariablen Loci. Die Größe der PCRProdukte ist abhängig von der Anzahl der TandemRepeats zwischen den beiden Primern und ermöglicht somit die Anfertigung eines individuumspezifischen Fragmentprofils. Als Ausgangsmaterial genügen wenige DNS-Moleküle. Dies ermöglicht eine Nutzung in der forensischen Medizin zur Identifizierung eines Individuums oder zur Klärung von Verwandtschaftsverhältnissen, da die Länge der Repeat-Sequenzen nach den Mendelschen Regeln vererbt wird. Selbst Untersuchungen an alten Skelettteilen waren erfolgreich. In alten Knochen findet sich, abhängig von ihrem Alter und den Expositionsbedingungen, mehr oder weniger degradierte DNS. Trotzdem kann häufig ihre Herkunft bestimmt werden. Ein spektakulärer Beweis dafür war die Identifikation der Leichname der 1918 erschossenen Zarenfamilie (Gill et al. 1994).

3.4

3.4.1.4 Sequenzanalyse Zur Sequenzierung der DNS muss die Abfolge der Nukleotide in einem DNS-Molekül in eine nachweisbare Größe umgewandelt werden. Durch die grundlegenden Arbeiten von Maxam und Gilbert (1977) sowie Sanger et al. (1977a) wurde es erstmals möglich, von einer DNS eine Population kürzerer Fragmente herzustellen, die jede mögliche Fragmentlänge enthält, und die Fragmentgröße gleichzeitig mit der Art der terminal gelegenen Base korreliert. Das Auslesen erfolgt über eine Elektrophorese in Acrylamid-Gelen oder Kapillaren, die es erlauben, Moleküllängen von einer Base Unterschied nachzuweisen. Von den beiden Methoden etablierte sich das enzymatische Sequenzieren (Sanger et al. 1977a) als Standardverfahren, mit dem alle bisher abgeschlossenen Genomprojekte durchgeführt wurden (> Tab. 3.4.1). Während der letzten Jahrzehnte gab es eine Vielzahl von alternativen Methoden zur Sequenzierung. Allerdings konnte keine vom Durchsatz, der Robustheit und der Genauigkeit mit der lang etablierten, optimierten und stark automatisierten Technik der Sanger-Sequenzierung konkurrieren. Mittlerweile wurden aber zwei Verfahren entwickelt, die speziell für die diagnostische Sequenzierung von hohem Interesse sind und zumindest für solche Anwendungen die Sanger-Sequenzierung ersetzen könnten. Sanger-Sequenzierung Die Technik basiert auf dem Einbau von Nukleotidderivaten, die zum Abbruch einer Polymerasereaktion führen (> Abb. 3.4.6). An einen schon bekannten Teil der Ziel-DNS wird ein Primer-Molekül gebunden und durch eine Polymerasereaktion verlängert. In vier getrennten Reaktionen wird neben den vier Desoxynukleotiden jeweils eine Base zusätzlich als Didesoxynukleotid zugegeben. An der Position eines Adenosins (dA) in der Vorlagen-DNS wird dadurch beispielsweise entweder das Desoxythymidin (dT) oder das Didesoxythymidin (ddT) eingebaut. Während Moleküle mit einem dT durch die Polymerase weiter verlängert werden, bricht nach Einbau eines ddT die Reaktion ab. Dadurch ist eine Korrelation zwischen der Länge der Moleküle und der Art der endständigen Base gegeben, da alle Moleküle, die kein ddT an dieser Stelle tragen, um mindestens ein Nukleotid länger oder durch den Einbau eines anderen Didesoxynukleotids an einer früheren Position entsprechend kürzer sind. Durch eine Automation und Optimierung der Prozesse über einen Zeitraum von 30 Jahren werden mit diesem Verfahren Leselängen im Kilobasenbereich und eine Fehlerrate von weniger als eine