| Stefanie Castell : Serielle Analyse der Genexpression (SAGE): Etablierung, Statistik und Reliabilität |
|
|
Aus der Abteilung für Experimentelle Neurologie der Medizinischen Fakultät der Charité – Universitätsmedizin Berlin
Dissertation
Serielle Analyse der Genexpression (SAGE):
Etablierung, Statistik und Reliabilität
Zur Erlangung des akademischen Grades Doctor medicinae (Dr. med.)
vorgelegt der Medizinischen Fakultät Charité der Humboldt-Universität zu Berlin
Stefanie
Castell
aus München
Dekan: Prof. Dr. Martin Paul
Gutachter:
1. Prof. Dr. med. U. Dirnagl
2. Prof. Dr. rer. nat. Ch. Behl
3. Prof. Dr. K.- D. Wernecke
eingereicht: 28. Juli 2004
Datum der Promotion: 20. März 2006
Zusammenfassung
Die vorliegende Arbeit ist im Rahmen eines Projektes zur Untersuchung der Genexpression bei Tiermodellen neurologischer Erkrankungen entstanden. Mit herkömmlichen Kandidatenansätzen ist eine Genexpressionsanalyse nur in beschränktem Umfang zu realisieren. Ziel war daher die Etablierung eines Verfahrens wie SAGE (serielle Analyse der Genexpression), das die Analyse des gesamten Transkriptoms zuläßt. Wie die Arbeit zeigt, ist SAGE in einem Standardlabor durchführbar. Es wurden geringfügige Abwandlungen der Orginalmethode eingeführt. Zur Sequenzfehlerkorrektur wurde ein spezielles Computerprogramm entwickelt und evaluiert.
Zur Evaluierung der statistischen Auswertung von SAGE wurde zusätzlich zu einer Darstellung des gesamten statistischen Entscheidungsprozesses explorativ die Situation statistischer Entscheidungen wie sie im Rahmen üblicher SAGE Experimente auftreten mit vier Tests nachgeahmt. Es wurde eine Testvariante (modifizierter Z-Test) angewandt und evaluiert, die bis dato noch nicht zur Auswertung von SAGE benutzt worden war.
Um die Reliabilität von SAGE abschätzen zu können, wurde von vier Mäusegroßhirnen die Gesamt-RNS vereinigt. Diese Transkriptgrundpopulation wurde zweigeteilt und parallel untersucht. Die beiden Gruppen wurden anhand eines statistischen Tests, der die gesamte Verteilungen der beiden Profile prüft, auf Homogenität untersucht. Zusätzlich wurde das Zusammenhangsmaß ermittelt. Dies ergab, daß die Reliabilität von SAGE im vorliegenden Kontext (relativ geringe Stichprobe und ein komplexes Gewebe) nicht optimal ist. Es kann jedoch keine Aussage dazu gemacht werden, ob dies der Methode selbst, das heißt ihrer molekularbiologischen Praxis und der Datenaufbereitung, anzulasten ist oder einer großen Stichprobenvariabilität. Dies bedeutet, daß in der vorliegenden Arbeit keine endgültige Aussage zur Reliabilität von SAGE möglich ist. Es werden Möglichkeiten dargestellt mit einer suboptimale Reliabilität im Rahmen von zukünftigen Projekten umzugehen.
Eigene Schlagworte:
SAGE,
Reliabilität,
Genexpression,
mRNS
Abstract
The work presented here evolved within the framework of a project that examines gene expression of neurological conditions in animal models. Using conventional methods (candidate genes study) gene expression analysis is limited. Hence, the aim was to establish a procedure like SAGE (serial analysis of gene expression) that allows for analysis of the entire transcriptome. As shown it is possible to perform SAGE in a standard laboratory. Minor changes to the original version were made. A special computer program was developed and evaluated to reduce sequencing errors.
In addition to a description of the entire statistical process, the statistics of SAGE were explored by simulating normal SAGE experiments, using 4 statistical tests. One test version (modified Z-test) that has not been used for statistical analysis of SAGE yet was applied and reviewed.
To assess the reliability of SAGE the total-RNA of 4 corteces of mice was extracted and combined. This basic transcript population was divided in two and the parts examined in parallel. Both groups were analysed using a statistical test that tests the entire distribution of both profiles for homogeneity. Additionally the correlation (and its degree) of the profiles was calculated. The result was that the reliability of SAGE is not optimal in the context of this work (relatively small sample and complex tissue). However, no conclusion can be drawn as to whether the method itself (biomolecular practice and data analysis) is responsible for this, or whether it is due to sample variability. This means that in the work presented here no final statement concerning the reliability of SAGE is possible. Possibilities are described to deal with the issue of suboptimal reliability within the framework of future projects.
Keywords:
SAGE,
Reliability,
gene expression,
mRNA
Inhaltsverzeichnis
-
1
Einleitung
-
1.1
Einführung: "Wanderer, kommst du nach 7q31.2" (FAZ, 7.3.00) oder "Wohin mit drei Milliarden Buchstaben?" (FAZ, 9.10.01).
-
1.2 Definitionen
-
1.3 Hintergründe und Potential der Transkriptomanalyse
-
1.4 Verhältnis Boten-RNS und molekularer Phänotyp
-
1.5 Methoden der Transkriptomanalyse
-
1.5.1
Klassische Technologien der Genexpressionsanalyse
-
1.5.2 Neue Verfahren zur Untersuchung der gesamten Expression einer Zellpopulation
-
1.5.3
Wahl einer geeigneten Methode zur globalen Untersuchung der Genexpression
-
1.5.4 Serielle Analyse der Genexpression (SAGE)
-
1.6 Verfahrensetablierung und Testgütekriterien
-
1.7 Reliabilität
-
1.7.1
Reliabilität und ihre verschiedenen Komponenten
-
1.7.2 Gründe für die Messung der Reliabilität
-
1.7.3 Die Reliabilität von SAGE in der Literatur
-
1.8 Problemstellung und Hypothese
-
2 Materialien
-
2.1
Kits
-
2.2 Vektoren und Bakterien
-
2.3 Enzyme
-
2.4 Chemikalien und weitere Stoffe
-
2.5 Puffer, Lösungen und Medien
-
2.6 Nukleotide, Linker und Primer
-
2.7 Geräte und Hilfsmaterial
-
2.8 Computer und Software
-
3 Methoden
-
3.1
RNase freies Arbeiten
-
3.2 Steriles Arbeiten
-
3.3 Phenol - Choroform - Extraktion
-
3.4 3. 4 Ethanolpräzipitation von Nukleinsäuren
-
3.5 Bestimmung von Nukleinsäurenkonzentrationen
-
3.5.1
Messung der optischen Dichte
-
3.5.2 Semiquantitative DNS Mengenbestimmung mit Ethidiumbromid
-
3.6 Gelelektrophorese
-
3.6.1
Agarosegelelektrophorese
-
3.6.2 Polyacrcylamidgelelektrophorese
-
3.7 Restriktionsenzymverdau
-
3.8 Begradigen von cDNS
-
3.9 Ligation
-
3.10 Präparation kompetenter Bakterien und Anlegen einer Bakterienstammsuspension
-
3.11 Transformation per Elektroporation
-
3.12 Gesamt-RNS Isolierung aus Gewebe
-
3.13 Boten-RNS - Präparation mittels Message Maker
™ Kit
-
3.14 cDNS - Herstellung
-
3.15 Polymerasekettenreaktion (PCR)
-
3.16 Fluoreszein - Markierung von DNS - Sonden
-
3.16.1
Markierung in der PCR
-
3.16.2 Kontrolle des Fluoreszein-Einbaus
-
3.17 Northern - Blot
-
3.17.1
Transfer der RNS auf eine Nylonmembran
-
3.17.2 Hybridisierung und Detektion von Northern-Blots mit dem Gene-Images-System
-
3.18 cDNS Southern - Blot
-
3.18.1
Transfer von cDNS auf eine Nylonmembran
-
3.18.2 Hybridisierung und Detektion von cDNS Southern -Blots mit dem Gene-Images-System
-
3.19 Präparative Gelelektrophorese
-
3.19.1
QIAqick Gel Extraction Kit
-
3.19.2 Präparation von DNS-Fragmenten nach Polyacrylamidgelelektrophorese
-
3.20 Binden von biotinylierten cDNS-Fragmenten an Dynabeads
-
3.21 Vektorisolation
-
3.21.1
Reinigen von Plasmid-DNS mit dem Plasmid Mini Purifikation Kit (Qiagen)
-
3.21.2 Reinigen von Plasmid-DNS mit Qiaprep 96 Turbo Miniprep Kit
-
3.22 Sequenzierung
-
3.22.1
Sequenzierung mit fluoreszierenden Primern
-
3.22.2 Sequenzierung mit fluoreszierenden Nukleotiden
-
3.23 Statistische Methoden
-
4 Etablierung von SAGE
-
4.1
Ergebnisse der Etablierung
-
4.1.1
Ausgangssituation und Ziel
-
4.1.2
Zusammenfassende Beschreibung der Methode
-
4.1.3
Vorbereitende Tests
-
4.1.3.1 Streptavidin Gelshift – Assay
-
4.1.3.2 Selbstligation der Linker
-
4.1.4
SAGE-Durchlauf
-
4.1.4.1
Isolierung der Gesamt-RNS
-
4.1.4.2 Präparation der Boten-RNS aus der Gesamt-RNS
-
4.1.4.3 Northern - Blot
-
4.1.4.4 cDNS Herstellung mit Oligo(dT)20-Biotin Primern
-
4.1.4.5 cDNS Southern Blot
-
4.1.4.6 Restriktionsenzymverdau der biotinylierten cDNS mit dem Verankerungsenzym NlaIII
-
4.1.4.7 Binden der biotinylierten cDNS-Fragmente an magnetische mit Streptavidin bedeckte Partikel
-
4.1.4.8 Ligation der Linker an die gebundene cDNS
-
4.1.4.9 Restriktionsenzymverdau der gebundenen cDNS mit dem Tags produzierendem Enzym BsmFI
-
4.1.4.10 Begradigung der Tags
-
4.1.4.11 Ligation der Monotags zu Ditags
-
4.1.4.12 Amplifikation der Ditags mittels PCR
-
4.1.4.13 Entfernung der Linker mittels NlaIII Verdau
-
4.1.4.14 Ligation der Ditags zu Ketten
-
4.1.4.15 Klonieren der Ditagketten
-
4.1.4.16 Sequenzieren
-
4.1.4.17 Auswertung
-
4.1.4.18 Quantitatives Resultat
-
4.2 Diskussion der Etablierung von SAGE
-
4.2.1
Methodische Probleme der Durchführung von SAGE
-
4.2.1.1
Kontamination mit Linkersequenzen
-
4.2.1.2 Amplifikation der Ditags
-
4.2.1.3 Verdau der 102bp Fragmente mit NlaIII
-
4.2.1.4 Behandlung der Ditag-Lösungen
-
4.2.1.5 Ligation der Ditags zu Polytags
-
4.2.1.6 Länge der klonierten Inserts
-
4.2.2
Probleme der Auswertung
-
4.2.3 Implikationen für SAGE bei Sonderfällen der Boten-RNS
-
4.2.3.1
Transkripte ohne Erkennungssequenz für das Verankerungsenzym
-
4.2.3.2 Besondere Lage der Erkennungssequenz für NlaIII (5')
-
4.2.3.3 Besondere Lage der Erkennungssequenz für NlaIII (3')
-
4.2.3.4 Transkripte, deren komplementärer Strang die Enzymerkennungssequenz für BsmFI enthält
-
4.2.4
Beurteilung des quantitativen Resultats
-
4.3
Fazit der Praxis von SAGE
-
5
Statistische Evaluation und Reliabilität von SAGE
-
5.1
Ergebnisse
-
5.1.1
Ausgangsituation und Strategie
-
5.1.2
Vergleich der Gesamtverteilungen
-
5.1.2.1
Chi²-Test für k x 2- Felder-Tafeln (Simulationen)
-
5.1.2.2 Kontingenzkoeffizient
-
5.1.3 Paarweise Vergleiche
-
5.1.4
Zusammenfassung der Ergebnisse der Simulationen üblicher Experimente
-
5.1.5
Statistischer Vergleich der angewandten paarweisen Tests
-
5.1.6
Zusammenfassung der Berechnungen zur Reliabilität von SAGE
-
5.1.7
Sequenzfehlerkorrektur
-
5.2 Diskussion
-
5.2.1
Der statistische Entscheidungsprozeß
-
5.2.1.1
Welche Teststruktur ist entscheidend?
-
5.2.1.2 α-Fehler-Adjustierung
-
5.2.1.3 Praktische Bedeutsamkeit
-
5.2.1.4 Struktur des statistischen Entscheidungsprozesses
-
5.2.2
Evaluation nicht angewandter Tests
-
5.2.3
Evaluation der angewandten Tests
-
5.2.3.1
Tests zum Vergleich der Gesamtverteilungen
-
5.2.3.1.1
Chi²-Test für k x 2- Felder Tafel (Simulationen)
-
5.2.3.1.2 Kontingenzkoeffizient
-
5.2.3.2 Tests zum paarweisen Vergleich
-
5.2.4
Reliabilität
-
5.2.4.1
Die Reliabilität von SAGE in der Literatur
-
5.2.4.2 Formale Grundvoraussetzungen der Reliabilitätsuntersuchung
-
5.2.4.3 Die statistische Überprüfung der Reliabilität
-
5.2.4.4 Exkurs: Validierung von SAGE Daten in der Literatur
-
5.2.4.5 Inhaltliche Bewertung der Reliabilität von SAGE
-
5.2.4.6 Möglichkeiten zur Behandlung des zufälligen Fehlers
-
5.2.4.7 Fazit der ermittelten Reliabilität
-
5.2.4.8 Ausblick
-
6
Zusammenfassung
-
Abkürzungsverzeichnis
-
Literaturverzeichnis
-
Danksagung
-
Lebenslauf
-
Eidestattliche Erklärung
Tabellen
Bilder
| © Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die
elektronische
Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich
vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für
die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
|
| DiML DTD Version 4.0 | Zertifizierter Dokumentenserver der Humboldt-Universität zu Berlin | HTML-Version erstellt am: 23.08.2006 |