Aus der Abteilung für Experimentelle Neurologie der Medizinischen Fakultät der Charité – Universitätsmedizin Berlin

Dissertation

Serielle Analyse der Genexpression (SAGE):

Etablierung, Statistik und Reliabilität

Zur Erlangung des akademischen Grades Doctor medicinae (Dr. med.)

vorgelegt der Medizinischen Fakultät Charité der Humboldt-Universität zu Berlin

Stefanie Castell
aus München

Dekan: Prof. Dr. Martin Paul

Gutachter:
1. Prof. Dr. med. U. Dirnagl
2. Prof. Dr. rer. nat. Ch. Behl
3. Prof. Dr. K.- D. Wernecke

eingereicht: 28. Juli 2004

Datum der Promotion: 20. März 2006

Zusammenfassung

Die vorliegende Arbeit ist im Rahmen eines Projektes zur Untersuchung der Genexpression bei Tiermodellen neurologischer Erkrankungen entstanden. Mit herkömmlichen Kandidatenansätzen ist eine Genexpressionsanalyse nur in beschränktem Umfang zu realisieren. Ziel war daher die Etablierung eines Verfahrens wie SAGE (serielle Analyse der Genexpression), das die Analyse des gesamten Transkriptoms zuläßt. Wie die Arbeit zeigt, ist SAGE in einem Standardlabor durchführbar. Es wurden geringfügige Abwandlungen der Orginalmethode eingeführt. Zur Sequenzfehlerkorrektur wurde ein spezielles Computerprogramm entwickelt und evaluiert.

Zur Evaluierung der statistischen Auswertung von SAGE wurde zusätzlich zu einer Darstellung des gesamten statistischen Entscheidungsprozesses explorativ die Situation statistischer Entscheidungen wie sie im Rahmen üblicher SAGE Experimente auftreten mit vier Tests nachgeahmt. Es wurde eine Testvariante (modifizierter Z-Test) angewandt und evaluiert, die bis dato noch nicht zur Auswertung von SAGE benutzt worden war.

Um die Reliabilität von SAGE abschätzen zu können, wurde von vier Mäusegroßhirnen die Gesamt-RNS vereinigt. Diese Transkriptgrundpopulation wurde zweigeteilt und parallel untersucht. Die beiden Gruppen wurden anhand eines statistischen Tests, der die gesamte Verteilungen der beiden Profile prüft, auf Homogenität untersucht. Zusätzlich wurde das Zusammenhangsmaß ermittelt. Dies ergab, daß die Reliabilität von SAGE im vorliegenden Kontext (relativ geringe Stichprobe und ein komplexes Gewebe) nicht optimal ist. Es kann jedoch keine Aussage dazu gemacht werden, ob dies der Methode selbst, das heißt ihrer molekularbiologischen Praxis und der Datenaufbereitung, anzulasten ist oder einer großen Stichprobenvariabilität. Dies bedeutet, daß in der vorliegenden Arbeit keine endgültige Aussage zur Reliabilität von SAGE möglich ist. Es werden Möglichkeiten dargestellt mit einer suboptimale Reliabilität im Rahmen von zukünftigen Projekten umzugehen.

Eigene Schlagworte: SAGE, Reliabilität, Genexpression, mRNS

Abstract

The work presented here evolved within the framework of a project that examines gene expression of neurological conditions in animal models. Using conventional methods (candidate genes study) gene expression analysis is limited. Hence, the aim was to establish a procedure like SAGE (serial analysis of gene expression) that allows for analysis of the entire transcriptome. As shown it is possible to perform SAGE in a standard laboratory. Minor changes to the original version were made. A special computer program was developed and evaluated to reduce sequencing errors.

In addition to a description of the entire statistical process, the statistics of SAGE were explored by simulating normal SAGE experiments, using 4 statistical tests. One test version (modified Z-test) that has not been used for statistical analysis of SAGE yet was applied and reviewed.

To assess the reliability of SAGE the total-RNA of 4 corteces of mice was extracted and combined. This basic transcript population was divided in two and the parts examined in parallel. Both groups were analysed using a statistical test that tests the entire distribution of both profiles for homogeneity. Additionally the correlation (and its degree) of the profiles was calculated. The result was that the reliability of SAGE is not optimal in the context of this work (relatively small sample and complex tissue). However, no conclusion can be drawn as to whether the method itself (biomolecular practice and data analysis) is responsible for this, or whether it is due to sample variability. This means that in the work presented here no final statement concerning the reliability of SAGE is possible. Possibilities are described to deal with the issue of suboptimal reliability within the framework of future projects.

Keywords: SAGE, Reliability, gene expression, mRNA

Inhaltsverzeichnis

Tabellen

Bilder



© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 4.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
23.08.2006