Zusammenfassung

Etablierung

↓198

Die vorliegende Arbeit ist im Rahmen eines Projektes zur Untersuchung der Genexpression bei Tiermodellen neurologischer Erkrankungen entstanden. Mit herkömmlichen Kandidatenansätzen und den entsprechenden Methoden wie beispielsweise Northern Blotting ist eine Expressionsanalyse nur in beschränktem Umfang zu realisieren. Ziel war daher die Etablierung eines Verfahrens wie SAGE, das die Analyse des gesamten zerebralen Transkriptoms zuläßt. Wie die Arbeit gezeigt hat, ist SAGE in einem Standardlabor durchführbar. Das Verfahren hat viele Entwicklungsmöglichkeiten (beispielsweise LongSAGE, SAGE lite), so daß SAGE der Forschung auch weiterhin neue Impulse (zum Beispiel im Zusammenhang mit Einzelzellanalysen) geben kann.

Im Verlauf der Etablierung von SAGE wurden folgende Abwandlungen der Orginalmethode durchgeführt: Um wenige redundante Ditags, welche die Anzahl an auswertbaren Tags senken, zu erhalten, wurden im Rahmen der PCR erfolgreich parallel sehr viele Ansätze mit niedriger Zyklenzahl durchgeführt. Da sich die Ligation der Ditags zu Konkatemeren aufgrund der hohen Qualität der Ditags als übereffizient erwieß, genügte eine geringere Menge des Enzyms sowie wesentlich kürzere Inkubationszeiten. Die Begradigung der Tags nach dem BsmFI Verdau mit Klenow erfolgt bei niedrigerer Temperatur, um die Exonukleaseaktivität des Enzyms zu verringern und damit die Wahrscheinlichkeit für zu kurze Tags zu senken.

↓199

Es wurden verschiedene Problembereiche offensichtlich, zu welchen Vorschläge zur Lösung (auch aus der Literatur) diskutiert wurden. Hierzu zählen: die Minderung der Effizienz von SAGE durch Kontamination mit Linkersequenzen, der suboptimal verlaufenden Verdau mit NlaIII und Sonderfälle der Boten-RNS-Gestalt wie Transkripte ohne NlaIII-Schnittstelle oder einer sehr weit 5’ liegenden und Transkripte, deren Gegenstrang die BsmFI Erkennungssequenz enthält. Zur Problematik des CG-Gehalts der Tags, der in der vorliegenden Arbeit in den beiden Gruppen nicht übereinstimmt (statistisch abgesichert), sind weitere Studien notwendig.

Im Zusammenhang mit der Auswertung waren dies: Die Elimination der Linkerartefakte erschien nicht ausreichend, so daß hierfür ein spezielles Computerprogramm entwickelt wurde. Für Publikationen wäre zu wünschen, daß die Kriterien und die Art der Linkerelimination dokumentiert wäre. Die Homologierecherche kann sich schwierig gestalten, da Uneindeutigkeiten der Zuordung auftreten können (Tags können mehreren Genen, ein Gen kann mehreren Tags, Tags können falsch oder gar nicht zugeordnet werden.). Lösungsansätze wurden dargestellt, insofern die Uneindeutigkeiten der Zuordnung nicht aufgrund der Datenlage der Genbanken auftreten, sondern SAGE anzulasten sind.

Statistik

Zur Evaluierung der statistischen Auswertung von SAGE wurde zusätzlich zu einer ausführlichen Darstellung des gesamten statistischen Entscheidungsprozesses explorativ die Situation statistischer Entscheidungen nachgeahmt, wie sie sich im Rahmen üblicher experimenteller Konstellationen darstellt. Es wurde eine Testvariante (modifizierter Z-Test) angewandt und evaluiert, die bis dato noch nicht zur Auswertung von SAGE benutzt worden war. Die Ergebnisse der Berechnungen zeigen die Eigenheiten der verschiedenen Tests. Dies macht deutlich, daß bei der statistischen Auswertung eines SAGE Projektes der Test gemäß den Eigenschaften des Projektes ausgewählt werden sollte. Es folgt eine entsprechende Zusammenfassung der vier evaluierten paarweisen Tests.

a) Test nach Madden et al. (1997)

↓200

Aufgrund der Tatsache, daß sich N 1 und N 2 für die gültige Anwendung dieses leicht zu berechnenden Tests identisch oder zumindest sehr ähnlich sein müssen, ist diese sehr eingeschränkt. Die Ergebnisse dieses Tests in der vorliegenden Arbeit unterscheiden sich nicht statistisch signifikant von denjenigen des Tests nach Audic und Claverie oder des Vier-Felder-Chi²-Testes. In einer weiteren Analyse erweist dieser Test sich als derjenige, von den in der vorliegenden Arbeit untersuchten Tests, welcher am konservativsten entscheidet.

b) Test nach Audic und Claverie (1997)

Im Gegensatz zu allen anderen vorgestellten Tests unterliegt der Test von Audic und Claverie keinerlei Einschränkungen bezüglich der Größe von N 1 und N 2 und der Taghäufigkeiten n. Diese Parameter können jeden beliebigen Wert annehmen. Im Bereich kleiner Taghäufigkeiten entscheidet der Test konservativ und hat eine geringe Teststärke, so daß dort eine niedrige Wahrscheinlichkeit vorliegt, daß der Test zugunsten von H1 entscheidet. Diese Eigenschaften machen den Test von Audic und Claverie zu einem geeigneten Test, wenn keine minimale zu verwendende Taghäufigkeit festlegt werden soll, aber in diesem unteren Bereich, die Daten unter strengen Kriterien betrachtet und wenig falsch positive Transkripte riskiert werden sollen. Dies könnte zum Beispiel in SAGE Projekten mit einer vergleichsweise geringen Anzahl an sequenzierten Tags der Fall sein oder bei Projekten, die Gewebe oder Zustände mit einem komplexen Expressionsmuster untersuchen. Da keine Software vorliegt, die eine rein statistische Analyse ganzer SAGE Projekte automatisiert durchführt, ist die Anwendung dieses Tests relativ aufwendig.

c) Vier-Felder-Chi²-Test

In der Monte-Carlo-Studie von Man et al. (2000) erweist sich dieser einfach zu berechnende Test als robust. Er entscheidet weder konservativ noch progressiv, sondern bleibt beim vorgegebenen α-Niveau. Seine Teststärke ist höher als diejenige des Tests nach Audic und Claverie. Dies gilt insbesondere für den Bereich kleiner Taghäufigkeiten. Die Daten der vorliegenden Arbeit bestätigen dies. Wenn die Tagpaare selektiert werden, deren Mittelwert m < 15 ist, ermittelt der Chi²-Test mehr Paare als statistisch signifikant verschieden als der Test nach Audic und Claverie. Im Bereich größerer Häufigkeiten entscheiden beide Tests identisch. Allerdings stellt sich im Bereich sehr kleiner Häufigkeiten die Frage nach der Verletzung der Voraussetzungen des Chi²-Testes, der Einschränkungen bezüglich der erforderlich minimalen Erwartungshäufigkeiten unterworfen ist. Dies macht den Test besonders geeignet für SAGE Projekte, die eine sehr große Anzahl von Tags sequenziert haben und/oder ein Gewebe oder einen Zustand untersuchen, das/der ein einfaches Expressionsmuster besitzt, so daß auf die Auswertung sehr kleiner Taghäufigkeiten verzichtet werden kann.

d) Z-Test

↓201

Die statistischen Entscheidungen des von Kal et al. (1999) vorgestellten Ansatzes, der auch der Software SAGEstat zugrunde liegt, stimmen exakt mit denjenigen des Vier-Felder-Chi²-Test überein. Da die Anwendung dieses Z-Testes ebenfalls Einschränkungen unterliegt, was die minimale zu verwendende Häufigkeit n betrifft, ist die Anwendung des modifizierten Z-Testes zu empfehlen. Bei dieser Variante des Z-Testes ist nur die Häufigkeit n = 0 problematisch. Der Vergleich der untersuchten vier Tests macht deutlich, daß die Ergebnisse des modifizierten Z-Test deutlich von denjenigen der anderen Tests insbesondere im Bereich kleiner Taghäufigkeiten abweichen. Er entscheidet hier deutlich progressiver. Wenn angestrebt wird, mittels SAGE möglichst viele Gene als reguliert zu identifizieren, die weiteruntersucht werden sollen, ist dieser Test damit geeignet. Dies gilt auch für große SAGE Projekte, die auf die Auswertung von Tags mit geringen Häufigkeiten (insbesondere n = 0) verzichten können.

Reliabilität

Um die Reliabilität von SAGE abschätzen zu können, wurde von vier Mäusegroßhirnen die Gesamt-RNS extrahiert und vereinigt. Diese Transkriptgrundpopulation wurde zweigeteilt und parallel untersucht. Die beiden Gruppen wurden anhand eines statistischen Tests, der die gesamte Verteilungen der beiden Profile prüft, auf Homogenität untersucht. Zusätzlich wurde der Zusammenhang (und dessen Ausmaß) der Profile ermittelt. Dies ergab, daß die Reliabilität von SAGE im vorliegenden Kontext (relativ geringe Stichprobe und ein komplexes Gewebe) nicht optimal ist. Es kann jedoch keine Aussage dazu gemacht werden, ob dies der Methode selbst, das heißt ihrer molekularbiologischen Praxis und der Datenaufbereitung, anzulasten ist oder einer großen Stichprobenvariabilität. Dies bedeutet, daß in der vorliegenden Arbeit keine endgültige Aussage zur Reliabilität von SAGE möglich ist.

Es gibt Möglichkeiten eine eventuell suboptimale Reliabilität im Rahmen von zukünftigen Projekten auszugleichen, indem die Stichprobengröße (Anzahl der sequenzierten Tags und die Anzahl der Durchläufe, deren Ergebnis gemittelt wird) erhöht wird. Außerdem ist zu beachten, daß dies bedeutet, daß nur große Regulationsunterschiede und Transkripte höherer Expressionsniveaus (die bei der Untersuchung homogener Gewebearten häufiger sind) so gemessen werden können, daß die Rate der falsch positiven Entscheidungen im Rahmen des vorgegebenen α-Signifikanzniveaus bleibt. Um im Rahmen eines SAGE Projektes die Reliabilität des Durchlaufs zumindest qualitativ beurteilen zu können, wäre es zu empfehlen, - wie in der vorliegenden Arbeit - die verwendete Gesamt-RNS zu teilen, parallel zu verarbeiten und die beiden Profile auf Homogenität zu prüfen. Aus dem gleichen Grund wäre es sinnvoll, ein Verfahren zur Abschätzung des Sequenzfehlers, der die Reliabilität von SAGE so wesentlich beeinflußt, standardmäßig anzuwenden.

↓202

Die in der vorliegenden Arbeit entwickelte Sequenzfehlerkorrektur zur Verbesserung der Meßgenauigkeit zeigte keine Erhöhung der Homogenität der beiden Vergleichsprofile K1 und K2. Solange noch keine exakte Evaluation dieser Korrektur in einem speziellen Versuch erfolgt ist oder eine andere entwickelt worden ist, ist keine nachträgliche Korrekturmöglichkeit vorhanden, was die Forderung nach hochwertiger Sequenzierung der SAGE Konkatemere betont.

Aufgrund der genannten Einschränkungen der Reliabilität sollte SAGE als potentes Screeningverfahren im Sinne einer explorativen Datenanalyse aufgefaßt werden, dessen Resultate steter Validierung mit einer zweiten Methode bedürfen.


© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 4.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
23.08.2006