[Seite 4↓]

1  Einleitung

Seit Charles Darwin ist es ein Traum eines jeden Evolutionsbiologen, die Entstehungsgeschichte aller lebenden Organismen zu rekonstruieren und das Ergebnis in Form eines Stammbaumes Haeckel (1866) auszudrücken. Ein Ansatzpunkt zur Verwirklichung dieses Traums ist das Studium des fossilen Berichtes, um eine möglichst lückenlose Genealogie der Organismen mit allen phänotypischen Übergangsformen rekonstruieren zu können. Dies gelingt für Teilbereiche des Baums, so genügend fossilisierbare Strukturen vorhanden waren (wie beispielsweise bei Cormophyten, Vertebraten, Foraminiferen oder Cephalopoden), in durchaus vielversprechender Weise, versagt jedoch zwangsläufig bei Gruppen mit kaum oder nicht fossilisierbarer Morphologie. Da dies bei der Mehrzahl der Großtaxa der Fall ist, wurde schon frühzeitig auf vergleichende Methoden an rezenten Organismen zurückgegriffen. Insbesondere morphologische Methoden haben wesentlich zur Klärung einiger Teilfragen des ``tree of life´´ beigetragen. Die Veränderungen morphologischer Merkmalskomplexe sind jedoch derartig komplex, dass es bis zum heutigen Tag nicht gelingt, ein im Detail klares Bild der Beziehungen der Organismen zueinander zu zeichnen. Viele Fragen der Beziehungen der Großtaxa zueinander sind nach wie vor offen und bedürfen der Bearbeitung mit innovativen Methoden.

Eine solche Vorgehensweise schlugen Zuckerkandl und Pauling Zuckerkandl undPauling (1965) vor, indem sie molekulare DNA- Sequenzen als Merkmale zur Klärung phylogenetischer Fragestellungen empfahlen. Die Erfindungen der enzymatischen DNA Sequenzierung durch Strangabbruch Sanger et al. (1977) und der PCR Mullis et al. (1986) liefern dazu die methodischen Werkzeuge, mit deren Hilfe es seitdem möglich wurde, eine Vielzahl von „DNA Phylogenien“ zu erstellen und in die allgemeine Diskussion einzubringen.

Die vergleichende Analyse von DNA Sequenzen hat einige Vorteile gegenüber der vergleichenden Morphologie. Die elementarste Gemeinsamkeit aller rezenten Organismen ist wohl unbestritten ihre Nutzung der DNA als Erbinformationsträger über alle Generationen hinweg. Weiterhin unbestritten ist, trotz der Beobachtung geringfügiger, seltener Abweichungen, die Universalität des genetischen Codes. Die monophyletische Entstehung der Erbinformationsweitergabe kann deshalb nicht mehr ernsthaft diskutiert werden. Für die phylogenetische Forschung ergibt sich daher die prinzipielle Möglichkeit, DNA-Sequenzen aller rezenten Organismen zu homologisieren und somit einen schier unerschöpflichen Pool an Merkmalen zu gewinnen. Dies setzt voraus, dass geeignete, problemlos homologisierbare (vergleichbare) Sequenzen gewählt werden, die eine gewisse Variabilität aufweisen (abhängig von dem zu untersuchenden taxonomischen Level). Diese Variabilität ist das Ergebnis von Mutationen der DNA, die einem mehr oder weniger gleichmäßigen Muster folgen. So ist es möglich, Evolutionsmodelle zu formulieren, die eingesetzt werden können, um auch entfernte Verwandtschaftsbeziehungen zu erforschen.

Aus genannten Gründen wird daher von der Molekularsystematik i.a. die Aufklärung vieler bislang fraglicher Beziehungen innerhalb des ``tree of life´´ erwartet. Daraus sollte ein besseres Verständnis der zu beobachtenden phänotypischen Komplexität und deren Bewertung ermöglicht werden.


[Seite 5↓]

1.1  Die phylogenetische Systematik im Blickpunkt molekularer
Daten

Die von Willi Hennig Hennig (1966) begründete Methode des „Cladismus“ gilt als methodische Basis der phylogenetischen Systematik. Ziel der phylogenetischen Systematik ist es, einen natürlichen Stammbaum zu rekonstruieren. Wir sind nicht Zeugen eines seit Hunderten von Millionen Jahren andauernden Prozesses. Jede Bemühung einer Rekonstruktion von Verwandtschaftsverhältnissen hat daher hypothetischen Charakter und muss der Falsifikation offen gegenüberstehen.

Durch die von W. Hennig eingeführten neuen Begriffe, wie Synapomorphie und Synplesiomorphie, gelang es der phylogenetischen Forschung, qualitativ zwischen Merkmalen und der Evolution derselben zu unterscheiden: Hierbei werden zunächst ursprüngliche (plesiomorphe) Merkmale von abgeleiteten (apomorphen) Merkmalen unterschieden. Taxa, die gegenüber ihren putativen Außengruppen abgeleitete Merkmalszustände teilen (Synapomorphien), werden zu monophyletischen Gruppen zusammengefasst, d.h. die Mitglieder dieser Gruppe stammen von einer nur ihnen gemeinsamen Stammart ab.

Aufgabe der phylogenetischen Forschung ist es nun, durch den Vergleich homologisierbarer Merkmale Abstammungsgemeinschaften (Monophyla) zu entdecken oder aber vermeintliche Monophyla als para- oder polyphyletisch zu entlarven. Die erste Quelle zur Rekonstruktion der Abstammungsgeschichte bieten paläontologische Funde, die, vorausgesetzt die geologische Datierung stimmt, einen chronologischen und typologischen Rahmen vorgeben. Verbunden mit Vergleichen homologer morphologischer Merkmale rezenter Arten versucht die phylogenetische Forschung Ähnlichkeitsreihen abzuleiten, die Hinweise auf die tatsächliche Entwicklungschronologie geben.

Die qualitative Unterscheidung eines Merkmals bezüglich seines plesiomorphen oder apomorphen Ursprungs geschieht hierbei über die Festlegung der Leserichtung , ist allerdings in der Praxis häufig nicht einfach, da sich viele Merkmale konvergent entwickelt haben. Mehrfach parallel evolvierte Merkmale können zu falsch interpretierten Verwandtschaftsverhältnissen führen. Ein zweites Problem ergibt sich aus der Tatsache, dass sich der Forschung nur ein höchst unvollständiges Bild der Evolution zeigt: Fossilfunde bieten nur schlaglichtartig Einblick in die längst ausgestorbene Organismenwelt. Die Systematik rezenter Organismen muß Evolutionsszenarien hypothetisieren, die Millionen von Jahren andauerten, um Schwestergruppenverhältnisse zu erklären. Dies stellt die Wissenschaft vor ein Dilemma. Prinzipiell kann man mit etwas Phantasie fast immer eine mögliche Folge von evolutiven Veränderungen eines beobachteten Merkmals von der putativen Stammart bis zum rezenten Organismus beschreiben. Doch gäbe es hier viele verschiedene Wege für verschiedene Hypothesen. Um der Gefahr eines solchen phantastischen Chaos zu entgehen, beruft sich die empirisch arbeitende phylogenetische Forschung traditionell auf das Ockham'sche Prinzip (Parsimonie) - das Prinzip der größtmöglich anzunehmenden Sparsamkeit: Es ist der Stammbaum anzunehmen, der die geringste Schrittanzahl benötigt, um beobachtete Veränderungen zu erklären. Mit anderen Worten, die Anzahl der ad hoc Hypothesen bezüglich einer Merkmalsverteilung zwischen verschiedenen Taxa muß minimiert werden Rieppel (1999). Diese Vorgehensweise setzt natürlich die [Seite 6↓]Annahme voraus, dass die Veränderung oder die Neuerwerbung eines Merkmals im Laufe der Evolution einen für uns logischen und damit direkten Weg bis hin zum Beobachtbaren gelaufen ist. Ob dies in jedem Fall bzw. bei jedem zu analysierenden Merkmal auch zutreffend ist, ist mehr als fraglich und entzieht sich dem Betrachter.

Auch die phylogenetische Analyse molekularer Datensätze lässt sich methodisch in das Ockham’schen Prinzips (Parsimonie) einbetten, d.h. es ist der Stammbaum anzunehmen, der die wenigsten Substitutionen benötigt, um einen Datensatz zu erklären. Neben der Parsimonie Methode zur Berechnung diskreter Datensätze Camin undSokal (1965) kommen in zunehmendem Maß auch statistische Algorithmen zum Einsatz. Verfahren, wie Maximum Likelihood Felsenstein (1981) oder auch Distanzmethoden, wie Neighbor joining Saitou undNei (1987),Studier undKeppler (1988), beruhen jeweils auf einem a priori anzunehmenden Evolutionsmodell. Die Modelle leiten sich aus zahlreichen, in den unterschiedlichsten Datensätzen beobachteten, Substitutionsereignissen von Nukleotiden oder Aminosäuren ab. Zur Berechnung der Datensätze werden zahlreiche Computerprogramme angeboten, in denen die o.g. Methoden und Modelle implementiert sind.

Parsimonie Analysen, die im Gegensatz zu beispielsweise Maximum Likelihood Analysen vorgeben, modellunabhängig zu arbeiten, entsprechen im wesentlichen der Tradition des vom Wissenschaftsphilosophen Karl Popper Popper (1963) begründeten Falsifikationismus und damit den Forderungen, die Anzahl der ad hoc Hypothesen zu minimieren, die nötig sind, um eine neue Theorie aufzustellen. Aus der Tradition der phylogenetischen Systematik heraus und damit verbunden dem Versuch, „...die vergleichende Biologie in die Tradition des Falsifikationismus einzubetten...“ Rieppel (1999), wird die Anwendung von Parsimonie Verfahren gegenüber der Anwendung statistischer Verfahren kontrovers diskutiert De Queiroz undPoe (2003),Kluge (2001).

Der phylogenetisch arbeitende Molekularbiologe sieht sich nun mit der Tatsache konfrontiert, dass es die unterschiedlichsten Qualitäten von Mutationen in der DNA geben kann (z.B. synonyme, nicht-synonyme Mutationen, Rückmutationen, sich gegenseitig kompensierende Mutationen, Covarianzen). Mutationen auf Nukleotidebene treten bei jeder Zellteilung auf. Im Fall von Punktmutationen können, abgesehen von Insertions- bzw. Deletionsereignissen, nur vier Merkmalszustände erreicht werden. Das heißt, bei jeder Replikationsrunde könnte ein anderer Merkmalszustand realisiert werden. Es gibt daher keinen vernünftigen Grund anzunehmen, dass die DNA auf dem kürzesten, für uns logischen Weg, evolviert ist. Daraus ergibt sich ferner, dass es aufgrund des nahezu neutralen Selektionsdruckes auf ein Nukleotid (im Vergleich zu beispielsweise einer komplexen morphologischen Struktur) kaum möglich ist, objektiv zwischen Konvergenzen, Apomorphien oder Plesiomorphien zu unterscheiden. Sogenannte Likelihoodisten empfehlen daher, DNA-Evolution als stochastischen Prozess zu begreifen. Das Wissen über qualitativ unterschiedliche Mutationsereignisse (z.B. Transition : Transversion) macht es möglich, Modelle über DNA-Evolutionen zu erstellen und a priori in die statistische Analyse mit einfließen zu lassen, ein Vorgehen, das im Sinne des Musterkladismus nicht zulässig ist. Dennoch führen die Berechnungen mit Parsimonie- und anderen, modellabhängigen Verfahren häufig zu kongruenten Ergebnissen, was die Diskussion über die verschiedenen Verfahren teilweise sehr theoretisch erscheinen lässt Goldman (1990),Sidall undKluge (1997).


[Seite 7↓]

Ausgangspunkt für eine phylogenetische Analyse molekularer Datensätze ist das Alignment. Dem Erstellen eines Alignments ist, insbesondere wenn es sich um ein nicht proteincodierendes Gen handelt, eine besondere Bedeutung beizumessen. Ribosomale RNA Gene sind in ihrer Länge bezüglich verschiedener Organismen ungleich, da sie keinen ``reading frame´´ wie etwa proteincodierende Gene besitzen. Durch das Einfügen sogenannter ``gaps´´ (Lücken) in die einzelnen Sequenzen erhält das gesamte Alignment eine einheitliche Länge. Die biologische Bedeutung solcher Insertionen oder Deletionen Li (1997) an einer spezifischen Position bleibt zunächst unklar, formuliert wird aber dennoch eine Homologiehypothese bezüglich der benachbarten sichtbaren Nukleotidpositionen. Das Einfügen von ``gaps´´ bzw. die Verlängerung derselben wird dabei über zu wählende Parameter gesteuert (``gap costs, gap creation, gap elongation´´). Hierbei kann es häufig zu wenig vertrauenswürdig alignten Sequenzbereichen kommen, d.h. die postulierten Positionshomologien sind ungewiss. Deshalb ist das Ergebnis der phylogenetischen Analyse in diesen Fällen stark abhängig von den gewählten Parametern im Alignmentverfahren. Zur Überwindung dieser Probleme werden im wesentlichen zwei Verfahren angewandt. Entweder werden Sequenzbereiche, die ``gaps´´ aufweisen, vor der phylogenetischen Berechnung eliminiert Swofford et al. (1996) oder es wird eine vergleichende Sekundärstrukturanalyse durchgeführt, in der die ``stem´´- und ``loop´´- Bereiche definiert werden Kjer (1995),Titus undFrost (1996). Sofern ``gaps´´ als Insertionen oder Deletionen betrachtet werden, d.h. als tatsächlich vorhandene Merkmale, können diese auch als fünftes Merkmal (neben den vier Nukleotiden) mit in die Analyse eingehen. Dieses Verfahren ist allerdings nur in Parsimonie Analysen möglich. Maximum Likelihood Analysen sehen diese Möglichkeit aufgrund der o.g. Unsicherheiten nicht vor.

1.2 Molekulare Daten zur Klärung phylogenetische
Beziehungen innerhalb der Metazoa

Die Güte der phylogenetischen Informationen, die sich aus einem Sequenzvergleich ergeben, hängt maßgeblich von der Auswahl der molekularen Marker ab. Ein „universell“ anwendbares Gen sollte dabei prinzipiell die folgenden Anforderungen erfüllen Woese (1987):

Bis heute wurden einige wenige Gene bzw. Genabschnitte auf ihre Anwendbarkeit für unterschiedliche systematische Fragestellungen verwendet und getestet. Hier kommt den ribosomalen Genen, insbesondere der nuklearen 18S rRNA, eine besondere Bedeutung zu. Die einfache Amplifizierbarkeit mit allseits bekannten universell einsetzbaren Primern führte in den letzten Jahren zu einer wahren „18S-Datenflut“ in den Genbanken. Obwohl die Probleme hinsichtlich des Auflösungsvermögens der 18S rRNA hinreichend publiziert sind Wägele et al. (1999), führt die große Anzahl an 18S rRNA Daten seitdem zu immer neuen Stammbaumrekonstruktionen verschiedenster [Seite 8↓]Taxa mit z.T. sich widersprechenden Ergebnissen. Dennoch verzeichnet die Datenbank in den letzten Jahren zahlreiche Einträge verschiedenster Taxa und anderer, speziell proteincodierender Gene. Dies sollte es in naher Zukunft ermöglichen, ein großes Spektrum an relevanten Genen (z.B. ``housekeeping genes´´) innerhalb verschiedener taxonomischer Ebenen, bezüglich eines phylogenetischen Signals, zu überprüfen um daraus gewonnene Stammbaumhypothesen miteinander zu vergleichen.

Weitere, für die Bearbeitung phylogenetischer Fragestellungen bekannte Gene sind u.a. die Gene des mitochondrialen Genoms Curole undKocher (1999) und die nuklearen Gene EF-1α Moreira et al. (1999),Roger et al. (1999), EF-2 Rivera undLake (1992) oder auch ein kleiner Abschnitt des Gens für die RNA Polymerase II Shultz undRegier (2000).

Die DNA-Sequenzdatenerhebung ermöglicht nicht nur den phylogenetischen Vergleich von Nukleotiden oder Aminosäuren, sondern kann auch in der Auswertung makromolekularer Strukturen Einblick in verwandtschaftliche Beziehungen gewähren. Hier wären zum einen Elemente der Sekundärstruktur von ribosomalen RNAs zu nennen und zum anderen die Positionen von Introns in proteincodierenden Genen. Die Identifizierung prosthetischer Positionen in Proteinen und damit die Möglichkeit der Modellierung von Proteinsekundärstrukturen bis Quartärstrukturen, wie dies das große Arbeitsfeld der ``Proteomics´´ darstellt, werden sicherlich in Zukunft auch dem phylogenetisch interessierten Wissenschaftler zahlreiche Betätigungsfelder bieten.

1.2.1 Mitochondriale Gene

Generelle Eigenschaften des mitochondrialen Genoms, wie i.a. maternale Vererbung, hohe Kopienzahl pro Zelle und „single copy genes“ Hoeh et al. (1996), machen dieses Molekül sehr attraktiv für das Studium der Phylogenie verschiedener Eukaryontentaxa Graf undSparks (2000). Insbesondere Sequenzvergleiche der 12S und 16S rDNA wurden in den letzten Jahren zur Aufklärung verschiedener taxonomischer Ebenen verwendet Ballard et al. (1992),Richter et al. (2001), aber bezüglich ihrer Auflösungskraft bei älteren Splits auch kritisch hinterfragt Gray et al. (1999).

Die heute im allgemeinen akzeptierte Erklärung für die Entstehung von Mitochondrien (und auch Chloroplasten) ist die Endosymbiontentheorie. Diese geht von einer endosymbiontischen Aufnahme eubakterieller, aerober Vorläufer durch einen Urkaryonten aus, mit anschließender Koexistenz vor ca. 1,5 Milliarden Jahren Gray (1989). Sequenzvergleiche des „mitochondrienartigsten“ bekannten eubakteriellen Genoms (Rickettsia prowazekii, einem α-Proteobakterium, Andersson et al. (1998)) und dem „bakterienartigsten“ bekannten mitochondrialen Genom (des Protozoen Reclinomonas americana mit 97 Genen, Lang et al. (1997)) machen deutlich, dass alle rezenten mitochondrialen Genome ihren Ursprung in einem einzigen sogenannten protomitochondrialen Genom haben müssen Gray et al. (1999).

Im Laufe der Evolution wurden aus den endosymbiontisch lebenden Bakterien, durch einen regen Gentransfer in das Kerngenom, semiautonome Organellen (Mitochondrien) unter nukleärer Kontrolle Nugent undPalmer (1991). In molekularer Hinsicht bietet der Sequenzvergleich der mitochondrialen [Seite 9↓]ribosomalen RNAs mit denen der Eubakterien starke Argumente für die Endosymbiontentheorie. So ist die bakterielle 16S rRNA homolog zu der tierischen, mitochondrialen 12S rRNA und entsprechend die bakterielle 23S rRNA homolog zur tierischen, mitochondrial kodierten 16S rRNA.

Das mitochondriale Genom der meisten Metazoa liegt in einem zirkulären Plasmid von etwa 16-20 kb Länge vor und kodiert i.d.R. nur noch durchschnittlich für 13 Proteine der Atmungskette (Untereinheiten 1-6 und 4L des NADH Dehydrogenase Komplexes, eine UE des Cytochrom b-c1 Komplexes, UE 1-3 des Cytochrom c Oxidase Komplexes, sowie zwei UE des ATP Synthase Komplexes), zwei ribosomale RNAs (12S und 16S rRNA) und 22 tRNAs (je eine tRNA für 18 Aminosäuren und je zwei tRNAs für die Aminosäuren Serin und Leucin). Mit dieser genetischen Ausstattung sind allerdings nur ca. 20% der in den Mitochondrien benötigten Genprodukte abgedeckt. Ca. 80% der Proteine sind kerncodiert und werden aus dem Cytoplasma in die Organellen importiert. Die Organisation des Chondrioms innerhalb der Metazoa ist sehr kompakt, kann allerdings in der Anordnung speziell seiner Gene für verschiedene tRNAs stark variieren. Die Untersuchung der Rekombination der tRNAs findet eine breite Anwendung für phylogenetische Fragestellung, insbesondere zur Klärung der Stellung verschiedener Taxa innerhalb der Arthropoda Boore et al. (1995),Hwang et al. (2001),Kurabayashi undUeshima (2000). Die meisten untersuchten Vertreter der Metazoa weisen keine Introns in den mitochondrialen Genomen auf (Ausnahme: Metridium senile mit zwei ORFs in den Genen cox1 und ND5).

1.2.2 Die Sekundärstruktur ribosomaler Gene und ihre Anwendungsbereiche in der Phylogenie

Ribosomale RNAs bilden nach der Transkription durch Basenpaarung eine Sekundär- bzw. Tertiärstrukturen aus. In dieser Form sind die Moleküle im Ribosom aktiv und mit Hilfe zahlreicher ribosomaler Proteine wesentlich an der Translation beteiligt. Die Sekundärstruktur besteht aus Helices, auch ``stems´´ genannt (basenpaarende Doppelstrangbereiche) und nicht basenpaarende Bereiche, den sogenannten ``loops´´. Auf diese Weise entsteht aus einer rRNA oder auch tRNA ein komplexes zweidimensionales Makromolekül. Verschiedene ``stems´´ und auch ``loops´´ können ebenfalls miteinander agieren und so in räumliche Nähe zueinander kommen, was dann im weiteren die dreidimensionale Struktur des Moleküls bedingt. Um die Sekundär- wie auch Tertiärstrukturen verschiedener prokaryontischer tRNA als auch rRNA Moleküle zu analysieren, wurden verschiedene Methoden wie z.B. Röntgenstrahl-Kristallographie Kim (1979) angewendet, was allerdings für die sehr langen rRNAs methodische Schwierigkeiten bereitet. Die meisten Sekundärstrukturen wurden durch das Auffinden positioneller Covarianzen im vergleichenden Ansatz postuliert und konnten in experimentellen Studien bestätigt werden Gutell et al. (1992),Gutell et al. (1994). Daher spielt insbesondere im Fall der sehr langen ribosomalen RNAs die vergleichende Sequenzanalyse zur Aufklärung von Sekundärstrukturen eine entscheidende Rolle Gutell et al. (1985),Woese et al. (1980),Zwieb et al. (1981).


[Seite 10↓]

Die 16S-artigen rRNAs der Mitochondrien gehören zu den atypischsten ribosomalen RNAs. Eine große Anzahl von 16S -``stem-loop´´- Strukturen aus E.coli sind in der mitochondrialen kleinen ribosomalen Untereinheit (12S rRNA) nicht mehr vorhanden Gutell et al. (1985). Durch die vergleichenden Arbeiten zur Determinierung eines Sekundärstrukturmodells der mitochondrialen 12S rRNA von Gutell et al. Gutell et al. (1994),Gutell et al. (1985) und Gutell Gutell et al. (1994) für verschiedene Mammalia-Spezies und nachfolgende Verbesserungen Douzery undCatzeflis (1995) ist es gelungen, ein im wesentlichen akzeptiertes Modell zu erstellen. Über die Verwaltung der Sekundärstrukturinformationen für eine Vielzahl von Taxa in den entsprechenden Datenbanken ist es inzwischen möglich, Elemente zur Sekundärstruktur oder komplette Sekundärstrukturen für neu sequenzierte Taxa mittels der vergleichenden Sequenzanalyse zu ermitteln.

Somit spielt die Determinierung der Sekundärstruktur von rRNA Sequenzen in einer phylogenetischen Analyse eine entscheidende Rolle. Mit zunehmender Sequenzvariabilität ribosomaler RNAs innerhalb eines Taxons wird es schwieriger, mittels mathematischer Kriterien ein verlässliches Alignment zu rekonstruieren. Über die Identifizierung von Helices und ``loops´´ anhand einer Modellstruktur wird heute im allgemeinen ein Alignment derartig visuell korrigiert, dass ``stem´´-Bereiche primär homologisiert werden können Hickson et al. (1996),Titus undFrost (1996). Auf diese Weise gehen Informationen der Sekundärstruktur in die phylogenetische Computeranalyse mit ein. Uneinigkeit herrscht jedoch über das alignen von ``loop´´-Sequenzen, die eine hohe Variabiliät aufweisen können und sich somit wiederum sensitiv gegenüber verschiedenen ``gap´´-Gewichtungen verhalten Dixon undHillis (1993),Wheeler undHoneycutt (1988). Daher wird häufig die Eliminierung dieser Bereiche empfohlen, was allerdings andererseits zu einem erheblichen Verlust an Informationen führt.

1.2.3  Nukleare Gene und ihre Struktur im Genom - ``intron early´´
oder ``intron late´´

Viele eukaryontische, im Nucleus lokalisierte Gene sind von nicht-codierenden, intervenierenden Sequenzen durchbrochen (Exon-Intron-Struktur). Die Expression dieser Gene erfordert die Entfernung der Introns bei der Reifung der mRNA-Moleküle im Nucleus, bevor sie in das Cytoplasma transportiert und dort translatiert werden. Das ``splicing´´ der Introns erfolgt bei kerncodierten Genen gewöhnlich durch ein sogenanntes Spliceosom, ein RNA-Protein-Komplex bestehend aus snRNPs (``snurps´´) und assoziierten Proteinfaktoren.

Mit der Entdeckung der Introns in eukaryontischen Genen Ende der siebziger Jahre des 20. Jahrhundert stellte sich gleichzeitig die Frage nach Funktion, Ursprung und Evolution derselben.

Dies führte zu zwei gegensätzlichen Postulaten: Die ``intron early´´ Hypothese, die davon ausgeht, dass bereits der Vorläuferorganismus der Prokaryonten Introns besaß Doolittle (1978),Gilbert (1978) und die ``intron late´´ Hypothese, die eine nachträgliche Insertion der Introns in das eukaryontische Genom postuliert Cavalier-Smith (1978),Cavalier-Smith (1985).

Noch bis vor ca. 20 Jahren war allgemein akzeptiert, dass ausschließlich Eukaryontengene von Introns unterbrochen werden. Dies wurde auch nicht durch die ``exon shuffling´´ Theorie Gilbert (1978),Gilbert (1987) [Seite 11↓]widerlegt, nach der die Introns des spliceosomalen Typs mit dem Ursprung der Gene an sich coinzidieren, d.h. der ``intron early´´ Hypothese folgen. Introns werden demzufolge als Rekombinationsmedien betrachtet, die die variable Verknüpfung von initialen Elementarexons und so die Evolution der heutigen Gendiversität ermöglichte. Die zu diesem Zeitpunkt geglaubte Abwesenheit von Introns in Bakterien musste konsequenterweise als sekundärer Verlust gedeutet werden und wurde mit einem starken Selektionsdruck auf eine schnelle Replikation und rationelle Genexpression zu Gunsten einer kurzen Generationsfolge erklärt.

Einen neuen Denkansatz brachte Mitte der achtziger Jahre des letzten Jahrunderts die erstmalige Entdeckung intervenierender Sequenzen in tRNA Genen einiger Archaebakterien, die zu einer neuen Klasse von Introns (Gruppe I Introns) gehören Daniels et al. (1985) und bald darauf auch in Bakteriophagen und in tRNA Genen von Cyanobakterien und Proteobakterien gefunden wurden Belford et al. (1995). In den beiden letztgenannten Organismengruppen gelangte wenig später auch eine Klasse von Introns der Gruppe II zur Entdeckung Ferat et al. (1994),Ferat undMichel (1993). Introns der Gruppe I und II sind autokatalytische Introns, d.h. es wird keine aufwendige spliceosomale Maschinerie zur Excision benötigt. Anstatt einer Bestätigung der ``exon shuffling´´ Theorie bewirkte die Feststellung, dass Introns in allen Organismenreichen vorkommen, eine Stärkung der ``intron late´´ Hypothese. Diese erklärt die Introns als Abkömmlinge ehemaliger mobiler genetischer Elemente, die in ursprünglich kontinuierlich organisierte Gene insertierten. Durch die Entdeckung der selbstspleißenden Introns in Proteobakterien und Cyanobakterien, d.h. den Prokaryontengruppen, aus denen vermutlich die Organellen via Endosymbiose hervorgingen, gewann die ``intron late´´ Hypothese an Argumenten Cavalier-Smith (1991),Roger undDoolittle (1993). Demzufolge liegt der Ursprung der Introns in den Eubakterien. Durch die Etablierung der Endosymbiose gelangten Gruppe I und Gruppe II Introns in die eukaryontische Zelle und von dort aus via massivem Gentransfer im Laufe der Evolution in den Nucleus. Während die Gruppe I Introns im Nucleus persistierten, vermuten Anhänger der ``intron late´´ Hypothese weiterhin, dass ehemalige Gruppe II Introns in die ausschließlich in Eukaryonten zu findenden, spliceosomalen Introns evolvierten Logsdon et al. (1998). Für diese These sprechen einige strukturelle und funktionelle Ähnlichkeiten zueinander Michel undFerat (1995),Strukla undPadgett (2002).

Die heute weitestgehend akzeptierte Theorie, dass spliceosomale Introns auschließlich in Eukaryonten zu finden sind und ihren ancestralen Vorläufer in prokaryontischen Gruppe II Introns haben, ermöglicht es in zunehmenden Maß eine detaillierte Aussage bezüglich der Evolution von Introns zu machen. Obwohl die Debatte der ``intron early´´ versus ``intron late´´ Hypothesen nicht an Aktualität verloren hat, mehren sich doch die Evidenzen für eine weitgehend rezente, autonome Ausbreitung und auch Verluste spleiceosomaler Introns innerhalb der Eukaryonten DeSouza et al. (1998),Stoltzfus et al. (1997). Die Betrachtung der phylogenetischen Verteilung von Intronpositionen, d.h. von Gewinn und Verlust innerhalb der Eukaryonten Logsdon Jr. (1998) und auch die vergleichende Analyse mit den inzwischen zahlreich sequenzierten bakteriellen Genomen und deren Introns auf der Basis der rekombinanten Molekularbiologie Lynch undRichardson (2002) werden hier in Zukunft einen entscheidenden Beitrag liefern können.


[Seite 12↓]

Für eine phylogenetische Betrachtung von Intronverteilungen ist zunächst die Frage der Mechanismen von Introngewinn und Verlust zu klären, wobei nicht vergessen werden darf, dass diese Vorstellungen Modellcharakter besitzen, da sie nicht direkt beobachtbar sind:

Der Intronverlust kann wie folgt erklärt werden:

Die Mechanismen des Introngewinns:

Wenngleich dieses Szenarium zunächst recht aufwendig und unwahrscheinlich klingt, so gibt es doch einige Hinweise für diese Annahme:

1.3 Crustacea und ihre Teiltaxa

Krebse bilden eines der artenreichsten und darüber hinaus eines der diversesten Taxa innerhalb der Arthropoda. Sie sind primär aquatisch, haben aber auch teilweise das Land erobert (z.B. einige Teiltaxa der Brachyura, der Isopoda und der Amphipoda). Die Crustacea umfassen die rezenten Teiltaxa der Remipedia, Cephalocarida, Maxillopoda (incl. Ostracoda), Branchiopoda und Malacostraca.

Seit der Intensivierung molekularer Studien zur Arthropodensystematik wird einerseits die traditionelle Annahme einer Monophylie der Crustacea und andererseits ihre Schwestergruppenbeziehung zu den [Seite 13↓]Tracheata (Myriapoda + Hexapoda), zusammengefasst als Mandibulata bezeichnet, zunehmend kontrovers diskutiert. Erste molekulare Studien führten zur Formulierung der Hypothese einer Schwestergruppenbeziehung von Crustacea-Teiltaxa (Malacostraca) zu den Hexapoda Ballard et al. (1992),Friedrich undTautz (1995),Turbeville et al. (1991),Wheeler et al. (1993). Diese Hypothese wurde nachfolgend durch Analysen verschiedener morphologischer Merkmalskomplexe erhärtet Richter (2002) und führte schließlich zu den Pancrustacea Zrzavý undStys (1997) bzw. Tetraconata Dohle (2001), wobei allerdings erst jüngst auch die Monophylie der Hexapoda in Zweifel gezogen wurde Nardi et al. (2003). Viele molekulare Analysen suggerieren neben einer engeren Beziehung eines Teiltaxons der Crustacea zu den Hexapoda gleichzeitig die Paraphylie der Crustacea Garchia-Machado et al. (1999),Hwang et al. (2001),Shultz undRegier (2000),Wilson et al. (2000). Verwandtschaftsbeziehungen von Teiltaxa innerhalb der Crustacea bedürfen ebenfalls weiterer Klärung Giribet undRibera (2000). Dies betrifft insbesondere die Stellung der Remipedia und Cephalocarida und die Mono- oder Paraphylie der Maxillopoda. So werden z.B. die Cephalocarida, Branchiopoda und Maxillopoda, zusammengefasst als Entomostraca, den Malacostraca gegenübergestellt, wobei die Remipedia nicht betrachtet wurden Walossek (1999). Das Thoracopoda- Konzept, welches die Cephalocarida, Branchiopoda und Malacostraca vereinigt und den Remipedia und Maxillopoda gegenüberstellt, findet in den Analysen basierend auf kombinierten molekularen und morphologischen Merkmalen (``total evidence´´) von Edgecombe et al. Edgecombe et al. (2000) und auch durch Ax Ax (1999) Unterstützung.

1.4 Ziele der Arbeit

Anhand ausgewählter Genbereiche und weiterer genetischer Marker (Intronpositionen und ribosomale Sekundärstrukturen) sollen die phylogenetischen Beziehungen innerhalb zweier sehr unterschiedlicher Teiltaxa der Crustacea erarbeitet werden. Dabei steht neben der systematischen Bewertung der Taxa die kritische Bewertung der gewählten Marker für unterschiedliche taxonomische Ebenen im Vordergrund. Die beiden Taxa umfassen einmal die Branchiopoda (Blattfußkrebse), die eine sehr hohe Diversität aufweisen und stammesgeschichtlich vermutlich sehr alt sind (Oberes Kambrium) und andererseits die Astacoidea, ein Teiltaxon der Astacida (Malacostraca), die vermutlich erst im Jura evolvierten. (Für eine genauere Beschreibung der beiden Taxa siehe Kapitel 2.2.9)

Für die Branchiopoda kommen folgende Genbereiche zum Einsatz:

Aus den generierten Sequenzen ergeben sich weitere genetische Marker, die einer phylogenetischen Bewertung unterzogen werden.

Für die Astacoidea werden folgende Genbereiche phylogenetisch analysiert.

Alle generierten Datensätze (Ausnahme: Intronpositionen) werden computercladistisch mit Parsimonie- und Maximum Likelihood Verfahren berechnet und die Ergebnisse mit einigen bestehenden morphologischen, molekularen und im Fall der Astacoidea zoogeographischen Hypothesen verglichen.


© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 3.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
05.01.2005