[Seite 15↓]

Material und Methoden

2.1 Material

2.1.1 Geräte

In der vorliegenden Arbeit werden im wesentlichen Geräte genutzt, die zur Standardausstattung eines molekularbiologischen Labors gehören, wie z.B. diverse Kleingeräte (Tischzentrifuge, Heizblöcke, Agarose Gelelektrophoresekammern, etc.) und zur Durchführung von PCR-Reaktionen und Cyclesequenzierungen Thermocycler der Hersteller Perkin Elmer bzw. MJ Research. Darüber hinaus kommt der Gradientencycler der Firma Eppendorf zur Optimierung von Annealingtemperaturen universeller Primer für einige Arten zur Anwendung. Die Sequenz Gelelektrophorese wird auf ALF Sequenzern für Fluoreszein Sequenzierungen und ALF Express Sequenzern für Cy5 -Sequenzierungen (beide Pharmacia) durchgeführt.

2.1.2 Hardware und Software

Für die Auswertung der Sequenzdaten und die phylogenetische Analyse der erhobenen Sequenzen wird ein zur Verfügung stehender Personal Computer (Pentium IV, 2,4 GHz Prozessor, 256 MB RAM Arbeitsspeicher) genutzt.

Die Auswertung der Sequenzläufe wird mit der Software ALFwin Vers. 2.00 (Amersham Pharmacia Biotech) durchgeführt. Sequenz Assemblies und Analyse der ``reading frames´´ erfolgt mit dem Software Paket SequencherTM Vers. 4.0 (Gene Codes Corporation).

Alignments und phylogenetische Analysen der Sequenzdaten werden mit den Programmpaketen Clustal X Thompson et al. (1997) (``multiple´´ Alignmentprogramm) und POY Gladstein undWheeler (1996-2000) (Alignment + Topologie).

Für die Parsimonie Analysen werden die Programme POY Gladstein undWheeler (1996-2000), NONA, PHAST Goloboff (1993-2000), Winclada, Vers. 0.9.9 als Shellsoftware Nixon (1999-2000) und PAUP Vers. 4.0 (Beta) (Sinauer Associates) genutzt.

Maximum Likelihood Analysen werden ausschließlich mit dem Programm TREE-PUZZLE Vers. 5.0 Schmidt et al. (1999-2000),Schmidt et al. (2002),Strimmer undvon Haeseler (1996) durchgeführt. Consensus Dendrogramme für ML Berechnungen werden mit dem Programm Phylip Vers. 3.5c Felsenstein (1986-1995) erzeugt (siehe auch Kapitel 2.2.7.3). Für die ``likelihood mapping´´ Analysen und das Kishino-Hasegawa-Testverfahren Kishino undHasegawa (1989) wird ebenfalls das Programm TREE-PUZZLE benutzt.


[Seite 16↓]

Grafiken der in dieser Arbeit gezeigten Stammbäume werden mit dem Programm TreeView Page (1996) erzeugt. Zur Erstellung des manuellen Alignments wird die Software Seaview Galtier et al. (1996) zu Hilfe genommen. Alle weiteren graphischen Darstellungen wie Sekundärstrukturen oder Colorierungen der Stammbäume werden mit CorelDraw Vers. 10 (Microsoft) angefertigt.

2.1.3 Labormaterialien

PCR -Reaktionen werden mit der Taq-Polymerase GenThermTM (5u/µl), dem dazugehörigen 10x Puffer (160 mM (NH4)2SO4, 670 mM Tris-HCL (pH 8,8 bei 25°C), 0,1% Tween 20), MgCl2 (Stammlösung 50 mM) und Desoxyribonukleotiden (100 mM Stammlösung) der Firma GeneCraft durchgeführt.

Zur Evaluierung der PCR Produkte auf dem Agarosegel werden 5µl des Längenstandards ``1 kb Ladder´´ (1µg/µl) von Boehringer Mannheim eingesetzt. Zur Aufreinigung von PCR Reaktionen werden Ultrazentrifugationsröhrchen Microcon 30 bzw. 50 der Firma Amicon verwendet.

Elutionen von PCR Fragmenten aus Agarosegelen erfolgen mit dem PCR Purification Kit der Firma Machery und Nagel nach Herstellerangaben.

Als weitere Kits zur DNA Sequenzierung und Klonierung kommen zum Einsatz: Original TA Cloning Kit (Invitrogen), Cycle Sequencing Kit (Amersham Pharmacia) und T7-Sequencing-Kit (Amersham-Pharmacia). Plasmid DNA wurde mit mittels eines Mini Plasmid Kits (Machery und Nagel) präpariert. Klonierungen und Sequenzreaktionen erfolgen nach Herstellerangaben. Alle eingesetzten Primer werden von der Firma TibMolBiol (Berlin) synthetisiert. Der Lieferumfang beträgt 1 OD260 eines lyophilisierten Pellets und wird vor Gebrauch mit ddH2O auf eine Lösung von 10 pmol/µl (PCR Primer) bzw. 2 pmol/µl (Sequenzierprimer) eingestellt.

2.1.4 Verwendete Puffer und Lösungen

Standardpuffer und Lösungen: 0,5 M EDTA (pH 8); 8 M LiCL; 5 M NaCL; 1 M Tris-HCL (pH 8,2 bei 25°C); 70% EtOH (unvergällt); 100% EtOH; 100% Isopropanol; Chloroform/Isoamylalkohol (24:1); TE Puffer (10 mM Tris-HCl, pH 7,6; 1 mM EDTA, pH 8,0).

DNA Präparation, Lysepuffer: 4% CTAB Lysepuffer (4 g Cetyltrimethylammoniumbromid; 1,4 M NaCL; 20 mM EDTA; 100 mM Tris-HCL, pH 8,2) + 100 mM b- Mercaptoethanol.

Elektrophoresepuffer Stammlösung: 10 x TBE Puffer (90 mM Tris base; 90 mM Borsäure; 20 mM EDTA).

6% iges Sequenzgel (60 ml): 13,5 ml einer 30% Polyacrylamid Gelmatrix (19:1 Acrylamid / Bisacrylamid); 6 M Urea, 3,6 ml 10xTBE Puffer (Endkonz. 0,6x). ca. 30 µl Repal Silane (20 ml 100% EtOH, 75 µl 100% Repal Silane, 5 ml 10% Essigsäure) zur Stabilisierung der Sequenzgeltaschen [Seite 17↓]sowie 10% APS (Ammoniumpersulfat) und 60 µl Temed (C6H16N2) zur Beschleunigung der Polymerisation.

``Loading solution´´ für die Sequenzgelelektrophorese: 95% Formamid (deionisiert in Amberlite IRN-150L); 500 mM EDTA (pH 8); 60 mg Dextran Blue.

``Loading solution´´ für Agarosegelelektrophorese: 0,25% Bromphenolblau; 40% (w/v) Sucrose (in H2O).

Anfärben der DNA in Agarosegelen: Fluoreszenzfarbstoff Ethidiumbromid (Stammlösung 100 mg/ml H2O) in einer Endkonzentration von 0,5 µg/ml.

Medien zur Anzucht von Bacterien: LB (Luria–Bertani) Flüssigmedium (1l). 10 g NaCl, 10g Bacto-Trypton, 5 g Hefeextrakt, 30% (v/v) Glycerin und zusätzlich 15 g Agar für LB Festmedium. Zur Selektion rekombinanter Bakterien wurde Ampicillin, IPTG und X-Gal, wie in Kapitel: 2.2.6 beschrieben, auf die Festmedien aufgetragen.

2.1.5 Verwendete Spezies

Sämtliche Arten werden in 100% EtOH bei 4°C bis zur weiteren Verarbeitung aufbewahrt. Aufgrund der geringen Größe einiger Spezies der Branchiopoda werden zumeist komplette Tiere verarbeitet. Von den bearbeiteten Astacida stand jeweils ein Pereiod zur Verfügung, von welchem zur DNA Präparation das Muskelgewebe ausgelöst und homogenisiert wird. In den Tabelle 1 und [LINK to link] werden alle in dieser Arbeit sequenzierten Arten aufgelistet. Sofern Referenzdaten aus der Genbank (http://www.ncbi.nlm.nih.gov) zur phylogenetischen Analyse zum Einsatz kommen, werden diese mit Accessionnumber und Referenz im Text (siehe auch Kapitel: 2.2.9) benannt.


[Seite 18↓]

Tabelle 1: Zusammenstellung der in der Arbeit sequenzierten Spezies und weitere Literaturdaten, bzw. Genbankeinträge des Taxons Branchiopoda.

Branchiopoda

Familie

Speziesbezeichnung

Fundort

Haplopoda

Leptodoridae

Leptodora kindti (Focke,1844)

Tegeler See,Berlin, Deutschland

Ctenopoda

Sididae

Diaphanosoma brachyurum (Liévin, 1848)

Nikolassee, Berlin, Deutschland

  

Sida crystallina (O.F.Müller,1776)

Untere Oder, Brandenburg, Deutschland

Anomopoda

Daphniidae

Daphnia pulex Leydig,1860

Fischfutter, kommerziell

  

Simocephalus vetulus (O.F.Müller,1776)

Untere Oder, Brandenburg, Deutschland

  

Scapholeberis mucronata (O.F.Müller,1785)

Untere Oder, Brandenburg, Deutschland

  

Ceriodaphnia megops G.O.Sars,1862

Nikolassee, Berlin, Deutschland

 

Bosminidae

Bosmina coregoni Baird, 1857

Spree, Berlin, Deutschland

 

Moinidae

Moina brachycephala

Acc.no nicht vorhanden, Hanner undFugate (1997)

 

Chydoridae

Eurycercus lamallata (O.F.Müller,1785)

Untere Oder, Brandenburg, Deutschland

  

Pseudochydorus globosus (Baird,1843)

Untere Oder, Brandenburg, Deutschland

 

Macrothricidae

Ilyocryptus spec.

Nikolassee, Berlin, Deutschland

Onychopoda

Cercopagididae

Bythotrephes longimanus Leydig,1860

Tegeler See,Berlin, Deutschland

 

Polyphemidae

Polyphemus pediculus (Linnaeus,1761)

Nikolassee, Berlin, Deutschland

 

Podonidae

Podon leuckarti (Sars,1862)

Sylt, Schleswig-Holstein, Deutschland

  

Evadne nordmanni Lovén,1836

Sylt, Schleswig-Holstein, Deutschland

Spinicaudata

Limnadiidae

Imnadia yeyetta Hertzog,1935

Morava flood plain, Österreich

  

Eulimnadia texana Packard,1871

Acc.no nicht vorhanden, Hanner undFugate (1997)

  

Limnadia lenticularis (Linnaeus,1761)

Morava flood plain, Österreich

  

Limnadopsis birchii (Baird,1860)

Paroo area, NSW, Australien

 

Cyzicidae

Cyzicus mexicanus (Claus,1860)

Acc.no nicht vorhanden, Hanner undFugate (1997)

  

Eocyzicus spec.

Paroo area, NSW, Australien

  

Caenestheriella spec.

Paroo area, NSW, Australien

  

Caenestheria spec.

Paroo area, NSW, Australien

 

Leptestheriidae

Leptestheria dahalacensis (Rüpell,1837)

Morava flood plain, Österreich

  

Leptestheria kawachiensis Uéno,1927

Lake Biwa area, Japan

 

Cyclestheriidae

Cyclestheria hislopi (Baird,1859)

Kakadu National Park, NT, Australien

Laevicaudata

Lynceidae

Lynceus tatei (Brady,1886)

Paroo area, NSW, Australien

  

Lynceus brachyurus (O.F.Müller,1776)

Kopenhagen, Dänemark

  

Lynceus biformis (Ishikawa,1895)

Lake Biwa area, Japan

Notostraca

Triopsidae

Triops longicaudatus (Leconte,1846)

Acc.no nicht vorhanden, Hanner undFugate (1997)

  

Triops cancriformis (Bosc,1801)

Morava flood plain, Österreich

  

Triops australiensis (Spencer et Hall,1896)

Paroo area, NSW, Australien

  

Lepidurus bilobatus Packard,1877

Acc.no nicht vorhanden, Hanner undFugate (1997)

  

Lepidurus apus (Linnaeus,1758)

Spandauer Forst, Berlin, Deutschland

Anostraca

Streptocephalidae

Streptocephalus texanus Packard,1871

Acc.no nicht vorhanden, Hanner undFugate (1997)

 

Linderiellidae

Linderiella santarosae Thiéry et Fugate,1994

Acc.no nicht vorhanden, Hanner undFugate (1997)

 

Artemiidae

Artemia franciscana Kellog,1906

Genbank

 

Branchipodidae

Parartemia minuta Geddes,1973

Paroo area, NSW, Australien

 

Thamnocephalidae

Branchinella occidentalis Dakin,1914

Paroo area, NSW, Australien

  

Branchinella pinnata Geddes,1981

Paroo area,NSW,Australien

[Seite 19↓]

Tabelle 2: Zusammenstellung der in der Arbeit analysierten Spezies des Taxons Astacida.

Astacida

Familie

Speziesbezeichnung

Vorkommen/Fundort

Astacoidea

Cambaridae

Cambaroides similis , Koelbel, 1892

Korea

  

Cambaroides dauricus, Pallas 1773

Mongolei

  

Cambaroides japonicus, de Haan, 1842

Hokkaido, Japan

  

Cambaroides schrenckii , Kessler, 1874

Mongolei

  

Procambarus clarkii, Girard, 1852

USA

  

Orconectes limosus, Rafinesque, 1817

Havel, Berlin

  

Procambarus fallax, Hagen

Florida, USA

  

Marmorkrebs, nicht beschrieben

Private Zucht, A.Reimann

 

Astacidae

Austrapotamobius torrentium, Schrank, 1903

Bayern, Deutschland

  

Austrapotamobius pallipes , Lereboullet, 1858

Bayern, Deutschland

  

Astacus astacus, Linnaeus, 1758

Bayern, Deutschland

  

Astacus leptodactylus , Eschscholtz, 1832

Türkei

  

Pacifastacus leniusculus, Dana, 1852

USA

Parastacoidea

Parastacidae

Astacopsis franklini

Tasmanien

  

Parastacoides sp., Erichson, 1946

Tasmanien

  

Paranephrops zeal.

Neuseeland

2.1.6 Primer

In Tabelle 3 sind alle in dieser Arbeit verwendeten Primer aufgelistet. (A) enthält die Sequenzen der PCR-Primer für die Branchiopoda (12S und EF-1α) und für die Astacida (12S und cox1) und die für die PCR eingesetzten Annealingtemperaturen. Zur Ansequenzierung der PCR-Produkte vom 5’ und 3’ Ende her sind die Sequenzen der Standard-Sequenzierprimer (5’- Label Fluoreszein) vermerkt. (B) enthält alle für die komplette Sequenzierung des EF-1α Gens eingesetzten internen ``walking´´-Primer.


[Seite 20↓]

Tabelle 3: (A) Aufstellung der verwendeten genspezifischen PCR- und Sequenzierprimer für die verschiedenen Taxa. „Tm“ bezeichnet die i. a. verwendeten Annealingtemperaturen während der PCR. Sofern für einzelne Spezies keine andere Annealingtemperatur verzeichnet ist, wird die für das entsprechende Großtaxon angegebene Temperatur gewählt. Sequenzen taxonspezifischer PCR-Primer sind fett gedruckt. Nicht fettgedruckte Primerbereiche entsprechen den komplementären Sequenzen der Standardprimer. (B) Aufstellung der verwendeten internen ``walking´´-Primer zur Sequenzierung des Gens EF-1α. Sofern nicht anders angegeben, werden die internen Primer für alle Spezies angewendet.

A.

Taxon

Gen

1. PCR Primer forward (5’ 3’)
2. PCR Primer backward (5’ 3’)

Tm PCR

Sequenzierprimer
(5’ 3’);
Label: Fluorszein (FI)

Branchiopoda

 

1. 12CR3UP (20 pmol)
GGG TAA AAC GAC GGC CAG TGA CTT TGT TAC GAC TTA TCT C

 

FI-M13 -20 (UP) (4 pmol)
GTA AAA CGA CGG CCA GT
Forward

 

12S

2. 12S-5cRP (20 pmol)
GGG AAC AGC TTA TGA CCA TGG CCA GCC GTC GCG GTT AGA C
2. 12-5aRP (20 pmol) (alternativ)
GGG AAC AGC TAT GAC CAT GRA AAG TTT GAW TCT RGC T

40°C

FI-M13 Reverse (RP) (4 pmol)
AAC AGC TAT GAC CAT G
Backward

Ausnahme:
Onychopoda

12S

Primer s.o. 1. + 2.

42°C

 

Astacida

12S

1. CF12FOR-T7T (10 pmol)
AAA GCT AGT TAT TGC TCA GCG GAM ATG ARA GCG ACG GGC GAT

2. CF12REV-T7P (10 pmol)
AAA TAA TAC GAC TCA CTA TAG GGA WCA AYT AGG ATT AGA TAC C

45°C

FI-T7term (4 pmol)
GCT AGT TAT TGC TCA GCG G
Forward
FI-T7prom (4 pmol)
TAA TAC GAC TCA CTA TAG GG
Backward

 

Cox1

1. CoxFOR-T7T (10 pmol)
AAA GCT AGT TAT TGC TCA GCG GGG KCA YCC YGA RGT YAT AT
2. CoxREV-T7P (10 pmol)
AAA TAA TAC GAC TCA CTA TAG GGA CTC CCA CAR ATA TTG TAA

50°C

FI-T7term (4 pmol)
GCT AGT TAT TGC TCA GCG G
Forward
FI-T7prom (4 pmol)
TAA TAC GAC TCA CTA TAG GG
Backward

Branchiopoda

EF-1α

1. M44-1UP Cho et al. (1995) (10 pmol)
GGG TAA AAC GAC GGC CAG TGG CTG AGC GYG ARC GTG GTA TCA C
2. 3’EF1 RP (10 pmol)
GGG AAC AGC TTA TGA CCA TGG GAA GTC AGA GAA GGA CTC

53°C

FI-M13-20 (UP) (4 pmol)
forward (s.o.)
FI-M13 Reverse (RP) (4 pmol)
backward (s.o.)


[Seite 21↓]

B.

 

Interne walking primer zur Sequenzierung des Gens EF-1 α . Label: Fluoreszein (FI) oder CY5

Primername

Sequenz 5’→3’

Bemerkungen

3’EF1

FI- 5’- GGA AGT CAG AGA AGG ACT C

 

Fly1B

CY5- 5’- GGC TAC GTT GCC GGT GAC TC

 

EF2B

FI- 5’- ACG GAC TTG ACT TCA GTG GT

 

EF3B

FI- 5-’ ATG TGG GCG GTG TGG CAA TC

 

EF4B

CY5- 5’- ATG TTG TCT CCG TGC CAT CC

 

EF5B

FI- 5’- GTC AAG GAA TTG CGT CGT GG

 

EF6B

FI- 5’- ATA CCA GCC TCG AAT TCA CC

 

EF14F

FI- 5’- AAC ATG ATY ACT GGT ACC TC

 

EF-18F

FI- 5’- GGY TTC RAC GTC AAG AAC GT

 

11/17EF3b

CY5- 5’- CCA TAC CGG GCT TGA TGA C

spez. für Scapholeberis

10/14EF-7

FI- 5’- AAG ATG GAT TCC ACT GAG CC

spez. für Eurycercus und Simocephalus

8-EF10F

CY5- 5’- GAC TTC TTC GCC CAG GTC

spez. für Evadne

8-EF9b

CY5- 5’- GCG ACG ATG AGC ACA GCG CA

spez. für Evadne

44-EF16F

FI- 5’- GGA CAT CGT GAT TTC ATC

spez. für Lynceus

43-17F

FI- 5’- CCT ACA GTG AAG CTC GTT A

spez. für Cyclestheria

2.2 Methoden

2.2.1 Molekularbiologische Standardmethoden

Alle hier im Text aufgeführten Standardmethoden, wie Chloroformextraktionen, Alkoholfällungen und Agarosegelelektrophorese und die Präparation kompetenter Bakterienzellen (sofern erforderlich) werden nach Sambrook et al. (1989) durchgeführt.

2.2.2 Datenerhebung

Die zur Datenerhebung durchgeführten Methoden umfassen die Gesamtnukleinsäurenpräparation, die anschließende PCR Amplifikation des gewünschten Genabschnittes mit universellen Primern und die Direktsequenzierung der PCR Produkte. In Ausnahmefällen, z.B. wenn das PCR Produkt zu schwach ist, um direkt sequenziert zu werden, werden diese Produkte kloniert. Im Regelfall wurden 10 positive Klone gescreent und auf die Richtigkeit ihrer Inserts mittels Sequenzierung überprüft.


[Seite 22↓]

2.2.3  DNA Präparation

Von ca. 1-20 Individuen (Branchiopoda) und ca. 10-20 mg Muskelgewebe der Astacida werden Nukleinsäureextraktionen mit dem 4%- igen Lysepuffer CTAB (s. Kap. 2.1.4) in abgewandelter Form nach der Methode von Doyle & Doyle Doyle undDoyle (1990) angefertigt. Die Homogenisation findet direkt in 500 µl Lysepuffer + 100 mM b- Mercaptoethanol in Gegenwart einiger Körnchen Seesand statt. Durch die Zugabe von Seesand wird die Menge der extrahierten Nukleinsäuren enorm erhöht, da das Gewebe der zum Teil sehr kleinen Tiere besser aufgeschlossen werden konnte. Besonders in Fällen, wo nur ein bis zwei sehr kleine Individuen zur Verfügung standen, ermöglicht erst die Zugabe von Seesand eine Extraktion in ausreichender Menge. Das Homogenisat wird nach einer Inkubationszeit von ca. 30 min bei 65°C mit einem Volumen Chloroform versetzt und ca. 10 min bei 13.000 rpm zentrifugiert. Anschließend werden die Nukleinsäuren mit 0,8 Volumen Isopropanol aus dem Überstand gefällt. Die Nukleinsäure-Pellets werden je nach ihrer Größe in 5 - 30 µl TE Puffer aufgenommen und bei –20°C gelagert. Menge und Qualität von je 1 µl der Präparationen wurde auf einem 1%- igen Agarosegel abgeschätzt. In einigen Fällen, in denen die DNA Präparationen einer folgenden enzymatischen Reaktion nicht zugängig waren, wird mit 8 M LiCL (2 h bei 65°C) erneut präzipitiert.

2.2.4 Primerdesign und PCR Amplifikation

Der Einsatz von universell anwendbaren PCR Primern ermöglicht es, mit nur einem Primerpaar einen definierten Genbereich unterschiedlicher Spezies zu amplifizieren.

Die zur Anwendung kommenden PCR Primer (Tabelle 3) werden an ihrem 5’-Ende artifiziell verlängert, sofern die PCR Produkte direkt in der Cyclesequenzierung eingesetzt werden können. Als zusätzliche Sequenzen werden die ``primingsites´´ von Standardprimern gewählt: Die Primer, die zur Amplifikation der Branchiopoda des 12S und EF-1a Gens genutzt werden, werden mit den Sequenzen für die Standardprimer M13 universe und M13 reverse verlängert. Die Primer zur Amplifikation der Gene 12S und cox1 der Astacoidea werden mit den ``primingsites´´ für T7term und T7prom verlängert. Die Methode der künstlichen Verlängerung der PCR Primer Cho et al. (1995) ermöglicht die routinemäßige Cyclesequenzierung unterschiedlicher Templates bei einer gegebenen Temperatur mit den angegebenen Standardprimern. In den Fällen, in denen das PCR Produkt kloniert wird, kann auf eine artifizielle Verlängerung der PCR Primer verzichtet werden.

Die PCR Amplifikationen (Gesamtvolumen 50-100 µl) erfolgen nach einem Standardprotokoll mit ca. 100 ng DNA Template und je 20 pmol Primer für die 12S rDNA , bzw. 10 pmol je Primer für die Genbereiche cox1 und EF-1a. Nach einer einmaligen Denaturierung der DNA für 3-5 min folgen 35-40 Zyklen mit einer Denaturierung bei 94°C (30 s), ``primerannealing´´ bei 40-53°C für 45 s und einer Elongation bei 72°C (45 s bis 1 min15 s). Eine einmalige Extension bei 72°C für 3-7 min beenden die Amplifikation. Durch die je nach gewünschtem Gen eingesetzten Primer werden für die 12S rRNA ein Amplifikat von durchschnittlich 500 bp., für das Gen EF-1a Produkte von 1063-~1200 bp. (inklusive [Seite 23↓]Introns) und für das Gen cox1 Produkte mit einer Länge von 450 bp. generiert. Die genauen Annealingtemperaturen werden, sofern sie abweichend zum Standard sind, in einem Gradientencycler (Eppendorf) optimiert. Annealingtemperaturen sind der Tabelle 3 zu entnehmen.

Von sämtlichen PCR Produkten wird ein Aliquot von 5 µl auf einem 1-1,2% igen Agarosegel näherungsweise quantifiziert. In der Regel kann erfahrungsgemäß für die Sequenzierung und Elektrophorese auf ALF-Sequenzern auf eine Aufreinigung der PCR-Produkte verzichtet werden. Sofern allerdings die Analyse auf dem Agarosegel eine noch erhebliche Menge an freien Primern oder Primerdimeren zeigt und das PCR Produkt in nur geringer Menge generiert werden konnte, werden die PCR Produkte mittels Microcon PCR 50 Ultrafiltrationsröhrchen (Millipore) gefiltert. Nicht incorporierte Primer bzw. Dimere werden auf diese Weise quantitativ entfernt. Gleichzeitig wird der PCR Ansatz auf ein erheblich kleineres Volumen (5-10 µl) konzentriert, sodass sich vielfach eine schwache Amplifikation trotzdem für eine anschließende direkte Sequenzierung als adäquat erweist. Die Filtration der PCR Produkte ist nur bei einigen Spezies nötig.

2.2.5 Cyclesequenzierung der PCR Produkte

Die Sequenzierung erfolgt mittels der von Sanger und Kollegen Sanger et al. (1977) entwickelten Methode des Strangaufbaus und definierten Strangabbruchs durch den Einsatz von Dideoxynukleotiden. Die Kettenabbruchmethode ist inzwischen die Routinemethode zur Bestimmung von Nukleotidsequenzen einer DNA und hat sich in der Laborroutine gegenüber der Maxam-Gilbert Sequenzierung Maxam undGilbert (1977) durchgesetzt: DNA-Doppelstränge werden hierbei zunächst denaturiert (durch Hitze- oder Alkalibehandlung). Zur Neusynthese von DNA mit einer DNA-Polymerase ist immer ein kurzer Doppelstrangbereich erforderlich, bei dem ein 3’-Ende anhand des überstehenden 5’-Endes des Gegenstranges als Template verlängert werden kann. Solch eine kurze Doppelstrangregion wird zur Sequenzierung (wie bei der PCR-Reaktion) künstlich durch einen Oligonukleotid-Primer erzeugt, der mit der einzelsträngigen Template-DNA hybridisieren muß. An dem auf diese Weise gebildeten 5’-Überhang kann nun die Neusynthese ansetzen. Die Neusynthese geschieht in Gegenwart der vier monomeren dNTPs (dATP, dCTP, dGTP und dTTP). Um nun einen definierten Strangabbruch zu erzeugen, werden der Reaktion zusätzlich Dideoxynukleotide zugefügt. Diesen ddNTPs fehlt ausser in der 2’- Position auch in der 3’- Positon der Ribose eine OH-Gruppe, d.h. es steht keine notwendige OH-Gruppe zur Bildung einer folgenden Phosphodiesterbindung zur Verfügung, die Synthese bricht ab. In vier verschiedenen Ansätzen mit jeweils einem Didesoxynukleotid, neben den normalen vier dNTPs, entsteht so eine Population unterschiedlich langer Moleküle, deren jeweils letztes Nukleotid dem zuvor eingesetzten ddNTP entspricht. Statistisch gesehen enthält so z.B. die ddATP-Reaktion an jedem im Template auftretenden Thymidin eine detektierbare Menge an Abbrüchen. Die vier Reaktionsansätze einer Sequenzierung werden getrennt (im Fall des ALF Sequenziersystems) der Elektrophorese zugeführt (im idealen Fall einem Sequenzautomaten). Ein Polyacryamidgel hat die Auflösekraft um Moleküle mit nur einer Base Unterschied in der Kettenlänge voneinander zu unterscheiden. Um die Moleküle detektieren zu können, ist der in der Sequenzreaktion eingesetzte Primer an seinem 5’-Ende mit einem Fluoreszenfarbstoff markiert (für die hier eingesetzten Systeme [Seite 24↓]ALF und ALF-Express sind Fluoreszein bzw. CY5-Fluoreszenzfarbstoffe erforderlich). Eine automatische Lesevorrichtung erlaubt die simultane Erfassung auf einem Computer nach Anregung und Detektierung des Farbstoffes (und damit des Moleküls) durch einen Laserstrahl.

Um die Syntheseeffizienz zu erhöhen, wird auch hier zur Sequenzierung (wie bei der PCR) mit thermostabilen Polymerasen gearbeitet, die es erlauben, in einem Ansatz, in mehreren Zyklen eine neue Synthese zu starten (Cycle-Sequenzierung). Diese Synthese verläuft allerdings linear, da nur ein Primer eingesetzt wird, im Gegensatz zur exponentiellen Synthese der PCR mit zwei gegenläufigen Primern. Die Methode der PCR-Direktsequenzierung hat des weiteren den Vorteil, dass mögliche Fehler beim Strangaufbau, die durch den Einsatz von Taq-Polymerase für die Amplifikation entstehen, ausgemittelt werden.

Sofern die Amplifikation ein in Qualität und Quantität ausreichendes Produkt ergibt, wird das Amplifikat direkt sequenziert. Die einzusetzende Menge an Template richtet sich nach Menge und Länge desselben. Es werden ca. 0,5 µg Template pro 500 bp. Länge (des PCR Produktes) eingesetzt. Die Cyclesequenzierungen erfolgen mit dem Thermosequenase Kit nach Herstellerangaben (Amersham Pharmacia) mit 4 pmol Primer pro Sequenzierung und einer Annealingtemperatur von 57°C.

Alle 12S und cox1- PCR Produkte werden doppelsträngig sequenziert. Als Sequenzierprimer für die Gene 12S und cox1 wurden die Standardprimer M13 universe bzw. reverse (12S) und T7term bzw. T7prom (cox1) eingesetzt.

Das Gen EF-1a konnte zunächst nur von zwei Branchiopoda-Spezies (Sida und Lepidurus) mit den Literaturprimern amplifiziert werden. Diese Amplifikate wurden mit M13 universe und M13 reverse ansequenziert und aus den Sequenzen wurden sowohl PCR spezifische universelle Primer für die erfolgreiche Amplifikation anderer Branchiopoda abgeleitet, als auch weiterführende (sogenannte interne Primer), soweit möglich universelle Sequenzierprimer, die es in den folgenden Sequenzreaktionen ermöglichen, die Exons der Produkte doppelsträngig zu sequenzieren (``primerwalking´´). Introns werden zumeist nur einzelsträngig sequenziert.

Für die Gene 12S und cox1 werden durchschnittlich 0,3 - 0,5 µg PCR Produkt eingesetzt, für das Gen EF-1a ca. 0,8-1 µg.

Die Sequenzgel-Elektrophorese erfolgt auf ALF- Sequenzern (bei Fluorescein-markierten Sequenzen) bzw. auf ALF Express Sequenzern, sofern die Sequenzierungen mit CY5 gelabelten Primern durchgeführt wurden. Die Herstellung des 6,5% Polyacrylamid- Sequenzgels erfolgt nach Angaben des Herstellers (Pharmacia). Die Auftrennung der Sequenzierungen im elektrischen Feld wird bei einer Temperatur von 50°C, 30 Watt, 1500 Volt, 38 mA und einer Laserpower von 3 mW durchgeführt.


[Seite 25↓]

2.2.6  Klonierungen

Im Falle quantitativ ungenügender Amplifikation wird kloniert, um eine Sequenzierung zu ermöglichen.

Die Ligationen der PCR Produkte werden mit dem Kit „TA Cloning“ (Invitrogen) nach Herstellerangaben durchgeführt. Anschließend werden die Plasmide (Vektor pCR 2.1 + 1 Molekül des PCR Produktes) mittels Elektroschock (1 Puls á 2,5 kV mit einer Feldstärke von 12,5 kV/cm) in den elektrokompetenten E.coli Stamm DH5a transformiert und auf LB+Ampicillin (50 µg/ml) Medium in Gegenwart von IPTG (24 µg/ml) und X-Gal (50 µg/ml) selektioniert. Von allen Transformationen werden 10-15 Klone auf das Vorhandensein eines Inserts und auf die Richtigkeit überprüft. Dazu werden 10-15 Kolonien einzeln gepickt und in 5 µl H20 für 5 min bei 96°C lysiert. Anschließend wird das Lysat bei maximaler Geschwindigkeit (13.000 rpm) 5 min. zentrifugiert um Zelltrümmer zu pelletieren. 1 µl des Überstandes wird als Template in einen 50 µl PCR Ansatz mit je 2,5 pmol LacZ A (5'-GGTAGTGGGATACGACGATA) und LacZ B (5'-CAACAATCGATCCTACTAAA) Primern gegeben. Der Vektor pCR2.1 enthält die ``priming sites´´ der Standardprimer LacZ A und B, sodass man auf diese Weise in einfacher und sehr effizienter Weise positive, d.h. Plasmide mit erfolgreich kloniertem PCR Produkt von negativen Klonen unterscheiden kann. Alle positiven PCR Produkte werden danach direkt cyclesequenziert. Die ausgewerteten Inserts werden mittels eines ``Blast-Search´´ Altschul et al. (1997), mit allen in der Genbank (http://www.ncbi.nlm.nih.gov) vorhandenen Sequenzen verglichen und die Richtigkeit der Inserts bestätigt.

2.2.7 Phylogenetische Analyse

Alle im Rahmen dieser Arbeit generierten Sequenzdaten wurden phylogenetisch ausgewertet. Zur Klärung der Aussengruppenfrage der Phyllopoda (Branchiopoda) wurde ein Arthropodenalignment, basierend auf den konservierten Bereichen der Aminosäuresequenzen mitochondrialen Proteine, herangezogen Hwang et al. (2001) und durch einige seitdem neu publizierte mitochondrialen Proteinsequenzen ergänzt (weitere Erläuterungen dazu siehe Kapitel: 3.1.2.1).

Im Folgenden werden die in dieser Arbeit angewendeten Methoden in umgekehrter Reihenfolge, zuerst die Berechnungmethoden der Cladogramme und anschließend die Erstellung der Alignments, beschrieben. Dies erscheint sinnvoll, da das hier u.a. verwendete Programm POY sowohl Alignments als auch Topologien erzeugt.


[Seite 26↓]

2.2.7.1  Phylogenetische Stammbäume

Eine gegebene DNA Datenmatrix (Alignment) ist definiert durch die Anzahl an Taxa (Arten) und die Anzahl an Merkmalen (Nukleotide, bzw. Aminosäuren). Anhand der Formel

N(u) = (2n-5) ! / [2 n-3 (n-3) !]

lassen sich von „n“ Taxa „N(u)“ ungewurzelte Topologien erzeugen Cavalli-Sforza undEdwards (1967). D.h. für 10 Taxa wären 2x106, bei 20 Taxa schon 2x1020 Topologien theoretisch möglich. Um aus dieser Fülle von ungewurzelten Topologien die sinnvollen herauszufinden, sind verschiedene Rechenalgorithmen nutzbar. Man unterscheidet hier zunächst zwischen heuristischen und exakten Verfahren. Das exakte Verfahren garantiert, unter der gegebenen Berechnungsmethode (Parsimonie oder Maximum Likelihood), den wahrscheinlichsten bzw. kürzesten Stammbaum zu finden, weil alle Möglichkeiten berechnet werden. Dies ist allerdings nur für maximal 10-12 Taxa durchführbar, da sonst die Rechenkapazitäten gängiger PCs nicht ausreichen. Größere Artenzahlen werden mit heuristischen Verfahren berechnet. Hierbei wird zunächst durch schrittweises Hinzufügen jeweils eines Taxons (``stepwise addition´´) an zunächst optimal erscheinende Stellen und anschließendes Variieren der einzelnen Äste (``branch swapping´´) die kürzeste (Parsimonie) oder wahrscheinlichste (Maximum Likelihood) Topologie gesucht.

Die im Folgenden beschriebenen Methoden Maximum Parsimonie und Maximum Likelihood betrachten die Nukleotidpositionen als Einzelmerkmale und versuchen die Merkmalsänderungen in der Rekonstruktion des Stammbaums zu reflektieren.

Alle im Rahmen dieser Arbeit sequenzierten Gene und zusätzlich die in der Datenbank oder Literatur erhältlichen Daten werden zunächst gesondert und dann auch als kombinierte Datensätze phylogenetisch ausgewertet.

2.2.7.2 Parsimonie

Parsimonie Methoden waren die ersten, die zur Rekonstruktion von Phylogenesen breite Anwendung fanden. Ihnen liegt die Philosophie des sogenannten „Occam’s razor“ -die größtmögliche Sparsamkeit- zugrunde, d.h. es wird hier die generelle Vorstellung der Naturwissenschaft umgesetzt, zunächst die einfachere gegenüber einer komplizierteren Hypothese zu bevorzugen und ad hoc Hypothesen weitestgehend zu vermeiden Swofford et al. (1996). Ziel der Maximum Parsimonie Methode in der Systematik ist es, das Cladogramm zu finden, welches die geringste Anzahl von Evolutionsschritten benötigt, um den beobachteten Datensatz zu erklären. Parsimonie Methoden berücksichtigen nur variable Positionen, sogenannte Parssimonie-informative Merkmale. Tritt in einer Position des Alignments nur ein bestimmtes Nukleotid oder Aminosäure auf, so ist dieses Merkmal nicht informativ. Wird in nur einem Taxon eine andere Merkmalsausprägung beobachtet, so ist diese Position ebenfalls nicht informativ. Treten hingegen in mehr als einem Taxon unterschiedliche Nukleotide (Aminosäuren) auf, so ist dieses Merkmal Parsimonie-informativ und wird durch die entsprechenden Algorithmen [Seite 27↓]rechnerisch erfasst. Je mehr allerdings eine Position variiert, desto stärker kann unter Umständen ihr Homoplasiegehalt sein und damit ein ungewolltes „verrauschen“ phylogenetischer Signale verursachen. Desweiteren können unterschiedliche Substitutionsereignisse (Transitionen versus Transversionen versus ``gaps´´) pro Position unterschiedlich gewichtet werden. Damit wird dem Umstand Rechnung getragen, dass in der Regel Transitionen häufiger vorkommen als Transversionen. Zusätzlich können ``gaps´´ als fünftes Merkmal mit in die Berechnung einfliessen.

2.2.7.3  Maximum Likelihood

Die Idee, die den Maximum Likelihood Verfahren zugrunde liegen, beruht auf der Vermutung, dass Evolution auf der Ebene von DNA Molekülen ein stochastischer Prozess ist, d.h. es wird die Wahrscheinlichkeit berechnet, mit der eine gegebene Topologie durch einen Datensatz unter der Annahme eines Modells begründbar ist.

Unter einem gegebenen Modell, welches die Wahrscheinlichkeiten der beobachteten Ereignisse (Substitutionen) spezifiziert, kann der ``likelihood´´ L für den gegebenen Datensatz berechnet werdenals

Ltree = P (D | H),

wobei P (D |H) die Wahrscheinlichkeit ist, einen Datensatz D unter einer gegebenen Hypothese H zu beschreiben. Da der ``likelihood´´ L sehr klein ist, wird der Wert als ``log likelihood´´, bzw. als natürlicher Logarithmus einer Wahrscheinlichkeit (lnL) ausgedrückt.

Die zugrunde liegenden Algorithmen zur Berechnung von Nukleotiddatensätzen wurden von Felsenstein Felsenstein (1973),Felsenstein (1981) entwickelt.

Zwei gegebene Sequenzen (1 und 2) unterscheiden sich durchschnittlich um d Substitutionen pro Position. Diese Distanz d entspricht µt, wobei µ die Mutationsrate ist und t die Zeit. Gegeben ist im Folgenden ein Substitutionsmodell (siehe unten), sodass für jede Position die Wahrscheinlichkeit P ij(d) berechnet werden kann, dass diese beiden Sequenzen, separiert durch d, die Nukleotide i bzw. j aufweisen. Die Wahrscheinlichkeit ist nun der ``likelihood´´ der Substitution der betrachteten Position, der beiden Sequenzen (Taxa). Der ``log likelihood´´ die gegebenen Daten zu erklären, ist folglich die Summe der ``log likelihoods´´ jeder individuellen Position.

, wobei k= Anzahl der Merkmale und i = Position 1-k

Auch in diesem Fall werden in einer heuristischen Suche eine große Anzahl an ungewurzelten Topologien ermittelt.

Die Gesamttopologie, die mit höchster Wahrscheinlichkeit den gegebenen Datensatz unter dem angenommenen Modell erklärt, wird als Maximum Likelihood Baum präsentiert. Hier ist anzumerken, dass der ``output´´ ein gewurzeltes Dendrogramm darstellt. Die Wurzel wird Eingangs vom Benutzer [Seite 28↓]festgelegt, geht aber nicht als gegebene Forderung in die Berechnung der Wahrscheinlichkeiten ein. Die Leserichtung ist daher als a posteriori Entscheidung anzusehen.

Besondere Bedeutung kommt der Wahl des Evolutionsmodells zu. Es dient der Schätzung der Wahrscheinlichkeit für das Auftreten einer Substitution. Im Laufe der letzten Jahrzehnte wurde eine Vielzahl von Modellen entwickelt, die in immer differenzierterer Weise versuchen, den unterschiedlichen Substitutionsraten Rechnung zu tragen. Im Gegensatz zum einfachsten Jukes-Cantor- Modell (gleiche Mutationsrate von a = 0,25 für jedes Nukleotid) Jukes undCantor (1969) bedienen sich alle weiteren Modelle der Annahmen, dass

  1. die Häufigkeit der beobachteten Nukleotide in einem Alignment (Basenfrequenz) nicht gleich sein muß (z.B. sind tierische mitochondriale Genome sehr A/T reich) und daher für jedes Nukleotid im Durchschnitt ermittelt wird (p i) und
  2. Transitionen und Transversionen unterschiedliche Substitutionsraten haben. Die Wahrscheinlichkeit des Auftretens einer Transition a (Purin « Purin, Pyrimidin « Pyrimidin) ist höher als die Wahrscheinlichkeit einer Transversion b (Purin « Pyrimidin), andererseits hat eine Base nur eine Möglichkeit via Transition in ein anderes Nukleotid zu substituieren, dagegen kann sie aber via Transversion in zwei andere Basen substituieren. In den hier vorgestellten Analysen der Nukleotidsequenzen kommen folgende Modelle zum Einsatz:
    - HKY: Hasegawa-Kishino-Yano Hasegawa et al. (1985) mit zwei Parametern: Variable Basenfrequenz und Transitionen:Transversionen.
    - TN: Tamura-Nei Tamura undNei (1993) mit drei Substitutionstypen: Variable Basenfrequenz, Transitionen:Transversionen und Y:R-Transitionsparameter.

Optional kann jedes Modell mit der zusätzlichen Forderung der Variabilität eines Merkmals, abhängig von seiner Position, die sogenannte „rate heterogeneity“, versehen werden. Hierbei wird der Beobachtung Rechnung getragen, dass Nukleotide abhängig von ihrer Position unterschiedliche Evolutionsgeschwindigkeiten aufweisen. Diese Evolutionsraten können nach der Gamma Verteilung Yang (1993) spezifiziert werden.

Für die Maximum Likelihood Analysen werden alle Nukleotiddatensätze mit dem Programm TREE-PUZZLE Vers. 5.0 Schmidt et al. (1999-2000),Schmidt et al. (2002),Strimmer undvon Haeseler (1996) berechnet. In einem ersten Schritt werden die Alignments jeweils unter den oben genannten Modellen einmal ohne Berücksichtigung und einmal mit Berücksichtigung der ``rate heterogeneity´´ im ``fast approximate´´ Modus berechnet. Für die genauen Berechnungen wird dann das Modell, das die höchste Wahrscheinlichkeit ergab, gewählt und erneut im ``exact slow´´ Modus berechnet. Die Option ``list puzzling step trees´´ wird aktiviert, um eine Liste aller gefundenen Topologien zu erhalten. Die Liste aller Topologien wird im weiteren mittels des Kishino-Hasegawa-Tests Kishino undHasegawa (1989) getestet. Der ``output´´ dieses Tests stellt eine Liste dar, aus der die Topologie mit der höchsten Wahrscheinlichkeit erkennbar ist (``best tree´´), aber auch allen Topologien, die nicht signifikant schlechter sind als der ``best tree´´ (``not significantly worse´´) und die Topologien die das Signifikanzlevel von 5% nicht erreichen (``significantly worse´´). Sofern die Gesamtanzahl der errechneten Topologien einen vertretbaren, d.h. im ``textfile´´ überschaubaren Umfang aufweisen (bis [Seite 29↓]zu 1000 Topologien) und die Anzahl der signifikant schlechteren Topologien mehr als 50% aller errechneten Möglichkeiten überschreitet, wird aus allen signifikant guten Topologien ein ``strict´´ Consensusbaum (im Programm Phylip, Vers. 3.5c) generiert, der auch mittels prozentualer Angaben die Unterstützungen einzelner Verzweigungen angibt, die aus allen im Consensus repräsentierten Topologien ermittelt werden. Für die erzeugte Consensustopologie wird die Wahrscheinlichkeit und die entsprechenden Astlängen gesondert als ``user tree´´ mit TREE-PUZZLE berechnet. Mit dieser Methode kann garantiert werden, dass der Consensusbaum aus allen wahrscheinlichsten Topologien resultiert. Anderenfalls würde in diesen Fällen bei einem durch TREE-PUZZLE automatisch generierten ``50% majority consensus tree´´ ein gewisser Anteil an signifikant schlechteren Topologien repräsentiert sein. Die Anwendung dieser Methode erwies sich in einigen Fällen als adäquat, da weit weniger als 50% aller Topologien das Signifikanzlevel erreichten. Die Unterstützung der Dichotomien gibt die Prozentualität an, mit der diese Verzweigung in allen Topologien vertreten ist und wird im Folgenden mit „CML“ (Consensus ML) abgekürzt. Sofern die Anzahl der signifikant schlechteren Topologien unter 50% der Gesamtanzahl blieb, wurde der durch TREE-PUZZLE erzeugte ``50% majority rule consensus tree´´ verwendet. Bei einer Gesamtanzahl von über 1000 zu testenden Topologien wird die nach dem entsprechenden Kishino-Hasegawa-Test als ``best tree´´ ausgewiesene Topologie gezeigt.

Die Anzahl aller möglichen Quartet-Puzzle-Topologien errechnet sich durch

= , wobei n = Anzahl der Taxa

wobei die obere Grenze der Gesamttopologien programmbedingt auf 10.000 Topologien limitiert ist.

2.2.7.4 Alignmentmethoden

Streng genommen spiegelt ein Alignment in sich schon die Evolutionsgeschichte wieder und muß daher mit besonderer Sorgfalt aufgestellt werden.

Prinzipiell entspricht der Aufbau eines Alignments dem einer morphologischen Datenmatrix, wobei die einzelnen Nukleotide, bzw. Aminosäuren für die verschiedenen Spezies so untereinander geschrieben werden, dass die daraus resultierenden Nukleotid- (Aminosäure) Spalten als homolog zueinander hypothetisiert werden (Positionshomologie). Folglich ist jede Spalte (Position) eines Alignments ein Merkmal, die Art der Nukleotide (Aminosäuren) in dieser Position sind dagegen die unterschiedliche Ausprägungen des Merkmals. Während des Alignmentprozesses wird die Anzahl der übereinstimmenden Nukleotide (Aminosäuren) durch das Einfügen von Lücken (``gaps´´ oder ``indels´´) maximiert. Die biologische Bedeutung von ``gaps´´ sind im Lauf der Evolution erfolgte Insertionen oder Deletionen. Das Einsetzten von ``gaps´´ ist insbesondere bei ribosomalen Genen, die keinen ``reading frame´´ aufweisen, im höchsten Maß hypothetisch. Um ein aussagekräftiges Alignment zu erhalten, können die Parameter (Maluspunkte) zur Eröffnung bzw. Verlängerung von ``gaps´´ variiert werden.


[Seite 30↓]

Sofern ``gaps´´ in den Alignments vorkommen, werden diese in den nachfolgenden phylogenetischen Rechenverfahren unterschiedlich bewertet. Hier ist zunächst anzumerken, dass Parsimonie Verfahren eine Wertung der ``gaps´´ als fünftes Merkmal (bei Nukleotidalignments) oder 21stes Merkmal (bei Aminosäurealignments) erlauben, Maximum Likelihood Verfahren werten ``gaps´´ grundsätzlich nicht.

Zur Erstellung eines Alignments werden verschiedene Computerprogramme im Internet angeboten, die auf der Basis unterschiedlicher Algorithmen arbeiten. Die in dieser Arbeit verwendeten Programme sind Clustal X Thompson et al. (1997) und POY Gladstein undWheeler (1996-2000). Darüberhinaus kommt für das ribosomale Gen (12S) ein drittes, visuell erstelltes Alignment zur Anwendung.

2.2.7.4.1 Clustal X

Dieses sogenannte ``multiple alignment´´ Verfahren Thompson et al. (1997) gehört zu den am weitesten genutzten Programmen, um homologe Sequenzen miteinander zu vergleichen.

Hierbei werden aus einem gegebenen Datensatz alle Sequenzen paarweise miteinander verglichen, und eine Distanzmatrix für den gegebenen Datensatz wird errechnet. Auf der Basis der Distanzmatrix wird ein, den multiplen Alignmentprozess initiierender, sogenannter ``guide tree´´ erstellt. Im zweiten Schritt werden jeweils die Sequenzen miteinander aligned, die die geringsten Distanzen zueinander aufweisen. Von jedem paarweisen Alignment wird eine Consensussequenz generiert und anschließend die paarweisen Alignments bzw. deren Consensussequenzen, wieder auf der Basis der kleinsten Distanzen, zueinander aligned. Während des multiplen Alignmentprozesses werden, wo dies notwendig erscheint, ``gaps´´ eingeführt.

Clustal X wird unter Verwendung der vorgegebenen Parameter (``default´´) Optionen zur Erstellung von Alignments für die Gene 12S (im Vergleich zum POY Alignment), EF-1α der Branchiopoda, cox1, 12S der Astacoidea und für die Vervollständigung des Arthropodendatensatzes (Aminosäuren) verwendet.

2.2.7.4.2 POY

Das Programm POY ist im eigentlichen Sinn kein ``stand alone´´ Alignmentprogramm, sondern verbindet Alignment mit der phylogenetischen Analyse in einem Schritt. Hierbei wird aus einem gegebenen Datensatz in einer heuristischen Suche eine Vielzahl möglicher Alignments generiert und anschließend in einer phylogenetischen Rekonstruktion nach dem Parsimonie Prinzip für jedes ermittelte Alignment eine Topologie erzeugt, für die dann schließlich die benötigte Anzahl der Substitutionen (Schritte) berechnet wird. Dieser Vorgang wird so häufig wiederholt, bis das Alignment und die dazugehörige Topologie mit der kürzesten Schrittanzahl festgestellt ist. Somit wird ein konsequenter Weg der gewählten Parameter garantiert, von der Erzeugung eines Alignments bis zur phylogenetischen Rekonstruktion Phillips et al. (2000). Insbesondere für die Analyse nicht-proteincodierender Gene, bei denen das Einfügen von ``indels´´(=Insertion/Deletion) die [Seite 31↓]Positionshomologie der benachbarten Nukleotide enorm beeinflussen, findet das Programm breite Zustimmung. Ein großer Nachteil ist, dass die Analyse eine enorm hohe Rechenzeit benötigt.

2.2.7.5 Testverfahren bezüglich der Zuverlässigkeit einzelner Topologien

Um Qualität und Stabilität der Cladogramme, insbesondere einzelner Monophyliehypothesen, zu testen, bieten sich mittlerweile eine große Anzahl verschiedener Testmöglichkeiten an, von denen hier eine kleine Auswahl zum Einsatz kommen.

2.2.7.5.1 ``Bootstrap´´ Analyse

Dieser Test wurde für alle Parsimonie Cladogramme angewendet. Die ``bootstrap´´ Analyse (Felsenstein, 1985) besteht aus einer Generierung von zufällig veränderten Datensätzen (Replikaten). Die Änderung des ursprünglichen Datensatzes erfolgt in der zufälligen Löschung einzelner Merkmale und gleichzeitiger Verdopplung anderer Merkmale im Alignment. Für jedes auf diese Weise generierte Alignment (i.d.R. 1000 Replikate) wird die optimale Topologie berechnet. Aus allen Topologien wird im zweiten Schritt ein Consensusbaum berechnet, der an jedem Monophylum die prozentuale Unterstützung ausweist, also die Häufigkeit mit der dieses Monophylum in allen artifiziellen Datensätzen vorkommt. Sofern im Text erwähnt, werden die ``bootstrap´´ Werte mit „BA“ abgekürzt.

2.2.7.5.2 ``Decay´´ Index oder Bremer ``support´´

Die Berechnung des Bremer ``supports´´ Bremer (1994) ist eine indirekte Überprüfung, durch wieviele Apomorphien ein Monophylum gestützt wird Wägele (2000) und wird hier als Alternative oder parallel zum ``bootstrap´´ Verfahren angewendet. Der Bremer Index gibt für jedes Monophylum eines Cladogramms an, wieviele Schritte notwendig sind, um eine Schwestergruppenbeziehung zu Fall zu bringen. Die angegebenen Werte sind ganze Zahlen von 1 - ¥ (abhängig von der Anzahl der Apomorphien in einer Schwestergruppenbeziehung). Im Text wird der ``decay´´ Index mit „DI“ abgekürzt. Zur Berechnung der ``decay´´ Indices wird das Programm NONA genutzt.

2.2.7.5.3  ``Quartet- Puzzling- support´´ (TREE-PUZZLE)

Dieser Test ist im Programm TREE-PUZZLE Vers. 5.0 implementiert und wird für die ML Analysen der beiden 12S Alignments für alle Branchiopoda, sowie die der Astacoidea angewendet. Der ``Quartet-Puzzling-support´´, im folgenden ``QP-support´´ genannt, ist der ``bootstrap´´ Analyse insofern ähnlich, als das für jedes Monophylum eine prozentuale Unterstützung errechnet wird. Dieser Wert ermittelt sich allerdings nicht aus der artifiziellen Änderung des Datensatzes (s. o. ``bootstrap´´ Analyse), sondern beschreibt die Häufigkeit der gefundenen Monophyla während des Quartet-[Seite 32↓]Puzzling -Prozesses unter dem ``50% majority rule consensus´´ Margush undMcMorris (1981). Dieser ``QP-support´´ wird anschließend auf die dargestellten besten ML Stammbäume (Branchiopoda) bzw. ``50% majority rule consensus´´ Dendrogramme der Astacoidea übertragen.

2.2.7.5.4  Sensitivitätsanalyse (POY)

Mittels einer Sensitivitätsanalyse Wheeler (1995) (´``gap X´´ oder ``molecularmatrix Y´´) wird der 12S rDNA-Datensatz unter verschiedenen Gewichtungsannahmen berechnet (Transitionen: Transversionen: Indels = 1:1:1, 1:1:2, 1:2:2, 1:2:4, 1:1:10). Auf diese Weise können Aussagen über die Robustheit einzelner Monophylien in der Gesamttopologie gemacht werden. Das Schema 1:1:2 gilt hierbei als die für Arthropoda favorisierte Gewichtung Wheeler (1995),Whiting et al. (1997).

2.2.7.5.5 Kishino-Hasegawa-Test

Durch dieses Testverfahrens ist es möglich, verschiedene Hypothesen (Topologien) bezüglich ihrer Signifikanz zu überprüfen. Es erlaubt eine Bewertung von unterschiedlichen Cladogrammen bzw. Dendrogrammen auf der Basis des 5% Signifikanzlevels. Der K-H-Test Kishino undHasegawa (1989) kommt in zweifacher Hinsicht zum Einsatz, einerseits bei der Ermittlung der wahrscheinlichsten und aller nicht signifikant schlechteren Topologien nach einer Quartet-Puzzle-Analyse (wie oben beschrieben) andererseits für eine Hypothesenbewertung der Topologien aus den Parsimonie und ML Analysen. Dabei werden von jeweils beiden Hypothesen die ``log likelihood´´ Werte unter den Parametern der zugrundegelegten Modelle verglichen, d.h. beide Hypothesen werden bezüglich ihrer Signifikanz in den Wahrscheinlichkeitswerten gegeneinander getestet.

2.2.7.5.6  ``Likelihood mapping´´

Das ``likelihood mapping´´´´Strimmer undvon Haeseler (1997) (implementiert im Programm TREE-PUZZLE, Vers. 5) ist eine graphische Methode, die die phylogenetische Information eines Datensatzes a priori visualisiert und einen ersten Eindruck über die Qualität der zu erwartenden phylogenetischen Analyse vermittelt. Die Methode basiert auf der Wahrscheinlichkeitsberechnung aller möglichen Quartet-Topologien. Jede Topologie wird mittels eines Punktes in einem Dreieck dargestellt, wobei die Aussage über die Wahrscheinlichkeit einer Topologie durch die Lage im Dreieck bestimmt wird. Die drei Eckpunktregionen repräsentieren die Situation, in der eine Topologie über die beiden anderen klar favorisiert werden kann. Punkte im Bereich der Seitenkanten repräsentieren die Situationen, in denen nicht eindeutig eine Topologie favorisiert wird. Das Zentrum umfasst die Menge der Topologien, die nicht aufgelöst sind (``star-like´´). Das heißt, je stärker sich die Punktwolken in den Eckpunkten des Dreiecks konzentrieren, desto größer ist das phylogenetische Signal des Datensatzes.


[Seite 33↓]

Das ``likelihood-mapping´´ kann auch zur Überprüfung von Hypothesen herangezogen werden Strimmer undvon Haeseler (1997). Zu diesem Zweck werden verschiedene Spezies des Alignments in einem Cluster zusammengefasst und einem oder mehreren anderen zu definierenden Clustern gegenübergestellt (maximal vier Cluster). Jedes Cluster wird somit als Monophylum behandelt. Nach dem gleichen Prinzip wie oben beschrieben, werden die Beziehungen dieser Cluster (Monophyla) zueinander in einem Dreieck dargestellt, wobei jede Ecke eine Hypothese bezüglich der wahrscheinlichen Schwestergruppenbeziehungen der maximal vier Cluster darstellt.

Beide Methoden des ``likelihood mappings´´ finden für die Datensätzen der Astacoidea Anwendung.

2.2.8 Die 12S Datensätze der Branchiopoda und Astacida

2.2.8.1 Branchiopoda

In der vorliegenden Arbeit werden zwei Alignments des 12S rRNA Datensatzes für die Parsimonie Analysen und Maximum Likelihood Analysen der Branchiopoda erstellt. Ein Alignment folgt hierbei strikt dem Parsimonie Prinzip und wird mit dem Programm POY berechnet, ein weiteres Alignment wird visuell anhand der Sekundärstruktur erstellt (siehe auch Kapitel: 3.1.2.5), wobei die ``loop´´-Bereiche (sofern in Länge zwischen den Taxa unterschiedlich) mit Clustal X (``default´´) aligned werden.

Für die POY Analyse wird der 12S Datensatz zunächst in drei sinnvolle Teile geteilt, wobei jeder Teilbereich mit einer ``stem´´-Hälfte beginnt und endet. Die drei Teildatensätze werden im ersten Schritt getrennt voneinander aligned, jeweils die kürzeste Schrittanzahl benötigend und im zweiten Schritt zusammengesetzt.

Der erste Datensatz umfasst die ``stem´´-Hälften 27’, 22’ und 31’, der zweite Datensatz erstreckt sich von ``stem´´ 32 bis 33’ und der letzte Datensatz von ``stem´´ 48 bis 32’ (Abbildung 5). Es sei an dieser Stelle deutlich darauf hingewiesen, dass die Analyse der Sekundärstruktur für diese Berechnung nur zur sinnvollen Teilung des Datensatzes herangezogen wird. Die Berechnung der drei Datensätze erfolgt nicht auf der Basis der sich innerhalb der Datensätze befindlichen Sekundärstrukturen.

Die POY Analysen werden mittels der Kommandokaskade „maxtrees 10, fitchtrees, checkslop 10, multibuild 10, treefuse, buildmaxtrees 5, treefuse, random 100, stopat 5 und minstop 3“ durchgeführt. Aus den so ermittelten, gleich sparsamen Cladogrammen wird das ``strict consensus´´ Cladogramm mit der favorisierten Gewichtung 1:1:2 ermittelt (jack2hen.exe) errechnet. ``Decay´´ Indices Bremer (1994) werden mit dem Programm PHAST kalkuliert: „ hold X, sub Y, find, bs“. Anschließend wird noch eine Sensitivitätsanalyse durchgeführt, um die Stabilität einzelner Verzweigungen unter anderen Gewichtungen zu überprüfen (siehe Kapitel: 2.2.7.5.4).


[Seite 34↓]

2.2.8.2  Astacida

Der 12S rRNA Datensatz der Astacida wird mit dem Programm Clustal X (``default´´) aligned und visuell bezüglich der korrekten Positionshomologien anhand der Sekundärstruktur der dritten Domäne überprüft.

2.2.9 Erstellung der Nukleotidalignments der proteincodierenden
Gene der Branchiopoda und Astacida

Die proteinkodierenden Bereiche der Gene EF-1α der Branchiopoda und cox1 der Astacida werden ohne Ambiguitäten aligned, insofern stellt sich hier die Frage nach dem „richtigen“ Alignment nicht. Es wird das Programm Clustal X unter ``default´´ Optionen angewendet. Während der Datenerhebung offenbarte sich die Existenz kleiner hochvariabler Introns im Gen EF-1α der Branchiopoda. Eine Homologisierung der Intronsequenzen lässt sich allerdings nicht rechtfertigen, daher werden die Intronsequenzen vor der Erstellung des Alignments entfernt.


© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 3.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
05.01.2005