Kern, Hartmut : „SIRS und Sepsis nach kardiochirurgischen Eingriffen - Vergleich verschiedener Modelle zur Risikostratifizierung“

14

Kapitel 2. Methodik:

2.1 Patientengut

Nach vorheriger Genehmigung durch die zuständige Ethikkommission wurden alle vom 01.06.1996 bis 31.12.1999 auf der Intensivstation III der Charité (Campus Mitte) aufgenommenen Patienten in die Datenanalyse eingeschlossen. Da aufgrund der anonymisierten, retrospektiven Datenauswertung die intensivmedizinische Therapie nicht beeinflußt wurde und im Vergleich zur klinischen Routine keine zusätzlichen Parameter erhoben wurden, ist in Übereinstimmung mit der Ethikkommission auf eine Patienten-aufklärung verzichtet worden. Die Intensivstation III verfügt über 11 Betten, die alle als Beatmungsplätze genutzt werden können, und wird durch ein Ärzte-Team bestehend aus Anästhesisten und Intensivmedizinern und geschultem Pflegepersonal betreut. Es handelte sich bei diesem Patientengut um ausschließlich postoperative kardiochirurgische Patienten (Bypass- und Herzklappenoperationen, Korrektur angeborener Herzfehler u.a.).

2.2 Perioperatives Management

Sowohl das anästhesiologische Management wie auch die Durchführung des kardiopulmonalen Bypasses erfolgte entsprechend klinikinterner Standardprozeduren [Kern 2000, Schlame 1998, Hensel 1998]. Nach oraler Prämedikation von 1-2 mg Flunitrazepam am präoperativen Abend und von 0,1 mg/kg Midazolam eine Stunde vor Narkosebeginn wurde die Narkose mit 2-5 µg/kg Fentanyl, 0,15-0,2 mg/kg Etomidate und 0,1 mg/kg Pancuronium eingeleitet. Nach endotrachealer Intubation wurde die mechanische Ventilation mit einem Sauerstoff/Luftgemisch und einer inspiratorischen Sauerstoffkonzentration von 50 % begonnen. Tidalvolumina (8-10 ml/kg) und Atemfrequenz (10-14/min) wurden kapnographisch und arteriell an Normalwerte (paCO2 40 - 45 mmHg) adaptiert. Ein PEEP von 5 cm H2O wurde standardisiert appliziert. Die Radialarterie wurde gemäß klinischer Routine zum invasiven hämodynamischen Monitoring vor Narkoseeinleitung kanüliert, und ein peripher venöser Zugang wurde angelegt. In Narkose wurde anschließend ein mehrlumiger zentraler Venenkatheter sowie bei einer präoperativ stark eingeschränkten Herzfunktion (Ejektionsfraktion < 40 %), bei Notfalloperationen bzw. bei Re-Operationen oder Eingriffen an mehreren Herzklappen ein Thermodilutions-Pulmonalarterienkatheter über die rechte Vena jugularis interna eingeführt. Die Anästhesie wurde fortgeführt durch kontinuierliche intravenöse Zufuhr von Fentanyl (0,1-0,3 µg/kg/min) und zusätzliche Gabe eines Inhalationsanästhetikums (Isoflurane mit 0,1 - 0,8 Vol % oder Sevoflurane mit 0,5 - 1


15

Vol%). Bei Bedarf wurden zusätzlich Bolusgaben von 1-5 mg Midazolam verabreicht. Vor Beginn der extrakorporalen Zirkulation wurden 1,5 Millionen I.E. Aprotinin infundiert und Heparin in einer Dosis von 350 I.E./kg Körpergewicht gegeben, um eine ACT (activating clotting time) von mindestens 480 Sekunden zu erzielen. Als antibiotische Prophylaxe wurden 2g Cefotiam vor und nach CPB verabreicht. Anschließend wurde ein normothermer, nicht-pulsatiler kardiopulmonarer Bypass (Biomedicus Centrifugal Pump, Medtronic, Minneapolis, USA) mit einem minimalen Perfusionsfluß von 2,2 l/m²/min und einem minimalen Perfusionsmitteldruck von 50 mmHg initiiert. Das Priming der Herz-Lungen-Maschine bestand aus einer Mischung aus kristalloidem und kolloidem Volumenersatz unter Zusatz von weiteren 1,5 Millionen I.E. Aprotinin sowie 1000 mg Methylprednisolon. Während des kardiopulmonalen Bypass wurden die Lungen nicht beatmet. Nach Abgang von der Herz-Lungen-Maschine wurde die Lunge manuell für 15 Sekunden gebläht bis zu einem Druck von 40 cm H2O unter optischer Kontrolle des Eröffnens atelektatischer Lungenareale. Das Heparin wurde anschließend mit Protamin antagonisiert, um eine ACT von 120 Sekunden zu erreichen. Die volumenkontrollierte, druckbegrenzte und kapnographisch adaptierte (paCO2 40 - 45 mmHg) mechanische Ventilation wurde unter Beibehaltung der initialen FiO2 fortgeführt, solange die Oxygenierung des Patienten gemessen am PaO2 eine Grenze von 100 mmHg nicht unterschritt (Standardbeatmung: PEEP von +5, Atemfrequenz von 12/min, Tidalvolumina 8-10 ml/kg und eine Spitzendruckbegrenzung von 25 cm H2O). Postoperativ wurden die Patienten initial hämodynamisch stabilisiert, indem die Füllungsdrucke und das Herzzeitvolumen durch Substitution von Kristalloiden und Kolloiden sowie durch die bedarfsadaptierte Gabe von Katecholaminen (Dopamin 1-5 µg/kg/min, Adrenalin 0,1-1,0 µg/kg/min, Noradrenalin 0,05-1,0 µg/kg/min, Enoximone 5-10 µg/kg/min) optimiert wurden. Zielparameter waren ein zentraler Venendruck (ZVD) zwischen 6 und 12 mmHg, ein pulmonalkapillärer Verschlußdruck (PCWP) zwischen 6 und 14 mmHg sowie ein Cardiac Index (CI) über 2 l/min/m². Die postoperative intensivmedizinische Therapie erfolgte zuerst nach mündlichen, später nach schriftlichen Standardprozeduren [Kern + Kox 1999].


16

2.3 Versuchsablauf

2.3.1 Datenerhebung

Die Datensammlung erfolgte mittels RIYADH-Programm Version 5.0 (RIP), das auf einem Personal-Computer installiert wurde. Zur Verlaufsbeobachtung wurden täglich die für den APACHE II-Score und SAPS II benötigten Parameter, die therapeutischen und pflegerischen Aufwendungen (TISS-Punkte) sowie Zahl und Dauer von auftretenden Organversagen im Organ Failure Score (OFS) vom ärztlichen und pflegerischen Personal erhoben. Darüber hinaus wurden demographische Daten, Diagnosen, durchgeführte Operationen, Komplikationen, die Liegedauer und das Hospital-Outcome dokumentiert. Um die Fehlerquellen zu minimieren, wurden wichtige Definitionen und Kodierungen auf den Erhebungsbögen übersichtlich dargestellt (Abb. 1a-f). Desweiteren waren die physiologischen Daten einschließlich der Laborparameter der letzten 24 Stunden am Patientenbett leicht der Kurve zu entnehmen, so daß kein zusätzlicher Zeitaufwand durch Recherchen entstand. Ließ der Stationsbetrieb keine Zeit zum Ausfüllen der Protokolle, wurde nachträgliche Kurveneinsicht und Übertragung der Werte vorgenommen. Eine Plausibilitätskontrolle wurde von den eingebenden Forschungsassistenten und dem zuständigen Oberarzt durchgeführt. Die Eingabe der Daten erfolgte retrospektiv, örtlich getrennt vom Stationsbetrieb und die errechneten farbcodierten Sterbewahrscheinlichkeiten hatten keinerlei Einfluß auf die intensivmedizinische Therapie. Wöchentlich wurden die Krankenhaus-Entlassungsdaten im Zentralcomputer des Klinikums erfragt und im RIP ergänzt. In die Auswertung wurden nur jene Patienten eingeschlossen, deren Verbleib nach der Verlegung von der Intensivstation bis zur Entlassung verfolgt werden konnte. Ausgeschlossen wurden darüberhinaus alle Patienten, die nicht direkt nach einem kardiochirurgischen Eingriff intensivstationär aufgenommen wurden inklusive der von anderen Stationen rückübernommenen Patienten, Kindern unter 13 Jahren sowie alle Patienten, die weniger als sechs Stunden intensivstationär behandelt wurden.


17

Abbildung 1a: Datenblatt zur Erfassung der Patientenbasisdaten sowie der chronischen Vorerkrankungen entsprechend des APACHE II


18

Abbildung 1b: Datenblatt zur Kodierung der Spezifischen Diagnosekategorie und der Begünstigenden Faktoren


19

Abbildung 1c: Datenblatt 1 zur Erfassung der akuten physiologischen Parameter entsprechend des APACHE II bzw. SAPS II


20

Abbildung 1d: Datenblatt 2 zur Erfassung der akuten physiologischen Parameter entsprechend des APACHE II bzw. SAPS II


21

Abbildung 1e: Datenblatt 1 zur Erfassung der Parameter entsprechend des TISS


22

Abbildung 1f: Datenblatt 2 zur Erfassung der Parameter entsprechend des TISS


23

2.3.2 Angewendete Scoring-Verfahren

Die Intensität der pflegerischen und ärztlichen Therapie, das Ausmaß der erforderlichen Interventionen und der apparative Aufwand wurden täglich durch die Dokumentation des Therapeutic Intervention Scoring System (TISS) erfaßt. Der Einsatz eines für allgemeine Intensivstationen angepaßtes Scoring-System auf der hochspezialisierten kardiochirugischen Intensivstation mit einer Vielzahl von apparativen Unterstützungsverfahren für die speziellen Anforderungen von Patienten nach herzchirurgischen Eingriffen erforderte unserer Meinung nach eine Erweiterung, um dem hohen Plegeaufwand und damit verbundenen Kosten von Patienten mit extra- oder intrakorporalen Herzunterstützungssystemen gerecht zu werden. Dementsprechend wurde der urprüngliche TISS-76 (Keene 1983) um die Variablen „Intraaortale Ballonpumpe“ und „LVAD“(Left Heart assist Device =Linksherzunterstützungssystem) erweitert, für die Maximalwerte von 4 Punkten veranschlagt wurden (Abb.1e-f). Die Dokumentation der TISS-Werte wurde täglich in der Nachtschicht retrospektiv für den vorherigen Tag vom Pflegepersonal durchgeführt.

Das APACHE II-Scoring-System umfaßt drei Teile. Den physiologischen Status des Patienten spiegelt der Acute Physiology Score (APS) wider. Berücksichtigung finden zwölf Einzelvariablen, die sieben Organsysteme (kardiovaskuläres, respiratorisches, renales, metabolisches, neurologisches, hämatologisches und Immunsystem) repräsentieren (Abb. 1 c). Für jede dieser Variablen werden 0-4 Punkte vergeben in Abhängigkeit davon, wie weit der jeweilige Wert vom Normalwert abweicht. Grundsätzlich wurden aus der Fülle der über 24 Stunden gesammelten Werte definitionsgemäß diejenigen zur Score-Berechnung herangezogen, welche den schlechtesten Zustand des jeweiligen Organsystems reflektierten (Abb.2). Elektolytentgleisungen wurden dokumentiert bei einem Natriumwert unter 130 mmol/l bzw. über 149 mmol/l und/oder einem Kaliumwert von unter 3,5 mmol/l bzw. über 5,4 mmol/l. Eine therapiebedürftige metabolische Störung wurden definiert als ein Standardbikarbonat von unter 21 mmol/l bei gleichzeitiger Azidose mit einem pH-Wert von unter 7,34 bzw. ein Standardbikarbonat von über 28 mmol/l bei gleichzeitiger Alkalose mit einem pH-Wert von über 7,44 und der gleichzeitigen Notwendigkeit zum Einsatz von Natrium-Bikarbonat bzw. Salzsäure zur Korrektur auf Normwerte [Müller-Plathe 1998]

Eine Sonderstellung nimmt der Glasgow-Coma-Score (GCS) ein [Teasdale 1974]. Ursprünglich entwickelt zur Beurteilung der Schwere eines Hirnschadens bei Patienten nach Schädel-Hirn-Verletzungen, diente der Glasgow-Coma-Score in dieser Studie zur allgemeinen


24

Einschätzung des Funktionsgrades des neurologischen Systems. Es werden drei Kategorien abgefragt: Augen öffnen, motorische Reaktion und verbale Äußerungen (zur Punktevergabe siehe Abb. 1 d). Die Differenz zum maximal erreichbaren Wert 15 geht als GCS-Punktwert in den APS ein. Unter Sedierung wurde, entsprechend der Validierungsstudie des APACHE II an Patienten einer kardiochirugischen Intensivstation, bei fehlenden klinischen Symptomen eines neurologischen Defizits ein GCS von 15 angenommen [Turner 1991]. Im zweiten Teil des APACHE II werden 0-6 Punkte für das Alter vergeben (le 44 Jahre : 0 Punkte; ge 75 Jahre : 6 Punkte). Chronische Vorerkrankungen als Prognosefaktoren werden schließlich im dritten Teil bewertet. Erfüllte ein Patient die untengenannten Kriterien vor der letzten Aufnahme ins Krankenhaus, wurden chronische Erkrankungen in folgender Weise gewichtet: handelte es sich um einen nicht-operativen oder postoperativen Notfall-Patienten wurden 5 Punkte, im Falle eines elektiv post-operativen Patienten 2 Punkte vergeben. Die Summe der Punkte aus allen drei Kategorien (APS, Alter, chronische Erkrankungen) ergab den endgültigen APACHE II-Score.


25

Abbildung 2: Verwendetes Scoring für das APACHE II-System

26Definitionen einer chronischen Vorerkrankung:

Leber:

- histologisch gesicherte Zirrhose
- gesicherte portale Hypertension
- stattgehabte Ösophagusvarizenblutung
- vorausgegangenes Leberkoma
- hepatische Encephalopathie

Herz-Kreislauf:

- Herzinsuffizienz im Stadium NYHA (New York Heart
Association) IV, d.h. Angina pectoris und/oder Dyspnoe in
körperlicher Belastung (Waschen, Anziehen)

Lunge:

- Schwere Lungenerkrankung mit der Unfähigkeit, Treppen zu steigen
- gesicherte chronische Hypoxämie und/oder Hyperkapnie
- dokumentierte pulmonale Hypertension, d.h. pulmonalarterieller
Mitteldruck > 40 mmHg

Niere:

- chronische Dialyse

Immunsystem:

- anamnestisch Immunsuppressiva, Chemotherapie oder Bestrahlung
- low-dose-Steroide über 30 Tage oder 15 mg/kg über länger als 5 Tage
- Infektionsgefährdung durch Leukämie, Lymphom oder metastasierendes
Karzinom

Anmerkung: Eine chronische Erkrankung lag definitionsgemäß vor, wenn mindestens eines der genannten Kriterien erfüllt und vor der Krankenhausaufnahme bekannt und dokumentiert war.

Zur Berechnug des SAPS II (Simplified Acute Physiology Score) kam ein Verfahren zur Anwendung, das sich nur in wenigen Punkten von der oben beschriebenen Methode des APACHE II unterscheidet [LeGall 1993].

Bei der Definition der einzelnen Organversagen zur Berechnung des bereits erwähnten OFS wurden die von Knaus et al. entwickelten Kriterien zugrunde gelegt [Knaus 1985b]. Bei einer


27

Herzfrequenz unter 55 /min, einem mittleren arteriellen Blutdruck unter 50 mmHg oder einem pH-Wert le 7.24 bei einem PaCO2 < 50 mmHg lag demzufolge ein kardiovaskuläres Organversagen vor. Auch das Auftreten von Kammerflimmern oder einer ventrikulären Tachykardie erfüllte diese Definition. Mußte ein Patient länger als drei Tage beatmet werden, galt dies ebenso als respiratorisches Versagen wie eine Atemfrequenz < 6 oder > 49 /min, ein PaCO2 ge 50 mmHg oder eine alveolär-arterielle Sauerstoffdifferenz ge 350 mmHg (AaDO2 = 713 FiO2-PaCO2-PaO2). Eine Urinausscheidung von weniger als 480 ml in 24 Stunden, ein Serum-Harnstoff-Spiegel ge 214 mg /dl oder ein Serum-Kreatinin-Wert ge 3,5 mg/dl wurde als akutes Nierenversagen definiert. Von dieser Regelung ausgeschlossen wurden jene Patienten, welche bereits vor der intensivstationären Aufnahme chronisch dialysepflichtig waren. Zusätzlich bestand die Möglichkeit, auf dem Erfassungsbogen in der Option „Akutes Nierenversagen“ ein „Ja“ zu vermerken, wenn die Retentionswerte aufgrund einer Dialyse nicht die obengenannten Grenzen überschritten. Ein Hämatokrit unter 21 % (außer bei chronischer Niereninsuffizienz), Thrombozytenzahlen le 20000/mm³ oder Leukozytenzahlen le 1000/mm³ sprachen für das Vorliegen eines hämatologischen Organversagens. Der Glasgow-Coma-Score durfte im Beobachtungszeitraum den Wert 6 nicht überschreiten, um als Versagen des neurologischen Systems zu gelten. Eine hepatische Enzephalopathie wurde definiert als GCS < 13 bei einem Serumammoniak-Spiegel >100 ug/dl. Im RIP waren keine genauen Kriterien für das Vorliegen eines klinischen Leberversagens vorgesehen, d.h. in diesem Punkt war allein entscheidend, ob der ausfüllende Arzt im Protokoll ein „Ja“ in der entsprechenden Zeile vermerkte. Das Zusammenspiel von Serum-Bilirubin, Serum-Glutamat-Oxalazetat-Transferase (SGOT) und Quick-Wert und die Existenz einer Zirrhose, akuten Virushepatitis oder hepatischen Encephalopathie gingen in diese Entscheidung ein. Erbrechen oder starker Reflux über die Magensonde, starke Diarrhoe, Blutungen im Bereich des Magen-Darm-Traktes sowie Zustände eines Ileus oder Subileus waren die Marker für eine gastro-intestinale Dysfunktion. In diesem Zusammenhang wurde auch die Ernährungsform (parenteral, enteral oder keine) des jeweiligen Tages dokumentiert. Entsprechend klinikinterner Standards wurde eine frühe enterale Ernährung noch am ersten postoperativen Tag begonnen, sofern keine Kontraindikationen bestanden [Kern + Kox 1999].

Da die reine Mortalität einer Station maßgeblich von der Krankheitsschwere der aufgenommenen Patienten beeinflußt wird, dient die Standardized Mortality Ratio (SMR), die definiert ist als Quotient aus beobachteter und vorhergesagter Mortalität, als Instrument zur Qualitätskontrolle. Die vorhergesagte Mortalität entspricht dem bereits genannten Sterberisiko


28

(Risk Of Death), welches über eine Regressionsgleichung sowohl aus dem APACHE II-Score als auch dem SAPS II berechnet werden kann. Auf diese Weise ist es möglich, die Leistung einer Station unabhängig vom Zustand der aufgenommenen Patienten objektiv mit anderen Stationen zu vergleichen. Voraussetzung hierfür ist die Anwendung des gleichen Score-Systems. Nimmt die SMR einen Wert über 1 an, spricht dies für eine eher schlechte Qualität der Intensivtherapie. SMR-Werte unter 1 stehen für eine überdurchschnittliche Qualität der intensivmedizinischen Behandlung. Auf die Einschränkungen, die sich aus den Besonderheiten des kardiochirurgischen Patientenspektrums ergeben, wurde bereits in der Einleitung hingewiesen. Das für die Berechnung der Standardized Mortality Ratio (SMR) benötigte vorausgesagte Sterberisiko (Risk Of Death) wird vom RIYADH-Programm mit Hilfe einer Regressionsformel, die an großen Patientenkollektiven erstellt wurde, errechnet. In diese Gleichung gehen unter anderem der SAPS II bzw. APACHE II-Score am Tag der Aufnahme sowie für jede Diagnosekategorie spezifische Koeffizienten ein [Knaus 1985a].

Da es sich in dieser Studie um postoperative kardiochirurgische Patienten handelte, wurden intraoperative Komplikationen speziell für diese Patientengruppe wie folgt definiert:

  1. Therapiebedürftige lebensbedrohliche Herzrhythmusstörungen (Ventrikuläre Tachykardie Kammerflimmern, nicht-kardioplegisch induzierter Herzstillstand)
  2. Wiederholter Abgang von der Herz-Lungen-Maschine (ge 3 Abgangsversuche)
  3. Blutverluste über 2 Liter

2.3.3 Definitionen für SIRS und Sepsis

Das Vorhandensein einer prolongierten systemischen Entzündungsreaktion (systemic inflammatory response syndrome SIRS) [Ziegler 1991, Bone 1992] erfolgte über das Vorliegen von mindestens zwei der folgenden Kriterien während der ersten drei postoperativen Tage:

  1. Temperatur > 38° C oder < 36° C;
  2. Herzfrequenz > 90/min ohne Einsatz von ß-Blockern;
  3. Atemfrequenz > 20/min oder pCO2 < 32 mmHg oder maschinelle Beatmung;
  4. Leukozytenzahl > 12000/mm³ oder < 4000/mm³ bzw. > 10 % unreife Formen an Neutrophilen.


29

Das Vorliegen einer Sepsis wurde durch die Kriterien der Konsensuskonferenz der „Society of Critical Care Medicine Consensus Conference“ [Members American College Chest Physicians 1992] während der direkten postoperativen intensivstationären Behandlung gesichert:

  1. Körpertemperatur > 38,0°C oder < 35,6°C
  2. Herzfrequenz > 90 Schläge/min ohne beta-Blockade
  3. Atemfrequenz > 20 Züge/min oder PaCO2 < 32 mmHg (4,3 kPa) oder
    mechanische Ventilation
  4. Veränderung der Leukozytenzahl: > 12000 Zellen/mm³ oder < 4000
    Zellen/mm³ oder > 10% unreife Neutrophile
  5. Hypotension, welche durch eines der folgenden Kriterien erfüllt sein muss:
    - systolischer Blutdruck < 90 mmHg
    - anhaltender Blutdruckabfall von > 40 mmHg mit entsprechendem
    Flüssigkeitsbedarf ohne Antihypertensiva
    - Therapie mit Vasopressoren, um den systolischen Blutdruck > 90 mmHg
    zu halten.
  6. Systemische Toxizität oder schlechte Endorganperfusion, die durch zwei oder mehr als zwei der folgenden Kriterien definiert wird :
    - metabolische Azidose (pH < 7,3 oder Basendefizit > 5 )
    - arterielle Hypoxämie : PaO2 < 75 mmHg (< 10 kPa)
    - erhöhtes Plasmalaktat (> 1,8 mmol/l)
    - akutes Nierenversagen (Oligurie < 0,5 ml * kg-1* h-1)
    - in den letzten 24 Stunden unerklärliche abnorme Gerinnungswerte ( Quick > 1,5 oder PTT > 1,2 * Kontrollwert )
    - in den letzten 24 Stunden unerklärlicher Thrombozytenabfall ( < 100000/ml
    oder Abfall > 50 % von bekanntem Ausgangswert )
    - plötzlicher Punkteabfall im Glascow Coma Scale
    - Herzindex > 4,0 l/min mit peripherem Widerstand < 800 dyn * s * cm -5
  7. Die Diagnose Sepsis ist vereinbar mir dem klinischen Bild.


30

2.3.4 Kostenberechnung

Eine Berechnung der angefallenen Kosten bei der Behandlung der kardiochirurgischen Patienten auf der ITS III wurde für das Jahr 1996 durchgeführt und für die nachfolgenden Jahre übernommen. In diese Berechnung gingen Sachkosten, Personalkosten, Instandhaltungs- und Wartungskosten, Nutzungsentgelte, extern bezogene Leistungen sowie Abschreibung von intensivmedizinischen Geräten über einen Zeitraum von 10 Jahren ein. Die angefallenen Gesamtkosten wurden dann prozentual auf die Gesamt-TISS-Punkte der 955 im RIYADH-Programm erfaßten Patienten angerechnet. Somit konnte die Wertigkeit eines TISS-Punktes auf 72,- DM festgelegt werden [ Kern + Kox 1999].

2.4 Statistische Verfahren

Einfache deskriptiv-statistische Auswertungen, d.h. Mittelwerte, Median und Standardabwei-chung wurden durch das RIYADH-Programm erstellt. Weiterhin sind mit dieser Software univariate Analysen, wie der ungepaarte t-Test für stetige normalverteilte Variablen, der Wilcoxon-Rank-Sum-Test für nicht normalverteilte und der Chi-Quadrat-Test für kategoriale Variablen möglich. Für weitergehende multivariate Analysen, wie die logistische Regression oder die Diskriminanzanalyse wurde das Programmpaket SPSS für Windows 97 (Version 10) verwendet [Diehl 1997].

2.4.1 Univariate Analyse

Um eine Vorauswahl derjenigen Faktoren zu treffen, welche einen signifikanten Einfluß auf die Vorhersage-Variable (prolongiertes SIRS> 3 Tage, Sepsis bzw. Tod) haben, wurde im ersten Schritt eine univariate Analyse aller prä- und perioperativen Daten durchgeführt. Hier kamen der Chi-Quadrat- bzw. Fisher‘s Exact Test für kategoriale sowie der Wilcoxon-Rank-Sum-Test für stetige Variablen zum Einsatz. Da der K-S-Lilliefors-Test [Lillefors 1967] bei allen stetigen Variablen eine signifikante Abweichung von der Normalverteilung ergab, konnte der Student-t-Test hier nicht angewendet werden.

Es wurden jeweils die Median-Werte für die stetigen sowie die absoluten und prozentualen Häufigkeiten für die kategorialen Variablen angegeben. Betrachtet wurden die ersten 24 Stunden nach der Aufnahme auf die Intensivstation. Trat ein Ereignis innerhalb dieses Untersuchungszeitraumes auf, so wurde es mit „Ja“ gewertet. Bei den stetigen Variablen wurden die am weitesten vom Normalwert abweichenden Werte selektiert. Kategoriale Variablen, deren minimale erwartete Häufigkeit im Chi-Quadrat-Test < 2 betrug, wurden


31

nicht berücksichtigt, da ab diesem Grenzwert der Test definitionsgemäß nicht mehr angewendet werden soll.

2.4.2 Multiple logistische Regression

Zur multivariaten Analyse wurde die schrittweise logistische Regression nach der Vorwärts-Likelihood-Ratio-Methode [Hosmer 1989] angewendet. Dieses Verfahren selektiert diejenigen Prädiktoren, die einen signifikanten Einfluß auf die Vorhersage-Variable (prolongiertes SIRS ge 3 Tage, Sepsis bzw. Tod) haben. Im Gegensatz zur univariaten Analyse werden hier auch die Wechselwirkungen zwischen den einzelnen Faktoren berücksichtigt. Eingeschlossen wurden alle Variablen mit einer in der univariaten Analyse erreichten Signifikanz von p< 0,05.

Die Wahrscheinlichkeit, zur Gruppe der Patienten zu gehören mit prolongierter systemischer Inflammation, Sepsis bzw. letalem Ausgang wird nach einer Regressionsgleichung folgender Form bestimmt.

Für jeden Patienten wird der Wert der Regressionsfunktion

berechnet, wobei X1, X2, ... , Xn die Werte der in die Regression einbezogenen Variablen sind. Die Bi stellen die Regressionskoeffizienten dar.

Für einen errechneten y-Wert (Wahrscheinlichkeit) y > 0,5 erfolgt die Zuordnung zur jeweiligen Gruppe mit dem gewählten Krankheitszustand (SIRS, Sepsis, Tod), anderenfalls zur Gruppe ohne Eintreffen dieses Ereignisses. Es wurde zur Berechnung der Regressionsgleichung das Modell mit der höchsten prozentualen Vorhersagewahrscheinlichkeit für den jeweiligen Krankheitszustand aus den nach der Vorwärts-Likelihood-Ratio Methode gebildeten Modellen gewählt.


32

2.4.3 Künstliche Neuronale Netze

Als weiteres statistisches Verfahren wurde zur Gruppendiskrimination der Einsatz von künstlichen neuronalen Netzen (NN) vorgenommen mittels des statistischen Softwareprogrammes Neural Connection® 2.0 (SPSS Inc.,Chicago,USA). Eingeschlossen wurden alle Variablen mit einer in der univariaten Analyse erreichten Signifikanz von p< 0,05. Anschließend wurde mit dieser Methode die Diskriminationsfähigkeit der in der mutliplen logistischen Regression identifizierten Variablen überprüft.

Künstliche Neuronale Netze können nach ihren Lernprinzipien in zwei große Klassen eingeteilt werden: solche, die in einem überwachten Modus lernen, und solche, die nicht-überwacht lernen. Beim überwachten Lernen wird das Verhalten des Netzwerkes an eine gegebene Input-Output-Beziehung angepasst. Netze, die das überwachte Lernen simulieren, können für Klassifikationsaufgaben eingesetzt werden. Das Netz lernt, auf die Ausprägung einer Anzahl von Eingangsvariablen mit einer bestimmten Antwort zu reagieren. Hier wiederum spielen sogenannte Fehlerrückführungs-Netze (Backpropagation[BP]-Netze) eine herausragende Rolle, bei denen es sich um vorwärtsgekoppelte Netze mit mindestens einer Schicht verborgener Neuronen handelt [Hoffmann 1991, Schöneburg 1990]. Im einfachsten Fall handelt es sich also um ein dreischichtiges Netz mit einer Eingangsschicht, einer verborgenen und einer Ausgangsschicht von Neuronen. Das grundsätzliche Vorgehen ist bei Klassifikationsverfahren gleich: man trainiert einen Klassifikator mit einer Trainingsstichprobe und testet ihn mit Teststichproben. Ein Vorteil der NN liegt in der Unabhängigkeit von mathematischen Voraussetzungen hinsichtlich der Verteilung der vorliegenden Stichproben [Wei 1999]. Ein Nachteil der NN ist, daß der Klassifikator in Form einer Gewichtsmatrix vorliegt, die keine Aussagen hinsichtlich der Wertigkeit einzelner Merkmale zuläßt [Krongrad 1999]. Dieser Nachteil läßt sich umgehen, indem zum Trainieren des Netzes jeweils Stichproben mit unterschiedlichen Merkmalssätzen verwendet werden.

Ein derartiges Backpropagation-Netz wurde zur Analyse der Daten, die in Zusammenhang mit der vorliegenden Untersuchung erhoben wurden, eingesetzt [Hoffmann 1991, Schöneburg 1990]. Da es sich um erste Untersuchungen zur Bewertung der Möglichkeiten handelte, zur Klassifikation der Patienten ein neuronales Netz zu verwenden, wurden die Standardeinstellungen des Progammes verwendet.


33

Es hatte folgende Eigenschaften:

Dieses Netz wurde mit einem Trainingsdatensatz trainiert (80% der Daten), wobei das Training mit einem Validierungsdatensatz von 10% der Daten überwacht wurde. Anschließend wurde die Klassifikationsgüte des Netzes mit Hilfe eines Testdatensatzes (10% der Daten) überprüft. Der Basisdatensatz bestand aus 28 (bzw. 5) Variablen, die von 3650 Patienten erhoben wurden. Zur Validierung der Klassifikationsgüte wurden die Datensätze mit Hilfe eines Zufallsgenerators gemischt. Nachdem zehn Blöcke zu je 365 Patienten (10% des Umfangs der Gesamtstichprobe) gebildet wurden, wurde das Training des Netzes zehnmal jeweils ohne den i-ten Block (i=1,...,10) durchgeführt. Anschließend wurde das trainierte Netz mit den nicht in das Training einbezogenen Daten getestet. Auf diese Weise wurde jeder Patient einmal mit Hilfe eines Neuronalen Netzes klassifiziert. Das Gesamtergebnis der Klassifikation wird in Form von Kreuztabellen dargestellt.

2.4.4 Interne Validierung

Um die Güte der Diskrimination der an der Gruppengesamtheit ermittelten Regressionsgleichung zu überprüfen, wurde eine interne Validierung („cross-validation“) nach der pi-Methode durchgeführt (Wernecke 1995). Dazu wurde die Population nach dem Zufallsprinzip in 11 Untergruppen L1-11 mit 350 Patienten bzw. einmalig 153 Patienten aufgeteilt. Jeweils eine Unterguppe, die ungefähr 10% der Gesamtpopulation entsprach, wurde entfernt. An den übrigen 90% wurde mit den an der Gesamtpopulation ermittelten Variablen eine Regressionsgleichung erstellt. Diese Regressionsgleichung, bestehend aus den Regressionskoeffizienten der einzelnen Variablen und einer Konstante (vgl 2.4.2), wurde an der vorher entfernten Untergruppe L1 angewendet. Anschließend wurde in einer Vier-Felder-Tafel das Verhältnis von vorhergesagtem zu beobachtetem Eintreffen des Krankheitszustandes (prolongiertes SIRS, Sepsis und Tod) dargestellt. Dieses Vorgehen wurde für alle Untergruppen L2-11 wiederholt. Anschließend wurden die ermittelten 11 Vier-Felder-Tafeln addiert und die Parameter Sensitivität, Spezifität, positive und negative Nachtest-Wahrscheinlichkeit als Indikatoren der Diskriminationsfähigkeit der getesteten


34

Regressionsgleichungen für die Gesamtpopulation ermittelt. Die positive Nachtest-Wahrscheinlichkeit ist definiert als Verhältnis der Zahl richtig positiv vorhergesagter Probanden zur Summe aus richtig und falsch positiv vorhergesagten Probanden. Die negative Nachtest-Wahrscheinlichkeit ist dementsprechend definiert als Verhältnis der Zahl von richtig negativ vorhergesagten Probanden zur Summe aus richtig und falsch negativ vorhergesagten Probanden. Die Diskriminationsfähigkeit mittels der künstlichen neuronalen Netze wurde wie oben dargestellt nach einem vergleichbaren Verfahren intern validiert.

2.4.5 Erstellung von Receiver-Operator-Characteristic Kurven

Die Sensitivität und Spezifität des vorhergesagten Outcomes bei verschiedenen APACHE II- Punktwerten bzw. ROD (Risk of Death)-Werten sowie des vorhergesagten Vorliegens einer prolongierten systemischen Inflammation bzw. einer Sepsis mittels hier entwickelter Regressionsgleichung wurden graphisch als Receiver Operating Characteristic(ROC)-Kurven dargestellt. Die Erstellung einer solchen Kurve ist immer dann sinnvoll, wenn eine stetige Variable allein oder eine mittels statistischer Verfahren aus vielen Variablen errechnete Wahrscheinlichkeit auf die Fähigkeit hin untersucht werden soll, eine Vorhersage des jeweiligen Endpunktes zu treffen. Jeder Punkt einer solchen Kurve entspricht einer Vier-Felder-Tafel, in der die richtig und falsch vorhergesagten Patienten für willkürlich gesetzte Grenzwerte zu finden sind. Die mittels Trapez-Regel berechnete Fläche unter der ROC-Kurve (AUC = Area Under the Curve) ist ein Maß für die Diskriminationsfähigkeit des eingesetzten Verfahrens [Hanley 1982]. Eine rein zufällige Verteilung der Vorhersage-Variablen in beiden Gruppen (z.B. Patienten mit Sepsis / Patienten ohne Sepsis) ergäbe eine Diagonale in besagtem Diagramm und entspräche einer Fläche von 50 %. Somit wäre die Nullhypothese anzunehmen, d.h. es besteht kein Zusammenhang zwischen der unabhängigen und der Zielvariablen und eine Vorhersage mittels dieser Variablen ist nicht möglich. Eine Fläche von 100 % ließe die Aussage zu, daß durch dieses Verfahren eine richtige Vorhersage mit einer Irrtumswahrscheinlichkeit von 0 % gemacht werden kann.


© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.

DiML DTD Version 2.0
Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML - Version erstellt am:
Thu Dec 6 15:40:32 2001