[Seite 1↓]

1  Einleitung und Fragestellungen

Angesichts der Flut von Forschungsergebnissen, die jedes Jahr publiziert werden, ist es selbst in abgegrenzten medizinischen Fachgebieten für den Einzelnen kaum noch möglich, die Übersicht zu behalten. Für den Arzt, der bei der Behandlung seiner Patienten eigentlich die beste externe Evidenz in seine Entscheidungsfindung miteinbeziehen sollte, ist es unmöglich, über ein weites Krankheitsspektrum hinweg alle relevanten klinischen Studien zu lesen und kritisch zu interpretieren. In diesem Zusammenhang haben in den letzten Jahren systematische Übersichtsarbeiten große Bedeutung erlangt. Übersichtsarbeiten (im folgenden synonym mit der Bezeichnung Review gebraucht) werden dann als systematisch bezeichnet, wenn sie vordefinierte und transparente Methoden bzgl. Literatursuche, Studienselektion und Studienbewertung verwenden (73). Systematische Übersichtsarbeiten, bei denen die einbezogenen Studien (Primärstudien) in einer integrierenden statistischen Analyse wie eine einzige große Studie ausgewertet (gepoolt) werden, bezeichnet man als Meta-Analysen. Als narrativ werden demgegenüber traditionelle Übersichtsarbeiten bezeichnet, die nicht nach systematischen und explizit beschriebenen Methoden vorgehen.

Obwohl systematische Übersichtsarbeiten grundsätzlich in allen Bereichen der Forschung durchführbar sind, findet man sie besonders häufig zu randomisierten Interventionsstudien. Die Fragestellungen systematischer Reviews gleichen im Prinzip denjenigen der Primärstudien. Sie sollten explizit in Bezug auf die Indikation bzw. die Patienten, auf Intervention, Kontrollintervention und nach Möglichkeit auf die Zielparameter formuliert sein (z.B. „Senkt Flunarizin in der prophylaktischen Behandlung von Patienten mit Migräne die Anzahl der Migräneattacken in ähnlichem Ausmaß wie Propranolol?“). Allerdings ist eine genaue Definition der Zielparameter in der Fragestellung bei Erkrankungen, die nicht ohne weiteres in einer einzigen Größe zusammengefaßt werden können, häufig schwierig oder wenig sinnvoll, sodass die Fragestellung in der Realität diesbezüglich häufig offengehalten werden muss (z.B. „Ist Flunarizin bei der prophylaktischen Behandlung von Migränepatienten ähnlich wirksam wie Propranolol?“).

Aus einer konkreten Fragestellung ergibt sich das erste entscheidende methodische Element einer systematischen Übersichtsarbeit: die Ein- und Ausschlusskriterien. Diese sollten grundsätzlich Angaben zu Patienten bzw. Erkrankung (z.B. „Migräne mit und ohne Aura“), Prüfintervention (z.B. „Flunarizin“), Kontrollintervention (z.B. „Placebo oder Betablocker“), Design (z.B. „ausschließlich randomisierte, doppelblinde Studien“) und Zielparametern machen (z.B. „mindestens einer der folgenden Zielparameter wurde gemessen: Attackenfrequenz, Kopfschmerztage, Anzahl Responder“). Darüberhinaus kann es sinnvoll sein, weitere Ein- und Ausschlußkriterien zu formulieren (z.B. „ausgeschlossen werden Studien mit einer Beobachtungsdauer von weniger als 8 Wochen“).


[Seite 2↓]

Die Literatursuche muß im nächsten Schritt gewährleisten, dass alle relevanten Studien, die möglicherweise die Einschlusskriterien erfüllen (= Primärstudien) auch tatsächlich identifiziert werden. Grundsätzlich herrscht in der Fachdiskussion Konsens, dass die Literatursuche so umfassend wie möglich erfolgen sollte (271), d.h. dass neben gängigen Datenbanken wie Medline oder Embase auch andere Quellen herangezogen und dass grundsätzlich Studien in allen Sprachen berücksichtigt werden sollten (das Letztere gehört eigentlich zu den Selektionskriterien, ist praktisch aber vor allem für Literatursuche und Extraktion relevant). Umfassende Suchen sind jedoch aufwändig und es ist nicht klar, ob der zusätzliche Aufwand tatsächlich die erwünschte Mehrinformation bzw. bessere Information bringt (332). So wurde gezeigt, dass nicht über Medline identifizierbare Studien und insbesondere unpublizierte Studien häufig schlechte Qualität haben (99;101;282). Ohne eine umfassende Suche bleibt im Einzelfall jedoch eine erhebliche Unsicherheit, ob die gefundenen Studien tatsächlich repräsentativ sind. Eine umfassende Literatursuche kann allerdings nicht alle Probleme – v.a. den sogenannten „publication bias“, d.h. die Nichtpublikation unerwünschter Ergebnisse – mit Sicherheit ausschliessen. Sie erlaubt jedoch „Sensitivitätsanalysen“, d.h. Analysen, in denen empirisch untersucht werden kann, ob z.B. die Ergebnisse in Zeitschriften publizierter Arbeiten positiver sind, als die von an anderer Stelle oder nicht publizierten.

Ein häufig wenig beachteter und in Veröffentlichungen von systematischen Übersichtsarbeiten wenig beschriebener Schritt ist die Umsetzung der Studienselektion. Hier sollte für den Leser gut nachvollziehbar sein, wie aus den zunächst durch die Literatursuche identifizierten Arbeiten die letztlich eingeschlossenen ausgewählt wurden. Eine Liste der Studien, die den Einschluss „knapp verfehlt“ haben, mit Ausschlussgründen ist hier unabdingbar. Unterschiede in den Ergebnissen systematischer Übersichtsarbeiten ergeben sich nämlich häufig aus einer Mixtur subtiler Unterschiede in den Einschlusskriterien und Literatursuchen (202) (siehe Kapitel 4).

Die Extraktion von Information aus den Primärstudien und deren Bewertung sollte nach Möglichkeit von mindestens zwei Beurteilern (Reviewer) durchgeführt werden (102). Für die Informationsextraktion bieten sich Formulare oder vordefinierte Tabellenmatrices an, in die die jeweils relevanten Informationen standardisiert eingefügt werden. Die Beurteilung der Qualität der Studien sollte nach vordefinierten, anerkannten Kriterien erfolgen. Dieser relevante, aber problematische Schritt wird in der vorliegenden Monographie in Kapitel 3 detailliert diskutiert.

Schließlich mündet der Reviewprozeß in den letzlich entscheidenden Schritt: Die Zusammenfassung der Ergebnisse. Sind die Primärstudien vergleichbar und präsentieren diese ihre Ergebnisse ausreichend detailliert, ist die Berechnung von Effektgrößen – d.h. von Maßen, die für die einzelne Studie die Größe des Unterschiedes zwischen den verglichenen Gruppen quantifizieren – eindeutig die Methode der Wahl (102;364). Hier ist nochmals darauf hinzuweisen, dass auch bei dieser Stufe noch nicht von einer Meta-Analyse zu sprechen ist. Erst wenn die [Seite 3↓]Effektgrößen der einzelnen Studien „gepoolt“ werden, d.h. integrierend statistisch wie Daten aus einer einzigen großen Studie ausgewertet werden, handelt es sich um eine Meta-Analyse. Der Großteil der Kritik an systematischen Übersichtsarbeiten (siehe z.B. (130;132)) bezieht sich auf diesen letzten Schritt, dessen Durchführung sorgfältig zu erwägen ist und dessen Ergebnisse meist nur mit großer Vorsicht zu interpretieren sind. In vielen Fällen scheitert jedoch bereits die Berechnung von Effektgrößen für die einzelnen Studien an der enormen Heterogenität oder der insuffizienten Berichterstattung der Primärstudien. In diesen Fällen ist dann lediglich eine deskriptive Zusammenfassung der Primärstudienergebnisse möglich. Häufig wird auch eine Kategorisierung der Ergebnisse (z.B. in „positiv“ und „negativ“, ein sogenannter „vote count“) durchgeführt, der jedoch äusserst unpräzise und irreführend sein kann. Dem Leser sollte klar sein, dass das Zählen „positiver“ und „negativer“ Ergebnisse letzlich nichts anderes als eine primitive Form der Meta-Analyse darstellt, auch wenn derartige systematische Übersichtsarbeiten gelegentlich als „qualitativ“ bezeichnet werden. Gute Reviews heterogener Studien enthalten daher meist ausführliche Tabellen, bei denen es dem kritischen Leser nicht erspart bleibt, die deskriptiv zusammengefassten Primärstudienergebnisse durchzusehen.

Angesichts der hier angedeuteten Probleme ist es wenig überraschend, dass systematische Übersichtsarbeiten trotz ihrer großen Bedeutung häufig Gegenstand von kontroversen Debatten sind (130;132). Darüberhinaus kann die methodische Entwicklung der vergleichsweise jungen Technik keineswegs als abgeschlossenen bezeichnet werden (100). Zu den einzelnen Schritten der Reviewmethodik werden in den letzten Jahren zunehmend empirische Untersuchungen durchgeführt, um die Auswirkungen einzelner Vorgehensweisen bzw. Einflüsse verschiedener Störfaktoren zu untersuchen. Eine spezielle Datenbank, in der diese Untersuchungen registriert werden, ist bereits verfügbar (Cochrane Methodology Register in der Cochrane Library, Oxford: Update Software).

Die vorliegende Monographie präsentiert 1. zwei größere eigene systematische Übersichtsarbeiten, 2. empirisch-methodische Untersuchungen zum Thema Studienqualität und deren Auswirkung auf das Ergebnis und 3. eine Analyse der vorliegenden systematischen Übersichtsarbeiten in den Bereichen Akupunktur, Phytotherapie und Homöopathie. Sie versteht sich als Beitrag zur methodischen Diskussion und Entwicklung von systematischen Übersichtsarbeiten.


[Seite 4↓]

Folgende Fragestellungen werden bearbeitet:

  1. Sind Propranolol, Metoprolol und Flunarizin bei der Migräneprophylaxe (Vorbeugung von Migräneattacken) wirksamer als Placebo und ähnlich wirksam oder wirksamer als andere Medikamente? (Kapitel 2)
  2. Sind Johanniskrautextrakte (Hypericum perforatum L.) bei der Behandlung von Depressionen wirksamer als Placebo und ähnlich wirksam wie synthetische Antidepressiva sowie ggfs. nebenwirkungsärmer? (Kapitel 2)
  3. Wie ist die methodische Qualität randomisierter Studien zu den Verfahren Akupunktur, Phytotherapie und Homöopathie? (Kapitel 3)
  4. Wie wirken sich Unterschiede in der Qualität von Studien auf die Ergebnisse aus? (Kapitel 3)
  5. Welche systematischen Übersichtsarbeiten liegen in den Bereichen Akupunktur, Phytotherapie und Homöopathie vor? (Kapitel 4)
  6. Kommen unterschiedliche systematische Übersichtsarbeiten zu gleichen Fragestellungen zu denselben Ergebnissen? (Kapitel 4)

Anmerkung: Kapitel 2 präsentiert zahlreiche Abbildungen zur Zusammenfassung von Studienergebnissen, die Bezeichnungen in englischer Sprache enthalten. Diese Abbildungen wurden mit der Cochrane Collaboration Review Manager Software, Version 4.1. erstellt und sind nicht editierbar, sodass die Bezeichnungen nicht ins Deutsche übersetzt werden konnten.


© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 3.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
04.08.2004