[Seite 73↓]

4  Analyse der vorliegenden systematischen Übersichtsarbeiten zu
Akupunktur, Phytotherapie und Homöopathie

4.1 Hintergrund

Mit der zunehmenden Zahl systematischer Übersichtsarbeiten entsteht die Möglichkeit, eine weitere Metaebene einzuführen: Analysen von systematischen Übersichtsarbeiten bzw. Meta-Meta-Analysen (291). Diese können verschiedenen Zielen dienen:

  1. Sie können einen groben Überblick über die Evidenzlage in größeren Themenbereichen geben. Aufgrund der erheblichen Entfernung vom Originalforschungs­gegenstand besteht hier aber eine sehr große Gefahr der Übervereinfachung.
  2. Sie erleichtern Ärzten, Patienten und Entscheidungsträgern den Zugang und die Orientierung zu systematischen Übersichtsarbeiten in Bereichen, über die sie sich mit geringem Zeitaufwand informieren wollen.
  3. Sie erlauben die Beschreibung von Vorgehensweisen, Merkmalen und Qualität im Sinne einer „Epidemiologie“ von systematischen Übersichtsarbeiten. Dadurch lassen sich insbesondere Schwachstellen identifizieren, die in zukünftigen Reviews vermieden werden sollten.
  4. Wenn mehrere systematische Übersichtsarbeiten zu einer Fragestellung vorliegen, ist es möglich zu überprüfen, ob diese sich im Hinblick auf Methoden und Ergebnisse unterscheiden. Ist dies der Fall, können die Gründe für Diskrepanzen untersucht werden.

Die komplementärmedizinischen Verfahren Akupunktur, Phytotherapie und Homöopathie sind aufgrund ihrer großen Verbreitung bei gleichzeitiger Umstrittenheit Bereiche, zu denen sich eine große Zahl von Personen eine Meinung bilden möchte, ohne sich im Detail in die Literatur einarbeiten zu wollen. Im Rahmen des Complementary Medicine Field der Cochrane Collaboration - einem weltweiten Netzwerk von Patienten, Ärzten und Wissenschaftlern mit dem Ziel systematische Reviews in allen Bereichen der Medizin zu erstellen, zu aktualisieren und zugänglich zu machen (2) – wurde unter Federführung des Autors eine Sammlung und Analyse der verfügbaren systematischen Übersichtsarbeiten mit den obengenannten Zielen (mit besonderer Betonung der bei Ziel 1 genannten Einschränkung) durchgeführt. Die Ergebnisse werden in drei Abschnitte unterteilt:

  1. Die Zusammenstellung und -fassung der vorliegenden systematischen Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie (dieser Teil der Arbeit ist bereits publiziert (279;288;289));
  2. Die Beschreibung von inhaltlichen und methodischen Merkmalen sowie der Qualität;
  3. Die primär qualitative, vergleichende Analyse der Übersichtsarbeiten zu gleichen Fragestellungen.


[Seite 74↓]

4.2  Methodik

4.2.1 Ein- und Ausschlusskriterien

Um eingeschlossen zu werden, musste eine Übersichtsarbeit folgende Kriterien erfüllen:

  1. In der Arbeit mussten prospektive (nicht notwendigerweise kontrollierte) klinische Studien zu Akupunktur (als Akupunktur bezeichnete Techniken mit Nadelinsertion sowie verwandte Techniken mit Stimulation explizit so bezeichneter „Akupunkturpunkte“ ohne Nadelinsertion wie z.B. Akupressur oder Laserakupunktur), Phytotherapie (Applikation von Extrakten oder anderen Zubereitungen von Pflanzen; isolierte oder synthetisch hergestellte, in Extrakten vorkommende Einzelsubstanzen wurden nicht berücksichtigt) oder Homöopathie (Applikation homöopathischer Arzneimittel) am Menschen referiert werden.
  2. Mindestens eines der folgenden methodischen Kriterien musste erfüllt sein:
    a) explizite Beschreibung der Literatursuchmethoden und explizite Beschreibung von Ein- und Ausschlusskriterien;
    b) explizite Beschreibung einer formalen Methode zur Beurteilung der Qualität der Primärstudien (z.B. mithilfe eines Scores);
    c) Durchführung einer quantitativen Meta-Analyse mit expliziter Beschreibung der statistischen Methoden.
  3. Verfügbarkeit als Publikation oder schriftlicher Bericht in Zeitschriften, Büchern, Dissertationen oder im Internet. Vor 1989 publizierte Reviews und solche, die lediglich als Abstract verfügbar waren, wurden nicht berücksichtigt.
  4. Der Schwerpunkt der bearbeiteten Fragestellung des Reviews bezog sich auf die Wirksamkeit der Intervention (nicht Schwerpunkt auf Diagnose, Nebenwirkungen, Risikofaktoren etc.).

Eingrenzungen bzgl. der Publikationssprache gab es keine. Krankheitsbezogene systematische Übersichtsarbeiten zu mehreren Interventionen (z.B. zu allen Therapien bei Postzosterneuralgie) wurden nur eingeschlossen, wenn mindestens vier Primärstudien zu einer der drei komplementären Therapien bearbeitet worden waren (Begründung: Nur wenn eine gewisse Anzahl an Primärstudien zu einer bestimmten Therapieform eingeschlossen wird, ist wahrscheinlich, dass diese in Abstracts oder Schlüsselworten überhaupt genannt wird und die Übersichtsarbeit so mit Hilfe gängiger Datenbankensuchen zu identifizieren ist).


[Seite 75↓]

4.2.2  Literatursuche

Primäre Quelle zur Identifikation potentiell relevanter Reviews war die Datenbank des Cochrane Complementary Medicine Field. Dieses ursprünglich aus der komplementärmedizinischen Datenbank CISCOM (Research Council of Complementary Medicine, London) hervorgegangene Register (verfügbar unter www.compmed.umm.edu) enthält neben Referenzen zu kontrollierten klinischen Studien zu unkonventionellen medizinischen Verfahren Referenzen zu systematischen Übersichtsarbeiten bzw. zu Referenzen, die möglicherweise systematische Übersichtsarbeiten sein könnten. Diese wurden aus einer Vielzahl von Datenbanken (z.B. Medline, Embase, AMED, Current Contents, Datenbank des Zentrums für naturheilkundliche Forschung München) mit systematischen Methoden gesammelt. Zusätzlich wurden in Medline (Silver Platter 1989 bis Juli 2000 mithilfe einer Standardsuchstrategie für systematische Übersichtsarbeiten (149) kombiniert mit Suchbegriffen für die Therapie: acupuncture or acupressure; medicinal plant exploded sowie Namen 50 medizinisch häufig verwendeter Pflanzen; homeopath* oder homoeopath*) und in der Cochrane Library (zuletzt Ausgabe 2000, 3) Suchen durchgeführt. Außerdem wurden die Literaturlisten eingeschlossener Arbeiten und von mehreren Lehrbüchern zum Thema nach potentiell relevanten Referenzen gescreent.

4.2.3 Selektionsprozess

Alle in der Datenbank des Cochrane Complementary Medicine Field gefundenen, potentiell relevanten Referenzen wurden in einem ersten Schritt von 2 Reviewern, die beide umfangreiche Erfahrung in der Durchführung von systematischen Reviews und bzgl. komplementärmedizinischer Datenbanken hatten, unabhängig durchgesehen. Dabei wurden diejenigen aussortiert, bei denen sich beide Reviewer sicher waren (meist aufgrund der Kenntnis des jeweiligen Artikels), dass dies Arbeiten waren, die die Einschlusskriterien mit Sicherheit nicht erfüllten. Die Abstracts der in Medline und der Cochrane Library gefundenen Zitate wurden durch einen Reviewer durchgesehen. Kopien aller potentiell relevanten Arbeiten wurden besorgt und von einem oder zwei bis drei Reviewern mit Hilfe einer Checkliste auf die Erfüllung der Einschlusskriterien geprüft. Aufgrund begrenzter Ressourcen war es nicht möglich, alle potenziell relevanten Arbeiten von zwei oder mehr Reviewern prüfen bzw. extrahieren zu lassen. Insgesamt 115 Übersichtsarbeiten erfüllten die Einschlusskriterien.


[Seite 76↓]

4.2.4  Extraktion und Beurteilung

Ein (für 46% aller eingeschlossenen Übersichtsarbeiten) oder zwei bzw. drei (54%) Reviewer extrahierten mithilfe eines in einem Vorlauf getesteten Formulars bibliographische Angaben, Informationen zu Fragestellung, Interventionen, Indikationen, Einschlusskriterien, Suchmethoden, Extraktion und Qualitätsbeurteilung der Primärstudien, Anzahl und Art der einbezogenen Primärstudien sowie zu Zahl der in diesen untersuchten Patienten, zu Methoden der Ergebniszusammenfassung, Schlussfolgerungen und Angaben zum Sponsoring des Reviews. Die Daten wurden in eine SPSS-Datei eingegeben und deskriptiv statistisch ausgewertet.

Für die tabellarische Zusammenfassung der Reviews wurden Ergebnisse und Schlussfolgerungen soweit möglich in den Worten der jeweiligen Autoren herangezogen. Zur Orientierung wurden folgende methodische Merkmale kategorisiert: Ob eine ausreichende Literatursuche erfolgte (wenn auch in anderen Quellen als in Medline bzw. einer Datenbank gesucht wurde), ob die Einschluss­kriterien ausreichend beschrieben worden waren, ob die Qualität der Primärstudien mit expliziten Methoden beurteilt, für jede Primärstudie eine Zusammenfassung des Ergebnisses (über einen vote count hinaus) präsentiert und ob eine quantitative Meta-Analyse durchgeführt worden war.

Darüber hinaus wurde die Qualität der eingeschlossenen Reviews mithilfe der Skala von Oxman et al. (355;356) beurteilt. Diese umfasst folgende 10 Fragen:

  1. Sind die Literatursuchmethoden beschrieben?
  2. War die Literatursuche umfassend?
  3. Wurden die Einschlusskriterien für die Primärstudien beschrieben?
  4. Wurden Verzerrungen bei der Studienselektion vermieden?
  5. Wurden Kriterien zur Beurteilung der Qualität der Primärstudien beschrieben?
  6. Wurde die Qualität der Primärstudien angemessen beurteilt?
  7. Wurden die meta-analytischen Methoden beschrieben?
  8. Waren die meta-analytischen Methoden angemessen?
  9. Sind die Schlussfolgerungen aufgrund der präsentierten Ergebnisse nachvollziehbar?
  10. Wie ist die Gesamtqualität der Übersichtsarbeit?

Die Fragen 1 bis 9 werden mit ja (1 Punkt), teilweise (0,5 Punkte) oder nein (0 Punkte) beantwortet, bei Frage 10 ist eine Skala von 1 (schwerwiegende Schwächen) bis 7 (keine Schwächen) vorgegeben.


[Seite 77↓]

4.2.5  Vergleich der Übersichtsarbeiten zu gleichen Fragestellungen

Ziel dieses Vergleichs war zu untersuchen (1) wie häufig systematische Übersichtsarbeiten zu gleichen Fragestellungen Unterschiede bzgl. Methoden, Ergebnissen und Schlussfolgerungen aufweisen und (2) was die Gründe für etwaige Nichtübereinstimmungen sind. Dabei wurden die Einschlusskriterien etwas enger gefasst, um zu gewährleisten, dass nur systematische Reviews mit einer ausreichenden Qualität berücksichtigt wurden. Jedes der folgenden Kriterien musste erfüllt sein: 1. Die Literatursuche war beschrieben. 2. Basale Einschlusskriterien waren definiert. 3. Es war eine formale Beurteilung der methodischen Qualität der Primärstudien mithilfe eines Scoresystems oder über Einzelmerkmale erfolgt oder es waren methodische Merkmale der Primärstudien transparent beschrieben. 4. Wenn Effektstärkeberechnungen durchgeführt worden waren, mußten die entsprechenden Methoden beschrieben sein. Wenn keine Effektstärkeberech­nungen erfolgt waren, mußte die jeweilige Methode der Ergebniszusammenfassung beschrieben sein oder es mußte für jede Studie eine deskriptive Zusammenfassung der Hauptergebnisse präsentiert sein. Die Überprüfung der Einschlusskriterien erfolgte durch den Autor.

Die Fragestellung wurde als gleich angesehen, wenn 1. die Interventionen gleich waren (z.B. Hypericumextrakte), 2. die bearbeitete Indikation identisch war (z.B. Depression), 3. die Kontroll­interventionen identisch waren (z.B. Placebo und andere Medikamente) und 4. gleiche oder ähnliche Zielkriterien (z.B. Depressionsscores) verwendet wurden. Außerdem durfte die Differenz der Publikationsjahre maximal 3 betragen (z.B. 1997-2000). Wenn ein Review zwei oder mehr Indikationen (z.B. Migräne und Spannungskopfschmerzen) bearbeitete, wurde er nur berück­sichtigt, wenn die einzelnen Indikationen im Review klar trennbar waren (d.h. wenn erkennbar war, welche Ergebnisse auf Migräne und welche auf Spannungskopfschmerzen bezogen waren).

Der Selektionsprozess erfolgte in zwei Stufen. In einem ersten Schritt wurden alle gefundenen Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie, die den in 4.2.1. genannten Einschlusskriterien entsprachen, geprüft und grob nach Fragestellungen klassifiziert. Alle Übersichtsarbeiten, die ähnliche Fragestellungen bearbeiteten, wurden detailliert vergleichend ausgewertet (siehe unten). Im zweiten Schritt wurde aus den hier bearbeiteten Reviews diejenigen selektiert, die den enger gefassten Einschlusskriterien für ausreichend hochwertige systematische Reviews entsprachen, von unabhängigen Reviewergruppen erarbeitet worden waren und die entsprechend den oben genannten Bedingungen gleiche Fragen bearbeiteten.

Aus allen Reviews zu ähnlichen Fragestellungen wurden Informationen zu folgenden Punkten in eine Tabellenmatrix übertragen: Details zu Literatursuche (welche Datenbanken, andere Suchmethoden), zu Einschlusskriterien (bzgl. Patienten, Test- und Kontrollinterventionen, Zielkriterien, Studiendesign, Sprachen, sonstige), zum Selektionsprozess (ob beschrieben oder [Seite 78↓]nicht, Anzahl der Studien auf den einzelnen Selektionsniveaus), zur Datenextraktion, zu den benutzten Qualitätsbeurteilungs- und Ergebniszusammenfassungsmethoden, die Anzahl der eingeschlossenen Primärstudien (unter Berücksichtigung des Publikationsjahres), Ergebnisse, Statements zur methodischen Qualität der Primärstudien und zu Schlussfolgerungen. Für jede Fragestellung wurde eine Liste aller Primärstudien erstellt, die in mindestens einem Review eingeschlossen waren, um den Einfluss des Alters des Reviews auf die Ergebnisse und Schlussfolgerungen beurteilen zu können. Hauptzielkriterium war die Zahl der jeweils eingeschlossenen Primärstudien bzw. der Grad der Übereinstimmung unter Berücksichtigung des Publikationsjahres. Unterschiede von mehr als 25% wurden als relevant klassifiziert.

4.3 Ergebnisse

4.3.1 Zusammenstellung der systematischen Übersichtsarbeiten zur Akupunktur

Von 48 potentiell relevanten Übersichtsarbeiten zur Akupunktur, die durch den Screeningprozess vorselektiert waren, erfüllten 39 (publiziert in 45 Veröffentlichungen bzw. Berichten) die Einschlusskriterien (siehe Tabellen 17 bis 21). Dabei wurden aktualisierte Versionen eines Reviews von der gleichen Autorengruppe als ein Review gezählt. 5 Reviews wurden ausgeschlossen, da sie nicht als systematisch klassifiziert wurden (Nichterfüllung von Einschlusskriterium 2) (33;51;84;105;387) und weitere 4, weil nicht die Beurteilung der Wirksamkeits sondern methodische Aspekte im Mittelpunkt standen (19;161;473;475).

Ein relevantes Problem in der Akupunkturforschung ist die Frage, inwieweit die Nadelung bzw. Stimulation definierter Punkte spezifische Effekte hat. In den vorliegenden Primärstudien wurde eine große Zahl unterschiedlicher „Placebo“-Techniken angewendet. Gemeinsam ist vielen, dass sie nicht als physiologisch inert angesehen werden können (19). Die Bezeichnung Placeboakupunktur für derartige Techniken ist daher problematisch und wird im folgenden vermieden. Stattdessen wird die Bezeichnung Sham oder Scheinakupunktur benutzt.

Wie zu erwarten, beschäftigte sich eine relevante Anzahl von Reviews mit dem Thema Schmerz (siehe Tabellen 17 und 18). 3 Reviews (publiziert 1989 (361;457), 1990 (455) und 2000 (131)) bearbeiteten chronischen Schmerz allgemein. Die Studiensammlungen – insgesamt wurden 72 Primärstudien in den drei Übersichtsarbeiten eingeschlossen – und die Reviewmethoden unterschieden sich erheblich, die vorhandene Evidenz wurde aber in allen Fällen als „inconclusive“, also nicht für klare Schlussfolgerungen ausreichend, beurteilt. Rücken- bzw. Nackenschmerzen waren das Thema von insgesamt 6 Reviews (127;293;415;449;465;466;502). Die Gesamtzahl der bearbeiteten Primärstudien war jeweils 11 für Rücken- und Nackenschmerz. Die Schlussfolgerungen bzgl. Rückenschmerzen waren deutlich unterschiedlich (siehe Tabelle 17), [Seite 79↓]während bzgl. Nackenschmerzen die Evidenz wiederum als „inconclusive“ beurteilt wurde. 6 Übersichten zu insgesamt 25 Primärstudien behandelten Kopfschmerzen (siehe Tabelle 18). Der umfangreichste Review zog eingeschränkt positive Schlussfolgerungen (321), während in den übrigen, kleineren Übersichten die Evidenz abermals als „inconclusive“ gewertet wurde (151;312;450;451;470). Die Ergebnisse der vorliegenden Studien zu akuten Zahnschmerzen und zur temporomandibulären Dysfunktion wurden in zwei weiteren Reviews als vielversprechend beurteilt (120;128).

Tabelle 17: Systematische Übersichtsarbeiten zu klinischen Studien zur Akupunktur bei Schmerzzuständen – Teil I

Autor & Jahr

Indikation

Kontrolle

Studien

Method

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Chronische Schmerzen

    

Ezzo 2000 (131)

Chronische Schmerzen

Sham, Placebo, keine Beh., Standard

51 RCT

j-j-j-j-n

Positive Ergebnisse in 21 Studien, negative in 3, neutrale in 27. Bessere Studien öfter negativ oder neutral

Hinweise, dass Akup. einer Nichtbehandlung überlegen ist, Evidenz unklar im Vergleich zu Sham, Placebo und Standard

ter Riet 90/89 (455;457)

Chronische Schmerzen

Sham, keine Behandlung, Standard

51 CCT

j-j-j-j-n

Studien klein und von meist schlechter Qualität. 24 mit positi­ven, 27 mit negativen Ergebnis­sen. Bessere Studien öfter neg.

Keine überzeugenden Belege für die Wirksamkeit der Akupunktur bei chronischen Schmerzen

Patel 89 (361)

Chronische Schmerzen

Sham, keine Behandlung, Standard

14 RCT

n-j-n-j-j

Wahrscheinlichkeit einer Besserung unter Akupunktur im Mittel um 18% (p<0.01) größer

Die vorhandene Evidenz ist positiv, aufgrund von methodischen Schwächen aber nicht überzeugend

Rücken- und Nackenschmerzen

    

Smith 2000 (415)

Rücken- & Nacken-schmerzen

Sham, keine Behandlung, Standard

13 RCT

j-j-j-j-n

5 Studien positiv, 8 negativ; bessere Studien öfter negativ

Keine überzeugenden Belege für die Wirksamkeit der Akupunktur bei Rücken- und Nackenschmerzen

White 99 (502)

Nacken-schmerzen

Sham, keine Behandlung, Standard

14 RCT

j-j-j-j-n

7 Studien positiv, 7 negativ. Von den 8 besseren Studien 5 negativ, 3 positiv

Keine überzeugenden Belege für die Wirksamkeit der Akupunktur bei Rückenschmerzen

van Tulder 99 (465;466)

LWS-Schmerzen

Sham, keine Behandlung, Standard

11 RCT

j-j-j-j-n

Studienautoren interpretieren 8 Studien als positiv, die Review­autoren 2. Methodische Qualität der Studien überwiegend schlecht

Autoren können keine Empfehlung aussprechen, Akupunktur einzusetzen. Gute, große Studien notwendig

Ernst 98 (127)

Rücken-schmerzen

Sham, keine Behandlung, Standard

12 RCT

j-j-j-j-j

OR einer Besserung im Vgl. zu allen Kontrollen 2,30 (95%KI 1,28-4,13), mit Sham 1,37 (0,84-2,25). Mehrheit der Studien von guter Qualität

Akupunktur besser als verschiedene Vergleichsinter­ventionen, aber keine überzeugenden Belege im Vergleich zu Placebo

Longworth 97 (293)

Rücken-schmerzen (mit Aus-strahlung)

unklar

1 RCT, 6 CCT, 31 unkontroll.

t-t-n-j-n

Studien meist von schlechter Qualität; Mehrheit der Patienten scheint zu profitieren

“There may be a role for acupuncture treatment of lumbar disk protrusions and sciatica”

ter Riet 89 (449)

Rücken- & Nacken-schmerzen

unklar

16 RCT, 6 CCT

j-t-j-n-n

Studien meist von schlechter Qualität. Nur Ergebnisse einzelner besserer Studien beschrieben

Aufgrund der geringen Qualität der Studien sichere Schlussfolgerungen nicht möglich

Method.: 1 = ausreichende Literatursuche, 2 = explizite Einschlusskriterien, 3 = formale Qualitätsbeurteilung, 4 = Ergebnis aller Einzelstudien zusammengefasst, 5 = Meta-Analyse durchgeführt; j = ja, t = teilweise, n = nein, x = nicht anwendbar, ? = unklar
RCT = randomized controlled trials = randomisierte Studien, CCT = controlled clinical trials = kontrollierte Studien (randomisiert und/oder nichtrandomisiert), KS = Kohortenstudien, UKS = unkontrollierte Studien; OR = Odds ratio, RR = Relatives Risiko, 95%KI = 95%-Konfidenzintervall
*Indikationsorientierter Review zu verschiedenen Interventionen; ** Indikationsorientierter Review zu verschiedenen komplementären Interventionen


[Seite 80↓]

Tabelle 18: Systematische Übersichtsarbeiten zu klinischen Studien zur Akupunktur bei Schmerzzuständen – Teil 2

Autor & Jahr

Indikation

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Kopfschmerzen

     

McCrory 2000* (312)

Span-nungskopf-schmerz

Sham, Physio-

therapie

6 RCT

j-j-j-j-n

3 von 4 Studien vs. Sham positiv (beste negativ), Physiotherapie besser in 1 von 2 Studien

Evidenz nicht ausreichend um Schlussfolgerungen zu ziehen. Weitere Studien notwendig

Melchart 99 (321)

chronische Kopf-schmerzen

Sham, keine Behandlung, Standard

22 RCT

j-j-j-j-j

Mehrheit der 14 Studien vs. Sham zumindest mit Trend zugunsten der Akupunktur. Studien vs. andere Interventionen widersprüchlich

Vorliegende Evidenz positiv, aber nicht ausreichend

Goslin 99 (151)

Migräne

Sham, keine Behandlung, Standard

6 RCT

j-j-j-j-n

2 von 3 Studien vs. Sham positiv, ähnliche Effekte wie medikamentöse Prophylaxe in 2 Studien

Evidenz reicht nicht aus, um Schlussfolgerungen zu ziehen

Vernon 99** (470)

Kopfschm. Typ Span-nung & zervikogen

Sham, keine Behandlung, Standard

8 RCT

j-j-j-j-n

2 von 4 Studien vs. Sham positiv, Ergebnisse vs. Physiotherapie widersprüchlich

Evidenz reicht nicht aus, um Schlussfolgerungen zu ziehen

ter Riet 89 (450)

Migräne & Span-nungskopf-schmerz

Sham, andere Behandlung

7 RCT, 1 CCT

j-t-j-n-n

Studien aufgrund von geringer Fallzahl und methodischen Schwächen nicht interpretierbar

Evidenz reicht nicht aus, um Schlussfolgerungen zu ziehen

ter Riet 89 (451)

Gesichts-schmerz

Sham

2 RCT

j-t-j-j-n

Studien von geringer Qualität

Evidenz reicht nicht aus, um Schlussfolgerungen zu ziehen

Verschiedene Schmerzzustände

    

Ernst 98 (120)

akute Zahn-schmerzen

Sham, keine Behandlung, Standard

11 RCT, 5 CCT

j-t-j-j-n

Mehrheit der Studien mit positiven Ergebnissen

Akupunktur scheint effektiv zu sein; weitere Studien jedoch notwendig

Ernst 99 (128)

temporo-mandibul. Dysfunktion

andere und keine Behandlung

3 RCT

j-j-j-j-n

3 Vergleiche mit Standard und 2 mit Nichtbehandlungen positiv

Akupunktur scheint effektiv zu sein; weitere Studien jedoch notwendig

Abkürzungen siehe Tabelle 17

Insgesamt 5 systematische Übersichtsarbeiten liegen zur Behandlung rheumatischer Erkrankungen vor (siehe Tabelle 19). Die vorliegende, limitierte Evidenz deutet darauf hin, dass Akupunktur bei Fibromyalgie wirksam sein könnte (39). Bei der Behandlung von Osteoarthrosen ergaben sich sowohl unter Verum- als auch unter Sham-Akupunktur Verbesserungen hinsichtlich Schmerz und Funktion, jedoch keine Unterschiede zwischen Verum und Sham (107). Bzgl. weiterer rheumatischer Erkrankungen ist die vorliegende Evidenz nicht ausreichend, um zuverlässige Schlussfolgerungen ziehen zu können (200;265;453).

Bei der Unterstützung der Raucherentwöhnung ist Akupunktur nicht wirksamer als eine Sham-Akupunktur. Diese Schlussfolgerung findet sich konsistent in allen vorliegenden systematischen Reviews zum Thema (266;454;456;503-505), bei denen insgesamt 22 Primärstudien einbezogen worden waren (siehe Tabelle 19). Allerdings zeigten sich auch keine Unterschiede zu belegterweise wirksamen Vergleichsinterventionen (z.B. Nikotinpflaster). Der einzige systematische Review zur unterstützenden Entzugsbehandlung bei Alkohol- und [Seite 81↓]Heroinabhängigkeit datiert aus dem Jahre 1990 (456); zu dieser Zeit reichte die vorliegende Evidenz nicht für klare Schlussfolgerungen aus. Aktuellere Übersichten zum Thema (z.B. (51)) sind lediglich als narrative Reviews einzustufen.

Die Forschung zur Behandlung von Übelkeit und Erbrechen nach Operationen (siehe Tabelle 20), in der Frühschwangerschaft oder unter Chemotherapie fällt deutlich aus dem Rahmen der übrigen Akupunkturforschung heraus. Zum einen erfolgt die Behandlung fast ausschliesslich an einem einzigen Punkt (Pe 6), zum anderen erfolgt die Stimulation des Punktes in der Mehrzahl der Studien nicht durch Nadelstiche, sondern mithilfe eines Akupressurbandes. Beim postoperativen Erbrechen sprechen die in den Reviews eingeschlossenen insgesamt 24 Studien eindeutig für eine punktspezifische Wirksamkeit (7;214;270;474). Bei Übelkeit in der Frühschwangerschaft ist die Mehrzahl der Studien (insgesamt 8 in den Reviews) ebenfalls positiv, die methodisch beste Studie zeigt jedoch keinen Effekt im Vergleich zur Shambehandlung (7;214;474). Auch bzgl. der Vorbeugung bzw. der Behandlung des chemotherapiein­duzierten Erbrechens liegen vielversprechende Ergebnisse vor, jedoch sind die Studien vor der Einführung hochpotenter Antiemetika durchgeführt worden und heute nur noch von begrenzter Relevanz (474).

Die vorliegenden Studien zum Asthma (insgesamt 15 in den vorliegenden Reviews (246;280;290;452)) haben allesamt äußerst geringe Stichprobenumfänge und widersprüchliche Ergebnisse. Insgesamt sprechen die Studien allenfalls für eine sehr begrenzte Effektivität der geprüften Therapiestrategien.


[Seite 82↓]

Tabelle 19: Systematische Übersichtsarbeiten zu klinischen Studien zur Akupunktur bei rheumatischen Erkrankungen und Sucht

Autor & Jahr

Indikation

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Rheumatische Erkrankungen

    

Berman 99 (39)

Fibromyalgie

Sham, Standard

3 RCT, 3 KS

j-j-j-j-n

Akupunktur besser als Sham bei Global- und Symptombeurteilung

Vorhandene Evidenz positiv, weitere Studien notwendig

Ernst 97 (107)

Osteo-arthrose

Sham, keine Behandlung, Standard

13 RCT

j-t-n-j-n

Sowohl Verum- als auch Sham-Akupunktur mit positivem Effekt, jedoch kein Unterschied zwischen beiden

Überlegenheit über Sham-Akupunktur nicht belegt

Lauten-schläger 97 (265)

entzündlich-rheumat. Erkrank.

Sham, keine Behandlung, Standard

2 RCT, 7 CCT, 9 KS

n-t-n-j-n

Widersprüchliche Ergebnisse, viele Studien von geringer Qualität

Akupunktur kann nicht empfohlen werden bei rheum. Arthritis, Spondarthropathie, Lupus eryth., Sklerodermie

Jacobs 91** (200)

rheumat.Erkrank.

Sham, Standard

23 CCT

t-j-n-j-n

7 Studien positiv, 13 keine Wirkung über Sham oder Standard, 3 Studien unklar

Keine ausreichende Evidenz für eine Therapieempfehlung

ter Riet 89 (453)

rheumatoide Arthritis

Sham

1 RCT, 2CCT

j-t-j-n-n

Nur eine Studie zusammengefasst: positiver Effekt auf Schmerz, nicht auf Entzündung

Evidenz reicht nicht aus, um Schlussfolgerungen zu ziehen

Sucht

      

White 2000/99 (503;505)

Raucher-entwöhnung

Sham, keine Behandlung, Standard

20 RCT

j-j-j-j-j

Akupunktur vs. Sham: OR Aufhören 1,22 (95%KI 0,99-1,49) nach Beh. und 1,02 (0,72-1,43) nach 12 Monaten. Kein Unter­schied zu anderen Beh., besser als keine Behandlung

Keine Evidenz, dass Akupunktur über eine Sham-Akupunktur hinaus spezifische Effekte bei der Raucherentwöhnung hat

White 97 (504)

Raucher-entwöhnung

Sham

7 RCT

j-j-j-j-n

In 6 von 7 Studien keine signifikant unterschiedlichen Erfolgsraten

Keine Evidenz, dass Akupunktur über eine Sham-Akupunktur hinaus spezifische Effekte bei der Raucherentwöhnung hat

Law 95* (266)

Raucher-entwöhnung

Sham, keine Behandlung, Standard

8 RCT

t-t-n-n-j

Im Vgl. zur Kontrolle 3% (95%KI –1 bis 6%) mehr Teilnehmer unter Verumakupunktur nicht rückfällig

Akupunktur ist nicht wirksam bei der Raucherentwöhnung

ter Riet 90/89 (454;456)

A. Raucher-entwöhnung

B. Alkohol-entzug

C. Heroin-entzug

Sham, keine Behandlung, Standard, andere Akupunktur

A. 13 CT, 2 CCT

B. 1 RCT, 1 CCT

C. 5 CCT

j-t-j-j-n

A. 3 von 15 Studien positiv

B. 2 von 2 Studien positiv

C. 3 von 5 Studien positiv

Keine sichere Evidenz für eine Wirksamkeit bei den drei Indikationen

Abkürzungen siehe Tabelle 17


[Seite 83↓]

Tabelle 20: Systematische Übersichtsarbeiten zu klinischen Studien zur Akupunktur bei Übelkeit und Asthma

Autor & Jahr

Indikation

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Übelkeit

      

Lee 99 (270)

Postop. Übelkeit

Sham, keine Behandlung, Standard

19 RCT

j-t-j-j-j

RR Früherbrechen im Vgl. zu Antiemetika 0,89 (95%KI 0,47-1,67) und zu Sham 0,47 (0,34-0,64), verzögertes Erbrechen 0,81 (0,46-1,42)

Akupunktur effektiv bei Erwachsenen, offensichtlich jedoch nicht bei Kindern

Aikins-Murphy 99** (7)

Schwanger-schafts-übelkeit

Sham, keine Behandlung

7 RCT

j-t-n-j-n

6 von 7 P6-Akupressur Studien positiv, 1 Studie zur P6-Elektro- stimulation positiv

Vorhandene Evidenz positiv aber nicht überzeugend

Jewell 98* (214)

Schwanger-schafts-übelkeit

Sham, keine Behandlung

4 RCT

j-j-j-j-j

3 von 4 P6-Akupressurstudien positiv, beste Studie negativ

Vorhandene Evidenz positiv aber nicht überzeugend

Vickers 96 (474) (P6-Stimu-lation)

Übelkeit postop., in Schwanger., bei Chemoth.

Sham, keine Behandlung, Standard

33 CCT

j-j-j-j-n

27 von 33 Studien positiv, 11 von 12 RCT vs. Sham positiv

Außer nach Narkoseinduktion scheint P6-Stimulation antiemetisch effektiv

Asthma

      

Linde 98 (280)

Asthma (nicht akute Anfälle)

Sham

7 RCT

j-j-j-j-n

Studien sehr heterogen, 2 positiv, 5 ohne klaren Effekt

Evidenz widersprüchlich, Empfehlungen für die Praxis nicht möglich

Linde 96 (290)

Asthma

Sham, keine Behandlung, Standard

15 RCT

j-j-j-j-n

Studien sehr heterogen, Ergebnisse widersprüchlich

Evidenz nicht ausreichend, um zuverlässige Schluss­folgerungen ziehen zu können

Kleijnen 91 (246) & ter Riet 89 (452)

Asthma

Unklar

9 RCT, 4 CCT

j-t-j-n-n

Studienqualität gering, Ergebnisse widersprüchlich

Vorhandene Evidenz kann eine Wirksamkeit nicht belegen

Abkürzungen siehe Tabelle 17

Systematische Übersichtsarbeiten zu einer Reihe weiterer Indikationen bzw. Themen sind in Tabelle 21 zusammengestellt. Beim Tinnitus sind die Ergebnisse der vorliegenden Studien wenig vielversprechend (93;360), bei der Unterstützung der Gewichtsreduktion bzw. Appetitverminderung widersprüchlich (108). Der bis zum Abschluss unserer Literatursuche einzig vorliegende systematische Review zur Schlaganfallreduktion bewertete die vorhandene Evidenz als vielversprechend (126). Während der Erstellung dieses Textes wurde jedoch von der gleichen Arbeitsgruppe eine aktualisierte Version des Reviews publiziert (359), in den neuere, besser kontrollierte und verblindete Studien vs. Sham-Akupunktur einbezogen wurden, die die positiven Ergebnisse der offenen Studien nicht bestätigen konnten.

Schließlich liegt ein Review zur Akupressur bei verschiedenen Indikationen (170) und zur Akupunktur bei zahnmedizinischen Indikationen vor (389).


[Seite 84↓]

Tabelle 21: Systematische Übersichtsarbeiten zu klinischen Studien zur Akupunktur bei verschiedenen Indikationen

Autor & Jahr

Indikation

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Park 2000 (360)

Tinnitus

Sham, Standard

6 RCT

j-j-j-j-n

2 offene Studien positiv, 4 Blindstudien ohne signifikante Unterschiede

Keine Evidenz aus sorgfältigen Studien für eine Wirksamkeit bei Tinnitus

Dobie 99 * (93)

Tinnitus

Sham, Standard

6 RCT

t-t-t-t-n

Keine signifikanten Effekte. Patienten in cross-over-Studien meist mit Präferenz für Akupunktur

Keine spezifischen Schlussfolgerungen zur Akupunktur (generell: keine Behandlung belegt wirksam)

Ernst 97 (108)

Gewichts- und Appetits-reduktion

Sham

4 RCT

?-j-j-j-j

2 Studien mit positivem Effekt v.a. auf Appetit, 2 bessere Studien ohne positives Ergebnis

Keine Evidenz aus sorgfältigen Studien für eine Wirksamkeit bzgl. Gewichtsreduktion

Ernst 96 (126)

Schlaganfall-rehabilitation

Nur Reha

5 RCT, 1 CCT

j-j-n-j-n

Alle Studien beschreiben positiven Effekt auf Funktion, jedoch zahlreiche methodische Schwächen

Evidenz ermutigend aber nicht überzeugend

Harris 97 (nur Aku­pressur) (170)

verschiedene

Sham, keine Behandlung, Standard

23 klinische Studien

t-n-j-n-n

P6-Akupressur bei Nausea belegt, ansonsten wenig gute Studien

Keine klaren Schlussfolgerungen gezogen

Rosted 98 (389)

Zahnmedizin (v.a. temp.-mandibuläre Dysfunktion)

Sham, keine Behandlung, Standard

15 RCT

j-t-j-n-n

Relevante Schwächen in den meisten Studien. 11 von 15 positiv

Evidenz meist nicht überzeu­gend, bei temp.-mand. Dysfunkt. und Gesichtsschmerz Wirksamkeit wahrscheinlich

Abkürzungen siehe Tabelle 17

4.3.2 Zusammenstellung der systematischen Übersichtsarbeiten zur Phytotherapie

Zur Phytotherapie wurden insgesamt 79 potentiell relevante Übersichtsarbeiten durch den Screeningprozess vorselektiert. Davon erfüllten 58 (publiziert in 65 Veröffentlichungen bzw. Berichten) die Einschlusskriterien. Dabei wurden aktualisierte Versionen eines Reviews von der gleichen Autorengruppe wiederum als ein Review gezählt. 11 Reviews wurden ausgeschlossen, da sie nicht als systematisch klassifiziert wurden (Nichterfüllung von Einschlusskriterium 2) (53;85;148;220;247;249;316;493;498;521), 5 bearbeiteten Studien zu einzelnen Inhaltsstoffen von Pflanzenextrakten (121;313;314;374;510) und weitere 4 aus unterschiedlichen Gründen (1 indikationsspezifischer Review mit weniger als 4 Studien zur Phytotherapie (98), 1 Review zur Korrelation von Knoblauchaufnahme in der Nahrung und Krebs (109), sowie 2 Reviews zu nicht rein phytotherapeutischen Präparaten (221;526)).

Mehr als die Hälfte der eingeschlossenen Übersichtsarbeiten waren zu Ginkgo-, Hypericum- oder Knoblauchpräparaten. Nicht weniger als 13 liegen zu Ginkgoextrakten (Ginkgo biloba) vor (siehe Tabelle 22 23). Davon behandeln 7 (mit insgesamt 15 Primärstudien; einer der Reviews


[Seite 85↓]

Tabelle 22: Systematische Übersichtsarbeiten zu Ginkgo biloba bei Claudicatio intermittens

Autor & Jahr

Indikation

Intervention

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Pittler 2000 (376)

Claudicatio intermittens

Ginkgo

Placebo

8 RCT

j-j-j-j-j

Zunahme der schmerzfreien Gehstrecke nach 12-24 Wochen 34 m (95%KI 26-43 m)

Kausaler Effekt von fraglicher klinischer Relevanz grundsätzlich belegt

Moher 2000 (330)

Claudicatio intermittens

Ginkgo*

Placebo

5 RCT

j-j-j-n-j

Zunahme der schmerzfreien Gehstrecke nach 24 Wochen 32 m (95%KI 14-50 m)

Die inkonsistenten Ergebnisse der kleinen Studien lassen keine Schlussfolgerungen zu

Ernst 96 (106)

Claudicatio intermittens

Ginkgo

Placebo, Standard

10 RCT/ CCT

t-t-n-n-n

Zunahme der schmerzfreien Gehstrecke vs. Placebo 24 - 160 m. Ähnlich effektiv wie Vergleichspräparate

Vorhandene Evidenz vielversprechend – weitere hochwertige Studien notwendig

Schneider 92 (401)

Claudicatio intermittens

Ginkgo Extrakt EGb 761

Placebo, Standard

9 RCT/ CCT

?-n-n-j-j

Standardisierter Effekt d = 0,75 (95%KI 0,44-1,07) über Placebo

Effektivität im Vgl. zu Placebo eindeutig belegt

Letzel 92 (277)

Claudicatio intermittens

Ginkgo Extrakt EGb 761

Ginkgo vs. Plac.,

Pentoxif. vs. Plac.

5 RCT Ginkgo

9 RCT Pentoxif

?-t-n-j-j

Zunahme der Gehstrecke: 45% über Placebo für Ginkgo und 57% für Pentoxifyllin

Ginkgo Extract EGb761 effektiver als Placebo und ähnlich effektiv wie Pentoxifyllin

Kleijnen 91 (240)

Claudicatio intermittens

Ginkgo

Ginkgo vs. Plac.,

Pentoxif. vs. Plac.

15 CCT Ginkgo, 5 CCT Pentoxif

j-j-j-n-n

Viele Studien mit mäßiger Qualität. Alle Studien posi­tiv. Evidenz vergleichbar wie für Pentoxifyllin

Vorhandene Evidenz vielversprechend – weitere hochwertige Studien notwendig

Weiss 91 (496)

Claudicatio intermittens

Ginkgo Extrakt EGb761

Placebo

8 CCT

?-t-t-n-n

Alle 4 interpretierbaren Studien positiv

Effektivität im Vgl. zu Placebo eindeutig belegt

Legende siehe Tabelle 17

behandelte ebenfalls Studien zur zerebrovaskulären Insuffizienz) das Thema Claudicatio intermittens (106;240;277;330;376;401;496). Eine Vergrößerung der schmerzfreien Gehstrecke unter Ginkgotherapie scheint grundsätzlich gut belegt, die klinische Relevanz dieser Effekte wurde jedoch zum Teil in Frage gestellt (330;376). Die 5 Reviews zu verschiedenen demenziellen Syndromen ((122;191;241;349;496), insgesamt ca. 50 Primärstudien, siehe Tabelle 23) ziehen grundsätzlich alle positive Schlussfolgerungen. Ein großer Teil der älteren Studien wurde jedoch mit Patienten mit leichteren kognitiven Einschränkungen durchgeführt. Zusätzliche Studien sind notwendig, um eine Beurteilung zu erlauben, ob Ginkgoextrakte klinisch relevante Effekte bei fortgeschritteneren bzw. schwerwiegenderen Demenzformen haben.


[Seite 86↓]

Tabelle 23: Systematische Übersichtsarbeiten zu Ginkgo biloba bei demenziellen Syndromen und anderen Erkrankungen

Autor & Jahr

Indikation

Intervention

Kontrolle

Studien

Method.1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Ernst 99 (122)

Demenz

Ginkgo

Placebo

9 RCT

j-j-j-j-n

Vorliegende Studien überwiegend mit positiven Effekten

Vielversprechende Ergebnisse – größere Studien notwendig

Oken 98 (349)

M. Alzheimer

Ginkgo

Placebo

4 RCT

j-j-n-j-j

Signifikanter Effekt über Placebo bzgl. Kognition (Hedges g = 0,41, 95%KI 0,22-0,61)

Die klinische Relevanz der berichteten Effekte sollte in weiteren Studien überprüft werden

Hopfenmüller 94 (191)

Zerebrovask. Insuffizienz

Ginkgo Extrakt LI 1370

Placebo

10 RCT, 1 CCT

n-n-n-j-j

OR Globalbewertung 1,98 (95%KI 1,39-2,57) zugunsten von Ginkgo

Ginkgoextrakt einer Placebobehandlung überlegen

Kleijnen 92 (241)

Zerebrovask. Insuffizienz

Ginkgo

Ginkgo vs. Plac.

Hydergin vs. Plac.

40 CCT Ginkgo, 4 CCT Hyderg.

j-j-j-n-n

Studienqualität meist schlecht, alle Ergebnisse positiv. Evidenz ähnlich wie für Hydergin

Ginkgoextrakte scheinen effektiv zu sein – weitere hochwertige Studien notwendig

Weiss 91 (496)

Zerebrovask. Insuffizienz

Ginkgo Extrakt EGb761

Placebo

17CCT

?-t-t-n-n

10 von 12 interpretierbaren Studien positiv

Effektivität im Vgl. zu Placebo eindeutig belegt

        

Ernst 99 (125)

Tinnitus

Ginkgo

Placebo, andere

5 RCT

j-j-j-j-n

In 3 Studien Ginkgo besser als Placebo, in 1 kein Unterschied

Ergebnisse vielversprechend

Evans 2000 (129)

Macula- degeneration

Ginkgo

Placebo

1 RCT

j-j-j-j-n.a.

Kleine Studie mit positivem Ergebnis

Vorliegende Evidenz nicht ausreichend für zuverlässige Schlussfolgerungen

Legende siehe Tabelle 17

Auch zur Behandlung des Tinnitus mit Ginkgoextrakten liegt eine systematische Übersichtsarbeit vor. Die Ergebnisse wurden als vielversprechend bewertet (125). Inzwischen wurde allerdings eine größere randomisierte Studie veröffentlicht, die die positiven Ergebnisse nicht bestätigen konnte (96). Ein weiterer Review zu Ginkgo zur Maculadegeneration umfasste nur eine einzige, kleinere Studie (129), aus der sich keine eindeutigen Schlussfolgerung ableiten lassen.

Die Wirksamkeit von Hypericumkrautextrakten (Hypericum perforatum, syn. Johanniskraut) bei Patienten mit depressiven Verstimmungen im Vergleich zu Placebo und Standardantidepressiva wurde in 9 systematischen Reviews untersucht (siehe Tabelle 24, 11 Publikationen (104;139;142;235;285;286;337;441;483;485;509), insgesamt 29 Primärstudien). Primär aufgrund unterschiedlicher Einschlusskriterien differieren die jeweiligen Studiensammlungen in erheblichem Maße. Die Schlussfolgerungen waren jedoch in allen Fällen sehr ähnlich: Bei leichten bis mittelschweren Depressionen ist die Wirksamkeit von Hypericumextrakten im Vergleich zu Placebo nachgewiesen. Die Äquivalenz mit (angemessen dosierten) Standardantidepressiva ist noch nicht sicher zu beurteilen. Hier werden weitere Studien benötigt. Im Vergleich zu älteren Antidepressiva sind die Nebenwirkungsraten unter Hypericumbehandlung deutlich niedriger.


[Seite 87↓]

8 systematische Übersichtsarbeiten (in 9 Publikationen) liegen zum Einfluss von Knoblauchpräparaten (Allium sativum) auf kardiovaskuläre Risikofaktoren ((239;244;268; 342;411;412;443;491) insgesamt ca. 50 Primärstudien) und zur Atherosklerose in den Beinen vor ((211), siehe Tabelle 25). Ein mäßig ausgeprägter, kurzzeitiger cholesterinsenkender Effekt scheint für eine Reihe von Knoblauchpräparaten grundsätzlich belegt. Langzeiteffekte sind nicht sicher belegt. Langzeitauswirkungen auf kardiovaskuläre Ereignisse und Mortalität wurden bisher nicht untersucht. Blutdrucksenkende Effekte sind, wenn überhaupt, eher schwach ausgeprägt. Die Ergebnisse bzgl. der fibrinolytischen Aktivität und der Thrombozytenaggregations­hemmung erscheinen grundsätzlich vielversprechend, aber nicht ausreichend abgesichert (268). Ein besonderes Problem ist die mangelnde Vergleichbarkeit unterschiedlicher Knoblauchzuberei­tungen.

Tabelle 24: Systematische Übersichtsarbeiten zu Johanniskrautextrakten (Hypericum perforatum)

Autor & Jahr

Indikation

Intervention

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Gaster 2000 (142)

Depression

Hypericum

Placebo, Standard

8 RCT

t-j-t-j-n

4 placebokontr. Studien mit positiven Effekten, in 4 Ver­gleichen mit Antidepressiva tendenziell unterlegen

Hypericum wohl besser als Placebo, Äquivalenz mit Antidepressiva unklar

Williams 2000 & Mulrow 98* (337)

Depression

Hypericum

Placebo, Standard

14 RCT

j-j-n-j-j

Responderratio 1,9 (95%KI 1,2-2,8) vs. Placebo und 1,2 (1,0-1,4) vs. Antidepressiva

Hypericum effektiver als Placebo, Äquivalenz mit Antidepressiva nicht sicher beurteilbar

Kim 99 (235)

Depression

Hypericum

Placebo, Standard

6 RCT

t-j-j-j-j

Responderratio 1,48 (95%KI 1,03-1,92) vs. Placebo und 0,98 (0,67-1,28) vs. Antidepressiva

Hypericum effektiver als Placebo, ähnlich wie niedrig dosierte Antidepressiva; Studienqualität mäßig

Stevinson 99 (441)

Depression

Hypericum

Placebo, Standard

6 RCT

j-j-j-j-n

Nur Studien publiziert nach Linde 96; Überlegenheit vs. Placebo, ähnliche Effekte wie Antidepressiva

Neue Studien bestätigen ältere; Äquivalenz mit Antidepressiva immer noch unsicher

Linde 98 & 96 (285;286)

Depression

Hypericum

Placebo, Standard

27 RCT

j-j-j-j-j

Responderratio 2,47 (95%KI 1,69-3,61) vs. Placebo und 1,01 (0,87-1,16) vs. Antidepressiva

Hypericum effektiver als Placebo, Äquivalenz mit Antidepressiva nicht sicher beurteilbar

Volz 97 (483)

Depression

Hypericum

Placebo, Standard

15 CCT

t-t-n-n-n

Studien vs. Placebo meist positiv; ähnliche Effekte wie niedrig dosierte Standard-Antidepressiva

Bei leichter bis mäßiger Depression Therapie­versuch mit Hypericum angemessen

Ernst 95 (104)

Depression

Hypericum

Placebo, Standard

11 RCT

j-j-j-j-n

Mehrheit der 8 placebo-kontrollierten Studien posi­tiv. 3 Studien vs. Standard ohne Unterschiede

Hypericum Placebo überlegen und ähnlich effektiv wie Standard-Antidepressiva

Volz 2000 (485)

Leichte bis mittelschw. Depression

Hypericum

Fluoxetin

17 + 9 CCT

n-j-n-j-n

Vgl. von Responseraten in Hypericum- (53%) und Fluoxetinstudien (55%); kein direkter Vergleich

Ähnliche Responseraten – problematisch zu interpretieren

Friede 98 (139)

Angst bei depressiven Verstim-mungen

Hypericum

Placebo, Amitrip-tylin

8 RCT

?-j-j-j-n

Rückgang der Angst­symptomatik unter Hypericum ausgeprägter im Vgl. zu Placebo

Hypericum effektiv zur Behandlung der Angstsymptomatik bei depressiven Patienten

Legende siehe Tabelle 17


[Seite 88↓]

Ein ähnliches Problem besteht auch bei Echinaceaextrakten, die häufig in Kombination mit anderen Extrakten verwendet werden. Hier liegen 3 systematische Übersichtsarbeiten (zu insgesamt 30 Primärstudien) vor ((29;320;322), siehe Tabelle 26). Vielversprechend erscheint hier die Evidenz bzgl. der Frühbehandlung von Erkältungskrankheiten, d.h. beim Auftreten der ersten Infektsymptome. Bei der eigentlichen Infektprophylaxe (Einnahme von Echinaceapräparaten über längere Zeiträume) erscheinen die Effekte allenfalls gering, bei der Behandlung späterer Infektstadien sind die Ergebnisse ebenfalls nicht überzeugend.

Tabelle 25: Systematische Übersichtsarbeiten zu Knoblauchpräparaten (Allium sativum)

Autor & Jahr

Indikation

Intervention

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Lawrence 2000 (268)

Kardiovask. Risiko-faktoren

Knoblauch

Meist Placebo

45 RCT

j-j-j-j-j

37 Studien mit kleinen, aber konsistenten Kurzzeiteffek-ten bzgl. Cholesterin. Ergebnisse zu RR-Senkung widersprüchlich, vielversprechend bzgl. Gerinnungshemmung

Nur Untersuchungen zu Surrogatvariablen. Moderate Kurzzeiteffekte auf Cholesterin können als belegt gelten. Äußerst unterschiedliche Präparate

Stevinson 2000 (443)

Hyperchol-esterinämie

Knoblauch

Placebo

13 RCT

j-j-j-j-j

Cholesterinreduktion über Placebo 0,41 (95%KI –0,66 to –0,15) mmol/l; in besten Studien 0,11 (-0,30 to 0,08)

Kleiner signifikanter Effekt von fraglicher klinischer Relevanz

Silagy 94 & Neil 96 (342;411)

Cholesterin-senkung

Knoblauch

Placebo

16 RCT

j-t-j-j-j

Cholesterinreduktion über Placebo 0,65 (95%KI 0,53-0,76) mmol/l

Meta-Analyse suggeriert signifikanten Effekt, Reviewer sind jedoch skeptisch

Warshafsky 93 (491)

Cholesterin-senkung

Knoblauch

Placebo

5 RCT

t-j-j-j-j

Cholesterinreduktion über Placebo 0,59 (95%KI 0,44-0,74) mmol/l

Vorhandene Evidenz spricht dafür, dass Knoblauch eine sinnvolle Therapieoption sein könnte

Silagy 94 (412)

Blutdruck-senkung

Knoblauch-pulver (Kwai)

Placebo, andere Behandl.

8 RCT

j-t-j-j-j

RR-Reduktion über Placebo: syst. 7,7 (95%KI 4,3-11,0), diast. 5,0 (2,9-7,1) mm Hg

Knoblauch möglicherweise blutdrucksenkend wirksam – weitere Studien notwendig

Kleijnen 91 (239)

Kardiovask. Risiko-faktoren

Knoblauch

Placebo

18 CCT

t-t-j-j-n

Methodische Qualität meist mäßig. Meist positive Ergebnisse, Effektgrößen jedoch heterogen

Keine klare Schlussfolgerung gezogen

Kleijnen 89 (244)

Kardiovask. Risiko-faktoren

Knoblauch und Zwiebeln

Unklar

10 RCT, 8 CCT

j-t-n-j-n

Alle Studien mit großen Qualitätsmängeln. Positive Effekte bei frischem Knobl., widersprüchlich bei Präp.

Evidenz nicht ausreichend für zuverlässige Schlussfolgerungen

Jepson 97 (211)

Bein-Athero-sklerose

Knoblauch

Placebo

1 RCT

j-j-j-j-n.a.

Keine signifikanten Unterschiede zwischen Gruppen bzgl. Gehstrecke

Evidenz nicht ausreichend um Schlussfolgerungen zu ziehen

Legende siehe Tabelle 17

Zwei systematische Reviews liegen zur Gabe von Preisselbeersaft zur Prävention bzw. Therapie von Harnwegsinfekten vor ((212;213), siehe Tabelle 26). Während bzgl. des prophylaktischen Einsatzes vielversprechende Studienergebnisse publiziert wurden, gibt es zur Behandlung keine Evidenz aus kontrollierten Studien: der entsprechende Review ist „leer“, d.h. keine einzige Studie entsprach den Einschlusskriterien.


[Seite 89↓]

Die v.a. in deutschsprachigen Ländern weit verbreitete Misteltherapie ist seit 1994 nicht mehr in systematischen Reviews untersucht worden. Die bis dahin vorliegenden Übersichten ((233;234;243), siehe Tabelle 26) fanden zwar überwiegend positive Primärstudien, die Studienqualität war jedoch unbefriedigend. Außerdem konnte in der methodisch besten Studie kein positiver Effekt auf die Überlebenszeit festgestellt werden. Für die Behandlung des Colon irritabile mit Pfefferminzöl sind die in zwei Reviews (207;373) zusammengefassten vorliegenden Studien in der Mehrheit ebenfalls positiv, aufgrund methodischer Schwächen und kurzer Beobachtungs­zeiträume kann die Evidenz jedoch noch nicht als überzeugend angesehen werden.

Für die Wirksamkeit von Sägepalmenextrakten (Serenoa repens) bei der benignen Prostatahyper­plasie gibt es gute Belege (49;511;512). Einzelne systematische Übersichtsarbeiten liegen zu einer ganzen Reihe weiterer Zubereitungen aus Pflanzen vor (siehe Tabellen 27 und 28):

Zur Behandlung von Beschwerden von stillenden Frauen (Milchstau, Mastalgie, Brustentzündung) mit Kohlblättern liegt ein Review vor (386). Dies ist der einzige Review, in dem eine nicht vermarktbare phytotherapeutische Anwendung untersucht wurde. Jedoch konnte nur eine einzige Studie identifiziert werden. Obwohl die Ergebnisse vielversprechend sind, erscheinen angesichts [Seite 90↓]des geringen finanziellen Interesses weitere Studien zu Kohlblätteranwendungen eher unwahrscheinlich.

Tabelle 26: Systematische Übersichtsarbeiten zu Extrakten verschiedener Pflanzen (zu denen mind. je 2 Reviews vorliegen)

Autor & Jahr

Indikation

Intervention

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Echinacea (Echinacea purpurea, angustifolia und pallida)

   

Barrett 99 (29)

Infekte der oberen Luftwege

Echinacea (incl. Kombi-nationsprä-parate)

Placebo

13 RCT

j-t-j-j-n

Studienqualität mäßig. Alle 4 Präventionsstudien nur mit Trend, 8 von 9 Behandlungsstudien positiv

Präventiver Effekt längerer Einnahme nicht belegt, Ergebnisse bzgl. kurativem Effekt vielversprechend

Melchart 99 (320)

Erkältung

Echinacea (incl. Kombi-nationsprä-parate)

Placebo, keine Behandl.

16 RCT

j-j-j-j-t

Positive Effekte bei Frühbehandlung, gering bei Prävention und Behandlung ausgeprägter Infekte

Einzelne Echinaceaextrakte zur Frühbehandlung wohl wirksam; Evidenz nicht ausreichend für Empfehlung

Melchart 94 (322)

Immun-stimulation

Echinacea (incl. Kombi-nationsprä-parate)

Placebo, keine Behandl.

18 RCT, 8 CCT

j-j-j-j-n

Studien meist mit mäßiger Qualität und positiven Ergebnissen

Einzelne Echinaceaextrakte wohl wirksam; Evidenz nicht ausreichend für Empfehlung

Preisselbeersaft

    

Jepson 98 (213)

Prävention Harnwegs-infekte

Preissel-beersaft

Placebo

4 RCT

j-j-j-j-n

In 3 von 4 Studien Wirksamkeit bzgl. mind. eines relevanten Parameters

Evidenz nicht ausreichend – weitere Studien notwendig

Jepson 98 (212)

Behandlung Harnwegs-infekte

Preissel-beeren

 

0 RCT

j-j-n.a.-n.a.-n.a.

Keine Studie gefunden, die den Einschlusskriterien entsprach

-

Mistel (Viscum album)

     

Kleijnen 94 (243)

Krebs

Mistel

Placebo, keine Zusatz-behandl.

11 CCT

j-j-j-n-n

Studienqualität meist mäßig. Alle Studien bis auf die beste zeigen Überlebens-vorteil unter Misteltherapie

Evidenz reicht nicht aus, um Misteltherapie außerhalb klinischer Studien zu empfehlen

Kiene 89 (233;234)

Krebs

Mistel

Keine Zu-satzbeh., keine Kontrolle

2 RCT, 33 CCT, 11 andere

j-n-n-j-n

Studienqualität meist mäßig. 9 von 12 interpretierbaren Studien zeigen Überlebens-vorteil unter Misteltherapie

Vorhandene Evidenz positiv

Pfefferminze (Mentha piperita)

     

Jailwala 2000* (207)

Colon irritabile

1. Pfeffer-minzöl

2. chin. Kräuter

Placebo

1. 3 RCT

2. 1 RCT

t-j-j-n-n

1 von 3 Pfefferminzstudien und Studie zu chin. Kräutern mit positiven Ergebnissen

Evidenz in beiden Fällen nicht ausreichend

Pittler 98 (373)

Colon irritabile

Pfefferminz-öl

Placebo, andere Behandl.

8 RCT

j-j-j-j-j

Studienqualität mäßig. Globalbeurteilung unter Pfefferminzöl besser als unter Placebo

Evidenz vielversprechend aber nicht ausreichend

Legende siehe Tabelle 17


[Seite 91↓]

Tabelle 27: Systematische Übersichtsarbeiten zu Zubereitungen verschiedener Pflanzen

Autor & Jahr

Indikation

Intervention

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Boyle 2000 (49)

Benigne Prostata-hyperplasie

Permixon®
(Sägepal-menextrakt)

Placebo, Standard

11 RCTs, 2 UKS

?-n-n-j-j

Anstieg Flowwerte 2,20 (95%KI 1,20-3,20) ml/s über Placebo; Nykturie signifikant vermindert

Trotz einiger Einschrän-kungen deutliche Evidenz für Wirksamkeit vorhanden

Wilt 2000 & 98 (511;512)

Benigne Prostata-hyperplasie

Sägepalme

Placebo, Standard

19 RCT

j-j-j-j-j

Überlegenheit vs. Placebo bzgl. Nykturie, Urinflow, Patientenurteil; ähnlich ef-fektiv wie Finasterid

Vorhandene Evidenz spricht für Wirksamkeit – weitere Studien notwendig

Vogler 99 (480)

Verschie-dene

Aloe vera

Placebo, Standard, keine Beh.

6 RCT, 4 CCT

j-j-j-j-n

Positive Studien bei Genital-herpes, Psoriasis, Hyper-lipidaemie, Diabetes; Wundheilung kontrovers

Vielversprechende, aber nicht ausreichende Evidenz

Pittler 98 (371)

Cholesterin-senkung

Artischok-kenblatt-extrakt

Placebo

1 RCT

j-j-j-n-n

Positiver Effekt über Placebo nur bei Patienten mit Werten > 210 mg/dl

Weitere Studien notwendig

Morse 89 (336)

Neurodermi-tis

Nachtker-zenöl

Placebo

9 CCT

?-n-n-j-j

Signifikant besser als Placebo für verschiedene Parameter

Keine Schlussfolgerung gezogen

Vogler 98 (481)

Migräne

Mutterkraut

Placebo

5 RCT

j-j-j-j-n

Mehrheit der Studien mit Wirksamkeit über Placebo

Wirksamkeit nicht ausreichend sicher belegt

Ernst 2000 (123)

Übelkeit und Erbrechen

Ingwer-wurzel

Placebo, Metoclo-pramid

6 RCT

j-j-j-j-t

2 von 3 Studien postop. positiv, Studien zu See-krankheit, Schwangersch. und Chemotherapie pos.

Evidenz vielversprechend aber nicht ausreichend

Vogler 99 (482)

Verschie-dene

Ginseng-wurzel

Placebo, Standard (1 Studie)

16 RCT

j-t-j-j-n

Ergebnisse widersprüchlich: körperl. Leistung (7 Stud.), psychol. Funktion (5), Im-munmodulation (2); positiv: Diabetes (1), Herpes (1)

Wirksamkeit von Ginsengwurzel bei keiner der geprüften Indikationen sicher belegt

Pittler 98 (372)

Venöse Insuffizienz

Rosskasta-nie

Placebo, Standard

13 RCT

j-j-j-j-n

Signifikant wirksamer als Placebo und ähnlich wie andere Therapien

Vorhandene Evidenz positiv aber weitere Studien notwendig

Pittler 2000 (375)

Angst-störungen

Kava

Placebo

7 RCT

j-j-j-t-t

Alle Studien positiv. Meta-Analyse von 3 Studien ebenfalls signifikant positiv

Vorhandene Evidenz positiv. Weitere Studien notwendig

Lawrence 2000 (269)

Leberer-krankungen

Mariendistel

Placebo, Standard, keine Beh.

33 RCT, 1 CCT

j-j-j-j-j

Verschiedene Lebererkr. untersucht; Qualität meist mäßig, Ergebnisse inkonsistent

Wirksamkeit nicht belegt. Positive Effekte am ehesten auf Leberfunktion (Trans-aminasen)

Legende siehe Tabelle 17


[Seite 92↓]

Tabelle 28: Systematische Übersichtsarbeiten zu Zubereitungen verschiedener Pflanzen

Autor & Jahr

Indikation

Intervention

Kontrolle

Studien

Method.

1-2-3-

4-5

Ergebnisse

Schlussfolgerungen

Ernst 99 (115)

Schmerzen im Bew.app.

Phytodolor®

(Populus, Fraxinus, Solidago)

Placebo, Standard

10 RCT

j-t-j-j-n

Überlegenheit im Vgl. zu Placebo und ähnliche Effekte wie nichtsteroidale Antiphlogistika

Vorhandene Evidenz positiv

MacDonald/ Wilt 2000 (302;513)

Benigne Prostata-hyperplasie

Secale cereale Pollen-extrakt

Placebo, Standard

4 RCT

j-j-j-j-j

Signifikant besser als Plac. für subjektive (nicht objek-tive) Symptome; ähnlich eff. wie Tadenan und Paraprost

Vorhandene Evidenz vielversprechend – weitere Studien notwendig

Ernst 2000 (118)

Hauter-krankungen

Teebaumöl

Placebo, Standard

4 RCT

j-j-j-j-n

2 Studien vs. Placebo positiv, 3 vs. andere Behandlung ohne Unterschiede

Evidenz vielversprechend aber bisher nicht ausreichend

Stevinson 2000 (442)

Schlaf-störungen

Baldrian-wurzel

Placebo

9 RCT

j-j-j-j-n

Sehr heterogene Studien mit zum Teil widersprüch-lichen Ergebnissen

Vorhandene Evidenz nicht eindeutig, aber grundsätz­lich vielversprechend – weitere Studien notwendig

        

Renfrew 84 (386)

Milchstau, Mastalgie

Kohlblätter

Übliche Behand-lung

1 RCT

j-j-j-j-n

Unter den Frauen, die Kohlblätterumschläge machten, mußten weniger abstillen

Weitere Forschung wünschenswert

Armstrong 99 (20)

Neuro-dermitis

Chinesische Kräuter

Placebo

2 RCT

j-j-j-j-n

2 positive Studien der gleichen Forschungsgruppe, keine intent-to-treat Analyse

Vorhandene Evidenz vielversprechend – weitere Studien notwendig

Ernst 97 (114)

Blutzucker-senkung

Keine Ein-schränkung

Placebo, keine Beh, keine Kontrolle

7 RCT, 4 CCT, 10 UCS

j-t-n-j-n

Qualität meist gering. Blutzuckersenkende Wir-kungen bei einer Reihe von Extrakten beschrieben

Bisher keine überzeugenden Belege vorhanden. Weitere Forschung gerechtfertigt

Ernst 2000 (117)

Analgetische und antiinfl. Behandlung

Keine Ein-schränkung

Placebo

18 RCT

j-j-j-j-n

Meist pos. Ergebnisse zu Nachtkerzen-, schwarzen Johannisbeer- und Borretschöl, Teufelskralle, Weidenrinde, Mutterkraut und Kombipräparaten

Ergebnisse zum Teil sehr vielversprechend – weitere Forschung sehr wünschenswert

Legende siehe Tabelle 17

Eine feste Mischung von Kräutern der traditionellen chinesischen Medizin zur Behandlung der Neurodermitis war Thema eines systematischen Reviews, in den 2 Primärstudien (vom selben Forschungsteam) eingeschlossen wurden (20).

Schließlich liegen noch zwei weitere systematische Übersichtsarbeiten vor, die Studien zusammenfassen, in denen verschiedene Pflanzen auf ihre blutdrucksenkende (114) oder entzündungshemmende Wirksamkeit (117) untersucht worden waren. Besonders im zweiten Fall wurde eine Reihe vielversprechender Ergebnisse gefunden; weitere klinische Studien wurden hier als besonders sinnvoll erachtet.


[Seite 93↓]

4.3.3  Zusammenstellung der systematischen Übersichtsarbeiten zur Homöopathie

Von insgesamt 22 potentiell relevanten Übersichtsarbeiten zur Homöopathie erfüllten 18 (in 19 Publikationen) die Einschlusskriterien (siehe Tabellen 29 und 30). Vier Arbeiten wurden ausgeschlossen, da es sich entweder um Subgruppen- oder Reanalysen eingeschlossener Reviews handelte (110;124;219;287).

3 quantitative Meta-Analysen beschäftigten sich mit der grundsätzlichen Frage, ob für homöopathische Arzneimittel überhaupt ein Effekt über Placebo hinaus nachweisbar ist (76;278;489). Insgesamt 97 Primärstudien waren in mindestens einen der 3 Reviews eingeschlossen worden, in den größten 89. Die einzelnen Studiensammlungen differierten v.a. aufgrund unterschiedlicher Einschlusskriterien erheblich. Während zwei Meta-Analysen (76;278) eine signifikante Überlegenheit der homöopathischen Arzneimittel gegenüber Placebo fanden, war der Unterschied in der dritten (489) in der Hauptanalyse (mit einem random effects Modell) nicht signifikant. In einer weiteren (fixed effects) Analyse war der Unterschied dagegen auch in diesem Review hochsignifikant. Bereits mehrere Jahre vor der Publikation dieser Untersuchungen war eine quantitative Meta-Aanalyse versucht worden (299). Diese Arbeit beschäftigte sich aber primär mit den dabei auftretenden methodischen Problemen, erbrachte keine klaren Ergebnisse und zog keine inhaltlichen Schlussfolgerungen.

Zwei ältere systematische Übersichtsarbeiten bezogen sowohl placebokontrollierte Studien als auch Vergleiche mit anderen Medikamenten mit ein (185;245). Die Ergebnisse wurde in einem Vote Count als positiv oder negativ kategorisiert. Ein Review zog vorsichtig positive Schlussfolgerungen (245), der andere eher negative (185).

Zwei weitere krankheitsübergreifende Reviews schlossen ausschließlich Primärstudien ein, in denen eine klassisch homöopathische Intervention (d.h. individuell ausgewählte Arzneimittel) untersucht worden war. Einer dieser Reviews war darüberhinaus auf Vergleiche mit konventionellen medikamentösen Interventionen beschränkt (111). Lediglich 6 methodisch fehlerbehaftete Studien entsprachen diesen Einschlusskriterien, sodass eine zuverlässige Schlussfolgerung nicht möglich schien. Der zweite Review schloss auch eine größere Zahl placebokontrollierter Studien ein (283). Bei der meta-analytischen Auswertung ergab sich eine signifikante Überlegenheit gegenüber Placebo; wurde die Analyse auf die methodisch besten Studien beschränkt, war der Effekt jedoch deutlich kleiner und nicht mehr signifikant.


[Seite 94↓]

Tabelle 29: Krankheitsübergreifende systematische Übersichtsarbeiten zur Homöopathie

Autor & Jahr

Indikation

Homöopath. Intervention/

Kontrolle

Studien

Method.

1-2-3-4-5

Ergebnisse

Schlussfolgerungen

Homöopathie allgemein krankheitsübergreifend

 

 

Cucherat 2000 (76)

Keine Einschränk.

Keine Einschränk./

Placebo

17 RCT

j-j-j-n-j

Kombinierter p-Wert für einen Effekt über Placebo = 0,000036, für die besten Studien = 0,08

Es gibt Evidenz für einen Effekt über Placebo hinaus. Bessere Studien weniger positiv

Linde 97 (278)

Keine Einschränk.

Keine Einschränk./

Placebo

89 RCT

j-j-j-j-j

OR alle Studien für Effekt über Placebo 2,45 (95%KI 2,05-2,93), in besseren Studien 1,66 (1,33-2,08)

Evidenz für Effekt über Placebo vorhanden; keine überzeugende Evidenz bei einzelnen Erkrankungen

Walach 97 (489)

Keine Einschränk.

Keine Einschränk./

Placebo oder Standard

41 RCT

j-t-j-j-j

Effektgröße g random effects = 0,259 (95%KI –0,319-0,837), fixed effects 0,295 (0,223-0,366)

Effekt über Placebo nicht statistisch signifikant absicherbar

Lutz 93 (299)

Keine Einschränk.

Keine Einschränk./

Placebo oder Standard

21 RCT/ CCT

?-n-j-j-t

Studienergebnisse widersprüchlich

Keine Schlussfolgerung (Dissertation hauptsächlich zu technischen Problemen der Meta-Analyse)

Kleijnen 91 (245)

Keine Einschränk.

Keine Einschränk./

Placebo oder Standard

107 CCT

j-t-j-j-n

81 Studien mit positiven Ergebnissen; Qualität meist schlecht, jedoch viele Ausnahmen

Vorhandene Evidenz positiv aber nicht ausreichend für definitive Schlussfolgerungen

Hill 90 (185)

Keine Einschränk.

Keine Einschränk./

Placebo oder Standard

40 RCT

n-t-j-j-n

Hälfte der Studien laut Autoren positiv, weitere 7 tendenziell positiv

Keine ausreichende Evidenz für eine Wirksamkeit

Individualisierte (klassische) Homöopathie krankheitsübergreifend

 

Ernst 98 (111)

Keine Einschränk.

Individuell/ Standard

3 RCT, 3 CCT

j-t-n-j-n

Alle Studien mit relevanten methodischen Schwächen; Ergebnisse unterschiedlich

Wirksamkeit klassischer Homöopathie im Vergleich zu konventionellen Medikamen-ten bisher nicht beurteilbar

Linde 98 (283)

Keine Einschränk.

Individuell/ Placebo oder Standard

32 RCT

j-j-j-j-j

Responder RR vs. Placebo 1,62 (95%KI 1,17-2,23), für bessere Studien 1,12 (0,87-1,44)

Vorhandene Evidenz grund-sätzlich positiv aber nicht überzeugend (Methodik, fehlende Replikationen)

Legende siehe Tabelle 17


[Seite 95↓]

Primär krankheitsbezogene Übersichtsarbeiten zur Behandlung mit homöopathischen Arzneimitteln liegen zum postoperativen Ileus (28), zum Muskelkater (116), bei rheumatischen Erkrankungen (200) und bei Asthma (281) vor (siehe Tabelle 30). Beim postoperativen Ileus hat die Mehrzahl der Studien einen signifikanten Effekt der homöopathischen Arzneimittel gezeigt, die methodisch beste und größte Studie jedoch nicht. In den anderen Fällen ist die vorliegende Evidenz wenig aussagekräftig.

Arnica wird in der Homöopathie sehr häufig bei der Behandlung von kleineren Verletzungen, Wunden etc. angewendet und ist das in klinischen Studien am häufigsten untersuchte Mittel. Zwei systematische Übersichtsarbeiten mit z.T. unterschiedlichen Einschlusskriterien (v.a. bzgl. des Einbezugs von Arnica in Kombination mit anderen Homöopathika bzw. in fixen homöopathischen Kombinationspräparaten) liegen vor ((119;301), insgesamt 37 Primärstudien). Die Ergebnisse der vorliegenden Studien sind widersprüchlich; der umfangreichere der beiden Reviews zieht jedoch etwas positivere Schlussfolgerungen.

Übersichtsarbeiten bzw. Meta-Analysen liegen darüberhinaus zur Gabe von isopathischen Nosoden bei allergischen Erkrankungen (448), für ein in Frankreich zur Infektbehandlung weit verbreitetes Nosodenpräparat (Oscillococcinum (476)), für die klassisch homöopathische Behandlung chronischer Kopfschmerzen (112) und für Galphimia glauca bei Heuschnupfen vor (300;508). Außer für die Behandlung von Kopfschmerzen sprechen in allen Fällen die vorliegenden Ergebnisse für eine Wirksamkeit. Im Falle der isopathischen Nosoden bei Allergie und Galphimia glauca bei Heuschnupfen sind jedoch unabhängige Replikationen der Studien unabdingbar, da die Primärstudien jeweils von einer Forschungsgruppe stammen.


[Seite 96↓]

Tabelle 30: Systematische Übersichtsarbeiten zur Homöopathie mit beschränktem Krankheitsspektrum

Autor & Jahr

Indikation

Homöopath. Intervention/

Kontrolle

Studien

Method.

1-2-3-4-5

Ergebnisse

Schlussfolgerungen

Verschiedene homöopathische Arzneimittel bei definierten Indikationen

 

Barnes 97 (28)

Post-operativer Ileus

Verschiedene/

Placebo

4 RCT, 2 CCT

j-j-j-j-j

Zeit bis zur Wiederaufnahme der Darmtätigkeit unter hom. Beh. signifikant kürzer – beste Studie jedoch negativ

Vorhandene Evidenz positiv, verschiedene Probleme machen aber endgültige Schlussfolg. unmöglich

Ernst 98 (116)

Muskelkater

Verschiedene/

Placebo

8 CCT

j-j-j-j-n

Studien meist mit großen Schwächen; bessere Studien ohne Effekt über Placebo hinaus

Vorhandene Evidenz spricht nicht für eine Wirksamkeit

Jacobs 91* (200)

Rheumat. Erkrank.

Verschiedene

Placebo

4 CCT

t-j-n-j-n

3 von 4 Studien positiv. Qualität der Studien schlecht

Keine spez. Schlussfolgerung zur Homöopathie (allg.: keine komplementäre Therapie gut belegt)

Linde 98 (281)

Asthma

Verschiedene

Placebo

3 RCT

j-j-j-j-n

Völlig unterschiedliche Interventionen. 2 Studien positiv

Vorhandene Evidenz läßt eine Beurteilung der Wirksamkeit bei Asthma nicht zu

Reviews zu Arnica bei verschiedenen Indikationen (meist Trauma)

 

Lüdtke 99 (301)

Keine Einschränk.

Arnica/

Placebo, keine Behandlung

23 RCT, 14 CCT

j-j-j-n-n

Qualität meist gering. 13 von 35 Studien vs. Placebo mit signifikant positiven Ergebnissen, 10 mit Trend

Evidenz suggeriert, dass Arnica wirksam sein kann – weitere Studien notwendig

Ernst 98 (119)

Keine Einschränk.

Arnica/ Placebo

4 RCT, 4 CCT

j-j-j-j-n

2 Studien positiv, 2 mit positivem Trend. Studien meist mit relevanten Schwächen

Wirksamkeit von Arnica nicht belegt

Definierte Homöopathika/ähnliche Mittel bei definierten Indikationen

 

Taylor 2000*** (448)

Allergische Erkrank.

Isopathische Nosoden/

Placebo

4 RCT

n-n-n-j-j

Meta-Analyse der Ergebnisse zu 100 mm Analogskala 9,8 (95%KI 4,2-15,4) mm besser unter Verum

Isopathische Nosoden Placebo überlegen

Vickers 2000 (476)

Erkältung

Oscillococci-num/

Placebo

7 RCT

j-j-j-j-j

Keine Überlegenheit vs. Placebo präventiv (3 Studien), jedoch Verkürzung der Krankheitsdauer kurativ

Oscillococcinum scheint die Krankheitsdauer zu verkürzen – weitere Studien notwendig

Ernst 99 (112)

Chronische Kopf-schmerzen

Individuelles Simile/

Placebo

4 RCT

j-t-j-j-n

1 Studie positiv, 1 mit Trend, 2 negativ

Wirksamkeit bei Behandlung chronischer Kopfschmerzen wenig wahrscheinlich

Wiesenauer 96*** (300;508)

Heu-schnupfen

Galphimia/

Placebo

8 RCT, 1 KS, 2 UKS

t-n-n-j-j

Responder RR Galphimia vs. Placebo 1,25 (95%KI 1,09-1,43)

Galphimia signifikant wirksamer als Placebo

Legende siehe Tabelle 17
***Meta-Analysen ausschließlich von Studien, die die Reviewautoren selbst durchgeführt hatten


[Seite 97↓]

4.3.4  Merkmale und Qualitätsbewertung der Übersichtsarbeiten zu allen drei Therapien

In allen drei Therapien ist in den letzten Jahren ein starkes Ansteigen der Publikation systematischer Übersichtsarbeiten zu verzeichnen (siehe Abbildung 13). 81% der Reviews wurden als Zeitschriftenartikel publiziert, 13% elektronisch als Cochrane-Reviews (siehe Tabelle 31). Die übrigen Reviews liegen als Dissertationen oder Internetpublikationen vor. Für fast ein Drittel aller Reviews in allen drei Therapien ist eine Gruppe vom Department of Complementary Medicine (Leiter Prof. E. Ernst) der Universität Exeter in Großbritannien verantwortlich. Ein weiterer relevanter Anteil der älteren Arbeiten stammt aus dem Department of Epidemiology and Biostatistics der Universität Maastricht (damaliger Leiter Prof. P. Knipschild). Bei den neueren Arbeiten stammt ein relevanter Teil vom Zentrum für naturheilkundliche Forschung der II. Medizinischen Klinik der Technischen Universität München, dem auch der Autor dieser Schrift angehört. 22% der Reviews sind über Medline nicht auffindbar; dieser Anteil ist bei der Homöopathie mit 39% besonders hoch.

Abbildung 4.1: Kumulative Zahl verfügbarer systematischer Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie

In Hinsicht auf die Fragestellungen gab es zwischen den drei Therapien deutliche Unterschiede. Wie zu erwarten gab es bei den Akupunkturreviews nur selten (4% = 1 Review) eine Einschränkung auf eine klar definierte Prüfintervention (z.B. eine bestimmte Punktkombination)


[Seite 98↓]

.Dagegen gab es bei den Homöopathiereviews in der Regel (62%) keine Einschränkung auf eine Indikation. Im Vordergund stand bei der Homöopathie auch besonders häufig der Vergleich mit Placebo (94%). Auffällig ist, dass der Vergleich mit anderen Interventionen in allen drei Bereichen eher sekundär ist.

Tabelle 31: Systematische Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie: Bibliographische Merkmale und Fragestellungen

 

Akupunktur

Phytotherapie

Homöopathie

Insgesamt

Anzahl Reviews

39

58

18

115

- Publikationsjahr (19..)

97 (89-99)

98 (89-2000)

97 (89-99)

98 (89-2000)

- davon Cochrane Reviews

4 (10%)

9 (16%)

2 (11%)

15 (13%)

- publiziert als Artikel

34 (87%)

45 (78%)

14 (78%)

93 (81%)

- aus Exeter

11 (28%)

21 (36%)

5 (28%)

37 (32%)

- auffindbar über Medline

30 (77%)

48 (84%)

11 (61%)

89 (78%)

     

Fragestellung

    

- eng definierte Intervention

1 ( 4%)

14 (37%)

3 (19%)

18 (22%)

- eng definierte Indikation

20 (74%)

33 (85%)

6 (38%)

59 (72%)

- statist. prüfbare Hypothese

12 (31%)

20 (35%)

10 (56%)

42 (37%)

- primär Vergleich mit Placebo

18 (58%)

40 (71%)

17 (94%)

75 (71%)

- primär Vergleich mit anderer Therapie

-

2 ( 4%)

1 ( 6%)

3 ( 3%)

- primär Vergleich mit Nichtbehandlung

2 ( 7%)

1 ( 2%)

-

3 ( 3%)

- gleichwertig mit Placebo/anderer Ther.?

9 (29%)

12 (21%)

-

21 (20%)

- andere/keine Vergleiche

2 ( 7%)

1 ( 2%)

-

3 ( 3%)

Bei vielen Reviews war die explizite Beschreibung der Einschlusskriterien nicht vollständig (siehe Tabelle 32). Dabei wurde auch eine Aussage darüber, dass auf der jeweiligen Ebene keine Beschränkung (z.B. alle Erkrankungen erlaubt) erfolgte, als explizite Beschreibung gewertet. Bzgl. Erkrankung, Intervention, Kontrollintervention und Zielkriterien fehlten Angaben in 35%, 24%, 36% und 56% der Übersichtsarbeiten. Nur bzgl. der Kontrollinterventionen ergab sich dabei zwischen den Therapien ein relevanter Unterschied: Homöopathie-Reviews machten hier häufiger klare Angaben. Ob die Publikationssprache ein Einschlusskriterium darstellte oder nicht, war in 51% der Reviews angegeben.

Entsprechend der Fokussierung auf einen Vergleich mit Placebo schlossen Homöopathie-Reviews besonders häufig nur placebokontrollierte Studien ein (44% vs. 31% bei Phytotherapie und 8% bei Akupunktur). Eine explizite Begrenzung auf randomisierte Studien erfolgte nur in 57% aller Übersichten. Insbesondere bei älteren Reviews wurden „kontrollierte klinische Studien“ eingeschlossen, wobei der Zuteilungsmodus nicht spezifiert war. In einigen Fällen waren auch Doppelblindbedingungen als Einschlusskriterium genannt. Nur 6% aller Reviews schlossen auf der [Seite 99↓]anderen Seite unkontrollierte Studien mit ein. Ebenfalls nur 6% waren ausschließlich auf in englischer Sprache publizierte Studien begrenzt.

Tabelle 32: Systematische Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie: Angaben zu Einschlusskriterien und Literatursuche

 

Akupunktur

Phytotherapie

Homöopathie

Insgesamt

Einschlusskriterien explizit bzgl.

    

- Patienten/Erkrankung

29 (74%)

37 (64%)

9 (50%)

75 (65%)

- Intervention

27 (69%)

45 (75%)

15 (83%)

87 (76%)

- Kontrollintervention

21 (54%)

37 (74%)

16 (89%)

74 (64%)

- Zielkriterien

16 (41%)

29 (50%)

6 (33%)

51 (44%)

- Sprache der Publikation

20 (51%)

31 (53%)

8 (44%)

59 (51%)

     

Wichtige Einschlusskriterien

    

- nur placebokontrollierte Studien

3 ( 8%)

18 (31%)

8 (44%)

29 (25%)

- nur randomisierte Studien

21 (54%)

35 (60%)

9 (50%)

65 (57%)

- auch unkontrollierte Studien

4 (10%)

2 ( 3%)

1 ( 6%)

7 ( 6%)

- nur in englisch publizierte Studien

4 (10%)

2 ( 3%)

1 ( 6%)

6 ( 6%)

     

Literatursuche

    

- nicht beschrieben

-

8 (14%)

2 (11%)

10 (9%)

- explizit in Medline

37 (95%)

51 (88%)

13 (72%)

101 (88%)

- explizit in Embase

25 (64%)

39 (67%)

11 (61%)

75 (65%)

- explizit in anderen Datenbanken

28 (72%)

40 (69%)

12 (67%)

80 (70%)

- expl. Screening Literaturverzeichnisse

30 (77%)

46 (79%)

13 (72%)

89 (77%)

- explizit Expertenanfragen

20 (51%)

29 (50%)

9 (50%)

58 (50%)

- explizit Herstelleranfragen

-

38 (66%)

6 (33%)

44 (38%)

Für die Mehrheit der Reviews erfolgte die Literatursuche in einer ganzen Reihe von Quellen. Die Autoren gaben für 88% der Übersichten an, ausdrücklich in der Datenbank Medline gesucht zu haben, 65% in Embase und 70% in anderen Datenbanken. In 77% waren die Literaturverzeichnisse gefundener Arbeiten und von Reviews nach weiteren potentiellen Primärstudien durchsucht worden, in 50% waren Experten und in 38% Hersteller kontaktiert worden. Erwartungsgemäß spielte dieser letzte Suchweg bei der Akupunktur keine Rolle (kein Review vs. 66% für Phytotherapie- und 33% für Homöopathie-Reviews).

55% der Reviews machten Angaben dazu, wieviele Reviewer bei der Extraktion und Beurteilung der Studien beteiligt waren (in 49% zwei und mehr Reviewer, in 6% nur einer, siehe Tabelle 33). In 76% der Übersichtsarbeiten wurde die Qualität der Primärstudien nach vordefinierten Methoden beurteilt. In 47% der Fälle kamen Scores und in 29% der Fälle Checklisten mit Einzelkriterien zum Einsatz (dabei wendeten 4% sowohl die eine wie auch die andere Methode an). Die mediane [Seite 100↓]Anzahl eingeschlossener Primärstudien insgesamt betrug 10 (Bereich 0-107), die mediane Zahl eingeschlossener randomisierter Studien 8 (0-89). Ein Review schloss keine einzige Studie ein.
Eine quantitative Meta-Analyse mit Berechnung eines gepoolten Effektmaßes erfolgte in 40% der Übersichtsarbeiten (am seltensten bei Akupunktur mit 26%). Positive bzw. eingeschränkt positive Schlussfolgerungen waren in Phytotherapiereviews am häufigsten, bei der Akupunktur am seltensten.

Tabelle 33: Systematische Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie: Methoden, Ergebnisse und Schlussfolgerungen

 

Akupunktur

Phytotherapie

Homöopathie

Insgesamt

Explizit Extraktion durch ≥ 2 Reviewer

19 (49%)

31 (53%)

6 (33%)

56 (49%)

Explizit Extraktion durch 1 Reviewer

1 ( 3%)

3 ( 5%)

3 (17%)

7 ( 6%)

     

Formale Qualitätsbeurteilung

    

- keine

9 (23%)

14 (21%)

4 (22%)

27 (24%)

- Score

16 (41%)

29 (50%)

7 (39%)

52 (43%)

- Einzelkriterien

11 (28%)

13 (22%)

5 (28%)

29 (25%)

- Score + Einzelitems

3 ( 8%)

1 ( 2%)

1 ( 6%)

5 ( 4%)

- andere Vorgehensweisen

-

1 ( 2%)

1 ( 6%)

2 ( 2%)

     

N eingeschl. Studien (Median, Bereich)

13 (2-51)

9,5 (0-53)

9,5 (3-107)

10 (0-107)

N eingeschlossene RCTs

8 (0-51)

7,5 (0-45)

7,5 (0-89)

8 (0-89)

     

Effektmaßberechnung

    

- für Einzelstudien

11 (28%)

26 (46%)

11 (61%)

48 (42%)

- für Pooling

10 (26%)

26 (46%)

9 (50%)

45 (40%)

     

Hauptschlussfolgerung

    

- eindeutig positiv

-

10 (18%)

2 (12%)

12 (11%)

- positiv mit Einschränkungen

14 (39%)

36 (63%)

7 (41%)

57 (52%)

- ambivalent

14 (39%)

10 (18%)

4 (24%)

28 (26%)

- negativ mit Einschränkungen

5 (14%)

1 ( 2%)

4 (24%)

10 ( 9%)

- eindeutig negativ

3 ( 8%)

-

-

3 ( 3%)

- nicht interpretierbar

3 ( 8%)

1 ( 2%)

1 ( 6%)

5 ( 4%)

Die Qualität der systematischen Übersichtsarbeiten war in allen drei Bereichen sehr variabel (siehe Tabelle 34). Die Beschreibung des Selektionsprozesses war nur in 38% aller Reviews ausreichend. Die meta-analytische Auswertung bzw. die Darstellung der Studienergebnisse war nur in 44% befriedigend. Bei dieser Frage sowie bei den Fragen zur Beschreibung der Auswertungsmethoden und bzgl. der Schlussfolgerungen gab es jedoch zwischen den Beurteilern vergleichsweise häufig Nichtübereinstimmungen (siehe letzte Spalte in Tabelle 34). Im Mittel wurden 6,2 von 9 möglichen Punkten bei den ersten 9 Fragen der Oxmanskala erreicht. Bei der zehnten Frage (Gesamtbeurteilung von 1 = erheblich Schwächen bis 7 = keine Schwächen) wurden im Mittel 4,6 Punkte vergeben.


[Seite 101↓]

Abbildung 4.2: Schlussfolgerungen der Reviewer in den Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie bzgl. der vorliegenden Evidenz. + = positiv, (+) = positiv mit Vorbehalten, 0 = ambivalent, (-) = negativ mit Vorbehalten, - = negativ

Tabelle 34:
Systematische Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie: Methoden, Ergebnisse und Schlussfolgerungen

Item

Akupunktur

Phytotherapie

Homöopathie

Insgesamt

Übereinst.*

Literatursuche gut beschrieben

38 (97%)

44 (76%)

12 (67%)

94 (82%)

0,66

Literatursuche ausreichend

30 (77%)

44 (75%)

13 (72%)

87 (76%)

0,69

Einschlusskriterien klar definiert

23 (59%)

37 (64%)

10 (56%)

70 (61%)

0,53

Selektionsbias vermieden

18 (46%)

22 (38%)

4 (22%)

44 (38%)

0,46

Qualitätskriterien beschrieben

28 (72%)

40 (69%)

13 (72%)

81 (70%)

0,60

Qualitätskriterien angemessen

30 (77%)

45 (78%)

14 (78%)

89 (77%)

0,56

Auswertungsmethoden beschrieben*

18 (50%)

29 (56%)

11 (61%)

58 (55%)

0,36

Angemessene Ergebnisintegration*

13 (38%)

23 (44%)

9 (53%)

45 (44%)

0,37

Schlussfolgerungen nachvollziehbar*

26 (68%)

50 (88%)

12 (71%)

88 (79%)

0,18

Gesamtbeurteilung

- Mittelwert

- Standardabweichung

- vorliegende Beurteilungen

4,6

1,5

39

4,7

1,5

58

4,6

1,5

18

4,6

1,5

115

0,27

Summe der Einzelitems

- Mittelwert

- Standardabweichung

- vorliegende Beurteilungen

6,4

2,2

33

6,2

2,4

52

6,0

2,4

16

6,2

2,3

101

0,71

Fehlende Daten aufgrund von Nichtbeurteilbarkeit bzw. Nichtanwendbarkeit des Kriteriums
*Übereinstimmung zwischen den Beurteilern: Für Einzelkriterien Kappa (Werte > 0,75 werden als sehr gute Übereinstimmung gewertet, Werte zwischen 0,50 und 0,74 als gute Übereinstimmung, Werte zwischen 0,25 und 0,49 als mäßige und niedrigere Werte als schlechte Übereinstimmung gewertet), für Gesamtbeurteilung und Summe Spearman Korrelationskoeffizient.


[Seite 102↓]

4.3.5  Vergleich der Übersichtsarbeiten zu gleichen Fragestellungen

Insgesamt wurden 21 ähnliche Fragestellungen (ohne Berücksichtigung von Unterfragestellungen aufgrund mehrerer Vergleiche innerhalb eines Reviews z.B. vs. Placebo und Standardtherapie) von zwei oder mehr Übersichtsarbeiten bearbeitet. 10 Fragestellungen betrafen die Akupunktur, 8

Tabelle 35: Fragestellungen in den Bereichen Akupunktur, Phytotherapie und Homöopathie, die in mehr als einer systematischen Übersichtsarbeit untersucht wurden

Intervention und Indikation

Vergleich in allen Reviews mit

Eingeschlossene Reviews

(Publikationszeitraum)

Ausgeschlossene Reviews mit Gründen

Akupunktur

   

Akupunktur bei chronischen Schmerzen

Scheinakupunktur, andere Behandlung

(361;455)
(1989-1990)

(131) – publiziert 2000

Akupunktur bei Nackenschmerzen

Scheinakupunktur, keine Behandlung

(415;502)
(1999-2000)

-

Akupunktur bei LWS-Schmerzen

Scheinakupunktur, keine und andere Beh.

(127;415;465;466)
(1998-2000)

(293) – nur Rückenschmerzen mit Ausstrahlung

Akupunktur bei Spannungskopfschmerz

Scheinakupunktur, andere Behandlung

(312;390;470)
(1999-2000)

(450) – publiziert 1989

Akupunktur zur Migräneprophylaxe

Scheinakupunktur, keine und andere Beh.

(151;390)
(1999)

(450) – publiziert 1989

Akupunktur zur Raucherentwöhnung

Scheinakupunktur

-

(266;503;505) – entsprechen Einschlusskriterien, jedoch Referenzen 1 und 2 zum gleichen Review und Referenz 3 vier Jahre vorher publiziert
(504) – anderer Reviewansatz der Arbeitsgruppe, die Ref. 1 und 2 publizierte
(454;456) – publiziert 1989 und 1990 von der gleichen Arbeitsgruppe

P6-Stimulation zur Prävention der postoperativen Übelkeit

Scheinakupunktur, keine und andere Beh.

(270;474)

(1996-1999)

-

P6-Stimulation bei Schwanger-schaftserbrechen

Scheinakupunktur, keine Behandlung

(7;214;474)

(1996-1999)

-

Akupunktur bei Asthma

Scheinakupunktur, keine und andere Beh.

-

(246) – publiziert 1991
(290) – publiziert 1996
(280) – gleiche Arbeitsgruppe wie Referenz 2 mit eingeschr. Fragestellung

Akupunktur bei Tinnitus

Scheinakupunktur, andere Behandlung

(93;110)
(1999-2000)

-


[Seite 103↓]

Tabelle 35 (Fortsetzung)
Fragestellungen in den Bereichen Akupunktur, Phytotherapie und Homöopathie, die in mehr als einer systematischen Übersichtsarbeit untersucht wurden

Intervention und Indikation

Vergleich in allen Reviews mit

Eingeschlossen

(Publikationszeitraum)

Ausgeschlossen mit Gründen

Phytotherapie

 

 

 

Ginkgo bei Claudicatio intermittens

Placebo

(330;376)
(2000)

(106) – publiziert 1996
(240) – publiziert 1991
(277;401;496) – Reviews zu einem definierten Extrakt, Literatursuchen nicht beschrieben

Ginkgo bei demenziellen Erkrankungen

Placebo

-

(122) – Demenzen allgemein, publ. 1999
(349) – Begrenzung auf M. Alzheimer
(191;496) – Literatursuche nicht beschrieben
(241) – Demenzen publ. 1992

Hypericumextrakte bei Depression

Placebo, Standardantidepressiva

(142;235;285;483;509)
(1997-2000)

(441) – nur neue Studiensubgruppe
(104;286) – publiziert 1996
(485) – Art des Vergleichs
(139) – Fokus auf Angstsy. bei Depression

Knoblauch zu Cholesterinsenkung

Placebo

Set 1: (268;443)
(2000)
Set 2: (411;491)
(1993-1994)

(342) – Update von (411)
(239;244) – allgemein zu kardiovaskulären Risikofaktoren

Echinacea bei Infekten der oberen Luftwege

Placebo

(29;320)
(1999)

(322) – zu Immunmodulation allgemein

Misteltherapie bei Krebs

Placebo, keine unkonvent. Behandlung

-

(233) – Literatursuche nicht beschrieben
(243) – entspricht als einziger Einschlusskriterien

Pfefferminzöl bei Colon irritabile

Placebo

(207;373)
(1998-2000)

-

Sabal bei benigner Prostatahyperplasie

Placebo, Standardmedikation

-

(49) – beschränkt auf ein Extrakt
(511) - zu Sabalprodukten allgemein

Homöopathie

 

 

 

Homöopathie bei verschiedenen Erkrankungen

Placebo, andere Behandlungen

(185;245)
(1990-1991)

-

Homöopathie bei verschiedenen Erkrankungen

Placebo

(76;278;489)
(1997-2000)

-

Arnica bei verschiedenen Indikationen (meist Trauma)

Placebo

(119;301)

-

die Phytotherapie und 3 die Homöopathie (siehe Tabelle 35). Unter Anwendung der engergefassten Einschlusskriterien bzgl. gleicher Fragestellungen und Reviewqualität blieben 16 Fragestellungen (8 zur Akupunktur, 5 zur Phytotherapie und 3 zur Homöopathie) für die [Seite 104↓]vergleichende Analyse. Bei einer Fragestellung (Cholesterinsenkung durch Knoblauchpräparate) mußten aufgrund des unterschiedlichen Alters der Reviews zwei separate Vergleiche bearbeitet werden (zwei Reviews, die im Jahr 2000 publiziert wurden sowie zwei Reviews, die 1993 und 1994 publiziert wurden). Dementsprechend erfolgten insgesamt 17 Vergleiche.

Bei 15 von 17 Vergleichen unterschied sich die Zahl bzw. die Gruppe der eingeschlossenen Primärstudien unter Berücksichtigung des Publikationsjahres der Reviews relevant (d.h. um mehr als 25%; siehe Tabelle 36). Bei 10 Vergleichen variierte die Primärstudienzahl um mehr als 50%. Häufigster Grund für die Diskrepanzen waren Unterschiede bei den Einschlusskriterien und in der Literatursuche.

Tabelle 36: Zahl der in die Übersichtsarbeiten zu klinischen Studien zu Akupunktur, Phytotherapie und Homöopathie eingeschlossenen Primärstudien und Gründe für Diskrepanzen

Intervention und Indikation

Zahl der Primärstudien* (Gesamt­zahl identifizierter Studien)

Hauptgründe für relevante Diskrepanzen

Akupunktur

 

 

Akupunktur bei chronischen Schmerzen

46 (455), 14 (361) (48)

Literatursuche, Einschlusskriterien

Akupunktur bei Nackenschmerzen

5 (415), 11 (502) (11)

Vermutlich Literatursuche, weniger Einschlusskriterien

Akupunktur bei LWS-Schmerzen

8 (415), 11 (465), 10 (127) (11)

Einschlusskriterien und Literatursuche

Akupunktur bei Spannungskopfschmerz

6 (312), 8 (390), 7 (470) (9)

Einschlusskriterien

Akupunktur bei Migräne

16 (390), 6 (151) (16)

Wahrscheinl. Berücksichtigung bzw. Nichtberücksich­tigung von nicht-englischsprachigen Publikationen

P6-Stimulation und postop. Übelkeit

19 (270), 18 (474) (24)

Alter (1996 vs. 1999) und Einschlusskriterien

P6-Stimulation bei Schwangerschaftsübelkeit

7 (7), 4 (214), 7 (474) (8)

Einschlusskriterien

Akupunktur bei Tinnitus

6 (360), 6 (93) (7)

 

Phytotherapie

 

 

Ginkgo bei Claudicatio intermittens

8 (376), 5 (330) (9)

Einschlusskriterien und Literatursuche

Hypericum bei Depression

8 (142), 14 (509), 6 (235), 27 (285), 11 (483) (29)

Primär Einschlusskriterien

Knoblauch zur Cholesterinsenkung

- Reviews 2000

- Reviews 1993-1994


37 (268), 13 (443) (37)
13 (411), 5 (491) (13)

Einschlusskriterien und Literatursuche

Einschlusskriterien und Literatursuche

Echinacea bei Infekten der ob. Luftwege

13 (29), 13 (320) (15)

 

Pfefferminzöl bei Colon irritabile

3 (207), 7 (373) (8)

Vermutlich primär Suche, evtl. Selektionsprozess

Homöopathie

 

 

Homöopathie bei verschiedenen Erkrankungen vs. Placebo

16 (76), 36 (489), 89 (278) (97)

Fast ausschliesslich Einschlusskriterien

Homöopathie bei verschiedenen Erkrankungen

105 (245), 40 (185) (105)

Einschlusskriterien und Literatursuche

Arnica bei verschiedenen Erkrankungen

35 (300), 8 (111) (35)

Primär Einschlusskriterien, Selektionsprozess

*Neuere Reviews zuerst


[Seite 105↓]

Ein erstes fundamentales Problem beim Vergleich der vorliegenden Übersichtsarbeiten war, dass die Hauptfragestellungen sehr häufig eher global-deskriptiv und nur selten genauer operationalisiert waren. Box 1 gibt ein typisches Beispiel.

Box 1

Fragestellungen bzw. Ziele in systematischen Übersichtsarbeiten zu Echinaceaextrakten

Barrett et al. (29): “To review the evidence regarding the effectiveness of orally ingested Echinacea extracts in reducing the incidence, severity, or duration of acute upper respiratory infections.”
Melchart et al. (320): “To assess whether there is evidence that preparations containing extracts of Echinacea are effective in the prevention and treatment of the common cold.”

Ohne eine Überprüfung der Einschlusskriterien bzw. der tatsächlich eingeschlossenen Studien läßt sich daher in der Regel nicht sicher sagen, ob die Fragestellungen wirklich identisch sind.

Dementsprechend kommt einer genauen Prüfung der Einschlusskriterien und des Selektionsprozesses entscheidende Bedeutung zu. In den vorliegenden systematischen Übersichtsarbeiten ergab die detaillierte Prüfung der Einschlusskriterien, dass in der Mehrzahl der Fälle Unterschiede bestanden, die zwar oft nur wenige Worte betrafen, jedoch zum Teil dazu führten, dass sich die Zahl der eingeschlossenen Studien dramatisch unterschied. In Tabelle 37 sind als Beispiel die Einschlusskriterien der zwischen 1997 und 2000 publizierten systematischen Übersichtsarbeiten zur Depressionsbehandlung mit Hypericumextrakten – soweit möglich im Originalwortlaut – und die Anzahl der jeweils eingeschlossenen placebokontrollierten Studien wiedergegeben. Die Zahl der eingeschlossenen Primärstudien variiert zwischen 2 und 17 bei insgesamt 20 Studien, die in mindestens einem Review berücksichtigt waren. Die unterschiedliche Verfügbarkeit aufgrund des Alters der Reviews spielte dabei eine untergeordnete Rolle. Die Einschlusskriterien, die die Studienzahl am meisten einschränkten, sind in Tabelle 37 in kursiver Schrift dargestellt. So ist der primäre Grund der geringen Studienzahl im Review von Gaster (142) die Begrenzung auf Publikationen in englischer Sprache. Bei Kim et al. (235) ist die geringe Studienzahl praktisch ausschliesslich durch die Begrenzung auf Untersuchungen, in denen die Klassifikation der Depression explizit nach ICD 10 oder DSM Kriterien erfolgte, begründet. Bei Williams et al. (509) ist die Mindestdauer der Behandlung von 6 Wochen das entscheidende Kriterium. Eine Nichtidentifikation einer relevanten Zahl von Studien kann in den neueren Reviews praktisch ausgeschlossen werden, da diese einen älteren und bereits deutlich umfangreicheren Review (286) zitieren.

Dagegen hatte z.B. ein potentiell sehr relevanter Unterschied in den Einschlusskriterien im Fall von Hypericum faktisch nur einen minimalen Einfluss auf die Primärstudienzahl: Der Einbezug bzw. Nichteinbezug von Kombinationspräparaten (d.h. Präparaten, in denen neben Hypericum auch andere Pflanzenextrakte enthalten sind). Im Gegensatz hierzu würde z.B. bei [Seite 106↓]Echinaceapräparaten der Ausschluss von Kombinationspräparaten die Studienzahl erheblich reduzieren.

Tabelle 37: Einschlusskriterien in systematischen Übersichtsarbeiten zu Hypericumextrakten bei Depression und Anzahl der jeweils eingeschlossenen placebokontrollierten Studien

Review

Patienten bzw. Indikation

Intervention

Design

Andere

Studien

Volz (485)

Depressed patients

Hypericum mono-preparations

Double-blind clinical trial

-

11

Linde (285)

Depressive disorders

1. Hypericum monoprep.

2. Combinations

Randomized clinical trials

-

16

1

Kim (235)

Depressive disorder acc. to ICD10/DSM

Hypericum mono-preparations

Blinded controlled trials

Outcome Hamilton Rating Scale Depression

2

Gaster (142)

Depressive disorder

Hypericum mono-preparations

Double-blind RCTs

Available in English

4

Williams (509)

Depressive disorders

Herbal preparations incl. Hypericum

RCTs

At least 6 weeks duration

8

Weitere Beispiele von dramatischen Unterschieden in der Primärstudienzahl aufgrund von divergierenden Einschlusskriterien sind die zwei neueren Reviews zur Cholesterinsenkung mit Knoblauchpräparaten (Unterschiede bzgl. Blindbedingungen und präsentierten Daten; zusätzlich wahrscheinlich Unterschiede bei der Literatursuche) sowie die drei Meta-Analysen zur Frage, ob Homöopathie Effekte über Placebo hinaus hat (Begrenzung auf Studien mit vordefiniertem Hauptzielkriterium in (76) und auf in den Datenbanken Medline oder Embase gelisteten Studien in (489) gegenüber Einschluss aller Studien mit verwertbaren Ergebnisdaten in (278))

Aufgrund der Komplexität der Literatursuchen und den daraus resultierenden Ungenauigkeiten in der Beschreibung ist die Vergleichbarkeit der Suchmethoden und deren Auswirkungen auf die Vollständigkeit selbst für methodisch erfahrene Leser schwer zu beurteilen. Während für Suchen in der Datenbank Medline zumindest zum Teil Details wie Suchbegriffe und Suchzeitraum angegeben sind, die eine Reproduzierbarkeit bis zu einem gewissen Grade gewährleisten, ist dies für andere Datenbanken fast nie der Fall. Die Effizienz anderer Suchmethoden wie Kontakte mit Experten oder das Durchsuchen der Literaturangaben gefundener Arbeiten ist ebenfalls nicht überprüfbar. In den vorliegenden Übersichtsarbeiten waren die verwendeten Suchstrategien in keinem einzigen Fall genau identisch. Die Auswirkungen der Unterschiede bei den Suchstrategien sind aber nur durch den Vergleich der jeweils tatsächlich zitierten Studien unter Berücksichtigung der Einschlusskriterien abschätzbar. Als Beispiel sind in Box 2 die Suchmethoden der beiden Übersichtsarbeiten zu Echinacea vereinfacht zusammengefasst.


[Seite 107↓]

Box 2

Literatursuchmethoden bzw. -quellen in systematischen Übersichtsarbeiten zu Echinaceaextrakten

Barrett et al. (29): Medline (Suchbegriff Echinacea), Kontakt mit Experten, Durchsuchen der Literaturangaben gefundener Arbeiten Melchart et al. (320): Datenbanken Medline, Embase, Cochrane Acute Respiratory Infections Collaborative Review Group, Cochrane Complementary Medicine Field, Phytodok mit dem Suchbegriff Echinac*; Durchsuchen der Literaturangaben gefundener Arbeiten, Kontakt mit Experten und Herstellern, Abstractbänden von Kongressen

Obwohl die Suchmethoden in der Übersicht von Melchart et al. (320) wesentlich umfangreicher sind, ist die Studiensammlung von Barrett et al. (29) fast identisch (vermutlich weil Barrett viele Studien mit Hilfe eines früheren Review von Melchart et al. (322) erfasste, der bereits die meisten Studien eingeschlossen hatte). Dagegen können auf den ersten Blick ähnlich umfangreiche Literatursuchen wie im Beispiel der beiden Knoblauch-Reviews (268;443) offensichtlich deutlich unterschiedliche Suchergebnisse erbringen.

Die Beschreibung des Selektionsprozesses (der Prozess, in dem aus den durch die Literatursuche identifizierten Referenzen die letztlich eingeschlossenen Primärstudien selektiert werden) ist in vielen Übersichtsarbeiten nicht genau genug, um mit Sicherheit ausschliessen zu können, dass trotz gleicher Einschlusskriterien unterschiedliche Studien ausgewählt werden. In einigen Fällen wurden nicht nachvollziehbare Diskrepanzen festgestellt, z.B. bei den Übersichtsarbeiten zu Akupunktur bei Nackenschmerzen (415;502). Hier ist anzunehmen, dass die als Einschlusskriterium genannte Indikation Nackenschmerzen unterschiedlich definiert wurde, sodass Smith et al. (415) Studien ausschlossen, die White und Ernst (502) berücksichtigten.

Aufgrund der häufig unterschiedlichen Instrumente zur Qualitätsbeurteilung ist ein unmittelbarer Vergleich der Bewertungen der einzelnen Primärstudien schwierig. Der Großteil aller Reviews bemängelt aber die überwiegend mäßige Qualität der Primärstudien. Deutliche Diskrepanzen in der Gesamtbeurteilung traten eigentlich nur bei den Übersichtsarbeiten zur Akupunktur bei Schmerzen im Bereich der Lendenwirbelsäule auf. Ernst und White bewerteten die Qualität als überwiegend gut („good in the majority of studies“ (127), S. 2237), van Tulder et al. als extrem schlecht („methodological quality was ... extremely poor“ (465), S. 1120) und Smith et al. als überwiegend schlecht („majority of trials were of poor quality“ (415), S. 123).

Die Methoden zur Zusammenfassung der Ergebnisse unterschieden sich in mehr als der Hälfte der Vergleiche in relevanter oder potentiell relevanter Weise. Zum Einsatz kamen deskriptive Ergebniszusammenfassungen, Ergebniskategorisierungen (vote counts) und Effektstärkebe­rechnungen mit und ohne Meta-Analysen. Wiederum waren hier die Diskrepanzen der drei Übersichtsarbeiten mit Studien zur Akupunktur bei Schmerzen im Bereich der Lendenwirbelsäule besonders auffällig. Ernst und White (127) führten quantitative Effektstärkeberechnungen einschl. Meta-Analyse durch, van Tulder et al. (465;466) Effektstärkeberechnungen und Ergebniskategorisierungen und Smith et al. (415) Ergebniskategorisierungen. Die beiden letzten [Seite 108↓]Reviews präsentierten außerdem deskriptive Zusammenfassungen der Studienergebnisse. Die Ergebniskategorisierungen von van Tulder et al. und Smith et al. unterscheiden sich sowohl bzgl. der Kategoriendefinition als auch bzgl. der letztlich erfolgten Beurteilungen (siehe Tabelle 38). In beiden Reviews wird zwischen den Interpretationen der Primärstudienautoren und der Reviewer unterschieden, aber sogar hinsichtlich der ersteren gibt es relevante Differenzen.

Tabelle 38: Ergebniskategorisierungen der Rückenschmerzstudien, die sowohl in den Review von van Tulder et al. (465;466) als auch in denjenigen von Smith et al. (415) eingeschlossen worden waren. Van Tulder et al. wendeten eine dreistufige Kategorisierung an (positiv, neutral, negativ) mit einer Option unklar, während Smith et al. die Studien als positiv oder negativ bewerteten. Beide Reviewteams führten separate Kategorisierungen der Schlussfolgerungen der Autoren der Primärstudien und der Reviewer durch.

 

van Tulder et al.

Smith et al.

van Tulder et al.

Smith et al.

Studie

Schlussfolgerung Autor

Schlussfolgerung Autor

Schlussfolg. Reviewer

Schlussfolg. Reviewer

Coan et al.

Positiv

Positiv

Unklar

Positiv

Duplan et al.

Positiv

Positiv

Positiv

Negativ

Edelist et al.

Neutral

Negativ

Neutral

Negativ

Garvey et al.

Positiv

Negativ

Neutral

Negativ

Gunn et al.

Positiv

Positiv

Neutral

Positiv

Lehmann et al.

Positiv

Negativ

Neutral

Negativ

Lopacz & Gralewski

Neutral

Negativ

Neutral

Positiv

Mendelson et al.

Neutral

Negativ

Unklar

Negativ

Die Verwendung unterschiedlicher meta-analytischer Methoden ist am deutlichsten am Beispiel der Übersichtsarbeiten zu dem Thema, ob Homöopathie Effekte über Placebo hinaus bewirkt. Cucherat et al. (76) verwendeten eine Methode, bei der die p-Werte der einzelnen Studien kombiniert wurden, Walach (489) berechnete standardisierte Mittelwertsdifferenzen und Linde et al. (278) Odds Ratios. Dies sind völlig unterschiedliche Ansätze zur Quantifizierung von Effekten. In allen drei Meta-Analysen wurden dagegen übereinstimmend für die primären Analysen sogenannte random effects Modelle verwendet (d.h. es wird angenommen, dass der „wahre“ Effekt in den einzelnen Studien differiert. Bei fixed effects Modellen wird dagegen angenommen, dass der „wahre“ Effekt in allen Studien gleich ist). Bei zwei der drei Meta-Analysen (76;278) ergab sich eine signifikante Überlegenheit der homöopathischen Interventionen gegenüber Placebo, bei der dritten (489) dagegen nicht. Dies ist vermutlich auf die Wahl eines speziellen random effects Modells (Hunter und Schmidt) zurückzuführen, welches bei großer Zwischen­studienheterogenität zu extrem weiten Konfidenzintervallen führt.

Eine Auswirkung des gewählten Meta-Analyse-Modells war jedoch nur bei dieser Fragestellung zu erkennen. In den drei anderen Fällen, in denen in mehr als in einem Review eine Meta-Analyse [Seite 109↓]durchgeführt worden war (Hypericum bei Depression und bei beiden Reviewsets zu Knoblauch zur Cholesterinsenkung), waren die (geringen) Unterschiede der berechneten Effektmaße mit großer Wahrscheinlichkeit auf die Unterschiede hinsichtlich der einbezogenen Primärstudien zurückzuführen.

Im Vergleich zu den großen Diskrepanzen bei Einschlusskriterien und Primärstudienzahl sind die Differenzen bei den Schlussfolgerungen gering. Die Schlussfolgerungen sind aber auch in den meisten Fällen angesichts der Evidenzlage sehr zurückhaltend. Differenzen scheinen eher durch die Unterschiede in der grundsätzlichen Haltung der Autoren zu der Intervention begründet als in den Daten selbst.

4.4 Diskussion

4.4.1 Zusammenstellung der systematischen Übersichtsarbeiten zu Akupunktur, Phytotherapie
und Homöopathie

Die Zusammenstellung zeigt, dass zu den untersuchten komplementärmedizinischen Verfahren eine nicht unerhebliche Anzahl von systematischen Übersichtsarbeiten vorliegt. Dennoch ist die Evidenz nur in Einzelfällen eindeutig.

Bei der Akupunktur wurden nur im Falle der P6-Stimulation zur Prävention der postoperativen Übelkeit (Wirksamkeit im Vergleich zur Scheinakupunktur belegt und ähnliche Wirksamkeit wie gängige Antiemetika) und der Raucherentwöhnung (kein Effekt einer Verum- im Vergleich zu einer Scheinakupunktur) eindeutige Schlussfolgerungen gezogen. Angesichts der weiten Verbreitung der Akupunktur und der vergleichsweise großen Zahl von Primärstudien ist diese Tatsache frustrierend. Das Hauptproblem in den Akupunkturstudien scheinen die unzureichenden Fallzahlen zu sein. Die medianen Fallzahlen der Studien zu Rückenschmerzen, Kopfschmerzen und Schmerzen bei Osteoarthrose waren z.B. 50 (465), 37 (390) und 31 (107). Ein zweites großes Problem ist die methodische Qualität der Primärstudien. Praktisch alle Reviews enden mit dem Ruf nach größeren und methodisch besseren Studien.

Ein möglicher Grund für das Fehlen solcher Studien dürfte – zumindest in der Vergangenheit – die fehlende finanzielle Förderung derartiger Studien gewesen sein. Das Industrieinteresse an Akupunktur ist gering, sodass einer relevante Förderung nur durch die öffentliche Hand realistisch erscheint. Eine solche Förderung hat erst in den letzten Jahren eingesetzt. In Deutschland, den USA und Grossbritannien sind derzeit mehrere große Studien in der Planung, in Durchführung oder zum Teil bereits abgeschlossen und im Publikationsprozess. Ein weiterer und verwandter Grund war bislang das Fehlen einen adäquaten Forschungsinfrastruktur, d.h. von [Seite 110↓]Personengruppen und Einrichtungen, die über ausreichendes Know-how sowohl in der Akupunktur wie auch in der klinischen Forschung verfügten. Ein dritter Grund ist, dass klinische Forschung zur Akupunktur in der Tat methodisch schwierig ist. Der Begriff Akupunktur bezeichnet (vergleichbar mit der Situation bei anderen nichtmedikamentösen Verfahren wie z.B. der Physiotherapie) eine heterogene Gruppe von Interventionen. Aufgrund von Ergebnissen zu einer definierten Akupunkturstrategie kann kaum eine Aussage zur Akupunktur insgesamt abgeleitet werden. Äußerst schwierig ist auch die Wahl einer adäquaten Kontrollgruppe. Aufgrund der aus westlicher Sicht geringen Plausibilität der Akupunktur wird häufig der Nachweis der „spezifischen“ Wirksamkeit gegenüber Placebo gefordert. Verschiedenste Vorgehensweisen wurden als „Placebo“ eingesetzt, wie z.B. die Nadelung an nicht-indizierten Punkten, an Nichtakupunkturpunkten (mit tiefer oder oberflächlicher Nadelung), ausgeschaltete Laserakupunktur- oder TENS-Geräte (transkutane elektrische Nervenstimulation), sogenannte Placebo-Nadeln (in ein Pflaster gesteckte Teleskopnadeln, die nicht in die Haut eindringen) etc. Die Verfahren, bei denen eine Hautpenetration erfolgt, sowie Verfahren, bei denen ein starker Druckreiz an Akupunkturpunkten erfolgt, können sicher nicht als physiologisch inert angesehen werden und könnten damit zu einer Unterschätzung der Wirksamkeit der Akupunktur führen. Dagegen sind z.B. bei der Verwendung eines ausgeschalteten Laserakupunkturgerätes Blindbedingungen nur möglich, wenn die Patienten nicht vollständig aufgeklärt werden. Angesichts dieser massiven methodischen Probleme sind die heterogenen und zum Teil widersprüchlichen Ergebnisse der vorliegenden Akupunkturstudien durchaus plausibel.

Mehrere der Reviews fanden eine negative Korrelation zwischen Studienqualität und Ergebnis, d.h. bessere Studien waren öfter negativ (z.B. (131;415)). Diese Resultate sind mit Zurückhaltung zu interpretieren. Die entsprechenden Reviews schlossen Studien mit sehr unterschiedlichen Kontrollgruppen ein: Wartelistenkontrollen bzw. keine Behandlung, die verschiedenen beschriebenen Scheinakupunkturverfahren und verschiedene aktive Kontrollinterventionen. Es ist nicht davon auszugehen, dass die Unterschiede zwischen Akupunktur und diesen verschiedenen Kontrollen alle gleich sind. Z.B. würde man bei Studien mit Wartelistenkontrolle größere Unterschiede erwarten als bei Studien mit Scheinakupunkturkontrolle. Akupunkturstudien ohne Scheinakupunkturkontrolle können aber nicht verblindet werden und schneiden daher bei der Qualitätsbewertung typischerweise schlechter ab. Untersuchungen zu Zusammenhängen zwischen Studienqualität und Ergebnis sollten daher grundsätzlich nur bei Studien mit gleicher Kontrollintervention durchgeführt werden.

Im Bereich der Phytotherapie sind die Ergebnisse und Schlussfolgerungen der meisten Übersichtsarbeiten tendenziell positiv. Aufgrund methodischer Probleme oder geringer Primärstudienzahlen sind definitive Schlussfolgerungen aber auch hier die Ausnahme. Auffällig ist die Häufung systematischer Übersichtsarbeiten zu Hypericum, Ginkgo und Knoblauch. Dies liegt [Seite 111↓]vermutlich an der relativ großen Zahl verfügbarer Primärstudien und an der Tatsache, dass es sich um weitverbreitete und für die Pharmaindustrie relevante Phytotherapeutika handelt. Insgesamt beschränken sich die Phytotherapie-Reviews – ebenso wie die überwiegende Zahl der Primärstudien – auf Extrakte, die in der Vermarktung eine Rolle spielen und bei denen Chancen auf eine Zulassung als Arzneimittel am europäischen oder nordamerikanischen Markt bestehen. Allerdings liegen für einige weit verbreitete Extrakte (z.B. Crataegusextrakte) bisher noch keine systematischen Übersichtsarbeiten vor. Viele traditionelle phytotherapeutische Anwendungen wie Teeanwendungen oder phytotherapeutische Strategien in Entwicklungsländern werden aber aufgrund mangelnden finanziellen Interesses gar nicht untersucht.

Bei der Phytotherapie erscheint die Gefahr des publication bias (242), d.h. der Nichtveröffentlichung negativer Ergebnisse, besonders groß. Phytotherapeutika werden häufig von mittelständischen Unternehmen hergestellt, für die eine negative Studie eine existenzielle Bedrohung darstellen kann. Allerdings kommt es aufgrund der fehlenden Patentierbarkeit auch zur gegenteiligen Situation: Hersteller verhindern die Publikation positiver Studien zu ihrem Präparat, damit die Daten nicht von einem Konkurrenten für die Zulassung seines Präparates mit einem ähnlichen Extrakt verwendet werden können.

Ein weiteres großes Problem von systematischen Übersichtsarbeiten zu Pflanzenextrakten ist die häufig unklare Vergleichbarkeit unterschiedlicher Produkte bzw. Extrakte. Dieses Problem spielt in der Expertendiskussion eine große Rolle, ist aber für die meisten Leser einer Übersichtsarbeit kaum einschätzbar. Besonders verwirrend ist die Situation z.B. bei Echinaceaprodukten: Es gibt drei verschiedene, medizinisch relevante Echinaceaarten (E. purpurea, pallida und angustifolia), verwendet werden Wurzeln, oberirdische Anteile, nur Blätter oder verschiedene Teile, es gibt hydro- und lipophile Extraktionsmethoden und letztendlich sind in vielen marktüblichen Präparaten weitere Pflanzenextrakte beigemischt. Die Durchführung von quantitativen Meta-Analysen ist in einer solchen Situation nicht sinnvoll. Sichere Aussagen lassen sich letztlich meist nur für die einzelnen geprüften Extrakte machen.

Bei den Übersichtsarbeiten zur Homöopathie spielt die grundsätzliche Frage nach der Wirksamkeit im Vgl. zu Placebo unabhängig von der Indikation oder der speziellen homöopathischen Vorgehensweise eine dominierende Rolle. Konkrete klinische Fragestellungen wurden nur in etwa der Hälfte der Übersichten bearbeitet. Von diesen Fragestellungen ist wiederum nur ein Teil für die homöopathische Praxis relevant, während sich andere Reviews mit nur aus Forschungssicht potentiell bedeutsamen Themen befassen (z.B. der Behandlung des postoperativen Ileus oder des Muskelkaters). Dementsprechend können die vorliegenden Übersichten für klinisch tätige Homöopathen und „Schulmediziner“ keine Evidenzbasis für ärztliche Entscheidungen bilden.


[Seite 112↓]

Es muss nochmals darauf hingewiesen werden, dass die vorliegende Zusammenstellung der Übersichtsarbeiten zu Akupunktur, Phytotherapie und Homöopathie nur einen sehr groben Überblick der Evidenzlage zu diesen Verfahren geben kann. Es kann nicht das Ziel einer solchen Zusammenstellung sein, die Wirksamkeit dieser Verfahren differenziert zu beurteilen. Die Zusammenfassung eines systematischen Reviews, der selbst wiederum die Zusammenfassung einer Reihe von Primärstudien ist, in wenigen Sätzen oder in einer Tabelle muss Ergebnisse und Schlussfolgerungen in hohem Maße vereinfachen. Für genauere Informationen oder wenn klinische Entscheidungen getroffen werden sollen, ist es daher für den Leser unumgänglich, die jeweiligen systematischen Übersichtsarbeiten genau zu studieren. Die Zusammenstellung erleichtert jedoch den Zugang hierzu in hohem Maße und gibt eine Orientierung, zu welchen Fragestellungen überhaupt Reviews vorliegen.

4.4.2 Merkmale und Qualitätsbewertung der Übersichtsarbeiten zu allen drei Therapien

Die Analyse der Merkmale und Qualität der bearbeiteten systematischen Reviews zeigt, dass (1) sich die Art der Fragestellungen in den drei Verfahren deutlich unterscheidet, (2) viele Übersichtsarbeiten relevante methodische Defizite bzw. Defizite bei der Beschreibung der angewandten Methoden haben und dass (3) die Schlussfolgerungen zur Phytotherapie am häufigsten positiv und bei der Akupunktur besonders häufig ambivalent bzw. weniger positiv sind.

Ad (1): Die Fragestellungen der vorliegenden Übersichtsarbeiten sind am spezifischten in der Phytotherapie, d.h. sie sind vergleichsweise klar definiert in Bezug auf die Prüf- und Kontrollinterventionen sowie auf die Indikation, z.B. „Sind Hypericumextrakte wirksamer als Placebo bei der Behandlung von Depressionen?“ Bei der Akupunktur sind in der Regel die Indikationen definiert, die Intervention ist jedoch meist die „ganze“ Akupunktur und in Bezug auf die Interventionen in der Kontrollgruppe sind die Einschlusskriterien meist weit, z.B. „Ist (jede Form der) Akupunktur wirksam bei Asthma?“ Bei der Homöopathie ist die Fragestellung häufig noch allgemeiner, z.B. „Ist Homöopathie (bei allen Indikationen in jeder Anwendungsweise) wirksamer als Placebo?“ Die Ansätze reflektieren einerseits die unterschiedliche Plausibilität der Wirkungsmechanismen sowie die Eigenheiten der Verfahren. So ist bei der Akupunktur eine Einschränkung auf definierte Einzelstrategien ähnlich wie bei anderen nichtmedikamentösen Verfahren wie z.B. der Chirotherapie oder der Physiotherapie nur in Einzelfällen möglich. Es muss aber klar sein, dass die Ergebnisse und Schlussfolgerungen aus Übersichtsarbeiten mit so unterschiedlich spezifischen Fragestellungen nicht in gleicher Weise für klinische Entscheidungen herangezogen werden können. Im Vergleich zu Übersichtsarbeiten zu konventionellen Pharmaka ist auch bei den Phytopharmaka, soweit es sich nicht um Übersichten zu einem einzigen Extrakt handelt, aufgrund der Variabilität die Fragestellung in Bezug auf die Intervention weniger spezifiziert.


[Seite 113↓]

Ad (2): Ähnlich wie bei den Primärstudien ist auch bei den Übersichtsarbeiten die Qualität außerordentlich heterogen. Die verwendete Beurteilungsskala von Oxman et al. (355) hat sich bei der Beurteilung nur in eingeschränktem Maße bewährt. Ein Problem mit der Skala, die ursprünglich für die Beurteilung von Übersichtsarbeiten allgemein und nicht von systematischen Übersichtsarbeiten im Speziellen entwickelt wurde, ist, dass nur sehr kurzgefasste Anleitungen für die Beantwortung der einzelnen Fragen vorliegen (persönliche Kontakte mit Andrew Oxman, 1997), die einen weiten Beurteilungsspielraum lassen. Für die durchgeführte Analyse wurden nur für einige besonders unklare Punkte (wie z.B. die Beurteilung der Studienselektion) Konkretisierungen in den Anleitungen vorgenommen. Weitergehende Eingriffe wurden als problematisch angesehen, da die Validierung der Skala mit den Originalanleitungen erfolgt war (356). Bei einigen Fragen (zur Beschreibung und Angemessenheit der Auswertungsmethoden sowie zur Nachvollziehbarkeit der Schlussfolgerungen) war aber nun in unserer Analyse die Übereinstimmung zwischen den Reviewern unbefriedigend. Außerdem erschien in der Zwischenzeit eine Analyse von systematischen Übersichtsarbeiten zu verschiedenen Interventionen bei Asthma von Jadad et al. (205), in der die Oxmanskala ebenfalls verwendet wurde. Die Beurteilungsanleitungen waren jedoch für diese Analyse – insbesondere für die Gesamtbewertung in Frage 10 - in hohem Maße verschärft worden. Zwei der von Jadad et al. beurteilten Reviews wurden auch in die hier vorgelegte Analyse eingeschlossen (280;281). Zwar war die Beurteilung bei den Fragen 1 bis 9 weitgehend gleich, bei Frage 10 wurden die beiden Reviews von Jadad et al. (jeweils aufgrund eines definierten Kritikpunkts) als fehlerhaft, in der vorliegenden Analyse dagegen als weitgehend fehlerfrei eingestuft. Es macht wenig Sinn, sich auf eine validierte Skala zu beziehen, wenn die Anleitungen für die Bewertung deutlich modifiziert werden. Für die Beurteilung von systematischen Übersichtsarbeiten sind die Originalanleitungen von Oxman et al. aber einfach zu ungenau. Wie bei der formalen Beurteilung von klinischen Studien gilt jedoch auch bei systematischen Übersichtsarbeiten grundsätzlich, dass mit Checklisten und Skalen nur eine grobe Bewertung möglich ist.

1999 wurden Leitlinien für die Publikation von Meta-Analysen publiziert (327), die möglicherweise zu einer Verbesserung der Qualität und der Berichterstattung führen werden. Einige der enthaltenen Empfehlungen sind jedoch nur auf quantitative Meta-Analysen mit sehr eng definierten Fragestellungen anwendbar, während sie für systematische Übersichtsarbeiten mit weiteren Fragestellungen nicht umsetzbar sind.

Ad (3): Bei den häufig positiven Schlussfolgerungen bei der Phytotherapie muss berücksichtigt werden, dass fast die Hälfte der systematischen Übersichtsarbeiten zu Ginkgo, Hypericum und Knoblauch durchgeführt wurden, bei denen die Evidenz im Vergleich zu anderen Pflanzen gut ist. Bei der Akupunktur ist die in 4.4.1. diskutierte Heterogenität von Prüf- und Kontrollinterventionen und die geringe Fallzahl zu beachten.


[Seite 114↓]

Dem Autor dieser Monographie sind nur wenige vergleichbare deskriptiv-epidemiologische Analysen zu Übersichtsarbeiten in der konventionellen Medizin bekannt (z.B. (204)). Solche Untersuchungen erscheinen sinnvoll, um allgemeine Trends in den Vorgehensweisen, Schwachstellen und Entwicklungen zu erfassen. Im Rahmen der Cochrane Collaboration werden aber derzeit zahlreiche empirische Untersuchungen zu verschiedensten Aspekten systematischer Reviews durchgeführt (siehe Cochrane Methodology Register in der Cochrane Library), die zu weiteren methodischen Entwicklungen führen werden.

4.4.3 Vergleich der Übersichtsarbeiten zu gleichen Fragestellungen

Trotz der zu erwartenden methodischen Weiterentwicklungen in Bezug auf systematische Übersichtsarbeiten sind die Ergebnisse der vergleichenden Analyse der Reviews zu gleichen Fragestellungen beunruhigend. Es wurde gezeigt, dass Einschlusskriterien, Literatursuche und die Zahl der eingeschlossenen Primärstudien zumindest in den drei komplementärmedizinischen Bereichen häufig und in hohem Ausmaß differierten.

Ein entscheidender Punkt in der hier präsentierten vergleichenden Analyse ist die Frage, was als gleiche Fragestellung bezeichnet werden kann. Hierzu dürften Forscher, die selbst systematische Reviews durchführen und der durchschnittliche Leser solcher Arbeiten völlig unterschiedliche Ansichten haben. Für den erfahrenen Reviewer ist klar, dass die Fragestellung letztendlich durch die Einschlusskriterien definiert wird und dass unterschiedliche Einschlusskriterien zu divergierenden Ergebnissen führen können. Der durchschnittliche Leser aber wird sich daran orientieren, was explizit als Ziel oder Fragestellung in Abstract oder Einleitung genannt ist. Von verschiedenen Reviews zu einer Frage wie „Sind Hypericumextrakte wirksamer als Placebo in der Behandlung der Depression?“ wird er sich – wenn er davon ausgeht, dass systematische Reviews zuverlässig sind – gleiche Antworten erwarten. Er wird kaum wissen, dass nur durch die Nichtberücksichtigung nicht in Englisch publizierter Studien drei Viertel der vorhandenen randomisierten Studien ignoriert werden. Aus der Sicht des Autors ist es angebracht, für eine vergleichende Analyse die Perspektive der Mehrheit der Leser einzunehmen, die die Ergebnisse eines Reviews perzepieren und interpretieren.

Ein Schwachpunkt der vorgelegten Analyse ist, dass aufgrund begrenzter Ressourcen die Analyse nur vom Autor allein durchgeführt wurde. Das ist bei einer qualitativen Auswertung besonders problematisch, da persönliche Sichtweisen hier einen großen Einfluss haben können.

In der Literatur gibt es eine Reihe von Veröffentlichungen, in denen Beispiele von systematischen Übersichtsarbeiten zum gleichen Thema mit divergierenden Ergebnissen diskutiert wurden (66;74;190;204;231). Keine dieser Untersuchungen kann aber Aussagen darüber machen, wie häufig Diskrepanzen in einer zufälligen oder repräsentativen und gleichzeitig ausreichend großen [Seite 115↓]Stichprobe von Fragestellungen sind. In der vorliegenden Analyse wurde alle 17 Fragestellungen zu Akupunktur, Phytotherapie und Homöopathie, bei denen mehr als zwei Reviews vorlagen, analysiert. In diesen Bereichen sind relevante Nichtübereinstimmungen eher die Regel als die Ausnahme. Bei 10 von 17 Fragestellungen variierte die Anzahl der eingeschlossenen Studien bzw. das Studienset um mehr als 50%. Dass dies nicht zu größeren Diskrepanzen bei den Schlussfolgerungen führte, liegt vermutlich einerseits an der generellen Tendenz, definitive Aussagen aufgrund von methodischen Schwächen der Primärstudien bzw. von zu geringen Studienzahlen zu vermeiden sowie daran, dass sich möglicherweise ein- und ausgeschlossene Studien bzgl. der Ergebnisse wenig unterschieden.

Es gibt überzeugende Evidenz, dass bei randomisierten Studien eine bessere methodische Qualität mit weniger positiven Ergebnissen assoziiert ist (287;331;406) (siehe auch Kapitel 3). Bzgl. systematischer Reviews sind die wenigen verfügbaren Ergebnisse über einen Zusammenhang zwischen Qualität und Schlussfolgerung widersprüchlich. Während Jadad und McQuay (204) fanden, dass weniger hochwertige Reviews häufiger positive Ergebnisse hatten, war bei Katerndahl und Lawler (231) das Gegenteil der Fall und Jadad et al. (205) fanden keinen Zusammenhang. In der vorliegenden Analyse scheint die Qualität nicht ein vorrangiger Grund für die Diskrepanzen zu sein. Z.B. gibt es beim Thema Hypericum bei Depression gute Argumente, entweder alle Studien (wie in (285)), nur Studien mit einer Diagnosestellung nach hochwertigen Kriterien (235) oder nur Studien mit mindestens 6 Wochen Behandlungsdauer (509) einzuschliessen. Solche fundamentalen Einschränkungen, die dazu führen, dass die jeweilige Übersicht sich von einer älteren deutlich unterscheidet, sollten jedoch bereits in der Einleitung einer Publikation explizit dargelegt werden.

Möglicherweise sind bei komplementärmedizinischen Interventionen aufgrund der häufig wenig spezifischen Fragestellungen Diskrepanzen häufiger wie in der konventionellen Medizin. Es erscheint jedoch sinnvoll, auch hier systematische vergleichende Analysen anzustellen.

Die vorgelegten Ergebnisse sollten nicht als Aufforderung missverstanden werden, wieder primär nichtsystematische, narrative Reviews durchzuführen. Ohne explizite, transparente und rigorose Methoden werden Übersichtsarbeiten sicher nicht besser. Es wäre aber irrig zu glauben, dass bei der Vielzahl von Entscheidungen, die bei der Erstellung eines Protokolls und während der Durchführung eines systematischen Reviews getroffen werden müssen, in jedem Fall zuverlässige und reproduzierbare Ergebnisse zu erwarten sind.


© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 3.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
04.08.2004