5 Untersuchungsmethodik

↓90

5.1  Untersuchungsdesign

↓91

Die in der vorliegenden Arbeit durchgeführten empirischen Analysen basieren auf den Daten einer multizentrischen Evaluationsstudie. Diese wurde im Rahmen des Forschungsprojektes „QualitätsManagementSystem für die medizinische Rehabilitation Muskulo-Skelettaler Krankheiten“ (MSK-QMS Studie) am Lehrstuhl für Versorgungssystemforschung und Qualitätssicherung in der medizinischen Rehabilitation der Humboldt-Universität zu Berlin (Verantwortlicher: Herr Prof. Dr. Werner Müller-Fahrnow) wissenschaftlich begleitet und von der Unternehmensgruppe Dr. Marx (MEDIAN Kliniken GmbH & Co. KG; Verantwortlicher: Herr PD Dr. Jörg-Rüdiger Blau) finanziell gefördert. Insgesamt umfasste das Projekt zwei multizentrische Längsschnittstudien, die in 14 bzw. 13 orthopädischen Rehabilitationskliniken der Unternehmensgruppe durchgeführt wurden. Die wesentliche Aufgabenstellung bestand in der Evaluation der Prozess- und Ergebnisqualität der rehabilitativen Behandlung von Patienten nach Knie- und Hüftgelenkersatz – zwei der bedeutsamsten Krankheitsbilder der orthopädischen Rehabilitation. Zu beiden Studien liegen umfassende Dokumentationen vor, an denen die Autorin der vorliegenden Arbeit maßgeblich mitgearbeitet hat (Dohnke, Blau, Wilhelm & Müller-Fahrnow, 2002; MEDIAN Kliniken, 2002; MEDIAN Kliniken, 2003).

Die hier vorgestellte Ergebnisanalyse basiert auf der zweiten multizentrischen Längsschnittstudie zur Rehabilitation nach Hüftgelenkersatz. Das Untersuchungsdesign sah zum Aufnahme- und Entlassungszeitpunkt in der Rehabilitationsklinik eine schriftliche Patientenbefragung sowie eine Befunderhebung durch den Arzt vor. Sechs Monate nach Abschluss der stationären Rehabilitationsmaßnahme erfolgte eine schriftliche Nachbefragung (Katamnese) der Patienten (siehe Abbildung 13). Zusätzlich lagen Daten aus der klinikinternen so genannten Basisdokumentation und dem einheitlichen ärztlichen Entlassungsbericht der Gesetzlichen Rentenversicherung (E-Bericht der GRV) vor. Die notwendige Datenerhebung und Dateneingabe wurde vollständig in den Rehabilitationskliniken organisiert und durchgeführt.

Abbildung 13: Untersuchungsdesign.

↓92

Im Untersuchungszeitraum von September 2000 bis August 2001 wurden alle Patienten um ihre Teilnahme an der Studie gebeten, die aufgrund eines erfolgten Hüftgelenkersatzes zur stationären Rehabilitationsmaßnahme in eine der beteiligten Kliniken aufgenommen wurden. Auf diese Weise nahmen insgesamt 1065 Patienten teil. Die katamnestische Patientenbefragung wurde im April 2002 abgeschlossen.

5.2 Erhebungsinstrumente

Die Datenerhebung erfolgte über einen Patientenfragebogen und einen Arztbefundbogen, die theoriegeleitet bzw. in Anlehnung an etablierte Instrumente konzipiert wurden. Zusätzlich lagen Daten aus der klinikinternen so genannten Basisdokumentation und dem einheitlichen ärztlichen Entlassungsbericht der Gesetzlichen Rentenversicherung (E-Bericht der GRV) vor.

5.2.1  Patientenfragebogen

Für das Forschungsprojekt wurde der Patientenfragebogen theoriegeleitet und unter Rückgriff auf etablierte Instrumente selbst entwickelt. Mit ihm wurden die Beschwerden (der Gesundheitszustand), spezifische Ergebnis- und Selbstwirksamkeitserwartungen, dispositionaler Optimismus (Scheier & Carver, 1985; Scheier et al., 1994; Wieland Eckelmann & Carver, 1990), Depressivität (Hautzinger & Bailer, 1993) und verschiedene globale Zufriedenheitsmaße erfasst. Des weiteren wurden Fragen zur präoperativen Aufklärung, zur Rehabilitationsmaßnahme sowie zur anschließenden ambulanten Versorgung gestellt. Den Aufbau des Patientenfragebogens veranschaulicht Tabelle 5 (vgl. auch 9. Anhang A).

↓93

Tabelle 5: Überblick über den Aufbau des Patientenfragebogens

Dimension

Parameter / Skalen

t1

t2

t3

Gesundheitszustand

Schmerzen [4 Items]

+

+

+

ADL-Funktionen [10 Items]

+

+

+

Allgemeiner Gesundheitszustand

+

+

+

Zufriedenheit

Gesundheitszufriedenheit

+

+

+

Lebenszufriedenheit

+

+

+

Zufriedenheit mit dem Ausmaß der eigenen Selbstständigkeit

+

+

+

Erwartungen

Schmerzen [4 Items]

+

+

ADL-Funktionen [10 Items]

+

+

Selbstwirksamkeit

Selbstwirksamkeitserwartungen

+

+

+

Optimismus

Dispositionaler Optimismus (modifizierter LOT-R)

+

+

+

Depressivität

Depressivität (ADS-K)

+

+

+

Präop. Aufklärung

über OP

+

über alltägliche Auswirkungen der Operation

+

Beurteilung der Reha

insgesamt

+

therapeutische Behandlung

+

ärztliche Betreuung

+

persönlicher Erfolg

+

+

Gefühl, gut auf Leben nach Reha vorbereitet worden zu sein

+

+

Ambulante Versorgung

Beurteilung der ambulanten ärztlichen Betreuung

+

Erhalt krankengymnastischer Leistungen

+

Selbstständige Durchführung krankengymnastischer Übungen

+

Anmerkungen. t1: Aufnahmezeitpunkt. t2: Entlassungszeitpunkt. t3 : Katamnesezeitpunkt (sechs Monate nach Entlassung aus der Rehabilitationsklinik).

5.2.1.1  Beschwerden bzw. Gesundheitszustand

Die Erfassung der Beschwerden bzw. des Gesundheitszustands erfolgte in Anlehnung an den Harris Hip Score (HHS, Harris, 1969). Dieses ist das am häufigsten verwendete und daher auch als Goldstandard bezeichnete klinische Bewertungsschema für das Ergebnis einer Hüftgelenkersatzoperation (Krämer & Maichl, 1993; Murray, 1993). Beurteilt werden hier die zentralen Beschwerden (Therapieziele) bei Hüftgelenkersatz: Schmerzen, Gelenkbeweglichkeit bzw. Aktivitäten des täglichen Lebens (ADL-Funktionen, vgl. Murray, 1993 ).

5.2.1.1.1  Schmerzen

Die Schmerzen wurden über die Schmerzintensität in vier verschiedenen Belastungssituationen erfasst: Schmerz in Ruhe, bei den ersten Schritten, beim Gehen und nach längeren Gehstrecken. Die Einschätzung der Schmerzintensität erfolgte auf einer elfstufigen numerischen Ratingskala (vgl. Geissner, Dalbert & Schulte, 1992) mit den Endpunkten kein Schmerz (0) und stärkster vorstellbarer Schmerz (10).

↓94

Diese vier Items wurden zu einer Schmerzskala aufsummiert. Die interne Konsistenz dieser Skala (Cronbach’s Alpha) betrugt für alle drei Erhebungszeitpunkte jeweils .92 (siehe 10.1 Anhang B). Bei der Interpretation der Item- und Skalenwerte ist zu beachten, dass alle Angaben umgepolt wurden und ein hoher Wert immer einen „guten Gesundheitszustand“, d.h. geringe Schmerzintensität kennzeichnet.

5.2.1.1.2 ADL-Funktionen

Zur Erfassung der ADL-Funktionen wurden die im Harris Hip Score zu beurteilenden Funktionen Gang (gait: Hinken, Gehhilfe, Gehstrecke) und Aktivitäten (activities: Treppensteigen, Anziehen von Schuhen und Socken, Sitzen, Benutzung öffentlicher Verkehrsmittel) übersetzt, als Fragen formuliert und mit dem entsprechenden Antwortformat versehen. Ergänzend wurden Fragen zum „Aufstehen aus dem Sitzen“ (vgl. Standard System of Termoniology for reporting results, Clinical Evaluation, Murray, 1993), zur „Benutzung der Toilette“ und zum „Waschen/Baden/Duschen“ (vgl. Barthel-Index, Johanson, Charlson, Szatrowski & Ranawat, 1992; Mahoney & Barthel, 1965) gestellt.

Das Antwortformat der insgesamt zehn verschiedenen ADL-Funktionen variierte in Abhängigkeit der Vorlage zwischen drei und neun Kategorien. Zum Beispiel wurde die Gehstrecke auf einer fünfstufigen und das Treppensteigen auf einer vierstufigen Skala beurteilt (siehe 9 Anhang A). Um die ADL-Funktionen bei der Skalenbildung – anders als für die Berechnung des Harris Hip Scores – nicht zu gewichten, wurden die Angaben standardisiert. Allerdings konnte eine übliche z-Standardisierung nicht vorgenommen werden, da hierbei der zeitliche Verlauf bzw. Veränderungen vom Aufnahme- bis zum Katamnesezeitpunkt nicht abgebildet würden. Die Mittelwerte wären für jeden Erhebungszeitpunkt Null. Daher wurde eine Standardisierung in Bezug auf den Aufnahmezeitpunkt vorgenommen. Veränderungen werden somit in Streuungseinheiten der Ausgangswerte wiedergegeben. Als Vorlage diente hierbei der Standardisierungsansatz der Längsschnittstudie SIMA (Bedingungen der Erhaltung und Förderung von Selbstständigkeit im höheren Lebensalter, Gassmann, Lang, Oswald, Hagen & Rupprecht, 1999; Oswald et al., 1996; Rupprecht et al., 1993). Nach diesem Ansatz werden für die z-Wert-Berechnungen die Mittelwerte und Standardabweichungen der Patientenangabe zum Aufnahmezeitpunkt von den Teilnehmern herangezogen, für die sowohl Aufnahme- als auch Entlassungswerte vorlagen (N = 922). Jede ADL-Variable wurde am Mittelwert und an der Standardabweichung ihres Ausgangswertes standardisiert. So betragen die Mittelwerte der zstandardisierten Ausgangswerte annähernd Null und ihre Standardabweichung annähernd Eins.

↓95

Infolge einer ausführlichen Itemanalyse wurden die Items „Hinken“ und „Gehhilfe“ bei der Skalenbildung ausgeschlossen. Die Trennschärfen der beiden Aufnahmewerte war kleiner .30 und der beiden Entlassungswerte negativ. Die Ergebnisse durchgeführter Faktorenanalysen bestätigten die mangelhafte Reliabilität bzw. Validität dieser Angaben (siehe 10.2 Anhang B). Die Reliabilität (Cronbach’s Alpha) der Summenskala betrug für die drei Erhebungszeitpunkte > .75.

Bei der Ergebnisdarstellung und Interpretation ist zu beachten, dass die z-Werte gepolt waren und ein positiver z-Wert bei allen Variablen einem „gutem Gesundheitszustand“ entspricht. Somit kennzeichnen positive z-Wert gute bzw. gering eingeschränkte ADL-Funktionen.

5.2.1.1.3 Allgemeiner Gesundheitszustand und Zufriedenheitsangaben

Ergänzend zu diesen krankheitsspezifischen Gesundheitsparametern wurden allgemeine Einschätzungen zur Gesundheit erhoben. Die Beurteilung des allgemeinen Gesundheitszustandes erfolgte über die übliche fünfstufige Antwortskala von sehr gut (1) bis schlecht (5). Daneben wurden globale Einschätzungen der Gesundheits- und Lebenszufriedenheit (Quelle: SOEP) sowie der Zufriedenheit mit dem Ausmaß eigener Selbstständigkeit erfragt. Das Antwortformat der Zufriedenheitsurteile war elfstufig von ganz und gar unzufrieden (0) bis ganz und gar zufrieden (10).

5.2.1.2 Behandlungsergebniserwartungen

↓96

Die Erwartungen wurden im Sinne von spezifischen Ergebniserwartungen parallel zur Beurteilung der Beschwerden Schmerzen und ADL-Funktionen als Behandlungsergebniserwartungen erfasst. Im Patientenfragebogen am Beginn der Rehabilitationsmaßnahme wurden die Erwartungen in Bezug auf das Entlassungszeitpunkt und im Fragebogen am Ende der Behandlung hinsichtlich des Katamnesezeitpunktes formuliert. Die Items wurden so angeordnet, dass die Ergebniserwartung immer der jeweiligen Frage zum aktuellen Zustand folgte. Beide Items hatten das selbe Antwortformat. Wobei die Erwartungs-Items durch die Formulierung „Was erwarten Sie: ... ?“ eingeleitet wurden.

Beispiel:

Zustand: „Wie stark ist derzeit in Ruhe der Schmerz an Ihrer operierten Hüfte?“

↓97

Erwartung: „Was erwarten Sie: Wie stark wird der Schmerz in Ruhe am Ende der Reha sein?“

Zustand: „Welche der angegebenen Gehstrecke trauen Sie sich derzeit zu?“

Erwartung: „Was erwarten Sie: Welche der angegebenen Gehstrecke werden Sie sich am Ende der Reha zutrauen?“

↓98

Parallel zu den beiden Beschwerdeskalen (Schmerzen, ADL-Funktionen) wurden zwei Erwartungsskalen gebildet. Hierzu wurden die ADL-bezogenen Erwartungen nach der in Abschnitt 5.2.1.1.2 beschriebenen Methode z-standardisiert. Die interne Konsistenz (Cronbach’s Alpha) der Summenscores betrug für die Schmerzreduktionserwartungen7 > .90 und für die ADL-bezogenen Erwartungen > .80 (siehe auch 10.2 Anhang B).

Bei der Ergebnisdarstellung und Interpretation ist zu beachten, dass die Erwartungswerte wie die Beschwerdeangaben gepolt waren. Ein positiver Wert entspricht bei allen Variablen einem „gutem Gesundheitszustand“. Somit kennzeichnen positive Erwartungswerte Erwartungen geringer Schmerzen bzw. guter oder gering eingeschränkte ADL-Funktionen.

5.2.1.3 Selbstwirksamkeitserwartungen

Die Operationalisierung des Konstruktes der Selbstwirksamkeitserwartungen erfolgte in Anlehnung an die Theorie von Bandura (1991) und die Arbeiten von Lorig (Lorig et al., 1989a; Lorig et al., 1989b) und Schwarzer (1996). Dabei wurden die drei Charakteristika der Selbstwirksamkeit ihr Allgemeinheitsgrad, Niveau und ihre Gewissheit berücksichtigt (vgl. auch Abschnitt 2.1.1).

↓99

Der Allgemeinheitsgrad (generality) bezieht sich auf den Anwendungsbereich, für den die Selbstwirksamkeit gilt. So kann sie sich auf eine spezifische Situation oder aber auf viele verschiedene Situationen beziehen. Ursprünglich hat Bandura selbst die Selbstwirksamkeit situations-, bereichs- bzw. verhaltensspezifisch konzipiert. Mittlerweile wurde Selbstwirksamkeit auch als generalisiertes, zeitstabiles Konstrukt vorgestellt (Schwarzer, 1994). Da Selbstwirksamkeitserwartungen über verschiedene Lebens- oder Handlungsbereiche beträchtlich variieren können, wird empfohlen, die Konzeption der Selbstwirksamkeit an den Untersuchungskontext anzupassen (Bandura, 1991; Schwarzer, 1994). Ähnlich wie in der Arthritis Self-Efficacy Scale (ASES) von Lorig (Lorig et al., 1989a; 1989b; O'Leary et al., 1988) sollte die Selbstwirksamkeit in der vorliegenden Arbeit hinsichtlich der Bewältigung krankheitsbedingter Beschwerden konzipiert werden. Dabei sollte auch gesundheitsbezogenes Verhalten im Rehabilitationsprozess mit einbezogen werden, das mit der Verringerung der Beschwerden verbunden ist. Indem die Überzeugung, die Beschwerden durch das eigene Verhalten verringern zu können, erfragt wird, bringt jedes Item eine internal-stabile Attribution der Erfolgserwartung zum Ausdruck. Das eigene Verhalten betrifft in der akuten Rehabilitationsphase die aktive Therapiemitarbeit und im Anschluss daran den Transfer dieses Gesundheitsverhaltens: die Durchführung krankengymnastischer Übungen (Heimübungsprogramm) sowie die Einhaltung von bestimmten Verhaltensregeln. Parallel zu den Ergebniserwartungen wurde die Selbstwirksamkeit hinsichtlich der Schmerzbewältigung und Verbesserung der ADL-Funktionen erhoben.

Als zweites wichtiges Merkmal wurde das Niveau oder die Aufgabenschwierigkeit (magnitude) bei der Konstruktion der Items berücksichtigt, indem mögliche Handlungsbarrieren formuliert wurden (vgl. Jerusalem & Schwarzer, 1999; Schwarzer & Fuchs, 1996). Barrieren stellen im Kontext einer Rehabilitationsmaßnahme bzw. der aktiven Therapiemitarbeit zum Beispiel Schmerzen oder Müdigkeit dar. Im Anschluss an die Rehabilitation können Barrieren wie mangelnde Zeit oder Lust das alltägliche Gesundheitsverhalten wie die Durchführung krankengymnastischer Übungen (Heimübungsprogramm) oder die Einhaltung bestimmter Verhaltensregeln erschweren. Dieses Charakteristikum wurde als eine allgemeine, für alle Items gültige Einleitung konzipiert:

„Auch wenn Ihnen die aktive Mitarbeit an den Behandlungsmaßnahmen [zu t2 und t3: regelmäßiges Üben oder das Einhalten der Verhaltensempfehlungen] manchmal schwer fallen sollte: Wie sicher sind Sie, dass Sie durch Ihr eigenes Mitwirken bis zum Ende der Reha...?“

↓100

Beispiel:

„Auch wenn Ihnen die aktive Mitarbeit an den Behandlungsmaßnahmen manchmal schwer fallen sollte: Wie sicher sind Sie, dass sie durch Ihr eigenes Mitwirken bis zum Ende der Reha ihre Schmerzen verringern können?“.

Das dritte Merkmal, die Gewissheit oder Stärke der wahrgenommenen Wirksamkeit (strength), wird in der Regel über die Antwortskala operationalisiert, die von hoher Unsicherheit über mittlere Werte bis zu absoluter Sicherheit reicht (vgl. Lorig et al., 1989a; O'Leary, 1985). Auf diese Weise wird die Aufmerksamkeit anders als bei der Ergebniserwartung auf die Gewissheit oder Sicherheit gerichtet, mit der die Person glaubt, die „Aufgabe“ bewältigen zu können (Lorig et al., 1989a; Schwarzer, 1996). Dementsprechend wurde ein vierstufiges Antwortformat gewählt: sehr unsicher (1), ziemlich unsicher (2), ziemlich sicher (3) und sehr sicher (4). Diesem wurde die Kategorie „Ich habe dieser Beschwerde nicht“ (0) vorweggestellt, um die Bewältigungsfähigkeit nur für Beschwerden zu erfragen, die individuell auch vorlagen. Die Ergebnisse eines Pretests hatten gezeigt, dass beschwerdefreien Patienten immer wieder unklar war, was sie ankreuzen sollten (vgl. 10.3 Anhang B).

↓101

Das Konstruktionsprinzip bestand zusammengefasst darin, das Konstrukt Selbstwirksamkeit mit einem kurzen Einleitungstext einzuführen, auf mögliche Barrieren hinzuweisen und die Sicherheit der beschwerdebezogenen Bewältigungsfähigkeiten einschätzten zu lassen.

Parallel zu den Beschwerde- und Ergebniserwartungsskalen sollten die Selbstwirksamkeitserwartungen hinsichtlich Schmerzen und ADL-Funktionen getrennt betrachtet werden. Somit lag ein Einzelitem „schmerzbezogene Selbstwirksamkeitserwartung“ und eine acht Items umfassende Summenskala „ADL-bezogene Selbstwirksamkeitserwartungen“ vor. Bei der Bildung dieser Skala wurden fehlende Werte bei Personen durch den (individuellen) Mittelwert ersetzt, wenn sie mindestens 80% der acht Fragen (d.h. sechs) beantwortet hatten (vgl. 10.3 Anhang B). Die interne Konsistenz (Cronbach’s Alpha) dieser Summenskala betrug für alle drei Erhebungszeitpunkte > .90.

5.2.1.4 Dispositionaler Optimismus

Zusätzlich zu den spezifischen Ergebniserwartungen wurden verallgemeinerte Ergebniserwartungen über das Konstrukt des dispositionalen Optimismus erfasst. Hierzu sollte ursprünglich die deutsche Version des Life Orientation Test (Wieland Eckelmann & Carver, 1990) eingesetzt werden. In einem Pretest waren allerdings Probleme deutlich geworden, die eine Modifikation notwendig erscheinen ließen. Dies ermöglichte zugleich eine Anpassung der deutschen an die revidierte englische Fassung von 1994 (Scheier et (Scheier et , da diese bisher noch nicht in deutscher Sprache vorliegt.

↓102

Zunächst wurden die beiden Items gestrichen, die in der revidierten Fassung des LOT nicht mehr enthalten sind. Des weiteren wurde auf die vier Füllitems verzichtet, um den Umfang des Fragebogens zu verringern. Auch der als zu lang empfundene Einleitungstext wurde gekürzt. Als einzige Aussage wurde das fünfte Item des deutschen LOT wörtlich übernommen. Alle anderen Items wurde wie im folgenden beschrieben modifiziert.

Im durchgeführten Pretest wurde als zentrales Problem deutlich, dass die vornehmlich älteren Patienten die drei negativ (d.h. pessimistisch) formulierten Items schwer verstehen und beantworten konnten. Dies ließ keine validen (reliablen) Aussagen erwarten, so dass diese Items (mit einer Ausnahme) positiv umformuliert wurden. Eine ausführliche Beschreibung der Modifikationen findet sich im 10.4 Anhang B.

Als Antwortformat wurde die Skala des deutschen LOT gewählt (Wieland Eckelmann & Carver, 1990). Die mittlere Antwortkategorie (weder zutreffend noch unzutreffend) wurde allerdings gestrichen, um eine eindeutige Aussage der Patienten zu forcieren: trifft überhaupt nicht zu (1) – trifft eher nicht zu (2) – trifft weitgehend zu (3) – trifft voll und ganz zu (4).

↓103

Eine Optimismusskala wurde über die fünf positiv gepolten Items gebildet. Das einzig negativ gepolte Item konnte aus inhaltlichen Gründen und aufgrund mangelhafter Trennschärfe nicht eingeschlossen werden (vgl. 10.4 Anhang B). Fehlende Werte wurden bei Personen durch den (individuellen) Mittelwert ersetzt, wenn sie mindestens 80% der fünf Fragen (d.h. vier) beantwortet hatten. Die interne Konsistenz (Cronbach’s Alpha) betrug für alle drei Erhebungszeitpunkte > .82.

5.2.1.5 Depressivität

Zur Erfassung der Depressivität wurde die Kurzform der Allgemeinen Depressions Skala (ADS-K, Hautzinger & Bailer, 1993) eingesetzt, der deutsche Fassung der „Center for Epidemiological Studies Depression Scale“ (CES-D, Radloff, 1977). Die Skala ist ein häufig angewandtes vollstandardisiertes Selbstbeurteilungsinstrument zur Untersuchung von nicht-klinischen oder epidemiologischen Stichproben. Um den Umfang des Fragebogens zu reduzieren und die Akzeptanz bei den Patienten zu erhöhen, wurde die 15 Fragen umfassende Kurzform (ADS-K) der 20 Fragen umfassenden Langform vorgezogen und als Block in den Fragebogen eingefügt.

Die 15 als Aussagen formulierten Items repräsentieren Empfindungen gedrückter bis depressiver Stimmungslagen. Sie können den Dimensionen gedrückte Stimmung, Schuldgefühle, Gefühl der Wertlosigkeit, Gefühle von Hilflosigkeit und Hoffnungslosigkeit Antriebsmangel, Appetitverlust, Schlafstörungen zugeordnet werden. Der Patient ist aufgefordert auf einer vierstufigen Skala einzuschätzen, wie häufig er sich in den vergangenen sieben Tagen so gefühlt hat: selten oder gar nicht (weniger als 1 Tag) (0) – manchmal (1 2 Tage lang) (1) – öfters (3 4 Tage lang) (2) – meistens oder die ganze Zeit (5 7 Tage) (3).

↓104

Grundsätzlich gilt diese Kurzform als reliabel und valide (Hautzinger & Bailer, 1993). Der als kritisch anzusehende mittlerer ADS-K-Wert der Bevölkerungsstichprobe liegt eine Standardabweichung über dem Mittelwert (Wert > 17) und trennt 19% der klinisch unauffälligen Stichprobe ab. Anhand dessen können Patienten mit auffällig und unauffällig hohen Depressivitätswerten klassifiziert werden.

Bei der Skalenbildung wurden auch hier fehlende Werte durch den (individuellen) Mittelwert bei Personen ersetzt, die mindestens 80% der 15 Fragen (d.h. zwölf) beantwortet hatten. Die interne Konsistenz (Cronbach’ss Alpha) betrug für alle drei Erhebungszeitpunkte > .82 (vgl. 10.5 Anhang B).

5.2.1.6 Präoperative Aufklärung

Der Patientenfragebogen zu Beginn der Rehabilitationsmaßnahme enthielt Fragen zur präoperativen Aufklärung. Ihre Operationalisierung erfolgte in Anlehnung an die „Patientenbefragung der BfA nach einer medizinischen Rehabilitation“ (Raspe, Weber, Voigt, Kosinski & Petras, 1997).

↓105

Die Patienten wurden gebeten, die Aufklärung über die Hüftgelenksoperation und über deren Auswirkungen auf ihr Leben im Alltag auf einer elfstufigen Antwortskala von sehr schlecht (0) bis ausgezeichnet (10) zu beurteilen.

Die Antworten geben Aufschluss über die Informiertheit der Patienten, wenn man davon ausgeht, dass eine als gut beurteilte präoperative Aufklärung auch tatsächlich besser und umfassender war, als eine als schlecht Beurteilte. Im Kontext der vorliegenden Arbeit wird einer guten oder schlechten Aufklärung als symbolische Erfahrung (verbale Überzeugung, vgl. Bandura, 1997) Bedeutung für die Erwartungshaltung der Patienten zu Beginn der Rehabilitationsmaßnahme beigemessen.

5.2.1.7 Beurteilungen der Rehabilitationsmaßnahme

Im Patientenfragebogen am Ende der Behandlung wurden Fragen zur Beurteilung der Rehabilitationsmaßnahme gestellt. Dabei handelte es sich um globale Beurteilungen der Rehabilitationsmaßnahme, der therapeutischen Behandlung, der ärztlichen Betreuung sowie des persönlichen Erfolgs der Rehabilitation auf einer elfstufigen Antwortskalen von sehr schlecht (0) bis ausgezeichnet (10). Die Operationalisierung erfolgte in Anlehnung an die „Patientenbefragung der BfA nach einer medizinischen Rehabilitation“ (Raspe et al., 1997).

↓106

Zusätzlich wurden drei Fragen in Anlehnung an den Zufriedenheitsfragenbogen von Schmidt (ZUF-8, Schmidt, Lamprecht & Wittmann, 1989) und einen Fragebogen für Antragsteller von medizinischen Rehabilitationsmaßnahmen (Reha-Forschungsverbund Berlin-Brandenburg-Sachsen (BBS): A4-Projekt „Direkte und indirekte Kosten und Erträge der Rehabilitation – Rehabilitation der Rentenversicherung als Instrument der sozialen Sicherung“) in den Fragebogen aufgenommen. Auf einer fünfstufigen Skala von überhaupt nicht (1) bis sehr (5) sollten die Patienten angeben, ob sie zu Beginn der Rehabilitation gerne mehr über Ablauf, Inhalt und Erfolgschancen erfahren hätte, ob man Wert darauf gelegt hat, dass sie lernen, mit ihren Einschränkungen bei alltäglichen Verrichtungen umzugehen und, ob sie sich gut auf Leben nach der Rehabilitation vorbereitet fühlen.

Die Beurteilung des persönlichen Erfolgs der Rehabilitation und der Vorbereitung auf das Leben nach der Rehabilitation wurde erneut im Fragebogen sechs Monate nach der Rehabilitation erbeten.

5.2.1.8 Gesundheitsverhalten im Anschluss an die stationäre Rehabilitation

Die Ausführungen zur Rehabilitation nach Hüftgelenkersatz (siehe Kapitel 3) haben die Bedeutung von gelenkschonendem und gelenkstabilisierendem Verhalten für die so genannte Lebensdauer eines künstlichen Gelenks verdeutlicht. Indem der Patient regelmäßig krankengymnastische Übungen durchführt, verbessert er die (Gelenk-)Beweglichkeit und stärkt die Muskulatur im Bereich von Hüfte und Oberschenkel. Auf diese Weise kann er wesentlich dazu beitragen, dass das künstliche Hüftgelenk stabil und sicher in seiner korrekten Position gehalten wird.

↓107

Vor diesem Hintergrund wurde im Patientenfragebogen sechs Monate nach der Rehabilitation als Gesundheitsverhalten der Erhalt krankengymnastischer Leistungen und die selbstständige Durchführung krankengymnastischer Übungen erfragt. Über eine Filterfrage wurde zunächst erfasst, ob Maßnahmen erhalten bzw. durchgeführt wurden. Anschließend wurden die Patienten gebeten, die Anzahl der Leistungen bzw. Übungen pro Woche sowie insgesamt seit dem Ende der Rehabilitation anzugeben.

5.2.2 Arztbefundbogen

Über den Befundbogen des behandelnden Arztes wurden medizinisch-diagnostische Parameter erhoben, die in der Rehabilitation von Patienten mit Hüftgelenkersatz als wichtige Merkmale zur Beschreibung des Gesundheitszustandes und zur Planung der Rehabilitation angesehen werden.

Hierzu gehörten zunächst die Bewertungskriterien des Harris Hip Scores (Harris, 1969), dem am häufigsten verwendeten klinischen Score zur Bewertung von Koxarthrosen und der Ergebnisse einer Hüftgelenkersatzoperation (Krämer & Maichl, 1993; Murray, 1993). Er umfasst vier unterschiedlich gewichtet Bereiche und kann maximal 100 Punkte betragen: Schmerz (max. 40 Punkte), Funktion (max. 47 Punkte), Abwesenheit von Deformität (max. 4 Punkte) und Bewegungsausmaß (max. 5 Punkte).

↓108

Die Stärke der Schmerzen in Ruhe, bei den ersten Schritten, beim Gehen und nach längeren Gehstrecken wurde über visuelle Analogskalen gemessen. Zur Beurteilung der ADL-Funktionen wurde die sieben Funktionen des Harris Hip Scores übersetzt und mit dem entsprechenden Antwortformat versehen. Ergänzend wurden Fragen zum „Aufstehen aus dem Sitzen“ (vgl. Standard System of Termoniology for reporting results, Clinical Evaluation, Murray, 1993), zur „Benutzung der Toilette“ und zum „Waschen/Baden/Duschen“ (vgl. Barthel-Index, Johanson et al., 1992; Mahoney & (vgl. Barthel-Index, Johanson et al., 1992; Mahoney & gestellt. Die Antwortformate der zehn ADL-Funktionen variierten in Abhängigkeit der Vorlage zwischen drei und neun Kategorien (vgl. 9 Anhang A).

Parallel zu diesen Beschwerden dokumentierte der Arzt Behandlungsziele, d.h. die Ausprägung der Schmerzen bzw. ADL-Funktionen, die im Einvernehmen mit dem Patienten bis zur Entlassung erreicht werden sollte.

Die Unterskala Abwesenheit von Deformität umfasst die Merkmale Beugekontraktur (< 30°), Beinlängendifferenz (< 2 cm), Adduktionskontraktur (< 10°) und Kontraktur der Innenrotation (< 10°). Die Beurteilung des Bewegungsausmaßes erfolgt hinsichtlich der Beugung-Streckung, Abduktion-Adduktion sowie Außen-Innenrotation. Diese Bewegungsmaße wurden nach der so genannten Neutral-Null-Methode gemessen, bei der mit einem Winkel der jeweilige Bewegungsausschlag in Grad erfasst wird. Der aktive Bewegungsgrad wird unter der eigenständiger Bewegung des Patienten und der passive Bewegungsgrad unter der vom Arzt geführten Bewegung bestimmt. Aufgrund der hohen Luxationsgefahr des Hüftgelenks so früh nach der Operation, wurden die Bewegungsmaße Adduktion, Außen- und Innenrotation nicht gemessen. Aus diesem Grund betrug der Höchstwert des Harris Hip Scores nicht 100 sondern rund 95 Punkte.

↓109

Als weitere wichtige medizinisch-diagnostische Parameter, die nicht in den Harris Hip Score eingehen, wurden erhoben: Komplikationen, der Lokalbefund, die Belastungsvorgabe und die Muskelkraft (Hüftabduktoren, -beuger, Einbeinstand).

Zusätzlich wurden bei der Aufnahmeuntersuchung auch funktionelle Einschränkungen am anderen Hüftgelenk und an weiteren Gelenken erfasst.

Nicht zuletzt wurden im Rahmen des Aufnahmebefundes verschiedene Charakteristika des Hüftgelenkersatz dokumentiert: die operierte Seite, die Operationsart (Wechsel- vs. Primäroperation), Verankerungstechnik, Prothesenart, Pfannenrekonstruktion und Schaft.

5.2.3 Dokumentation von Routinedaten

↓110

Neben den eigens für die Studie entwickelten Erhebungsinstrumenten lagen auch Routinedaten der Patienten aus der klinikinternen so genannten Basisdokumentation und aus dem einheitlichen ärztlichen Entlassungsbericht der Gesetzlichen Rentenversicherung (E-Bericht, GRV) vor. Aus diesen Instrumenten konnten soziodemographische Angaben, Angaben zum Behandlungsprozess und weitere Informationen zum allgemeinen Gesundheitszustand entnommen werden. Im ärztlichen Entlassungsberichts der GRV werden beispielsweise bis zu fünf medizinische Diagnosen (nach ICD-10) dokumentiert und die klinikinterne Basisdokumentation enthält eine Beurteilung funktioneller Einschränkungen durch Begleiterkrankungen.

5.3 Beschreibung der Untersuchungsstichprobe

Von den 1065 Studienteilnehmern der Haupterhebung nahmen 295 nicht an der katamnestischen Befragung sechs Monate nach ihrer Entlassung teil. Zur Beantwortung der Frage, ob sich diese 295 Patienten (Drop-Out: 28%) systematisch in Alter, Geschlechtsverteilung, medizinischen Parametern bzw. zentralen Untersuchungsvariablen von denjenigen unterschieden, die auch am dritten Erhebungszeitpunkt teilnahmen (Längsschnitt: n = 770; 72%), wurde die Stichprobenbeschreibung aller Patienten um eine vergleichende Darstellung der beiden Patientengruppen ergänzt.

5.3.1  Soziodemographie

Das durchschnittliche Alter der Studienteilnehmer lag bei 65 Jahren (SD = 10.5), wobei der älteste Patient 90 Jahre und der jüngste 29 Jahre alt war. Der Anteil weiblicher Patienten betrug 60% (= 621).

↓111

Wie Tabelle 6 zu entnehmen ist, war der Längsschnitt im Durchschnitt zwei Jahre älter als der Drop-Out, t(1026) = -2.70, < .00, = 0.16. Anhand der Effektgröße ist dieser Unterschied jedoch als klein zu bewerten. Der Anteil weiblicher Patienten unterschied sich nicht signifikant (= .11).

Tabelle 6: Alter und Geschlecht: Charakteristik für Studienteilnehmer, Längsschnitt und Drop-Out

Studienteilnehmer

( N  = 1065)

Längsschnitt

( n  = 770)

Drop-Out

( n  = 295)

t / 2

df

p

Alter (in Jahren)

-2.70

1026

.00

M

64.58

65.12

63.14

SD

10.54

10.45

10.68

Range

29-90

29-90

33-88

Geschlecht n(%)

2.63

1

.11

männlich

407 (39.6)

284 (38.1)

123 (43.6)

weiblich

621 (60.4)

462 (61.9)

159 (65.4)

5.3.2 Krankheitsspezifische Gesundheit

↓112

Die Beschreibung des krankheitsspezifischen Gesundheitszustandes erfolgte anhand der Hauptdiagnose, medizinisch-klinischen Arztbefunden sowie anhand der vom Patienten berichteten Zufriedenheit mit dem Ausmaß seiner Selbstständigkeit.

Erwartungsgemäß lag bei über 90% aller Studienteilnehmer als Hauptdiagnose eine Arthrose des Hüftgelenkes vor. Längsschnitt und Drop-Out unterschieden sich nicht signifikant (vgl. 11 Anhang C).

Der aktuelle Hüftgelenkersatz erfolgte bei 7% (= 68) der Studienteilnehmern im Rahmen einer Wechseloperation. An einer früheren Anschlussheilbehandlung hatten zuvor bereits 27% der Patienten (= 273) teilgenommen. Der aktive Beugungsgrad des operierten Hüftgelenks betrug zum Aufnahmezeitpunkt 78 Grad (SD = 12.8) und bei der Entlassung 90 Grad (SD = 10.6). Während der Rehabilitation sank die Schmerzstärke8 (Harris Hip Score; max. 44 Punkte) durchschnittlich von 36 (SD = 6.7) auf 41 Punkte (SD = 4.4). Die Funktionen Gang und Aktivitäten (Harris Hip Score; max. 47 Punkte) verbesserten sich im Mittel von 19 (SD = 5.6) auf 28 Punkte (SD = 5.1).

↓113

Die Beurteilung der Zufriedenheit mit dem Ausmaß eigener Selbstständigkeit erfolgte auf einer elfstufigen Skala von ganz und gar unzufrieden (0) bis ganz und gar zufrieden (10). Zum Aufnahmezeitpunkt betrug der Zufriedenheitswert im Mittel 6 (SD = 2.5) und bei der Entlassung 8 (SD = 1.9).

Der Vergleich von Längsschnitt und Drop-Out weist nur einen signifikanten Unterschied aus: Im Entlassungsbefund hatten die Drop-Out-Patienten einen geringeren Funktionsskalenwert (Harris Hip Score) als die Längsschnittteilnehmer, t(967) = -2.19, < .05, = -0.14. Dieser Unterschied kann anhand der Effektgröße als klein beurteilt werden.

5.3.3 Allgemeiner Gesundheitszustand

Zur Beschreibung des allgemeinen, nicht-krankheitsspezifischen, Gesundheitszustands lagen Angaben des Arztes (vgl. Abschnitt 5.2.2) sowie der Patienten (vgl. Abschnitt 5.2.1.1) vor. Die Komorbidität konnte über die Anzahl der Nebendiagnosen, die Beurteilung funktioneller Einschränkungen durch internistische Begleiterkrankungen (klinikinterne Basisdokumentation) sowie an anderen Gelenken (Aufnahmebefund) beschrieben werden.

↓114

Im ärztlichen Entlassungsbericht eines jeden Studienteilnehmers waren durchschnittlich zwei Nebendiagnosen (SD = 1.4) aufgeführt. 15% der Patienten waren durch internistische Begleiterkrankungen eingeschränkt. Rund die Hälfte der Patienten war am anderen Hüftgelenk und 7% (= 65) an einem weiteren Gelenk funktionell eingeschränkt. Längsschnitt und Drop-Out unterschieden sich in keinem dieser Parametern signifikant (vgl. 11 Anhang C).

Auch die Patientenangaben zum Aufnahme- und Entlassungszeitpunkt unterschieden sich nicht zwischen Längsschnitt und Drop-Out. Beide Patientengruppen schätzten ihren gegenwärtigen Gesundheitszustand sowie ihre Gesundheitszufriedenheit ähnlich ein (vgl. 11 Anhang C).

5.3.4 Behandlung

Die Studienteilnehmer wurden im Akutkrankenhaus im Durchschnitt 18 Tage (SD = 6.1) lang (ab dem Operationstag) behandelt. Die Behandlung der Längsschnittteilnehmer war einen Tag länger als die derjenigen, die zum dritten Erhebungszeitpunkt nicht mehr teilnahmen, t(1018) = -2.46, < .01, = -0.15.

↓115

Insgesamt wurden 40% der Patienten (= 398) direkt, d.h. am selben Tag, vom Akutkrankenhaus in die Rehabilitationsklinik verlegt. Damit erfolgte die Aufnahme durchschnittlich 22 Tage (SD = 8.2) nach der Hüftoperation. Die Rehabilitationsmaßnahme dauerte im Mittel 23 Tage (SD = 4.1). Ein Überblick ist 11 Anhang C zu entnehmen.

Im Entlassungsfragebogen beurteilten die Patienten den Erfolg ihrer Rehabilitation auf einer Skala von sehr schlecht (0) bis ausgezeichnet (10) mit durchschnittlich 9 (SD = 1.7). Auf die Frage, inwieweit sie sich jetzt am Ende der Rehabilitation gut auf das Leben nach der Rehabilitation vorbereitet fühlen, antworteten sie im Durchschnitt ziemlich (= 4.3, SD = 0.7). Längsschnitt und Drop-Out unterschieden sich nicht signifikant (siehe Tabelle 72).

5.3.5 Zentrale Untersuchungsvariablen

Im Zentrum der Analysen stehen die schmerz- und ADL-bezogenen Beschwerdeskalen, die Ergebniserwartungsskalen sowie die Selbstwirksamkeitsskalen.

↓116

Die schmerzbezogenen Angaben sind in Tabelle 7 aufgeführt (hohe Werte zeigen geringe Schmerzen an). Zum Aufnahmezeitpunkt betrug der durchschnittliche Schmerzskalenwert 30 (SD = 7.6) und der für den Entlassungszeitpunkt erwartete 37 (SD = 4.4). Bei der Entlassung lag der Schmerzskalenwert im Durchschnitt bei 34 (SD = 5.9). Der für sechs Monate später erwartete Schmerzskalenwert betrug 38 (SD = 3.9).

Längsschnitt und Drop-Out unterschieden sich ausschließlich in ihren Angaben zum Entlassungszeitpunkt: Patienten, die an der Befragung sechs Monate später nicht teilnahmen (Drop-Out), gaben im Vergleich zu den Längsschnittteilnehmern bei der Entlassung stärkere Schmerzen an (= -0.24), erwarteten sechs Monate später auch (noch) stärkere Schmerzen zu haben (= -0.15) und waren weniger von ihrer Schmerzbewältigungsfähigkeit überzeugt (= -0.32).

Tabelle 7: Schmerzen und schmerzbezogene Erwartungen: Charakteristik für Studienteilnehmer, Längsschnitt und Drop-Out

Studienteilnehmer

(N = 1065)

Längsschnitt

(n = 770)

Drop-Out

(n = 295)

t

df

p

AUFNAHME

Schmerz

-0.90

429.54

.37

M

29.82

29.97

29.45

SD

7.59

7.37

8.13

Erwartungen

-1.56

954

.12

M

36.80

36.94

36.45

SD

4.41

4.42

4.39

Selbstwirksamkeit

-1.60

387.19

.11

M

3.19

3.21

3.14

SD

0.60

0.60

0.59

ENTLASSUNG

Schmerz

-2.50

451.75

.01

M

34.03

34.33

33.23

SD

5.94

5.67

6.52

Erwartungen

-2.40

1023

.02

M

38.15

38.33

37.67

SD

3.90

3.68

4.41

Selbstwirksamkeit

-2.99

351.76

.00

M

3.27

3.31

3.16

SD

0.60

0.60

0.59

Anmerkungen. Schmerz, Erwartungen: Hohe Werte zeigen geringe Schmerzen an. Selbstwirksamkeit: Einzelitem von sehr unsicher (1) bis sehr sicher (4).

↓117

Die ADL-bezogenen Angaben führt Tabelle 8 auf. In Bezug auf die Beschwerde- und Ergebniserwartungswerte sei auf die in Abschnitt 5.2.1.1.2 beschriebene z-Standardisierung hingewiesen. Zum Aufnahmezeitpunkt betrug der ADL-Funktionsskalenwert im Durchschnittlich 0 (SD = 4.9) und der für den Entlassungszeitpunkt erwartete 8 (SD = 5.1). Bei der Entlassung lag der Funktionsskalenwert im Durchschnitt bei 4 (SD = 5.0). Der für sechs Monate später erwartete ADL-Funktionsskalenwert betrug 12 (SD = 3.7). Es zeigen sich keine Unterschiede zwischen Längsschnitt und Drop-Out.

Tabelle 8: ADL-Funktionen und ADL-bezogene Erwartungen: Charakteristik für Studienteilnehmer, Längsschnitt und Drop-Out

Studienteilnehmer

(N = 1065)

Längsschnitt

(n = 770)

Drop-Out

(n = 295)

t

df

p

AUFNAHME

ADL-Funktionen

0.20

444.15

.84

M

0.03

0.01

0.09

SD

4.90

4.74

5.31

Erwartungen

-1.52

982.00

.13

M

8.28

8.43

7.88

SD

5.12

4.93

5.57

Selbstwirksamkeit

-1.14

369.46

.25

M

25.91

26.02

25.63

SD

4.19

4.11

4.41

ENTLASSUNG

ADL-Funktionen

-1.78

444.80

.08

M

4.05

4.23

3.57

SD

4.97

4.82

5.34

Erwartungen

-1.91

984.00

.06

M

11.96

12.09

11.59

SD

3.72

3.65

3.89

Selbstwirksamkeit

-0.74

348.99

.46

M

27.52

27.60

27.33

SD

4.16

4.16

4.18

Abschließend ist in Tabelle 9 die Verteilung erwartungsdiskrepanter Behandlungsergebnisse aufgeführt (zur Definition siehe Abschnitt 5.4.4). Die zum Entlassungszeitpunkt berichtete Schmerzstärke entsprach bei 46% der Studienteilnehmern überwiegend der anfänglich erwarteten Stärke. Die zu diesem Zeitpunkt beurteilten ADL-Funktionen stimmten bei 74% der Patienten überwiegend mit ihren anfänglichen Erwartungen überein. Längsschnitt und Drop-Out unterschieden sich nicht signifikant.

↓118

Tabelle 9: Erwartungsbezogene Behandlungsergebnisse: Charakteristik für Studienteilnehmer, Längsschnitt und Drop-Out

Studienteilnehmer

(N = 1065)

Längsschnitt

(n = 770)

Drop-Out

(n = 295)

2

df

p

Schmerz [n (%)]

0.48

1

.49

unerwartet stark

403 (53.9)

284 (53.1)

119 (55.9)

erwartungsgemäß

345 (46.1)

251 (46.9)

94 (44.1)

ADL-Funktionen [n (%)]

1.62

1

.20

unerwartet schlecht

210 (26.4)

145 (25.2)

65 (29.7)

erwartungsgemäß

584 (73.6)

430 (74.8)

154 (70.3)

5.3.6 Zusammenfassung

Insgesamt nahmen 1065 Patienten an der Studie teil. Sie waren im Durchschnitt 65 Jahre alt (SD = 10.5), wobei der älteste Patient 90 Jahre und der jüngste 29 Jahre alt waren. Der Anteil weiblicher Patienten betrug 60%.

↓119

Erwartungsgemäß lag bei über 90% aller Studienteilnehmer als Hauptdiagnose eine Arthrose des Hüftgelenkes vor. Der Hüftgelenkersatz erfolgte bei 7% der Patienten im Rahmen einer Wechseloperation. Während der Rehabilitation verbesserte sich die aktive Beugungsfähigkeit von durchschnittlich 78 Grad (SD = 12.8) auf 90 Grad (SD = 10.6). Die Schmerzstärke (Harris Hip Score) nahm von 36 (SD = 6.7) auf 41 Punkte (SD = 4.4) ab. Die Funktionen Gang und Tätigkeiten des täglichen Lebens (Harris Hip Score) verbesserten sich im Mittel von 19 (SD = 5.6) auf 28 Punkte (SD = 5.1).

Neben den aktuellen Hüftbeschwerden litten die Patienten durchschnittlich an zwei weiteren Erkrankungen (SD = 1.4). Rund die Hälfte der Patienten war am anderen Hüftgelenk, 7% an einem weiteren Gelenk und 15% durch internistische Begleiterkrankungen funktionell eingeschränkt.

Die Rehabilitationsmaßnahme begann im Durchschnitt 22 Tage (SD = 8.2) nach der Hüftoperation und dauerte durchschnittlich 23 Tage (SD = 4.1).

↓120

Der Vergleich der 770 Längsschnittteilnehmer mit den 295 Patienten, die nicht an der katamnestischen Befragung teilnahmen, zeigte insgesamt folgende Unterschiede. Die Längsschnittteilnehmer waren im Durchschnitt zwei Jahre älter und waren durchschnittlich einen Tag länger nach ihrer Hüftoperation im Akutkrankenhaus behandelt worden. Laut Harris Hip Score wurden sie mit einem besseren Funktionsstatus aus der Rehabilitationsklinik entlassen. Dieser Unterschied wurde allerdings nicht anhand der selbstberichteten ADL-Funktionen beobachtet. Vielmehr zeigten sich im Entlassungsfragebogen Unterschiede in der Schmerzstärke: Die Längsschnittteilnehmer gaben bei der Entlassung geringere Schmerzen an und erwarteten (auch) sechs Monate später geringere Schmerzen zu haben. Zudem waren sie überzeugter von ihrer Fähigkeit, ihre Schmerzen bewältigen zu können. Die unterschiedlich starken Schmerzen fanden sich nicht in der Schmerzskala des Harris Hip Scores (Entlassungsbefund). Im zentralen Konstrukt der Erwartungsdiskrepanzen waren keine Unterscheide zu beobachten.

Die anfängliche Frage nach systematischen Unterschieden zwischen den beiden Patientengruppen kann vor dem Hintergrund der zu untersuchenden Fragestellungen verneint werden.

Die Untersuchung der ersten Fragestellung wird durch die Tatsache, dass 295 Patienten an der katamnestischen Befragung nicht teilnahmen, nicht berührt, denn sie bezieht sich auf die akute Rehabilitationsphase, an der alle 1065 Patienten teilnahmen.

↓121

In Bezug auf die zweite Fragestellung ist festzustellen, dass die Akutbehandlungsdauer sowie die Funktionsskala des Entlassungsbefundes (Harris Hip Score) keine Relevanz für die Hypothesenprüfung haben. Zum gefundenen Altersunterschied kann gesagt werden, dass es sich erstens um einen kleinen Effekt handelt und zweitens das Alter in allen Analysen als Kontrollvariable berücksichtigt wird (vgl. auch Abschnitt 5.4.2).

Hinsichtlich der unterschiedlichen Schmerzangaben zum Entlassungszeitpunkt kann angemerkt werden, dass Patienten, die nicht an der katamnestischen Befragung teilnahmen, bei ihrer Entlassung stärkere Schmerzen hatten. Anzunehmen ist, dass sie auch ein halbes Jahr später stärkere Schmerzen haben als die Längsschnittteilnehmer. Aufgrund dessen wird die absolute Schmerzstärke sechs Monate nach der Entlassung bezogen auf die Gesamtstichprobe von 1065 Patienten vermutlich unterschätzt. Dieser positive Selektionseffekt muss bei der Interpretation der absoluten Schmerzstärke berücksichtigt werden, spielt jedoch für die Modellprüfung keine Rolle (vgl. Abschnitt 4.2.5).

5.4 Auswertung

Im Folgenden soll ein allgemeiner Überblick über die statistischen Methoden gegeben werden, mit denen die zentralen Fragestellungen und Hypothesen der vorliegenden Arbeit geprüft wurden. Als zentrale statistische Auswertungsmethoden bzw. -maße wurden in der vorliegenden Arbeit bivariate Analysen durchgeführt, Übereinstimmungsmaße bestimmt und Regressionsanalysen berechnet. Die Auswertungen erfolgten mit SPSS 10.0.

5.4.1  Bivariate Analysen

↓122

Zunächst wurden für alle Datenanalysen bivariate Zusammenhänge mithilfe von Pearson Korrelationen, t-Tests (für abhängige und unabhängige Stichproben) und ggf. nonparametrischen Tests (Kruskal-Wallis-Test und Chi-Quadrat Tests) geprüft.

5.4.1.1  Exkurs: Übereinstimmungsmaße

Eine spezielle Form der bivariaten Zusammenhangsanalyse stellt die Bestimmung (Prüfung) der Übereinstimmung von zwei Angaben wie beispielsweise den erwarteten und selbstberichteten Behandlungsergebnissen dar. Zur Verfügung stehen verschiedene Maße der Übereinstimmung wie die prozentuale Übereinstimmung, einfache Zusammenhangsmaße und zufallskorrigierte Maße (vgl. Wirtz & Casper, 2002).

Zusammenhangsmaße wie Korrelationskoeffizienten ermöglichen Aussagen über die so genannte Kovariationsgenauigkeit. Sie sagen etwas über die Richtung und die Stärke bzw. Schwäche eines Zusammenhangs zwischen zwei Angaben aus. Korrelieren zum Beispiel Erwartungen und Behandlungsergebnisse positiv miteinander, liegt eine gleichläufige oder gleichsinnige Beziehung vor. In diesem Fall gehen niedrige Erwartungswerte mit niedrigen Ergebniswerten einher, hohe mit hohen Werten. Die Stärke des Zusammenhangs wird über die Höhe der Korrelation ausgewiesen. Die Koeffizienten variieren zwischen –1 und +1. Bei einer positiven Korrelation von 1 handelt es sich um eine perfekte Korrelation oder Kovariationsgenauigkeit – die beiden Rangreihen entsprechen sich.

↓123

Bei dieser korrelativen Methode werden jedoch keinerlei Informationen zu Niveauunterschieden ausgewiesen. Die Frage, ob zwei Angaben bezüglich ihres mittleren Niveaus übereinstimmen, erfordert Maße der Niveaugenauigkeit.

Für kontinuierliche Variablen (mit gleichen Maßeinheiten) wird die Niveaugenauigkeit über den unjustierten Intraklassenkorrelationskoeffizienten (ICC unjust) und für kategoriale Variablen über den Kappa-Koeffizienten bestimmt (Wirtz & Casper, 2002).

Der ICC unjust bestimmt die Übereinstimmung von zwei Angaben unter der Annahme, dass verschiedene Nichtübereinstimmungen unterschiedlich schwerwiegend sind. D.h. gerade bei ordinal- und intervallskalierten Daten ist die Bestimmung der absoluten Übereinstimmung nicht immer sinnvoll. Vielmehr ist eine differentielle Gewichtung von Nichtübereinstimmungen angemessen. Der Koeffizient nimmt nur dann hohe Werte an, wenn die Mittelwerte der beiden Angaben ähnlich sind und die Angaben zusätzlich hoch miteinander korrelieren. Aus der zusätzlichen Modellannahme der Varianzhomogenität folgt, dass die absoluten Werte der Angaben ähnlich sein müssen. Ein hoher ICC unjust resultiert also im Beispiel dann, wenn Erwartungen und Ergebnissen hoch korrelieren und deren Mittelwerte sowie absoluten Werte ähnlich sind. Um eine Übereinstimmung möglichst nicht zu unterschätzen, sollte das zweifaktorielle dem einfaktoriellen Modell vorgezogen werden, da es eine präzisere Schätzung der Merkmalsvarianz liefert (Wirtz & Casper, 2002). Wie bei einem üblichen Korrelationskoeffizienten liegt der Wertebereich zwischen -1 und +1. Der ICC unjust kann mithilfe von SPSS 10.0 im Rahmen der Reliabilitätsanalyse berechnet werden (Korrelationskoeffizient in Klassen; Modell: Zwei-Weg; zufällige Effekte). Der Wert wird unter „Single Measure Intraclass Correlation“ ausgegeben.

↓124

Der Kappa-Koeffizient (κ) von Cohen ist ein Übereinstimmungsmaß für Variablen auf Nominalskalenniveau. Er wird für quadratische Kreuztabellen berechnet, in denen dieselben numerischen Kodierungen für die Zeilen- und Spaltenvariable verwendet werden. Im Vergleich zur prozentualen Übereinstimmung ist der Koeffizient ein zufallskorrigiertes Übereinstimmungsmaß, dass die Ratewahrscheinlichkeit und die unterschiedlichen Randhäufigkeiten berücksichtigt. Der Koeffizient gibt an, wie hoch die Differenz zwischen beobachteter (p o) und zufälliger (p e) Übereinstimmung ist, wenn diese an der maximal möglichen nicht-zufälligen Übereinstimmung (1 - p e) aufgrund der Randverteilungen relativiert wird; κ = (p o    p e ) / (1 - p e) (Wirtz & Casper, 2002). D.h. er beschreibt den Anteil der beobachteten „überzufälligen“ Übereinstimmung an der erreichbaren „nicht-zufälligen“ Übereinstimmung. Bei perfekter Übereinstimmung nimmt der Kappa-Koeffizient den Wert +1 an. Ein Wert von Null zeigt keine überzufällige Übereinstimmung an, d.h. sie ist nicht höher als allein durch Zufall zu erwarten war. Zur Interpretation von Kappa-Werten liegen keine absoluten Definitionen vor (vgl. Wirtz & Casper, 2002). Altman (1991) liefert jedoch folgende Richtlinien zur Beurteilung (Tabelle 10).

Tabelle 10: Interpretation von Kappa-Koeffizienten

Kappa

Altman

0.81 bis 1.0

very good

0.61 bis 0.8

good

0.41 bis 0.6

moderate

0.21 bis 0.4

fair

< 0.2

poor

5.4.2 Multiple Regressionen

Schrittweise Regressionen wurden für Fragestellungen gewählt, die ein exploratives Vorgehen verlangten. Bei dieser Methode werden alle Variablen bei jedem Schritt geprüft und diejenige, die ähnlich der Auswahlmethode „Vorwärts“ den höchsten partiellen Korrelationskoeffizienten mit dem Kriterium aufweist, in die Gleichung eingeschlossen. Danach wird sie nach der Rückwärts-Methode untersucht und gegebenenfalls wieder ausgeschlossen. Diese Methode wurde beispielsweise für die Untersuchung der Erwartungsbildung gewählt (vgl. Abschnitt 4.1.2). Theoretisch abgeleitete Einflussgrößen wurden in das Modell aufgenommen und deren Einfluss empirisch geprüft.

↓125

Im Vergleich dazu werden bei einer hierarchischen Regression alle unabhängigen Variablen blockweise in einer vom Untersucher vorgegebenen Reihenfolge in eine Gleichung eingeschlossen. Dies ermöglicht es, den Anteil erklärter Kriteriumsvarianz zu bestimmen, den jeder Block von Prädiktoren zu der Gleichung beiträgt.

Bei den meisten Analysen wurden in einem ersten Schritt verschiedene Kontrollvariablen eingeführt, die eventuell mit den hypothetischen Prädiktoren konkurrieren. Diese wurden anschließend eingeführt.

Wenn anstelle eines Wertes die Veränderung zwischen zwei Erhebungszeitpunkten das Kriterium darstellten, wurde in diesem ersten Schritt die jeweilige Kriteriumsvariable zu t1 als Autoregressor (Ausgangswertvariable) eingeführt. Auf diese Weise können die Veränderungsprädiktoren identifiziert werden. D.h. die Variablen, die den Anteil an Kriteriumsvarianz vorhersagen, der von der Variablenausprägung des Autoregressors unabhängig ist (vgl. Dalbert, 1987). Diese Veränderungsprädiktoren, die theoretisch für die Veränderung relevant sein sollen, werden im zweiten Schritt in das Modell eingeführt. Wird ihre Vorhersagekraft als signifikant ausgewiesen, so tragen sie (über den Einfluss von Kontrollvariablen) zur Erklärung der Veränderung der Kriteriumsvariable bei.

↓126

Bei diesem Ansatz erklärt in der Regel der Autoregressor den größten Varianzanteil des Kriteriums. Es ist damit zu rechnen, dass darüber hinaus sozial-kognitive Faktoren nur rund 5% erklären (vgl. Dalbert & Kulla, 1998; O'Leary, 1985; Orbell et al., 1998; Rejeski et al., 1996).

5.4.2.1  Exkurs: Prüfung von Interaktionstermen

Die zentralen Hypothesen der vorliegenden Arbeit waren Moderatorhypothesen, die über Interaktionsterme im Rahmen von hierarchischen Regressionsanalysen untersucht wurden. Bei diesem methodischen Ansatz richtet sich das Interesse auf die Beantwortung der Frage, ob eine so genannte Moderatorvariable (Z) eine zweite Variable (X) in ihrer Wirkung auf eine dritte Variable (Y) beeinflusst (vgl. Aiken & West, 1991; Baron & Kenny, 1986). Angenommen wird, dass (a) eine kausale Beziehung zwischen zwei Variable (X und Y) vorliegt und diese (b) unter spezifischen Bedingungen (Z) geschwächt oder gestärkt wird. Die Variable, die die Beziehung zwischen einer unabhängigen und einer abhängigen Variable beeinflusst, wird als Moderatorvariable (Z) bezeichnet.

Beispiel. Es wird angenommen, dass die Ergebniserwartungen (X) positiv mit den Behandlungsergebnissen (Y) zusammenhängen. Patienten, die positive Ergebnisse erwarten, sollten auch tatsächlich bessere Ergebnisse erreichen als diejenigen, die vergleichsweise schlechtere Ergebnisse erwarten. Darüber hinaus wird postuliert, dass dieser Zusammenhang (X und Y) umso stärker ist, je höher die wahrgenommene Selbstwirksamkeit (Z) ist. Hohe Ergebniserwartungen sollten insbesondere dann gesundheitsförderlich sein, wenn zugleich hohe Selbstwirksamkeit wahrgenommen wird. Bei Patienten mit gering wahrgenommener Selbstwirksamkeit sollten Ergebniserwartungen und Behandlungsergebnisse eher gering zusammenhängen.

↓127

Um Probleme mit erhöhter Multikollinearität in den Regressionsanalysen mit Interaktionstermen zu vermeiden bzw. diese zu reduzieren, wurden die beiden Variablen eines Interaktionsterms am Stichprobenmittelwert zentriert und (erst) anschließend multipliziert (Aiken & West, 1991; Cohen & Cohen, 1983). Hierbei wurde der individuelle Wert der Variable X durch die (individuelle) Abweichung vom Mittelwert von X ersetzt (Cohen & Cohen, 1983). Dieses Zentrieren beeinflusst die Regressionskoeffizienten (den Effekt der b-Gewichte) der (einzelnen) Variablen und des Y-Achsenabschnitt, nicht jedoch den Koeffizienten bzw. Effekt des Interaktionsterms (Cohen & Cohen, 1983).

Die Implikation einer signifikanten Interaktion kann graphisch veranschaulicht werden. Hierfür wird die Regressionsgleichung 1 umgestellt, so dass Gleichung 2 resultiert.

(1)

(2)

↓128

Zur Notation bzw. Variablen-Definition der Gleichungen 1 und 2: Als Variable X wird im Folgenden immer die Variable bezeichnet, deren Beziehung mit der abhängigen Variable (Y) untersucht wird. In den Abbildungen wird sie immer auf der X-Achse dargestellt. Die Variable Z ist die postulierte Moderatorvariable, deren Ausprägung die Beziehung zwischen X und Y verändern soll (so die zu prüfende Annahme).

Die Gleichung 2 kann nun für ausgewählte Werte der Variable Z aufgelöst werden. Entsprechend der Empfehlung von Cohen und Cohen (1983) werden hierfür ein geringer Wert (eine Standardabweichung unter dem Mittelwert von Z), ein mittlerer (Mittelwert von Z) und ein hoher Wert (eine Standardabweichung über dem Mittelwert von Z) gewählt. Diese drei graphisch als Geraden dargestellten Gleichungen veranschaulichen die Interaktion zwischen X und Z.

Für die signifikanten Interaktionsterme wurden in Bezug auf Aiken und West (1991)Folgeanalysen zur Untersuchung der Fragen durchgeführt, ob sich die Regression (Steigung) (a) für einen spezifischen Wert von Z von Y auf X signifikant von Null und (b) zwischen einem hohen und geringen Wert von Z unterscheidet.

↓129

Zur Beantwortung der ersten Frage wird der Standardfehler der Steigung für einen spezifischen Wert der Variable Z (b 1 + b 3 Z) nach Gleichung 3 berechnet. In diese Berechnung gehen Werte der Varianz-Kovarianz-Matrix der Regressionskoeffizienten ein (s i). Die Prüfung auf statistische Signifikanz erfolgt anhand eines t-Tests für einfache Steigungen (Gleichung 4). Die Freiheitsgrade berechnen sich nach df = (nk – 1), wobei n die Fallzahl und k die Anzahl der Prädiktoren (ohne Konstante der Regressionsgleichung) darstellen.

(3)

(4)

Die zweite Frage bezieht sich darauf, ob sich die einfachen Steigungen von Y auf X für zwei verschiedene Werte der Variable Z (z.B. Z hoch und Z gering) unterscheiden: (b b Z hoch) von (b b Z gering). Zur Beantwortung wird die Differenz bestimmt: d = (Z hochZ gering) b3 und anhand eines t-Tests nach Gleichung 5 auf statistische Signifikanz geprüft (vgl. Aiken & West, 1991, p. 20).

↓130

(5)

Auf dieser theoretischen Grundlage wurden die Moderatorhypothesen in der vorliegenden Arbeit statistisch untersucht. Allerdings wurden in der Regel komplexere Modelle geprüft. Zusätzlich zu den beiden Gleichung 1 definierten Prädiktoren und deren Interaktionsterm wurden Kontrollvariablen bzw. bis zu drei Interaktionsterme geprüft.

Beispiel. Bei der Vorhersage der Behandlungsergebnisse durch Erwartungen wurden im ersten Schritt als Kontrollvariablen das Alter und Geschlecht sowie der Autoregressor des Kriterium (Ausgangswert) eingeführt (K 1: Alter, K 2: Geschlecht, A: Ausgangswert). Der zweite Schritt beinhaltete die Ergebnis- und Selbstwirksamkeitserwartungen (X, Z) und der dritte die drei Interaktionsterme (AX, AZ und XZ). Das postulierte Vorhersagemodell ist in Gleichung 6 dargestellt.

↓131

(6)

Die oben beschriebenen Folgeanalysen wurden in diesem Fall einzeln für jeden signifikanten Moderatoreffekt durchgeführt. Dabei wurden alle Variablen der Produkte ersetzt, die keine der beiden Variablen oder den Interaktionsterm dieser beiden beinhalteten. Eingesetzt wurden die geschätzten (unstandardisierten) b-Gewichte und die Mittelwerte der anderen Variablen (Prädiktoren). Auf diese Weise konnten bis auf drei Produkte (z.B. b 4 X; b 5 Z und b 8 XZ) alle Produkte der Gleichung 6 aufgelöst werden. Nach Umstellen und Ausklammern des interessierenden Prädiktors X resultierte Gleichung 7. Sie entspricht Gleichung 2 insofern, dass sie die Summe der gewichteten und in der konkreten Folgeanalyse nicht interessierenden Variablen und Interaktionsterme (b1K+ b2K+ b3A + b6AX + b7AZ) enthält.

(7)

↓132

Im Fall einer signifikanten Interaktion, ist die Interpretation der entsprechenden Haupteffekte an der Interaktion zu relativieren (Bortz, 1993). Die Beantwortung der Frage, welche Haupteffekte eindeutig interpretierbar sind, wird durch die Klassifikation der (signifikanten) Interaktion erleichtert. Unterschieden werden ordinale, hybride und disordinale Interaktionen. Bei einer ordinalen Interaktion sind prinzipiell beide Haupteffekte eindeutig interpretierbar, bei einer hybriden nur einer und bei einer disordinalen keine der beiden.

5.4.3 Exkurs: Effektgröße

Die statistische Signifikanz ist von der Größe des Haupteffekts, vom Stichprobenumfang und von der Streuung der Daten (Standardabweichung) beeinflusst. Die Wahrscheinlichkeit, dass ein Unterschied zufallsbedingt ist, ist umso geringer, je größer der Haupteffekt, je größer die Stichprobe und/oder je geringer die individuellen Werte variieren. Aus diesem Grund sollte in Bezug auf Bortz (1995, S. 568) auf die Ermittlung der tatsächlich erzielten Effektgröße (Effektstärke), die so genannte ex-post-Bestimmung von Effektgrößen, niemals verzichtet werden. Der Bericht beispielsweise eines Mittelwertunterschiedes sollte zusätzlich zur Standardabweichung, Stichprobengröße und statistischen Signifikanz immer auch die Angabe der Effektgröße beinhalten. Wie die Effektgröße für verschiedene Signifikanztests bestimmt wird, ist Tabelle 11 zu entnehmen.

Tabelle 11: Überblick über Effektgrößen verschiedener Signifikanztests

Test

Effektgröße

Formel

klein

mittel

groß

t-Test für unabhängige Stichproben

= 2 * t / √df

0.20

0.50

0.80

t-Test für abhängige Stichproben

= (M 1 M 2 / SD Differenz)* √ 2

0.20

0.50

0.80

Korrelationstest (r)

r

0.10

0.30

0.50

Test für Korrelationsdifferenzen

= ZA – ZB

0.10

0.30

0.50

Multiple Korrelation (R)

f 2 = R 2 / (1 — R 2)

0.02

0.15

0.35

Anmerkungen. Bortz (1995, S.568ff).

5.4.4 Exkurs: Erwartungsdiskrepanzen

↓133

Im Zentrum der zweiten Fragestellung stehen erwartungsbezogene – d.h. erwartungsgemäße und erwartungsdiskrepante Behandlungsergebnisse, die indirekt über Differenzwerte zwischen anfänglichen Erwartungen und tatsächlich erreichten Ergebnissen bestimmt wurden. Um Probleme durch unterschiedliche Aggregationsniveaus (Antwortformate) der Items zu vermeiden, erfolgte die Analyse auf der Ebene der Einzelitems (vgl. Kohlmann & Raspe, 1998). Für jedes Item wurde ein (individueller) Differenzwert bestimmt, der anschließend einer der folgenden drei Kategorien zugeordnet wurde: keine Differenz wurde als „erwartungsgemäß“, eine negative Differenz als „unerwartet stärker/schlechter“ und eine positive Differenz als „unerwartet geringer/besser“ gewertet.

Diese Kategorisierung ist einerseits unangemessen differenziert, weil eine exakte Übereinstimmung von Erwartungen und Ergebnissen nur selten zu erwarten ist und eine geringe Differenz nicht in jedem Fall subjektiv als bedeutsam erlebt wird und andererseits relativ undifferenziert, da nicht zwischen geringen und großen Abweichungen unterschieden wird. Deshalb wurde die überwiegende Diskrepanz (bzw. Übereinstimmung) der vier Schmerzdifferenzwerte bzw. der acht ADL-bezogenen Differenzwerte bestimmt, d.h. die Differenz, die am häufigsten vorlagt.

Am Beispiel der Schmerzdifferenzwerte zu den vier Belastungssituationen (vgl. Abschnitt 5.2.1.1.1) kann die Kategorisierung folgendermaßen beschrieben werden: Als überwiegende Diskrepanz galt die Differenz, die am häufigsten vorlagt. Entsprechend konnten die in Tabelle 12 aufgeführten Beispielfälle 1 bis 4 eindeutig einer Kategorie zugewiesen werden. Allein die drei Fälle, in denen zweimal zwei gleiche Differenzen (d.h. in die selbe Richtung) vorlagen, konnten keiner Kategorie zugeordnet werden (siehe Beispiel in Tabelle 12: Fall 5).

↓134

Tabelle 12: Beispiele für die Bestimmung der überwiegenden Erwartungsdiskrepanz bzw. -übereinstimmung in Abhängigkeit von der Anzahl der Erwartungsdifferenzen am Bespiel der vier Schmerzdifferenzwerte.

Fall

unerwartet stärker

Schmerzen zu t2

erwartungsgemäß

unerwartet geringer

überwiegende Diskrepanz

1

4

0

0

„unerwartet stärker“

2

0

3

1

„erwartungsgemäß“

3

0

0

4

„unerwartet geringer“

4

2

1

1

„unerwartet stärker“

5

2

2

0

keine

Die Methode der indirekten Bestimmung der Erwartungsdiskrepanzen wurde der Methode direkter Vergleichsangaben (z.B. „Sind ihre Schmerzen jetzt am Ende der Rehabilitation unerwartet stärker, erwartungsgemäß oder unerwartet geringer?“) aus folgenden Überlegungen bzw. Kenntnissen von mir vorgezogen.

Sie hat den Vorteil, dass der Bezug zu den Beschwerden (und zu den spezifischen Erwartungen) erhalten bleibt. Denn aus vergleichenden Untersuchungen der indirekten und direkten Veränderungsmessung kann geschlossen werden, dass mit direkten Vergleichsangaben etwas anderes als beschwerdebezogene Veränderungen gemessen wird: Die indirekten Differenzwerte hingen relativ gering mit den direkten Vergleichsangaben zusammen und hatten eine andere Faktorstruktur (Bleßmann, Kohlmann & Raspe, 2001a; Bleßmann, Kohlmann & Raspe, 2001b; Bleßmann, Kohlmann & Raspe, 2002; Kohlmann & Bleßmann, 2002; Kohlmann & Raspe, 1998). In den durchgeführten Faktorenanalysen luden die indirekten Differenzwerte auf unterschiedlichen Faktoren, die die ursprünglichen Beschwerdebereiche abbildeten. Beispielsweise luden alle schmerzbezogenen Differenzwerte gemeinsam auf einem und alle schlafproblembezogenen Differenzwerte auf einem anderen Faktor etc. Demnach scheint diese indirekte Methode Veränderungen differenzierter zu messen und damit differenziertere Aussagen zu ermöglichen. Während die direkten Vergleichsangaben alle auf einem Faktor luden, der (inhaltlich) nur undifferenziert als „Veränderung“ interpretiert werden kann.

↓135

Da die Ergebnisse zur prognostischen Bedeutung der beiden Methoden keine wesentlichen bzw. systematischen Unterschiede zwischen indirekten Differenzwerten und direkten Vergleichsangaben auswiesen (Bleßmann et al., 2001a; Bleßmann et al., 2002), die dafür sprechen könnten, dass indirekte Differenzwerte subjektiv weniger bedeutsam wären, lässt sich hieraus kein Gegenargument gegen meinen Ansatz ableiten.

Anders als in anderen Arbeiten, die sich der indirekten Methode bedienten, wurde die exakte Übereinstimmung bzw. Abweichung wie bereits erwähnt auf der Ebene der Einzelitems bestimmt und kategorisiert. In den Studien zur Veränderungsmessung wurden beispielsweise Differenzen im Bereich -1 bis +1 als „unverändert“ definiert (vgl. Kohlmann & Raspe, 1998). Renner konnte in ihrer Untersuchung bei der Bestimmung von Diskrepanzen zwischen subjektiven Risikoeinschätzungen und tatsächlichen gesundheitlichen Risiken auf theoretische Kriterien zurückgreifen (Renner, 2000). Sie kategorisierte den erwarteten Cholesterinwert (normal, grenzwertig, zu hoch) und stellte diesen dem gemessenen Cholesterinwert gegenüber, der gemäß der Normwerte der European-Atherosclerosis-Society und der Nationalen Cholesterin-Initiative zu drei Kategorien zusammengefasst worden war (optimal, grenzwertig, zu hoch). Ähnlich verfuhr sie mit den erwarteten und tatsächlichen Blutdruckwerten. Ein solches Vorgehen konnte in der vorliegenden Arbeit nicht realisiert werden – aufgrund der unterschiedlichen Antwortskalen und des z.T. nur dreistufigen Antwortformates sowie aufgrund fehlender theoretischer Schwellenwerte, nach denen die Einschätzungen der Patienten ähnlich wie bei Renner hätten zusammengefasst werden können. Dem Problem der exakt bestimmten Übereinstimmung wurde vielmehr begegnet, indem die überwiegende Erwartungs diskrepanz (bzw. Übereinstimmung) zur Grundlage der Hypothesenprüfung gemacht wurde. Zudem spricht der Vergleich der indirekten und direkten Veränderungsmessung dafür, dass indirekte Differenzwerten das Ausmaß einer Veränderung (Diskrepanz) nicht überschätzen, sondern eher (konservativ) unterschätzen (Bleßmann et al., 2001a; Bleßmann et al., 2001b; Bleßmann et al., 2002; Kohlmann & Bleßmann, 2002; Kohlmann & Raspe, 1998).

Aus diesen Überlegungen bzw. Kenntnissen heraus erscheint mir, die indirekt auf der Ebene der Einzelitems bestimmte überwiegende Erwartungsdiskrepanz angesichts der Fragestellung dieser Arbeit als geeignetes Verfahren.


Fußnoten und Endnoten

7  Der Begriff Schmerzreduktionserwartungen wird alternativ für Schmerzergebniserwartungen benutzt, wenn unterstrichen werden soll, dass hohe Schmerzergebniserwartungen „Erwartungen geringer Schmerzen“ anzeigen.

8  Bei der Interpretation der Item- und Skalenwerte ist zu beachten, dass alle Angaben umgepolt wurden und ein hoher Wert immer eine geringe Schmerzintensität kennzeichnet.



© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 4.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
05.10.2006