Instrumente und Methoden
Errata zum Manual des Inventars zur Erfassung Interpersonaler Probleme (IIP-D) von
L. M. Horowitz, B. Strauß und H. Kordy (2000) 2., überarbeitete und neunormierte Auflage. Göttingen: Beltz Test.
M. Wolf, C. Gallas, H. Kordy
1. Ergänzung zum Kap. 3.1 Testauswertung (S.23): Die Skalenrohwerte müssen für die Zuordnung zu den nicht-ipsatierten Normwerten durch die Anzahl der pro Skala beantworteten Items dividiert werden (Mittelwertbildung). Bei vollständiger Beantwortung ist somit also jeweils die Zahl 8 der Divisor. In der Formulierung „In diesem Manual sind Normtabellen und Vergleichswerte immer auf die ‚unnormierten’ Skalenrohwerte“ (S. 23, rechte Spalte) muss „‚unnormierten’ Skalenrohwerte“ durch „‚normierte Skalenwerte’“ ersetzt werden.
2. Korrektur der Normtabellen im Anhang (S. 45 ff.): In den Tabellen im Manual finden sich vereinzelt fehlerhafte Angaben. Die korrigierten Normtabellen können hier heruntergeladen werden.
Clinical and Research Inventory for Eating Disorders (CR-EAT)
M. Mößner, S. Bauer, D. Faßnacht & H. Kordy
Das CR-EAT ist ein faktorenanalytisch konstruiertes Selbstbeurteilungsinstrument zur Erfassung von Essstörungssymptomen sowie von für die Entstehung von Essstörungen als relevant erachteten Dimensionen. Bei der Konstruktion wurden vor allem Aspekte der Testökonomie berücksichtigt. Der Itempool von ursprünglich 100 Fragen wurde nach Faktorenanalyse (N=1626) auf 70 Items reduziert. Diese bilden 12 Skalen, mit zufriedenstellenden bis guten internen Konsistenzen (Cronbachs α, rit) und Retestreliabilitäten (4 Wochen, rtt):
1. Übermäßige Beschäftigung mit Gewicht (rit = .88, rtt = .91)
2. Kontrolle des Essverhaltens (rit = .91, rtt = .87)
3. Emotionale Dysregulation (rit = .89, rtt = .78)
4. Essen als Affektregulation (rit = .89, rtt = .84)
5. Selbstwert (rit = .85, rtt = .71)
6. Sorge vor negativer Bewertung (rit = .89, rtt = .83)
7. Unzufriedenheit mit dem Körper (rit = .87, rtt = .89)
8. Gezügeltes Essverhalten (rit = .77, rtt = .76)
9. Gesellschaftliche Erwartungen bzgl. Figur und Gewicht (rit = 78, rtt = .81)
10. Perfektionismus: Familiäre Erwartungen (rit = .74, rtt = .76)
11. Schädliche Maßnahmen zur Gewichtsregulation (rit = .62, rtt = .87)
12. Perfektionismus: persönliche Ansprüche (rit = .64, rtt = .78).
Auf der Grundlage einer Faktorenanalyse 2. Ordnung wurden zudem drei globale Skalen gebildet:
I. Störung des Essverhaltens (rit = .95, rtt = .92)
II. Kognitiv-emotionale Belastung (rit = .93, rtt = .89) und
III. Perfektionismus (rit = .70, rtt = .83).
Ein Gesamtscore (rit = .96, rtt = .93) gibt das Ausmaß der Gesamtbeeinträchtigung wieder.
Insgesamt stellt das CR-EAT ein breit angelegtes Instrument dar, welches neben der Symptomatik auch andere für den Bereich der Essstörungen als relevant erachtete Konstrukte reliabel erfasst. Die Validität konnte mittels Korrelationsanalysen mit Skalen aus gängigen Instrumenten sowie durch Sensitivitäts-/ Spezifitätsanalysen aufgezeigt werden. Übersetzungen des CR-EAT sind in englisch, französisch, portugiesisch, tschechisch und ungarisch verfügbar.
Das CR-EAT kann computergestützt vorgegeben werden und ist zu Forschungszwecken frei einsetzbar. Für nähere Informationen wenden Sie sich bitte an markus.moessner@med.uni-heidelberg.de
Entwicklung einer deutschen Version des Linguistic Inquiry and Word Count (LIWC)
M. Wolf, H. Kordy in Zusammenarbeit mit J. W. Pennebaker, University of Texas
Um den Mechanismen der Computer vermittelten Kommunikation (CvK) in psychotherapeutischen Kontexten auf den Grund zu gehen, liegt es nahe, auf die Interaktion, Kommunikation und Sprache im neuen Medium zu fokussieren. Bei der Sondierung entsprechender Methoden für die Analyse der Transkripte aus E-Mail- und Chat-Brücke zeigte sich rasch ein Mangel an geeigneten Instrumenten; zwar wurden speziell in der Psychotherapieforschung einige Ansätze für die computergestützte Textanalyse entwickelt, jedoch wurde festgestellt, dass deren Einsatzbereich oft zu eng definiert ist. Eine Ausnahme stellt das Linguistic Inquiry and Word Count (LIWC) dar, ein computergestütztes Textanalyseprogramm, das von Pennebaker und Kollegen entwickelt wurde, um Essays aus Experimenten zum expressiven Schreiben zu untersuchen. Das Programm greift auf ein hinterlegtes Wörterbuch zu und analysiert Texte hinsichtlich der im Wörterbuch definierten Kategorien und Worteinträge (z.B. Emotionen, psychologische Prozesse, kognitive Prozesse, soziale Prozesse). Das LIWC wurde in zahlreichen Studien zu sozial- und klinisch psychologischen Fragestellungen eingesetzt, in denen u.a. gute psychometrische Eigenschaften und eine breite Abdeckung natürlicher, gesprochener und geschriebener Sprache festgestellt wurden. In Kooperation mit der Arbeitsgruppe von James Pennebaker wurde daher die bestehende deutsche Version des LIWC weiterentwickelt und gezielt bzgl. seiner Brauchbarkeit im Kontext der CvK geprüft.
In zwei Studien wurden die Güte und Praktikabilität des deutschen LIWC untersucht: Zunächst wurde an einer Stichprobe bestehend aus 122 bilingualer Texte die Äquivalenz des deutschen Wörterbuchs mit dem Original überprüft. Die analysierten Korpora umfassten insgesamt 32 278 (deutsch) bzw. 35 619 (englisch) Wörter. Für die überwiegende Mehrheit der LIWC-Sprachkategorien konnte eine sehr gute Übereinstimmung beider Versionen gezeigt werden (Median ICC .74). In einem zweiten Schritt wurde die Robustheit des Verfahrens gegenüber Schreibfehlern untersucht, wie sie üblicherweise in der CvK vorzufinden sind. Anhand von 104 E-Mails aus dem Projekt „E-Mail Brücke“ konnte gezeigt werden, dass eine umfassende Editierung nach Maßgabe des LIWC-Handbuchs sowie Korrekturen von Rechtschreibung und Zeichensetzung die Resultate der einzelnen LIWC-Kategorien nur unwesentlich beeinflussen. Die Befunde stellen einen ersten Hinweis für die Brauchbarkeit des LIWC für die Analyse deutscher Texte und speziell der natürlichen geschriebenen Sprache aus computervermittelten Kommunikationen. Weitere psychometrische Studien zur Validität und Reliabilität der LIWC-Kategorien sind aktuell in Vorbereitung. Das dt. Wörterbuch ist für wissenschaftliche Zwecke frei nutzbar. Es ist bei den Autoren erhältlich oder kann über die LIWC Homepage www.liwc.net heruntergeladen werden.
Literatur:
Wolf, M., Horn, A., Mehl, M., Haug, S., Pennebaker, J. W. & Kordy, H. (2008). Computergestützte quantitative Textanalyse: Äquivalenz und Robustheit der deutschen Version des Linguistic Inquiry and Word Count. Diagnostica, 2, 85-98.
Klinisch Psychologisches Diagnosesystem 38 (KPD-38)
R. Percevic, C. Gallas, M. Wolf, S. Haug, H. Kordy
Das Klinisch Psychologische Diagnosesystem 38 (KPD-38) ist ein Selbstbeurteilungsinstrument für den Einsatz in Qualitätssicherung (QS) und Ergebnismonitoring (EM) und bildet das Kerninstrument für die Ergebnisbewertung in Web-AKQUASI.
Das KPD-38 wurde aus dem Itempool des Klinisch Psychologischen Diagnosesystems (KPD, Schwarz & Hünerfauth, 2000) entwickelt. Dafür wurden von der FOST in Zusammenarbeit mit der USUMA GmbH Ende 2002 repräsentative Bevölkerungsnormdaten erhoben (N = 2066). Von den ursprünglich 134 Items des KPD wurden nach inhaltlichen Gesichtspunkten und unter Kontrolle der Item-Skala Korrelationen (rit > 0,4) 38 Items beibehalten und zu den sechs Skalen „Körperbezogene Beeinträchtigung“ (KOE), „Psychische Beeinträchtigung“ (PSY), „Soziale Probleme“ (SOZ), „Handlungskompetenz“ (KOM), „Allgemeine Lebenszufriedenheit“ (ZUF) und „Soziale Unterstützung“ (SOU) zusammengefasst. Die Skalenstruktur wurde faktorenanalytisch bestätigt, mit Ausnahme der Skalen PSY und SOZ, die einen gemeinsamen Faktor bilden. Eine Faktorenanalyse höherer Ordnung bestätigte einen übergeordneten Faktor, bestehend aus den Subskalen KOE, PSY, SOZ, KOM und ZUF. Die internen Konsistenzen der Skalen sind zufrieden stellend (KOE: 0,90; PSY: 0,89; SOZ: 0,82; KOM: 0,75; ZUF: 0,78; SOU: 0,80; Gesamtskala GES: 0,91).
In einer Auswertung an 351 Patienten der Panorama-Fachklinik in Scheidegg zeigten sich die größten Effektstärken auf den Skalen KOE (1,04), GES (0,83) und PSY (0,71). Durch die Gesamtskala des KPD-38 konnten in 84% aller Fälle korrekte Zuordnungen zur Patienten- bzw. Normstichprobe getroffen werden (vgl. Globaler Schwereindex der SCL 90-R: 77%). Die Korrelationen der KPD-38-Skalen mit etablierten Selbst- und Fremdbeurteilungsinstrumenten entsprechen weitgehend den Erwartungen, was für die Konstruktvalidität des Instruments spricht. Von den Therapeuten wurde die klinische Bedeutung der zurück gemeldeten KPD-38-Skalenwerte bestätigt. In den meisten Fällen bestätigten (78%) oder ergänzten (18%) die auf dem KPD-38 basierenden Rückmeldungen ihren klinischen Eindruck; nur in weniger als 4% der Fälle wurde die Qualität der Rückmeldungen angezweifelt.
Als nächster Schritt werden die Faktorenstruktur des KPD-38 und dessen Änderungssensitivität an Patientenstichproben aus verschiedenen Kliniken überprüft.
Literatur
Percevic, R., Gallas, C., Wolf, M., Haug, S., Hünerfauth, T., Schwarz, M. & Kordy, H. (2005). Das Klinisch Psychologische Diagnosesystem (KPD-38): Entwicklung, Normierung und Validierung eines Selbstbeurteilungsbogen für den Einsatz in Qualitätssicherung und Ergebnismonitoring in der Psychotherapie und psychosomatischen Medizin. Diagnostica, 51, 134-144.
Validierung der Short Evaluation of Eating Disorders (SEED)
S. Bauer & H. Kordy
Forschung zum Verlauf von Essstörungen verlangt kurze und valide Instrumente, um z. B. ein Monitoring der zentralen Symptome zu ermöglichen. Zu diesem Zweck wurde im Rahmen der MZ-ESS und des Forschungsverbundes COST Action B6 die Short Evaluation of Eating Disorders (SEED) entwickelt und eingesetzt.
Die SEED erfasst anhand weniger Items die zentralen Symptome von Anorexia nervosa (AN; Untergewicht, Angst vor Gewichtszunahme, Körperwahrnehmungsstörung) und Bulimia nervosa (BN; Essanfälle, kompensatorisches Verhalten, übermäßige Beschäftigung mit Figur und Gewicht) und erlaubt die Berechnung von zwei globalen Beeinträchtigungsscores, dem Total Severity Index für AN (AN TSI) und dem Total Severity Index für BN (BN TSI).
Basierend auf den Daten der deutschen (N = 366 für AN; N = 667 für BN) und der englischen (N = 70 für AN; N = 100 für BN) Stichprobe aus COST sowie einer Stichprobe von Nichtpatientinnen (N = 70) wurden verschiedene Validitätsaspekte der SEED untersucht.
In Bezug auf die Konstruktvalidität ergaben sich erwartungskonforme Zusammenhänge der SEED Scores mit den EDI-Skalen, wobei diese für AN Patientinnen ausgeprägter waren als für BN Patientinnen. Ferner erwies sich die SEED als geeignet, zwischen AN und BN Patientinnen sowie Nichtpatientinnen zu diskriminieren. Bzgl. der Übereinstimmung zwischen Patientinnen- und Therapeutenurteil ergaben sich moderate Zusammenhänge (Intraclass Korrelationen .77 für AN TSI und .84 für BN TSI). Auf eine gewisse Änderungssensitivität weist hin, dass die SEED Werte von Patientinnen, deren Befinden anhand der Veränderung ihrer EDI-Werte zwischen Aufnahme und Entlassung als „unverändert“ klassifiziert wurden, signifikant weniger abnahmen als die derjenigen, die als „reliabel“ oder „klinisch signifikant verändert“ klassifiziert wurden.
Insgesamt weisen die Befunde die SEED als ökonomisches und valides Instrument aus, welches sich eignet, den Symptomverlauf von AN und BN longitudinal zu beobachten.
Literatur
Bauer, S., Winn, S., Schmidt, U. & Kordy, H. (2005). Construction, scoring and validation of the Short Evaluation of Eating Disorders (SEED). European Eating Disorders Review, 13, 191-200.
Test zur Erfassung des emotionalen Ressourcenpotenzials (BER)
M. Wolf in Zusammenarbeit mit W. Bongartz, Universität Konstanz
Die Fähigkeit positive emotionale Ressourcen zu aktivieren, gilt in der Psychotherapie als zentraler Bestandteil der Bewältigung persönlicher Probleme oder psychischer Störungen. Insbesondere in der modernen Hypnosetherapie wird daher versucht, Patienten positive emotionale Erfahrungen zu ermöglichen. Der von W. Bongartz an der Universität Konstanz konzipierte Test zur Erfassung des emotionalen Ressourcenpotentials (BER) soll gezielt erfassen, inwieweit eine Person in der Lage ist, über hypnotische Trance Zugang zu den eigenen Ressourcen zu bekommen. Mittels sechs Items wird vom Probanden eingeschätzt, wie sehr eine jeweils durch eine imaginative Szene suggerierte Emotion aktuell empfunden wurde (Skala „BER-Aktuell“). Weitere sechs Items erfragen, wie häufig die jeweilige Emotion im Alltag erlebt wird (Skala „BER-Alltag“). Der Selbsteinschätzung geht eine von CD abgespielte Trancesequenz voraus, in der nacheinander folgende Emotionen symbolisch dargestellt werden: „Kraft und Stärke“, „befreiende Kraft“, „innere Sicherheit“, „Vertrauen“, „Hoffnung“, „Helligkeit und Klarheit“. Die Durchführung der BER dauert ca. 30 Minuten. Objektivität hinsichtlich Durchführung und Auswertung sind gegeben.
In einer Reihe von Studien wurde das Verfahren an nicht-klinischen (insgesamt N = 614) und an einer klinischen Stichprobe (N = 198 Psychotherapiepatienten) psychometrisch untersucht. Die Überprüfung der Verteilung der Items und BER-Skalen ergab lediglich in der nicht-klinischen Stichprobe eine statistisch signifikante Abweichung von der Normalverteilung. Die Skalen zeigten zufriedenstellende Reliabilitäten (Retest: .68 bzw. .71; Interne Konsistenzen .75 bis .89). In einer Hauptkomponentenanalyse wurden nach Maßgabe des Kaiserkriteriums vier (nicht-klinisch) bzw. zwei (klinisch) Faktoren extrahiert, die im Wesentlichen die beiden rational gebildeten Skalen repräsentieren. Konfirmatorische Faktorenanalysen ergaben eine moderate Übereinstimmung der vorgegebenen Skalenstruktur mit den empirischen Daten. Die BER-Werte waren weitestgehend unabhängig vom Alter und Geschlecht der Probanden, sowie der Größe der Gruppe, in der die Durchführung erfolgt ist. Die Zusammenhänge mit inhaltlich verwandten Konstrukten, wie Hypnosefähigkeit, Emotionsinduktion und Imaginationsfähigkeit fielen moderat aus. Höhere Korrelationen ergaben sich mit Instrumenten, die die Induktionsfähigkeit ermitteln, sowie mit Fragebögen, die Resilienz und Ressourcen erfassen. Erwartungsgemäß hohe Korrelationen fanden sich mit Verfahren zur direkten Emotionserfassung. Korrelationen mit klinisch-psychologischen Fragebögen sowie die im Vergleich zur nicht-klinischen Stichprobe deutlich geringeren Werte in der Patientenstichprobe lassen die weitere Erprobung der BER in klinischen Zusammenhängen sinnvoll erscheinen.
Literatur:
Wolf, M. & Bongartz, W. (2009). Die "Bestimmung des emotionalen Ressourcenpotenzials (BER)" – Psychometrische Überprüfung eines Tests zur Erfassung individueller emotionaler Erfahrungsmöglichkeiten. Psychotherapie, Psychosomatik, Medizinische Psychologie, 59, 5-13.
Entscheidungsorientiertes adaptives Testen bei Essstörungen
M. Mößner, R. Percevic, H. Kordy
Ziel ist die Entwicklung einer Testbatterie für Essstörungen, welche in der Lage ist, Krankheitsverläufe über verschiedene Krankheits- und Behandlungsphasen hinweg (Prävention, ambulante und stationäre Therapien, Rückfallprävention) zu beschreiben. Als Anwendungsbereich scheint u.a. die individuelle Behandlungsplanung im Rahmen eines stepped care Ansatzes lohnenswert, um Entscheidungshilfen in bezug auf die Behandlungsintensität/ Übergange zwischen verschiedenen Behandlungsphasen bereit zu stellen.
Aufgrund des breiten Anwendungsbereiches der Testbatterie muss eine Vielzahl von Domänen abgedeckt werden. Bei einem Einsatz im Rahmen des Ergebnismonitoring (EM) sind zusätzlich möglichst hochfrequente Messungen wünschenswert, so dass der dadurch entstehende Aufwand der Testungen schnell den Rahmen des Zumutbaren sprengen würde. Mittels computerisierter adaptiver Vorgabe (Web-AKQUASI) kann der Testaufwand erheblich gesenkt werden. So können Regeln für eine Vorauswahl der Skalen, die bei einem Patienten aufgrund seines momentanen Befindens als relevant erscheinen, erstellt werden. Eine weitere Möglichkeit bietet das entscheidungsorientierte adaptive Testen. Hierbei werden die Skalen in verschiedene Bereiche eingeteilt und der Test dient der Klassifikation der Probanden zu diesen Skalenbereichen. Die Wahl der Trennwerte, die diese Bereiche definieren, kann unter verschiedenen Gesichtspunkten erfolgen. Zur Identifikation von Problembereichen werden für jede Domäne separat Trennwerte gewählt, die die Skalen in funktionale und dysfunktionale Bereiche unterteilen. Soll eine Kombination von Klassifikationen auf verschiedenen Skalen zur Prognose oder Behandlungsplanung genutzt werden, können andere Trennwerte angebracht sein. Aufgrund erster Simulationen werden, in Abhängigkeit von der tolerierten Fehlklassifikationsraten, durchschnittliche Itemeinsparungen von ca. 20% (0% Fehlklassifikationsrate) bis zu maximal 40% (5% Fehlklassifikationsrate) durch die adaptive entscheidungsorientierte Vorgabe erwartet.






