Kinder-DIPS - Hogrefe eContent

Transcription

Kinder-DIPS - Hogrefe eContent
Zeitschrift für Kinder- und Jugendpsychiatrie und Psychotherapie, 41 (5), 2013, 319–334
Z. Kinder-Jugendpsychiatr.
M.Psychother.
Neuschw ander
41 (5)et©al.:
2013
Interrater-Reliabilität
Verlag Hans Huber, Hogrefe
des Kinder-DIPS
AG , Bern
Originalarbeit
Interrater-Reliabilität des
Diagnostischen Interviews bei
psychischen Störungen im Kindesund Jugendalter (Kinder-DIPS)
Murielle Neuschwander1, Tina In-Albon2, Carmen Adornetto3,
Binia Roth4 und Silvia Schneider1
1
Klinische Kinder- und Jugendpsychologie, Ruhr-Universität Bochum, 2Klinische Psychologie und
Psychotherapie des Kindes- und Jugendalters, Universität Koblenz-Landau, 3Kinder- und
Jugendpsychiatrische Klinik der UPK Basel, 4Kinder- und Jugendpsychiatrie, Baselland
Zusammenfassung. Fragestellung: Ziel der vorliegenden Studie ist, die Interrater-Reliabilität des Diagnostischen Interviews bei psychischen Störungen im Kindes- und Jugendalter (Kinder-DIPS; Schneider, Unnewehr & Margraf, 2009) anhand von Eltern- und Kinderinterviews für verschiedene Störungsklassen zu ermitteln. Zusätzlich wird geprüft, ob sich in Abhängigkeit des Alters oder des Geschlechtes des Kindes, Unterschiede hinsichtlich der Interrater-Reliabilität ergeben. Methodik: 264 Eltern- und 213 Kinderinterviews wurden
von 48 geschulten Interviewern in kinder- und jugendpsychiatrischen und schulpsychologischen Einrichtungen sowie im Rahmen eines
Forschungsprojektes durchgeführt. Ergebnisse: Die Übereinstimmungsmaße der Eltern- und Kinderinterviews zeigen eine gute bis sehr
gute Interrater-Reliabilität der Oberklassen Expansive Störungen, Ticstörungen, Ausscheidungsstörungen, Affektive Störungen, Essstörungen, Schlafstörungen sowie einem Großteil der spezifischen Diagnosen und für den Ausschluss psychischer Störungen. Das Geschlecht
und das Alter der interviewten Kinder hatten keinen Einfluss auf die Reliabilitätswerte. Schlussfolgerung: Die Ergebnisse zeigen, dass
es sich beim Kinder-DIPS mit trainierten Interviewern für die Oberklassen psychischer Störungen um ein reliables Eltern- und Kinderinterview zur Diagnostik psychischer Störungen handelt.
Schlüsselwörter: Psychische Störungen, Kinder-DIPS, strukturiertes Interview im Kindes- und Jugendalter, Reliabilität
Abstract. Interrater reliability of the «Diagnostisches Interview bei psychischen Störungen im Kindes- und Jugendalter» (Kinder-DIPS)
Objective: This study investigates the interrater reliability of the «Diagnostisches Interview bei psychischen Störungen im Kindes- und
Jugendalter» (Kinder-DIPS; Schneider, Unnewehr & Margraf, 2009) based on child and parent interviews. It further investigates differences in the interrater reliability depending on age or sex of the children. Method: 48 certified interviewers conducted 264 parent and
213 child interviews in various inpatient, outpatient, and research settings. Results: There is a good interrater reliability for the parent
and child interviews for the major diagnostic categories of conduct disorders, tic disorders, elimination disorders, mood disorders, eating
disorders, sleeping disorders, the majority of the specific psychiatric disorders, and the exclusion of psychiatric disorders. Neither the
sex nor the age of the children influenced interrater reliability. Conclusions: The second and expanded Kinder-DIPS proves to be a reliable
parent and child interview for the assessment of mental disorders in both outpatient and inpatient settings.
Keywords: mental disorders, Kinder-DIPS, structured interview for children and adolescents, reliability
Einleitung
Psychische Störungen im Kindes- und Jugendalter weisen
eine mittlere Periodenprävalenz (1–12 Monate) von 22 %
auf (Eschmann, Weber Häner & Steinhausen, 2007). Die
häufigsten psychischen Störungen im Kindes- und JugendDOI 10.1024/1422-4917/a000247
alter stellen Angststörungen, hyperkinetische und dissoziale Störungen dar. Im Jugendalter treten zudem vermehrt
affektive Störungen, Substanzmissbrauch und Essstörungen auf (Essau, Karpinski, Petermann & Conradt, 1998;
Ihle & Esser, 2002; Merikangas et al., 2010). Bei etwa 40 %
der Kinder und Jugendlichen liegen eine oder mehrere ko-
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
320
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
morbide psychische Störungen vor (Essau et al., 1998;
Merikangas et al., 2010).
Um eine solide Indikationsstellung und somit eine adäquate Behandlung zu ermöglichen, ist eine zuverlässige
und valide Differentialdiagnostik unbedingt erforderlich
(Silverman & Ollendick, 2005). Zur Feststellung von Störungen mit Krankheitswert ist eine kategoriale und eine dimensionale Diagnostik sinnvoll (Heubrock & Petermann,
2005). Im Rahmen der kategorialen Diagnostik stellen
strukturierte und standardisierte Interviews zur Diagnosestellung nach den Kriterien von ICD-10 oder DSM-IV-TR
den Gold-Standard für eine zuverlässige Diagnosestellung
psychischer Störungen bei Kindern und Jugendlichen dar
(Costello, Egger & Angold, 2005; In-Albon, Dubi, Adornetto, Blatter-Meunier & Schneider, 2011). Für den englischen Sprachraum existieren verschiedene standardisierte
und strukturierte Interviews zur Diagnostik psychischer
Störungen im Kindes- und Jugendalter (vgl. Schneider &
Adornetto, 2006). Im deutschen Sprachraum sind drei
strukturierte Interviews, das Mannheimer Elterninterview
(MEI; Esser, Blanz, Geisel & Laucht, 1989), das Diagnostische Interview bei psychischen Störungen im Kindes- und
Jugendalter (Kinder-DIPS; Schneider, Unnewehr & Margraf, 2009) und das Kiddie-SADS-Present and Lifetime
(K-SADS-PL; Delmo, Weiffenbach, Gabriel, Stadler &
Poustka, 2001) aktuell verfügbar. Zudem sind das halbstrukturierte Interview CASCAP-D (Psychopathologisches
Befund-System für Kinder und Jugendliche; Döpfner, Berner, Flechtner, Lehmkuhl & Steinhausen, 1999) und das
DISYPS-II (Diagnostik-System für psychische Störungen
nach ICD-10 und DSM-IV für Kinder und Jugendliche –
II; Diagnose-Checkliste; Döpfner, Görtz-Dorten & Lehmkuhl, 2008) erhältlich. Tabelle 1 beschreibt deutschsprachige Verfahren, deren Altersbereich, Klassifikationssystem
der Diagnosestellung und Gütekriterien. Neben den störungsübergreifenden klinischen Interviews existieren weitere störungsspezifische Interviews für den Kinder- und Jugendbereich wie bspw. die Interviews zur Posttraumatischen Belastungsstörung bei Kindern und Jugendlichen
(IBS-KJ; Steil & Füchsel, 2006), die deutsche Version des
Child Eating Disorder Examination (ChEDE; Hilbert, im
Druck), die deutsche Version der Children’s Depression
Rating Scale – Revised (CDRS-R; Keller, Grieb, Kölch &
Spröber, 2012) oder das Diagnostische Interview für Autismus – Revidiert (ADI-R; Bölte, Rühl, Schmötzer &
Poustka, 2005).
Lapouse und Monk (1959, 1964) sowie Rutter und
Graham (1968) verwendeten erstmals für die Diagnostik
psychischer Störungen im Kindes- und Jugendalter Parallelversionen strukturierter Interviews für Eltern und Kinder. Verhaltensweisen, Gefühle und Fähigkeiten der Kinder wurden direkt erfragt. Der Wortlaut der Fragen, die
Antwortkategorien und die Reihenfolge der Fragen wurden dem Interviewer genau vorgegeben. Gezeigt werden
konnte, dass Kinder ihre Beschwerden reliabel schildern
können (Angold, 2002; Rutter & Graham, 1968). Hinsichtlich des Geschlechts und Alters der Kinder bestehen
unterschiedliche Befunde in Bezug auf reliable und valide Angaben. Nach Herjanic, Herjanic, Brown und
Wheatt (1975) können Mädchen reliablere Angaben machen als Jungen. Unter Experten besteht keine Einigkeit,
ab welchem Alter Kinder im Rahmen von diagnostischen
Interviews ausreichend detaillierte und genaue Angaben
zur Diagnosestellung geben können, was sicherlich auch
mit einer bislang spärlichen Datenlage zusammenhängt.
Angold, Erkanli, Costello und Rutter (1996) zeigten aufgrund ihrer Datenanalyse, dass Kinder ab dem Alter von
9 Jahren ebenso genaue Angaben zu Beginn, Dauer und
Zusammentreffen von Symptomen machen, wie ihre Eltern. Edelbrock, Costello, Dulcan, Kalas und Conover
(1985) konnten zeigen, dass diagnostische Interviews mit
Kindern ab dem Alter von 10 Jahren sinnvoll durchgeführt werden können. Herjanic et al. (1975) teilten aufbauend auf Entwicklungsstufen ihre Stichprobe in die Alterskategorien 6–8, 9–13 und 14–16 Jahre ein, wobei die
Ergebnisse keine signifikanten Unterschiede zwischen
den Altersgruppen zeigten. Nach Poustka (1988) sollten
diagnostische Interviews bei Kindern erst ab dem Alter
von 12 Jahren durchgeführt werden, wobei es sich hierbei
nicht um eine empirisch fundierte Aussage handelt. Insgesamt kann festgehalten werden, dass der Einfluss des
Alters auf die Reliabilität und Validität von strukturierten
Interviews nicht abschließend eingeordnet werden kann
und empirische Studien notwendig sind, um diese wichtige Frage zu klären. Generell kann davon ausgegangen
werden, dass die altersgerechte Formulierung der Fragen
in strukturierten Interviews einen erheblichen Einfluss
auf Reliabilität und Validität der Antworten haben dürfte
(Breton et al., 1995).
Für die Diagnostik psychischer Störungen im Kindesund Jugendalter gilt, dass verschiedene Informanten
(Kind, Eltern, andere Bezugspersonen) in den diagnostischen Prozess eingebunden werden müssen, um eine
vollständige Erfassung der Symptomatologie des Kindes
und somit eine valide Diagnosestellung zu ermöglichen
(Kraemer et al., 2003; Silverman & Ollendick, 2005).
Strukturierte klinische Interviews sind hinsichtlich ihrer
Gütekriterien abhängig von der Güte der ihnen zugrundeliegenden Klassifikationssysteme (siehe Mohr &
Schneider, 2013). Für deutschsprachige Interviews und
andere Verfahren, die für die Diagnostik im Kindes- und
Jugendalter existieren, kann festgehalten werden, dass
diese hinsichtlich ihrer psychometrischen Gültigkeit wenig überprüft sind. Aufgrund einer Überarbeitung der
Erstauflage des Kinder-DIPS (Unnewehr, Schneider &
Margraf, 1995), wurde eine Überprüfung der Gütekriterien für die Zweitauflage des Kinder-DIPS (Schneider,
Unnewehr et al., 2009) notwendig. Ziel der vorliegenden
Studie ist es, die Interrater-Reliabilität des Kinder-DIPS
anhand von Kinder- und Elterninterviews für verschiedene Störungsklassen zu ermitteln. Zusätzlich soll überprüft werden, ob sich in Abhängigkeit des Alters oder des
Geschlechtes des Kindes Unterschiede hinsichtlich der
Interrater-Reliabilität ergeben.
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
321
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
322
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
Methodik
Kinder-DIPS für DSM-IV-TR
Das Kinder-DIPS (Schneider, Unnewehr et al., 2009) ist ein
strukturiertes Interview zur Erfassung psychischer Störungen
im Kindes- und Jugendalter, welches erlaubt die Fragen an
das Alter der Kinder anzupassen. Das Kinder-DIPS umfasst
eine Kinderversion zur direkten Befragung des Kindes bzw.
Jugendlichen sowie eine parallele Elternversion ab frühestens 6 Jahren (Empfehlung für die Kinderversion: ab frühestens 8 Jahren). Die Abfolge der Interviewfragen ist syndromorientiert und zur Vermeidung unnötiger Fragen enthält das
Interview an entsprechenden Stellen Sprungregeln, welche
das Überspringen einzelner Abschnitte erlauben. Es können
derzeitige und Lebenszeitdiagnosen nach DSM-IV-TR
(APA, 2000) und ICD-10-Diagnosen (WHO, 2000) erhoben
werden und die Überführung der Diagnosestellung vom einen zum anderen Klassifikationssystem ist anhand einer Tabelle möglich. In der 2. Auflage wurden neue, für den psychotherapeutischen Bereich wichtige psychische Störungen
aufgenommen, z. B. Ticstörungen, Schlafstörungen, Prüfungsangst, Selektiver Mutismus, Pica und Binge-EatingStörung und formale Änderungen vorgenommen. Zudem
wurde ein Screening zu Nikotin-, Alkohol- und Drogenmissbrauch integriert (für eine Übersicht siehe Handbuch des Kinder-DIPS für DSM-IV-TR; Schneider, Suppiger, Adornetto,
Unnewehr & Margraf, 2009). Das Kinder-DIPS für DSMIV-TR und ICD-10 erfasst die folgenden Störungskategorien: Störungen der Aufmerksamkeit, der Aktivität und des
Sozialverhaltens, Ticstörungen, Angststörungen, Störungen
der Ausscheidung, Schlafstörungen, Affektive Störungen
und Essstörungen. Neben dem Teil zur Erfassung spezifischer psychischer Störungen enthält das Kinder-DIPS einen
allgemeinen klinisch-demographischen Teil und Screeningfragen zu körperlichen Krankheiten, entwicklungsbezogenen
Koordinationsstörungen, Kommunikationsstörungen, Schulund Teilleistungsstörungen, Substanzmissbrauch, nicht-organische Psychosen sowie zu Medikamentengebrauch. Zudem werden eine psychiatrische Anamnese, eine Familienanamnese psychischer Störungen sowie die Achsen IV (psychosoziale und umgebungsbedingte Probleme) und V
(globale Erfassung des Funktionsniveaus) des DSM-IV-TR
erhoben. Das Kinder-DIPS enthält therapierelevante Fragen
zu auslösenden und modulierenden Faktoren, um das Interview insbesondere für den psychotherapeutischen Gebrauch
nutzbar zu machen.
Ablauf der Untersuchung
Zur Überprüfung der Interrater-Reliabilität wurden 264 Eltern- und 213 Kinderinterviews, welche in kinder- und jugendpsychiatrischen und psychologischen Einrichtungen geführt wurden, auf Tonband aufgenommen und von einem
zweiten unabhängigen Diagnostiker gegenkodiert. Der unab-
hängige Diagnostiker nahm anhand der Tonbandaufnahme
eine eigenständige klinische Einschätzung vor. Die Diagnosestellungen wurden in Fallkonferenzen besprochen und bei
abweichenden Diagnosen wurden Konsensdiagnosen gebildet. Die ermittelten Symptome wurden von den Interviewern
beschrieben, es wurden Einschätzungen anhand DSM-IVTR-Diagnosen vorgenommen und anhand einer Checkliste
für jede Störungskategorie Gründe für mangelnde Übereinstimmung zwischen zwei Diagnostikern erhoben. Die Kinder
und deren Eltern wurden nach derzeitigen sowie früheren
psychischen Problemen der Kinder befragt, somit konnten
neben aktuellen auch Lebenszeitdiagnosen der Kinder erhoben werden. Die Eltern und die Kinder wurden über die Untersuchung informiert und gaben ihr schriftliches Einverständnis zur Teilnahme am diagnostischen Interview.
Interviewer und Schulung
Alle Interviewer absolvierten ein standardisiertes Training
in der Durchführung und Auswertung des Kinder-DIPS
(siehe Handbuch des Kinder-DIPS für DSM-IV-TR;
Schneider, Suppiger et al., 2009) und mussten eine Zertifizierungsprüfung mit einem reliablen Interviewer bestehen.
Erst nach Abschluss einer erfolgreichen Zertifizierung
wurden die Interviewer in die Studie für die Durchführung
von Interviews bzw. Gegenkodierungen aufgenommen.
Die Eltern- und Kinderinterviews sowie die Gegenkodierungen wurden von 48 Interviewern (39 Psychologen
mit Bachelorabschluss: 35 Frauen, Alter: 21.18–42.15 Jahre; MW = 25.86; SD = 3.81 und 4 Männer, Alter:
24.37–26.83 Jahre; MW = 25.78; SD = 1.59 und 9 diplomierte Psychologinnen: 9 Frauen, Alter: 27.78–45.72 Jahre; MW = 31.63, SD = 5.54) durchgeführt. Der Range für
die Anzahl geführter Kinderinterviews pro Interviewer lag
zwischen 1 und 17 und für die Anzahl geführter Elterninterviews zwischen 1 und 36. Die neun diplomierten Psychologinnen führten die Interviews im Rahmen einer Therapiestudie durch und die Interviews in der Kinder- und
Jugendpsychiatrie Baselland (Kinder: n = 76; Eltern: n =
65) und dem Schulpsychologischer Dienst Basel-Stadt
(Kinder: n = 10; Eltern: n = 13) (siehe Rekrutierung) sowie
alle Gegenkodierungen (Kinder: n = 213; Eltern: n = 264)
wurden von den 39 Psychologen mit Bachelorabschluss
durchgeführt.
Stichprobe
Rekrutierung
Im Zeitraum von Februar 2004 bis Dezember 2008 wurden
in der Kinder- und Jugendpsychiatrie Baselland (KJP), im
Schulpsychologischen Dienst Basel-Stadt (SPD) sowie im
Rahmen einer Therapiestudie an der Universität Basel, insgesamt 272 Kinder (KJP: n = 114, 41.91 %; SPD: n = 16,
5.88 %; Forschung: n = 142, 52.21 %) und 346 Eltern (KJP:
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
323
Abbildung 1. Verlauf der Datenerhebung.
n = 114, 32.95 %; SPD: n = 16, 4.62 %; Forschung: n =
216, 62.43 %) über die Reliabilitätsstudie informiert und
für eine Studienteilnahme angefragt. Die teilnehmenden
Institutionen organisierten die Rekrutierung der Studienteilnehmenden in ihrer Patientenpopulation. Der Verlauf
der Datenerhebung ist in Abbildung 1 dargestellt.
Kinder
Der Mädchenanteil bei den Kinderinterviews betrug
50.2 % (n = 107) und das durchschnittliche Alter der Kinder war 11.31 Jahre (SD = 2.70; Min. = 6.02, Max. = 18.44).
Die folgenden Schultypen waren vertreten: 2.3 % besuchten den Kindergarten, 53.1 % die Grundschule, 14.1 % die
Mittelstufe, 11.3 % die Oberstufe (Real-/Sekundarschule),
8.9 % die Oberstufe (Gymnasium), 1.4 % hatten die Schule
abgebrochen und 9 % fielen unter «andere Schule» (z. B.
Sonderschule, Berufsausbildung).
Eltern
Bei den Elterninterviews betrug der Mädchenanteil 51.9 %
(n = 137) und das Durchschnittsalter der Kinder lag bei
10.04 Jahre (SD = 2.88, Min. = 4.82, Max. = 17.89).
138 (52.3 %) der Interviews fanden mit den Müttern, 13
(4.9 %) mit den Vätern und 113 (42.8 %) mit beiden Elternteilen statt. Die interviewten Eltern waren durchschnittlich
41.50 Jahre (SD = 5.41, Min. = 27.74, Max. 60.96) alt.
64.5 % der Mütter waren berufstätig (Angestellte: 53.1 %,
n = 140, Beamte: 3.4 %, n = 9, Selbstständig Erwerbende:
8.0 %, n = 21), 31.4 % waren Hausfrauen, 0.4 % arbeitslos
und von 3.8 % fehlt die Angabe zur Berufstätigkeit. 86.7 %
der Väter waren berufstätig (Angestellte: 66.2 %, n = 175,
Beamte: 7.2 %, n = 19, Selbstständig Erwerbende: 12.1 %,
n = 32), 1.1 % Hausmänner, 1.5 % arbeitslos und von
10.6 % fehlt diese Angabe. 74.6 % der Eltern waren verheiratet, 18.2 % getrenntlebend oder geschieden, 0.4 %
verwitwet, 4.2 % ledig und von 2.7 % fehlt die Angabe.
Maße zur Reliabilitätsbestimmung
Zur Bestimmung der Reliabilität werden auf der Ebene von
Oberklassen psychischer Störungen (z. B. Angststörungen,
Schlafstörungen) und auf der Ebene der einzelnen Diagnosekategorien (z. B. Soziale Phobie, Spezifische Phobie) die
prozentuale Übereinstimmung, der Kappa-Koeffizient (Cohen, 1960) und der Y-Koeffizient (Yule, 1912) angegeben.
Anhand der drei Übereinstimmungsmaße sind Aussagen
über die Reliabilität einzelner Diagnosekategorien und Störungsklassen möglich. Die prozentuale Übereinstimmung
berücksichtigt das Ausmaß der zufällig zu erwartenden Übereinstimmung nicht, was zu einer Überschätzung der Übereinstimmung führt (Asendorpf & Wallbott, 1979). Der Y-Koeffizient (Yule, 1912) ist dem Kappa-Koeffizienten (Cohen,
1960) ähnlich, ist jedoch unabhängig von der Basisrate (Auf-
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
324
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
tretenshäufigkeit bestimmter Störungsbilder) und bleibt im
Bereich einer beobachteten Basisrate von 1–50 % stabil
(Spitznagel & Helzer, 1985). Kappa-Koeffizienten mit einer
Basisrate < 10 % stellen eine Unterschätzung der Übereinstimmung dar. Kappa- und Y-Werte > .40 werden als akzeptable und Werte > .70 als sehr gute Übereinstimmung interpretiert (Burke, 1986). Wenn eine Zelle der Häufigkeitstabelle Null ist, kann der Y-Koeffizient nicht interpretiert werden,
da er den Endpunkt eines Wertebereiches erreicht (–1 oder
+1). Dies gilt auch für die Berechnung des Kappa, wenn die
Zellen der Diagonale beide den Wert Null enthalten. Dies
wurde anhand der Pseudo-Bayes Schätzung (Bishop, Fienberg & Holland, 2007; Formeln 12.7–19 und 12.7–20) ausgeglichen und es wurden jeweils die absoluten sowie die geschätzten Koeffizienten berechnet. Für die Interpretation der
Übereinstimmung werden die geschätzten Koeffizienten berücksichtigt. Die Übereinstimmungsmaße sollten in Relation
zueinander interpretiert und nicht als absolute Werte verstanden werden. Die globale prozentuale Übereinstimmung zwischen zwei Interviewern gibt an, inwiefern mehrere Diagnosen gleichzeitig übereinstimmend gestellt werden können.
Hierbei lag eine Übereinstimmung nur dann vor, wenn beide
Interviewer in allen aktuellen und früheren Diagnosen übereinstimmten. Zwischen Haupt- und Zusatzdiagnose wurde
nicht unterschieden. Die Übereinstimmungskoeffizienten
wurden für die gesamte und für die klinische Stichprobe berechnet. Der Vorteil der Berechnungen für die Gesamtstichprobe besteht darin, dass auch die Reliabilität bzgl. des Ausschlusses psychischer Störungen ermittelt werden kann.
Nachteilig ist zu erwähnen, dass sich durch dieses Vorgehen
die Basisraten der zu überprüfenden Diagnoseklassen reduzieren. Um diesem Nachteil entgegen zu wirken, wurden die
Übereinstimmungsmaße zusätzlich für die klinische Stichprobe berechnet, um mehr Diagnoseklassen interpretierbar
zu machen.
Fehleranalyse bei Nichtübereinstimmung
Die Gründe für eine nichtübereinstimmende Diagnose zwischen Interviewern und Gegenkodierern wurden im Rahmen von Fallkonferenzen festgehalten. Anhand einer
Checkliste zur Fehleranalyse konnte für jede Störungskategorie der Grund für die mangelnde Übereinstimmung
festgehalten werden. Folgende Kategorien wurden unterschieden:
1. Interviewfehler: Sprungregel falsch angewendet; starke
Abweichung von standardisierten Fragen; ungenügende
Folgefragen zu Diagnoseklärung; unvollständige Befragung; Protokollierungsfehler.
2. Auswertungsfehler: DSM-Kriterien falsch angewendet;
Differentialdiagnostische Aspekte falsch beachtet.
3. Unterschiedliche Symptomgewichtung: bezüglich Symptomen, Leiden/Beeinträchtigung.
4. Qualität der Tonaufnahme: die Antwort wurde nicht verstanden; ein Teil der Aufnahme fehlt.
5. Unterschiedliche differentialdiagnostische Bewertung.
6. DSM-IV-TR oder Kinder-DIPS unpräzise/unklar: beispielsweise zu allgemein formulierte Diagnosekriterien;
spezifische Störungen, welche nicht anhand des KinderDIPS erfasst werden.
Einfluss des Geschlechts und des Alters der Kinder
auf die Reliabilität
Um zu prüfen, ob sich in Abhängigkeit des Alters der Kinder
UnterschiedeinderInterrater-Reliabilitätergeben,wurdenAlterskategorien in Anlehnung an die Befunde zu Altersunterschieden hinsichtlich der Reliabilität von Interviews mit Kindern gebildet (Angold et al., 1996; Edelbrock et al., 1985; Herjanicetal.,1975;Poustka,1988).Eswurdenfürdievorliegende
UntersuchungdieAlterskategorien6.0–9.99Jahre,10.0–11.99
Jahre und älter als 12 Jahre gewählt. Die Alterskategorie der
jüngsten Kinder wurde weiter in die Kategorien von 6.0–7.99
und 8.0–9.99 Jahre bzw. von 6.0–8.99 und 9.0–9.99 Jahre eingeteilt. Um den Einfluss des Alters und des Geschlechts der
interviewten Kinder auf die Wahrscheinlichkeit, dass zwei Interviewer hinsichtlich der Diagnosestellung übereinstimmen,
kontinuierlichzutesten,wurde eine binärelogistische Regressionsanalyse mit den Prädiktoren Alter und Geschlecht der interviewten Kinder berechnet. Die binäre logistische RegressionsanalysewurdefürdieGesamtstichprobederKinderinterviews(N=213)undfürdieTeilstichprobederKinderinterviews
nach Ausschluss der gesunden Kinder (N = 106), d. h. ohne
DiagnoseneinerpsychischenStörung,berechnet.
Ergebnisse
Es wurden insgesamt 213 Kinder- sowie insgesamt 264 Elterninterviews durchgeführt und gegenkodiert. Durchschnittlich wurden 0.84 Lebenszeitdiagnosen (SD = 1.09, Range
0–7) anhand der Kinderinterviews sowie 1.33 Lebenszeitdiagnosen (SD = 1.13, Range 0–6) anhand der Elterninterviews
vergeben. Die Kinderinterviews (n = 175) dauerten durchschnittlich 76.63 Minuten (SD = 34.83, Range 10–180 Minuten) und die Elterninterviews (n = 223) durchschnittlich
98.75 Minuten (SD = 40.06, Range 24–328 Minuten).
Interrater-Reliabilität Eltern
(Lebenszeitdiagnosen)
Die Ergebnisse zur Interrater-Reliabilität für die Lebenszeitdiagnosen auf der Ebene von Oberklassen psychischer Störungen sowie auf der Ebene von spezifischen Diagnosen sind
in den Tabellen 2 und 3 dargestellt. Die prozentuale Übereinstimmung der Oberklassen beträgt mindestens 96.21 %. Insgesamt ist die Interrater-Reliabilität der Oberklassen gut bis
sehr gut. Die Kappa-Werte liegen zwischen 0.94 und 0.97
und die Y-Werte zwischen 0.85 und 0.97.
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
325
Tabelle 2
Interrater-Reliabilität des Kinder-DIPS Elternversion (Oberklasse, Lebenszeitdiagnosen) für die gesamte Stichprobe
(N = 264)
DSM-IV-TR Oberklassen
Häufigkeiten
–/–
–/+
+/–
+/+
Expansive Störungen
220
2
2
40
Ticstörungen
246
2
2
14
Ausscheidungsstörungen
238
3
2
21
Affektive Störungen
233
1
2
28
Angststörungen
Essstörungen
Schlafstörungen
Keine Diagnosen
104
2
6
152
258
3
0
3
240
7
3
14
202
1
%
Kappa [95 % KI]
Yule’s Y
98.49
(.94 [.89, .99c]
.96
98.49
(.87) [.74, .99c]
.93
98.11
(.88) [.78, .98]
.93
98.86
(.94 [.88, 1.00]
.97
96.97
(.94 [.90, .98]
.95
98.86
(.66) [.29, 1.00]
96.21
(.72) [.55, .89]
.85
98.86
(.97 [.93, 1.00]
.97
1.00/.87a
2
59
Anmerkungen. Kappa-Koeffizienten, die aufgrund einer Basisrate der jeweiligen Oberklasse von < 10 % (n = 26.4 (Formel: (+/+) + ((+/–) +
(–/+)/2)) eine Unterschätzung darstellen, sind in Klammer aufgeführt. aPseudo-Bayes Schätzung von Kappa bzw. Y. – nicht berechenbar. KI =
Konfidenzintervalle. cObergrenze des KI wurde abgerundet, 1.00 wurde nicht erreicht.
Tabelle 3
Interrater-Reliabilität des Kinder-DIPS Elternversion (Störungsebene, Lebenszeitdiagnosen) für die gesamte Stichprobe
(N = 264)
DSM-IV-TR Spezifische Diagnosen
Häufigkeiten
–/–
–/+
+/–
+/+
Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung
242
0
3
19
Störung mit oppositionellem Trotzverhalten
238
1
1
24
Störung des Sozialverhaltens
260
1
0
3
Tourette-Störung
262
0
0
2
Chronische motorische oder vokale Ticstörung
Vorübergehende motorische oder vokale Ticstörung
Enuresis
Enkopresis
257
1
1
5
254
1
1
8
239
3
2
20
261
0
0
3
%
Kappa [95 % KI]
Yule’s Y
98.86
(.92) [.83, 1.00]
1.00/.96a
99.24
(.96) [.90, 1.00]
99.62
(.86) [.57, 1.00]
1.00/0.93a
(1.00)/(.80a) [.36, 1.00]b
1.00/.96a
100.00
.97
99.24
(.83) [.59, 1.00]
.95
99.24
(.89) [.73, 1.00]
.96
98.11
(.88) [.77, .98]
.93
100.00
(1.00)/(.86a) [.55, 1.00]b
1.00/.97a
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
326
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
DSM-IV-TR Spezifische Diagnosen
Major Depression
Dysthyme Störung
Störung mit Trennungsangst
Panikstörung ohne Agoraphobie
Häufigkeiten
–/–
–/+
+/–
+/+
242
2
2
18
252
1
2
9
160
2
3
99
263
1
0
0
Panikstörung mit Agoraphobie
264
0
0
0
Agoraphobie ohne Panikstörung
262
0
0
2
Spezifische Phobie
222
1
7
34
215
1
3
45
Sozialphobie
Selektiver Mutismus
264
0
0
0
Zwangsstörung
260
1
0
3
Generalisierte Angststörung
253
1
4
6
Posttraumatische Belastungsstörung
263
0
0
1
Pica
261
3
0
0
262
0
0
2
263
0
0
1
Anorexia Nervosa
Bulimia Nervosa
Binge Eating Disorder
264
0
0
0
Primäre Insomnie
245
5
3
11
Primäre Hypersomnie
263
1
0
0
Schlafstörung mit Alpträumen
261
0
0
3
Pavor Nocturnus
264
0
0
0
263
1
Schlafstörung mit Schlafwandeln
%
Kappa [95 % KI]
Yule’s Y
98.49
(.89) [.79, .99c]
.94
98.86
(.85) [.68, 1.00]
.94
98.11
(.95 [.93, .99c]
.96
99.62
–
–
100.00
–
–
100.00
(1.00)/(.80a) [.36, 1.00]b
1.00/.96a
96.97
(.88 [.79, .96]
.94
98.49
(.95 [.90, .99c]
.97
100.00
–
–
99.62
(.86) [.57, 1.00]
1.00/.93a
98.11
(.70) [.43, .96]
.90
(1.00)/(.67a) [.00, 1.00]b
1.00/.95a
–
–
100.00
(1.00)/(.80a) [.36, 1.00]b
1.00/.96a
100.00
(1.00)/(.67a) [.00, 1.00]b
1.00/.95a
100.00
–
–
100.00
98.86
96.97
(.72) [.52, .91]
.86
99.62
–
–
100.00
(1.00)/(.86a) [.55, 1.00]b
1.00/.97a
100.00
–
–
99.62
–
–
0
0
Anmerkungen. Kappa-Koeffizienten, die aufgrund einer Basisrate der jeweiligen Oberklasse von < 10 % (n = 26.4 (Formel: (+/+) + ((+/–) +
(–/+)/2)) eine Unterschätzung darstellen, sind in Klammer aufgeführt. a Pseudo-Bayes Schätzung von Kappa bzw. Y. – nicht berechenbar. KI =
Konfidenzintervalle. b Konfidenzintervall basierend auf Pseudo-Bayes Schätzung von Kappa. c Obergrenze des KI wurde abgerundet, 1.00 wurde
nicht erreicht.
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
Auf der Ebene der spezifischen Diagnosen lagen alle
prozentualen Übereinstimmungen über 96.97 %. Für die
Interrater-Reliabilität der spezifischen Diagnosen über die
Lebenszeit ergaben sich gute bis sehr gute Werte. Die Kappa-Werte lagen zwischen 0.88 und 0.95 und die Y-Werte
zwischen 0.86 und 0.97.
Die globale prozentuale Übereinstimmung zeigte, dass
in 83.3 % (n = 220) der Interviews zwei Interviewer in allen
Lebenszeitdiagnosen (aktuelle und frühere Diagnosen)
übereinstimmten. Die maximale Anzahl komorbider Diagnosen betrug hierbei sieben. Bei Betrachtung der aktuellen
Diagnosen stimmten in 87.9 % (n = 232) der Interviews
beide Interviewer hinsichtlich aller Diagnosen überein. Bei
86.7 % (n = 229) dieser Fälle wurde Übereinstimmung hinsichtlich primärer und zusätzlicher Diagnose erzielt. Die
maximale Anzahl aktueller Diagnosen betrug sechs.
Interrater-Reliabilität (Eltern) bei
ausschließlicher Betrachtung der Klinischen
Stichprobe
Nach Ausschluss der Kinder ohne Diagnosen psychischer
Störungen, kann der Kappa-Koeffizient für die spezifischen
Diagnosen ADHS (Kappa = 0.92), Störung mit oppositionellem Trotzverhalten (Kappa = 0.95) und Enuresis (Kappa =
0.90) interpretiert und als sehr gut eingeschätzt werden.
Interrater-Reliabilität Kinder
(Lebenszeitdiagnosen)
Die Ergebnisse zur Interrater-Reliabilität für die Lebenszeitdiagnosen auf der Ebene von Oberklassen psychischer Störungen sowie auf der Ebene von spezifischen Diagnosen sind
in den Tabellen 4 und 5 dargestellt. Die prozentuale Übereinstimmung der Oberklassen beträgt mindestens 95.31 %. Die
Interrater-Reliabilität der Oberklassen ist insgesamt gut bis
sehr gut. Die Kappa-Werte liegen zwischen 0.90 und 0.92
und die Y-Werte liegen zwischen 0.94 und 0.97.
Auf der Ebene der spezifischen Lebenszeitdiagnosen lagen alle prozentualen Übereinstimmungen über 97.65 %.
Für die Interrater-Reliabilität der spezifischen Diagnosen
über die Lebenszeit ergaben sich gute bis sehr gute Werte.
Die Kappa-Werte lagen zwischen 0.92 und 0.98 und die
Y-Werte zwischen 0.84 und 0.97.
Die globale prozentuale Übereinstimmung zeigte, dass in
90.6 % (n = 193) der Interviews zwei Interviewer in allen
Lebenszeitdiagnosen (aktuelle und frühere Diagnosen) übereinstimmten, wobei die maximale Anzahl komorbider Diagnosen sieben betrug. In 92.0 % (n = 196) der Interviews
stimmten zwei Interviewer hinsichtlich der aktuell bestehenden Diagnosen überein, davon stimmten in 92.0 % (n = 196)
der Fälle die beiden Interviewer auch hinsichtlich der Zuordnung der Diagnosen als primär bzw. zusätzlich überein. Die
maximale Anzahl aktueller Diagnosen betrug fünf.
327
Interrater-Reliabilität (Kinder) bei
ausschließlicher Betrachtung der Klinischen
Stichprobe
Nach Ausschluss der Kinder ohne Diagnosen psychischer
Störungen, kann der Kappa-Koeffizient für die spezifischen Diagnosen Major Depression (Kappa = 0.96), Soziale Phobie (Kappa = 0.96) und Primäre Insomnie (Kappa =
0.95) interpretiert und als sehr gut eingeschätzt werden.
Fehleranalyse Eltern und Kinder
Die häufigsten Fehlerquellen bei nichtübereinstimmenden
Diagnosestellungen können für die Eltern- und Kinderinterviews der Tabelle 6 entnommen werden.
Interrater-Reliabilität aktuelle und primäre
Diagnosen
Das zeitliche Auftreten von Diagnosen (aktuell bzw. früher) wird durch die Analysen anhand von Lebenszeitdiagnosen nicht berücksichtigt. Aus diesem Grund wurden die
Reliabilitätsberechnungen ebenfalls für die Übereinstimmung aller aktuell bestehenden Diagnosen zum Zeitpunkt
des Interviews sowie für die Primärdiagnose, welche aktuell vergeben wurde, durchgeführt. Übereinstimmend mit
den Ergebnissen zu den Lebenszeitdiagnosen wurde für alle aktuellen Diagnosen auf der Basis der Oberklassen für
die Elterninterviews die Expansiven Störungen, Ticstörungen, Angststörungen, Schlafstörungen sowie der Ausschluss von psychischen Störungen (keine Diagnosen) und
auf der Basis spezifischer Störungsbereiche (Störung mit
oppositionellem Trotzverhalten, Chronische motorische
oder vokale Ticstörung, Major Depression, Dysthyme Störung, Störung mit Trennungsangst, Spezifische Phobie, Soziale Phobie, Generalisierte Angststörung und Primäre Insomnie) sehr gute Reliabilitätswerte ermittelt. Alle prozentualen Übereinstimmungen lagen über 96.21 %. Die
Kappa-Werte lagen zwischen 0.87 und 0.98 und die Yule’s
Y-Werte zwischen 0.88 und 0.98. Die Übereinstimmung
der aktuellen Diagnosen anhand der Kinderinterviews weisen für die Oberklassen (Ticstörungen, Angststörungen,
Schlafstörungen und keine Diagnosen) sowie die Störungsebene (Störung mit Trennungsangst und Spezifische Phobie) ebenfalls sehr gute Reliabilitätswerte auf. Alle prozentualen Übereinstimmungen lagen über 94.37 %. Die Kappa-Werte lagen zwischen 0.89 und 0.98 und die Yule’s
Y-Werte zwischen 0.87 und 0.97. Ausführliche Tabellen zu
den Reliabilitätsmaßen der aktuell bestehenden und der
Primärdiagnosen können bei den Autoren angefordert werden.
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
328
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
Tabelle 4
Interrater-Reliabilität des Kinder-DIPS Kinderversion (Oberklasse, Lebenszeitdiagnosen) für die gesamte Stichprobe
(N = 213)
DSM-IV-TR Oberklassen
Häufigkeiten
%
–/–
–/+
+/–
+/+
Expansive Störungen
201
0
1
11
Ticstörungen
202
6
1
4
Ausscheidungsstörungen
203
0
1
9
Affektive Störungen
191
0
2
20
Angststörungen
132
1
9
71
208
0
0
5
Essstörungen
Schlafstörungen
Keine Diagnosen
195
1
2
15
97
8
Kappa [95 % KI]
Yule’s Y
99.53
(.95) [.86, 1.00]
1.00/.96a
96.71
(.52) [.17, .87]
99.53
(.95) [.84, 1.00]
1.00/.96a
99.06
(.95) [.87, 1.00]
1.00/.96a
95.31
.90 [.84, .96]
(1.00)/(.91a) [.72, 1.00]b
100.00
.94
.94
1.00/.97a
98.59
(.90) [.79, 1.00]
.95
95.78
.92 [.86, .97]
.95
1
107
Anmerkungen. Kappa-Koeffizienten, die aufgrund einer Basisrate der jeweiligen Oberklasse von < 10 % (n = 21.3 (Formel: (+/+) + ((+/–) +
(–/+)/2)) eine Unterschätzung darstellen, sind in Klammer aufgeführt. a Pseudo-Bayes Schätzung von Kappa bzw. Y. – nicht berechenbar. KI =
Konfidenzintervalle. b Konfidenzintervall basierend auf Pseudo-Bayes Schätzung von Kappa.
Tabelle 5
Interrater-Reliabilität des Kinder-DIPS Kinderversion (Störungsebene, Lebenszeitdiagnosen) für die gesamte Stichprobe
(N = 213)
DSM-IV-TR Spezifische Diagnosen
Häufigkeiten
%
–/–
–/+
+/–
+/+
210
0
1
2
207
0
0
6
208
1
0
4
Tourette-Störung
212
0
0
1
Chronische motorische oder vokale Ticstörung
208
0
1
4
Vorübergehende motorische oder vokale Ticstörung
206
1
1
5
Enuresis
204
0
1
8
211
0
0
2
Aufmerksamkeitsdefizit-/Hyperaktivitätsstörung
Störung mit oppositionellem Trotzverhalten
Störung des Sozialverhaltens
Enkopresis
99.53
100.00
99.53
Kappa [95 % KI]
Yule’s Y
(.80) [.40, 1.00]
1.00/.90a
(1.00)/(.92a) [.76, 1.00]b
1.00/.97a
(.89) [.66, 1.00]
.93a
(1.00)/(.67a) [.00, 1.00]b
1.00/.95a
99.53
(.89) [.66, 1.00]
1.00/.93a
99.06
(.83) [.60, 1.00]
99.53
(.94) [.82, 1.00]
1.00/.96a
(1.00)/(.80a) [.36, 1.00]b
1.00/.96a
100.00
100.00
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
.94
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
DSM-IV-TR Spezifische Diagnosen
Häufigkeiten
%
–/–
–/+
+/–
+/+
Major Depression
195
0
2
16
Dysthyme Störung
206
0
1
6
173
2
3
35
Störung mit Trennungsangst
Panikstörung ohne Agoraphobie
Panikstörung mit Agoraphobie
Agoraphobie ohne Panikstörung
213
0
0
0
212
0
1
0
210
1
1
1
187
0
1
25
Sozialphobie
198
1
1
13
Selektiver Mutismus
212
0
1
0
Zwangsstörung
209
0
1
3
Generalisierte Angststörung
205
0
3
5
212
0
0
1
213
0
0
0
210
0
0
3
Bulimia Nervosa
212
0
0
1
Binge Eating Disorder
212
0
0
1
Primäre Insomnie
202
0
1
10
Primäre Hypersomnie
211
1
0
1
208
0
1
4
Spezifische Phobie
Posttraumatische Belastungsstörung
Pica
Anorexia Nervosa
Schlafstörung mit Alpträumen
329
Kappa [95 % KI]
Yule’s Y
99.06
(.94) [.85, 1.00]
1.00/.96a
99.53
(.92) [.77, 1.00]
1.00/.95a
97.65
(.92 [.85, .99]
.94
100.00
–
–
100.00
–
–
99.06
(.50) [.00, 1.00]
.87
99.53
(.98 [.93, 1.00]
99.06
(.92) [.82, 1.00]
99.53
–
–
99.53
(.86) [.57, 1.00]
1.00/0.92a
98.59
(.76) [.50, 1.00]
1.00/.92a
100.00
(1.00)/(.67a) [.00, 1.00]b
1.00/.95a
100.00
–
–
100.00
(1.00)/(.86a) [.55, 1.00]b
1.00/.96a
100.00
(1.00)/(.67a) [.00, 1.00]b
1.00/.95a
100.00
(1.00)/(.67a) [.00, 1.00]b
1.00/.95a
99.53
(.95) [.85, 1.00]
1.00/.96a
99.53
(.67) [.01, 1.00]
1.00/.84a
99.53
(.89) [.67, 1.00]
1.00/.93a
1.00/.97a
.96
Anmerkungen. Kappa-Koeffizienten, die aufgrund einer Basisrate der jeweiligen Oberklasse von < 10 % (n = 21.3 (Formel: (+/+) + ((+/–) +
(–/+)/2)) eine Unterschätzung darstellen, sind in Klammer aufgeführt. aPseudo-Bayes Schätzung von Kappa bzw. Y. – nicht berechenbar. KI =
Konfidenzintervalle. bKonfidenzintervall basierend auf Pseudo-Bayes Schätzung von Kappa.
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
330
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
Tabelle 6
Fehleranalyse des Kinder-DIPS Eltern- und Kinderversion (Störungsebene, Lebenszeitdiagnosen) für die gesamte Stichprobe
Elternversion
Oberklassen (n)
Interviewfehler
Sprungregel falsch angewendet
Oberklassen (%)
Kinderversion
Oberklassen (n)
Oberklassen (%)
11
19.64
4
14.29
0
.00
0
.00
Starke Abweichung von standardisierten Fragen
1
1.79
2
7.14
Ungenügende Folgefragen zur Diagnosestellung
9
16.07
1
3.56
Protokollierungsfehler
1
1.79
0
.00
Unvollständigkeit der Befragung
0
.00
0
.00
Andere Gründe
0
.00
1
3.57
Auswertungsfehler
23
41.07
12
42.86
18
32.14
10
35.72
DSM-Kriterien falsch angewendet
Differentialdiagnostische Aspekte falsch beachtet
Unterschiedliche Symptomgewichtung
5
8.93
2
7.14
15
26.79
11
39.28
bezüglich Symptomen
9
16.07
7
25.00
bezüglich Leiden/Beeinträchtigung
6
10.71
4
14.28
Qualität der Tonaufnahme
0
.00
0
.00
Antwort wurde nicht verstanden
0
.00
0
.00
Ein Teil der Aufnahme fehlt (Qualität der Aufnahme)
0
.00
0
.00
Unterschiedliche differentialdiagnostische Bewertung
4
7.14
1
3.57
DSM-IV-TR oder Kinder-DIPS unpräzise/unklar
Total
3
5.36
0
.00
56
100.00
18
100.00
Tabelle 7
Binäre logistische Regression der vorhersagenden Wahrscheinlichkeit für übereinstimmende Diagnosestellung zwischen
zwei Interviewern in Abhängigkeit des Alters und Geschlechts des interviewten Kindes (gesamte Stichprobe, N = 213)
Prädiktor
B
SD
Odds Ratio (= eB)
95 % KI des Odds Ratio
Untere Grenze
Konstante
Wald’s χ2
.30
1.07
Obere Grenze
1.69
1.64
5.43
.08
.15
1.08
.81
1.44
.61
.26
2.04
2.09
7.69
.13
461.18
.33
.95
Alter
Geschlecht (männlich = 1, weiblich = 2)
p
Alter × Geschlecht
–.22
.18
.80
.56
1.14
.21
1.56
Anmerkungen. SD = Standardfehler; KI = Konfidenzintervall. R2 = 11.75 (Hosmer & Lemeshow), .02 (Cox & Snell), .04 (Nagelkerke). Modell
χ2(3) = 3.72, p = .29.
Tabelle 8
Binäre logistische Regression der vorhersagenden Wahrscheinlichkeit für übereinstimmende Diagnosestellung zwischen
zwei Interviewern in Abhängigkeit des Alters und Geschlechts des interviewten Kindes (nach Ausschluss der Kinder ohne
Diagnose, n = 106)
Prädiktor
B
SD
Odds Ratio (= eB)
95 % KI des Odds Ratio
Untere Grenze
p
Wald’s χ2
Obere Grenze
Konstante
.51
1.73
1.67
.77
.09
Alter
.12
.16
1.13
.83
1.52
.45
.58
Geschlecht (männlich = 1, weiblich = 2)
.88
2.29
2.40
.03
212.88
.70
.15
Alter × Geschlecht
–.15
.20
.86
.59
1.26
.44
.60
Anmerkungen. SD = Standardfehler; KI = Konfidenzintervall. R2 = 7.85 (Hosmer & Lemeshow), .03 (Cox & Snell), .05 (Nagelkerke). Modell
χ2(3) = 3.61, p = .31.
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
Einfluss des Alters und des Geschlechts der
interviewten Kinder
Zusätzlich wurde untersucht, ob das Geschlecht und das Alter
einen Einfluss auf die Reliabilitätswerte der Kinderinterviews haben. Die deskriptiven Vergleiche ergaben, dass das
Geschlecht keinen Einfluss auf die Reliabilitätswerte der Lebenszeitdiagnosen auf der Ebene von Oberklassen hat (ausführliche Tabellen können bei den Autoren angefordert werden). Der Vergleich der Alterskategorien (6.0–9.99 Jahre,
10.0–11.99 Jahre, älter als 12 Jahre) der Kinderinterviews
ergab für die Lebenszeitdiagnosen auf der Ebene der Oberklassen keine nennenswerten Unterschiede hinsichtlich der
Reliabilitätswerte. Die geringste prozentuale Übereinstimmung betrug über die drei Kategorien 92.86 % (Ticstörungen), der niedrigste Kappa-Wert betrug 0.86 (Schlafstörungen) und der niedrigste Yule’s Y-Wert betrug 0.75 (Expansive
Störungen). Nach Burke (1986) können diese Werte als sehr
gute Übereinstimmungen interpretiert werden. Für die spezifischen Lebenszeitdiagnosen Störung mit Trennungsangst,
Spezifische Phobie und Soziale Phobie zeigte sich deskriptiv,
dass auch hier keine Altersunterschiede in Bezug auf die Reliabilitätswerte bestehen. Die Alterskategorie der jüngsten
Kinder wurde nochmals in zwei Gruppen eingeteilt, um den
Einfluss des Alters zu untersuchen. Die Gruppe der 6.00 bis
7.99-Jährigen unterschied sich nicht nennenswert von der
Gruppe der 8.00 bis 9.99-Jährigen und die Gruppe der 6.0 bis
8.99-Jährigen unterschied sich nicht von der Gruppe der 9.0
bis 9.99-Jährigen hinsichtlich der Reliabilitätswerte. Die Interrater-Reliabilität für die Lebenszeitdiagnosen auf der Ebene der Oberklassen sowie die überprüften spezifischen Lebenszeitdiagnosen ergab gute bis sehr gute Werte (ausführliche Tabellen können bei den Autoren angefordert werden).
Die kontinuierliche Testung des möglichen Einflusses
des Alters und Geschlechts der interviewten Kinder auf die
Übereinstimmung zwischen zwei Interviewern hinsichtlich
der Diagnosestellung, wurde mittels einer binären logistischen Regressionsanalyse überprüft. Tabelle 7 können die
Ergebnisse für die Gesamtstichprobe der Kinderinterviews
(N = 213) und Tabelle 8 können die Ergebnisse der Teilstichprobe der Kinderinterviews nach Ausschluss der gesunden Kinder (N = 106), d. h. ohne Diagnosen einer psychischen Störung, entnommen werden. Die Ergebnisse verweisen darauf, dass die Wahrscheinlichkeit für eine
Diagnose-Übereinstimmung zweier Interviewer weder
durch das Alter noch durch das Geschlecht des interviewten Kindes signifikant beeinflusst wird.
Diskussion
Die Ergebnisse der vorliegenden Studie zur Interrater-Reliabilität zeigen, dass die 2. Auflage des Kinder-DIPS gute
bis sehr gute Interrater-Reliabilitäten aufweist, welche vergleichbar mit jenen der 1. Auflage des Kinder-DIPS (Un-
331
newehr et al., 1995) sind. Aufgrund der umfangreicheren
Stichprobengröße sowie der höheren Auftretenshäufigkeit
spezifischer Störungsbereiche, konnten für die vorliegende
Untersuchung im Vergleich zur Überprüfung der 1. Auflage für weitere Störungsbilder Reliabilitätsmaße berechnet
und interpretiert werden. Gute bis sehr gute Interrater-Reliabilitäten ergaben sich für die Eltern- und Kinderversion
der Kinder-DIPS-Oberklassen Expansive Störungen, Ticstörungen, Ausscheidungsstörungen, Affektive Störungen,
Angststörungen, Essstörungen und Schlafstörungen. Anhand der Kinderinterviews konnten neben der prozentualen
Übereinstimmung, welche mindestens bei 97.65 % lag, für
23 der 27 spezifischen Kinder-DIPS-Diagnosen, weitere
Übereinstimmungsmaße berechnet werden (Ausnahme:
Panikstörung ohne/mit Agoraphobie, Selektiver Mutismus
und Pica). Alle Kappa- und Y-Koeffizienten sind als gut
bis sehr gut zu interpretieren (Ausnahme: Agoraphobie
ohne Panikstörung, Kappa = 0.50). Für 21 der 29 spezifischen Diagnosen der Elterninterviews konnten neben der
prozentualen Übereinstimmung, welche mindestens bei
96.07 % lag, weitere Übereinstimmungsmaße berechnet
werden (Ausnahmen: Panikstörung ohne/mit Agoraphobie,
Selektiver Mutismus, Pica, BED, Primäre Hypersomnie,
Pavor Nocturnus und Schlafstörung mit Schlafwandeln).
Alle Kappa- und Y-Koeffizienten können als gut bis sehr
gut interpretiert werden. Der Ausschluss von psychischen
Störungen erwies sich für die Eltern- (98.86 %) und die
Kinderversion (95.78 %) ebenfalls als sehr reliabel.
Mittels der Methode der Pseudo-Bayes Schätzung (Bishop et al., 2007) konnten Kappa- und Y-Koeffizienten für
Störungsbilder mit einer zu geringen Basisrate (< 10 %)
berechnet und interpretiert werden. Nach Ausschluss der
Kinder ohne psychische Störungen konnten weitere Kappa-Koeffizienten auf der Basis von Lebenszeitdiagnosen
für spezifische Diagnosen der Eltern- und Kinderinterviews interpretiert und als sehr gut eingeschätzt werden.
Ergebnisse im Vergleich zu weiteren
deutschsprachigen klinischen Interviews
Die Interrater-Reliabilität des Kinder-DIPS kann nur bedingt mit den Gütekriterien anderer deutschsprachiger Interviews verglichen werden. Mit einem Kappa von 0.71
und einer prozentualen Übereinstimmung von 79 % liegen
ebenfalls gute Interrater-Reliabilitätsmaße der Diagnosestellung anhand des MEI (Esser et al., 1989) vor. Diese
wurden jedoch anhand von nur 34 Interviews erhoben und
bedürfen daher einer Replikation an einer größeren Stichprobe, die es auch erlaubt, für spezifische Störungsbilder
Gütekriterien zu bestimmen. Die Befunde zur Prüfung einiger Symptomskalen des CASCAP-D lassen keinen Vergleich mit der Interrater-Reliabilität des Kinder-DIPS zu,
da anhand des CASCAP-D keine Diagnosestellung erfolgt
(Döpfner, Berner, Schwitzgebel & Lehmkuhl, 1994). Aus
Mangel an publizierten Befunden zur Reliabilität der
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
332
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
Checklisten des DISYPS-II (Döpfner et al., 2008) und des
K-SADS (Delmo et al., 2001), können ebenfalls keine weitergehenden Vergleiche mit Reliabilitätsbefunden deutschsprachiger diagnostischer Verfahren berichtet werden.
Fehlerquellen
In 44 der 264 Eltern- sowie 20 der 213 Kinderinterview lag
keine Übereinstimmung zwischen zwei Interviewern in allen Lebenszeitdiagnosen vor. Als häufigste Fehlerquelle
wurde die fehlerhafte Anwendung der DSM-IV-TR-Kriterien (Auswertungsfehler) ermittelt. Über alle Interviews
betrachtet, ist die Fehlerquote jedoch relativ gering.
Da das Kinder-DIPS auf dem DSM aufbaut, kann die Reliabilitätsprüfung des Kinder-DIPS auch als Überprüfung der
Reliabilität der Diagnosekriterien des DSM-IV-TR betrachtet werden. Diese enge Verknüpfung mit dem DSM-IV-TR
machte das Kinder-DIPS abhängig von der Gültigkeit und
Veränderungen des Klassifikationssystems. Somit können
strukturierte und standardisierte Interviews lediglich so reliabel sein, wie das Klassifikationssystem auf dem sie beruhen.
Einfluss des Geschlechts und des Alters der
Kinder auf die Reliabilität
In der vorliegenden Untersuchung wurden einerseits die
Reliabilitätsmaße getrennt nach Geschlecht sowie Alterskategorien der Kinderinterviews berechnet und deskriptiv
verglichen und andererseits wurde eine binäre logistische
Regressionsanalyse mit den Kovariablen Alter und Geschlecht der interviewten Kinder berechnet. Es zeigte sich,
dass das Geschlecht des Kindes keinen Einfluss auf die Interrater-Reliabilität hat. Dieses Ergebnis steht im Gegensatz zu den Befunden von Herjanic et al. (1975), dass Mädchen reliablere Informanten sind als Jungen und bestätigt
die Ergebnisse von Edelbrock et al. (1985) und Angold et
al. (1996), wonach kein Geschlechtsunterschied für Reliabilitätswerte bzw. präzise Antworten im Rahmen diagnostischer Interviews vorhanden waren. Somit kann angenommen werden, dass die Reliabilität des Kinder-DIPS nicht
mit dem Geschlecht des Kindes in Zusammenhang steht.
Zur Anwendung von diagnostischen Interviews in Abhängigkeit vom Alter des Kindes liegen, wie oben berichtet,
unterschiedliche Befunde vor (Angold et al., 1996; Edelbrock et al., 1985; Herjanic et al., 1975; Poustka, 1988).
Dem Alter der Kinder konnte in der vorliegenden Untersuchung keine entscheidende Rolle hinsichtlich der Interrater-Reliabilitätsmaße beigemessen werden. Die prozentualen Übereinstimmungen, die Kappa- und die Y-Werte sind
für die überprüften Alterskategorien deskriptiv vergleichbar und das Alter hat keinen signifikanten Einfluss auf die
Übereinstimmung zwischen zwei Interviewern. Somit
kann das Kinder-DIPS bereits mit Kindern im Grundschulalter durchgeführt werden. Die Ergebnisse der vorliegen-
den Untersuchung stehen in Einklang mit denjenigen von
Herjanic et al. (1975), unterscheiden sich jedoch von jenen
von Angold et al. (1996), Edelbrock et al. (1985) und der
Lehrmeinung von Poustka (1988).
Bei der Rekrutierung wurde speziell darauf geachtet,
dass neben den Interviews im Rahmen des Forschungsprojekts, Kinder und Eltern aus klinisch-psychiatrischen und
schulpsychologischen Institutionen rekrutiert wurden. Der
häufige Einwand, dass strukturierte Interviews primär im
Forschungskontext reliabel durchführbar sind, kann durch
die Ergebnisse der vorliegen Studie nicht bestätigt werden.
Es zeigte sich, dass unabhängig vom Rekrutierungsort und
dem Alter der Kinder reliable Interviewergebnisse erzielt
werden konnten.
Einschränkungen
Einschränkend muss erwähnt werden, dass aufgrund kleiner Stichprobengrößen, auch nach Ausschluss von Kindern
ohne psychische Störungen, für spezifische Störungsbereiche (Elterninterviews: Tic-, Ess- und Schlafstörungen; Kinderinterviews: Tic-, Ausscheidungs- und Schlafstörungen)
eine abschließende Interpretation und Beurteilung der Interrater-Reliabilität nicht möglich ist und die Befunde als
vorläufig betrachtet werden müssen. Des Weiteren waren
die Studienbedingungen für die Teilnehmenden der drei
Teilstichproben nicht exakt identisch. Für das Forschungsprojekt wurden spezifische Alterskategorien (6- bis 12-Jährige) rekrutiert und es bestand eine Zeitvorgabe bzgl. der
Durchführung des Interviews. Diese gezielte Rekrutierung
einer bestimmten Alterskategorie sowie der Zeitdruck zur
Durchführung des Interviews bestanden in der Praxis nicht.
Weiterhin wurden alle Interviews und Gegenkodierungen
der Interviews in den beiden Praxisinstitutionen von Psychologen mit Bachelorabschluss durchgeführt. Die neun
diplomierten Psychologinnen haben lediglich im Forschungskontext Interviews geführt. Aus diesem Grund
konnte der Ausbildungsgrad bzw. die klinische Erfahrung
der Interviewer, nicht berücksichtigt und nicht analysiert
werden, ob der Ausbildungsstand mit der Interviewdauer
oder höheren Reliabilitätswerten einhergeht. Aufgrund des
standardisierten Trainings zur Durchführung des KinderDIPS, kann jedoch davon ausgegangen werden, dass alle
Interviewer einen Mindeststandard an klinischer Erfahrung
mit strukturierten Interviews aufwiesen. Weiter kann das
Fehlen von näheren Angaben zum Bildungsstand der Eltern bemängelt werden. Der Einfluss von Schul- und Berufsbildung der Eltern hinsichtlich der Reliabilität der Interviewdaten konnte daher nicht untersucht werden.
Schlussfolgerungen und Ausblick
Basierend auf den Ergebnissen kann gezeigt werden, dass das
Kinder-DIPS ein reliables Erhebungsinstrument für die Di-
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
agnostik psychischer Störungen sowie für den Ausschluss
psychischer Störungen im Kindes- und Jugendalter anhand
von Eltern- und Kindinformationen ist. Zudem ist die untersuchte Stichprobe der Eltern (N = 264) und Kinder (N = 213)
auch im internationalen Kontext als groß zu betrachten, die
Geschlechterverteilung der Kinder ist ausgeglichen, es wurden Interviews im Forschungskontext sowie in der Praxis
durchgeführt, ein breites Spektrum hinsichtlich des Alters der
Kinder konnte berücksichtigt werden und neben genügend
Deutschkenntnissen wurde auf weitere Ausschlusskriterien
verzichtet. Es zeigten sich gute bis sehr gute Reliabilitätsmaße, unabhängig vom Alter und Geschlecht der Kinder. Die
vorliegenden Ergebnisse und Hinweise, dass auch klinische
Beurteiler vom Einsatz strukturierter Interviews profitieren
können (Dolle, Schulte-Körne, von Hofacker, Izat & Allgaier, 2012), machen das Kinder-DIPS für die Praxis und
Forschung einsetzbar. In Anbetracht dieser Gegebenheiten
können die Ergebnisse der psychometrischen Überprüfung
des Kinder-DIPS als sehr gut beurteilt werden. Die vorliegenden Ergebnisse zur Interrater-Reliabilität sollen durch Untersuchungen zur Akzeptanz, Test-Retest-Reliabilität und zur
Validitätsprüfung (in Vorbereitung) des Kinder-DIPS ergänzt
werden. Ergebnisse zur Akzeptanz des Kinder-DIPS zeigen,
dass Kinder und ihre Eltern am Interview wieder teilnehmen
würden und sie sich durch die strukturierte Diagnostik gut
verstanden fühlen (in Vorbereitung). Ein breiter Einsatz
strukturierter Interviews erscheint daher wünschenswert und
machbar (Seehagen, Pflug & Schneider, 2012).
Abschließend soll darauf hingewiesen werden, dass
strukturierte Interviews, wie das Kinder-DIPS, eines stringenten Trainings in Durchführung und Auswertung bedürfen. Nur so kann die reliable und valide Anwendung sichergestellt werden.
Danksagung
Die Autoren danken allen Kindern und Eltern für die Teilnahme an der Studie, allen Interviewern für die Durchführung und Auswertung der Interviews sowie der Kinder- und
Jugendpsychiatrie Baselland und dem Schulpsychologischen Dienst Basel-Stadt für die Unterstützung des Forschungsprojektes.
Literatur
Ambrosini, P. (2000). Historical development and present status
of the Schedule for Affective Disorders and Schizophrenia for
School-Age Children (K-SADS). Journal of the American
Academy of Child and Adolescent Psychiatry, 39, 49–58.
American Psychiatric Association. (Eds.). (2000). Diagnostic and
Statistical Manual of Mental Disorders – Text Revision (DSMIV-TR). Washington, DC: Autor.
Angold, A. (2002). Diagnostic interviews with parents and children. In M. Rutter & E. Taylor (Hrsg.), Child and adolescent
psychiatry (4th ed., pp. 32–51). Oxford: Blackwell Science.
333
Angold, A., Erkanli, A., Costello, E. J. & Rutter, M. (1996). Precision, reliability and accuracy in the dating of symptom onsets
in child and adolescent psychopathology. Journal of Child
Psychology and Psychiatry, 37, 657–664.
Asendorpf, J. & Wallbott, H. G. (1979). Maße der Beobachtungsübereinstimmung: Ein systematischer Vergleich. Zeitschrift für
Sozialpsychologie, 10, 243–252.
Bishop, Y. M. M., Fienberg, S. E. & Holland, P. W. (2007). Discrete multivariate analysis: Theory and applications. New
York: Springer.
Bölte, S., Rühl, D., Schmötzer, G. & Poustka, F. (2005). Diagnostisches Interview für Autismus – Revidiert (ADI-R). Bern: Huber.
Breton, J.-J., Bergeron, L., Valla, J.-P., Lapine, S., Houde, L. &
Gaudet, N. (1995). Do children aged 9–11 years unterstand the
DISC version 2.25 questions? Journal of the American Academy of Child and Adolescent Psychiatry, 34, 946–956.
Burke, J. D. (1986). Diagnostic categorization by the Diagnostic
Interview Schedule (DIS): A comparison with other methods
of assessment. In J. Barrett & R. M. Rose (Eds.), Mental disorders in the community (pp. 255–285). New York: Guilford.
Cohen, J. (1960). A coefficient of agreement for nominal scales.
Educational and Psychological Measurement, 20, 37–46.
Costello, E. J., Egger, H. & Angold, A. (2005). 10-year research
update review: The epidemiology of child and adolescent psychiatry disorders: I. methods and public health burden. Journal
of the American Academy Child and Adolescent Psychiatry,
44, 972–986.
Delmo, C., Weiffenbach, O., Gabriel, M., Stadler, C. & Poustka,
F. (2001). Diagnostisches Interview. Kiddie-Sads-Present and
Lifetime Version (K-SADS-PL). Frankfurt am Main: Klinik für
Psychiatrie und Psychotherapie des Kindes- und Jugendalters.
Dolle, K., Schulte-Körne, G., von Hofacker, N., Izat, Y. & Allgaier
A.-K. (2012). Übereinstimmung von klinischer Diagnose, strukturierten Interviews und Selbstbeurteilungsfragebögen bei Depression im Kindes- und Jugendalter. Zeitschrift für Kinder- und
Jugendpsychiatrie und Psychotherapie, 40, 405–414.
Döpfner, M., Berner, W., Flechtner, H., Lehmkuhl, G. & Steinhausen, H.-C. (1999). Psychopathologisches Befund-System für Kinder und Jugendliche (CASCAP-D). Göttingen: Hogrefe.
Döpfner, M., Berner, W., Schwitzgebel, P. & Lehmkuhl, G.
(1994). Dimensionen psychischer Störungen bei Kindern und
Jugendlichen auf der Basis klinischer Beurteilungen. Zeitschrift für Kinder- und Jugendpsychiatrie, 22, 299–317.
Döpfner, M., Görtz-Dorten, A. & Lehmkuhl, G. (2008). DISYPSII. Diagnostik-System für Psychische Störungen nach ICD-10
und DSM-IV für Kinder und Jugendliche – II. Bern: Huber.
Edelbrock, C., Costello, A. J., Dulcan, M. K., Kalas, R. & Conover,
N. C. (1985). Age differences in the reliability of the psychiatric
interview of the child. Child Development, 56, 265–275.
Eschmann, S., Weber Häner, Y. & Steinhausen, H.-C. (2007). Die
Prävalenz psychischer Störungen bei Kindern und Jugendlichen unter Berücksichtigung soziodemografischer Merkmale.
Zeitschrift für Klinische Psychologie und Psychotherapie, 36,
270–279.
Essau, C., Karpinski, N. A., Petermann, F. & Conradt, J. (1998).
Häufigkeit und Komorbidität psychischer Störungen bei Jugendlichen: Ergebnisse der Bremer Jugendstudie. Zeitschrift
für Klinische Psychologie, Psychiatrie und Psychotherapie,
46, 105–124.
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern
334
M. Neuschwander et al.: Interrater-Reliabilität des Kinder-DIPS
Esser, G., Blanz, B., Geisel, B. & Laucht, M. (1989). Mannheimer
Elterninterview (MEI). Weinheim: Beltz.
Herjanic, B., Herjanic, M., Brown, F. & Wheatt, T. (1975). Are
children reliable reporters? Journal of Abnormal Child Psychology, 3, 41–48.
Heubrock, D. & Petermann, F. (2005). Diagnostik in der klinischen Kinderpsychologie. In F. Petermann & H. Reinecker
(Hrsg.), Handbuch der Klinischen Psychologie und Psychotherapie (S. 178–190). Göttingen: Hogrefe.
Hilbert, A. (in press). Eating Disorder Examination für Kinder:
deutschsprachige Übersetzung. Münster: Verlag für Psychotherapie.
Ihle, W. & Esser, G. (2002). Epidemiologie psychischer Störungen im Kindes- und Jugendalter: Prävalenz, Verlauf, Komorbidität und Geschlechtsunterschiede. Psychologische Rundschau, 53, 159–169.
In-Albon, T., Dubi, K., Adornetto, C., Blatter-Meunier, J. &
Schneider, S. (2011). Neue Ansätze in der Diagnostik von
Angststörungen im Kindes- und Jugendalter und deren Gütekriterien. Klinische Diagnostik und Evaluation, 4, 133–147.
Keller, F., Grieb, J., Kölch, M. & Spröber, N. (2012). Children’s
Depression Rating Scale – Revised by E. O. Poznanski and
H. B. Mokros: Deutsche Version (CDRS-R). Göttingen: Hogrefe.
Kraemer, H. C., Measelle, J. R., Ablow, J. C., Essex, M. J., Boyce,
W. T. & Kupfer, D. J. (2003). A new approach to integrating
data from multiple informants in psychiatric assessment and
research: Mixing and matching contexts and perspectives.
American Journal of Psychiatry, 160, 1566–1577.
Lapouse, R. & Monk, M. (1959). Fears and worries in a representative sample of children. American Journal of Orthopsychiatry, 29, 803–818.
Lapouse, R. & Monk, M. (1964). Behavior deviations in a representative sample of children: Variation by sex, age, race, social
class, and family size. American Journal of Orthopsychiatry,
34, 436–446.
Merikangas, K. R., He, J., Burstein, M., Swanson, S. A., Avenevoli, S., Cui, L., . . . Swendsen, J. (2010). Lifetime prevalence
of mental disorders in U. S. adolescents: Results from the National Comorbidity Survey replication – Adolescent supplement (NCS-A). Journal of American Academy of Child and
Adolescent Psychiatry, 49, 980–989.
Mohr, C. & Schneider S. (2013). Anxiety disorders. European
Child Adolescent Psychiatry, 22(Suppl. 1), 17–22.
Poustka, F. (1988). Kinderpsychiatrische Untersuchungen. In H.
Remschmidt & M. H. Schmidt (Hrsg.), Kinder- und Jugendpsychiatrie in Klinik und Praxis (Bd. I, S. 478–511). Stuttgart:
Thieme.
Rutter, M. & Graham, P. (1968). The reliability and validity of
the psychiatric assessment of the child: I. Interview with the
child. British Journal of Psychiatry, 114, 563–579.
Schneider, S. & Adornetto, C. (2006). Standardisierte Diagnostik
mit Interviews. In F. Mattejat (Hrsg.), Lehrbuch der Psychotherapie, 4 Verhaltenstherapie mit Kindern, Jugendlichen und
deren Familien (S. 159–169). München: CIP-Medien.
Schneider, S., Suppiger, A., Adornetto, C., Unnewehr, S. & Margraf, J. (2009). Handbuch zum Kinder-DIPS. In S. Schneider,
S. Unnewehr & J. Margraf (Hrsg.), Diagnostisches Interview
bei psychischen Störungen im Kindes- und Jugendalter (Kinder- DIPS) (S. 1–62). Heidelberg: Springer.
Schneider, S., Unnewehr, S. & Margraf, J. (Hrsg.). (2009). Diagnostisches Interview bei psychischen Störungen im Kindesund Jugendalter (Kinder-DIPS) (2. aktualisierte und erweiterte
Aufl.). Heidelberg: Springer.
Schwab-Stone, M., Fallon, T., Briggs, M. & Crowther, B. (1994).
Reliability of diagnostic reporting for children aged 6–11
years: A test-retest study of the Diagnostic Interview Schedule
for Children – Revised. American Journal of Psychiatry, 151,
1048–1054.
Seehagen, S., Pflug, V. & Schneider, S. (2012). Psychotherapie
und Wissenschaft. Harmonie oder Dissonanz? Zeitschrift für
Kinder- und Jugendpsychiatrie und Psychotherapie, 40,
301–306.
Silverman, K. W. & Ollendick, T. H. (2005). Evidence-based assessment of anxiety and its disorders in children and adolescents. Journal of Clinical Child and Adolescent Psychology,
34, 380–411.
Spitznagel, E. L. & Helzer, J. E. (1985). A proposed solution to
the base rate problem in the kappa statistic. Archives of General Psychiatry, 42, 725–728.
Steil, R. & Füchsel, G. (2006). Interviews zur Posttraumatischen
Belastungsstörung bei Kindern und Jugendlichen (IBS-KJ).
Göttingen: Hogrefe.
Unnewehr, S., Schneider, S. & Margraf, J. (1995). Diagnostisches
Interview bei psychischen Störungen im Kindes- und Jugendalter (Kinder-DIPS). Berlin: Springer.
World Health Organisation (WHO). (2000). The ICD-10, classification of mental and behavioural disorders: Diagnostic criteria for research. Geneva: Autor.
Yule, G. U. (1912). On the methods of measuring association between two attributes. Journal of the Royal Statistical Society,
75, 579–642.
Manuskripteingang
Nach Revision angenommen
13. Dezember 2012
30. April 2013
Mögliche Interessenskonflikte
Die Letztautorin, Prof. Dr. Silvia Schneider, ist Mitherausgeberin des Kinder-DIPS und erhält anteilig ein Autorenhonorar vom Verlag.
Prof. Dr. Silvia Schneider
Klinische Kinder- und Jugendpsychologie
Ruhr-Universität Bochum
Universitätsstraße 150
44780 Bochum
[email protected]
Z. Kinder-Jugendpsychiatr. Psychother. 41 (5) © 2013 Verlag Hans Huber, Hogrefe AG, Bern