Instrumente der Prognose
Transcription
Instrumente der Prognose
Überblick IBE Teil 1 Ziele einer Prognosestudie Instrumente der Prognoseforschung L5−Seminar „Prinzipien der klinischen Epidemiologie“ Risikofaktor vs. Prognosefaktor Teil 2 Analyse von Überlebenszeiten (Kaplan-Meier Kurven) Vergleich zweier Überlebenskurven mittels Log-Rank Test IBE – Institut für Med. Informationsverarbeitung, Teil 3 Biometrie und Epidemiologie Qualitätssicherung von Prognosestudien ( BMJ 2001) WS 2008/09 Prognosestudie, Prognosefaktoren (1) Prognosestudie, Prognosefaktoren (2) Definition Prognosestudie: Eine Gruppe von Kranken wird beobachtet, und die klinischen Verlaufs- und Endzustände werden registriert (im Sinne einer Kohortenstudie) Meist werden mehrere Prognosefaktoren in einem Prognosemodell kombiniert. 2 2 Patientenauswahl wichtiger als in kontrollierten Studien ( Verallgemeinerbarkeit) Prognosefaktoren (PF) sind Variablen, die den weiteren Verlauf der Erkrankung statistisch vorherzusagen erlauben, die also mit einem klar definierten Endzustand assoziiert sind Terminologie oft uneinheitlich: begrifflich wird nicht klar zwischen validierten Prognosefaktoren (PF) / Prognosemodellen (PM) und unvalidierten PF / PM unterschieden PF werden meist zum Zeitpunkt der Diagnose oder Behandlungsbeginn (Baseline) oder zu einem festgelegten Zeitpunkt (zeitabhängige PF) erhoben Surrogat-Zielgrößen sind zeitabhängige PF: z.B. Zeit bis Therapieversagen als Surrogat-Zielgröße für Überlebenszeit WS 2008/09 3 3 WS 2008/09 4 4 Stellenwert prognostischer Faktoren Ziel von Prognosestudien Prognose einzelner Patienten Individualisierung der Therapie: Individuelle Therapieentscheidung des behandelnden Arztes Anleitung für klinische Entscheidungen einschließlich Behandlungsauswahl und Patientenberatung Einblick in die Ätiologie, Vorhersage des Krankheitsverlaufs Definition von Risikogruppen basierend auf Prognosen Verhütung unerwünschter Arzneimittelwirkungen Verbesserung der Planung und Analyse klinischer Studien (z.B. Risiko-Stratifikation) Förderung von ökonomischem Ressourceneinsatz Genauere oder einfachere Vorhersage des Krankheitsausgangs bei zeitabhängigen Prognosefaktoren Verbesserung des Verständnisses des Krankheitsfortschritts – Präzisierung der Prognose – Entscheidungshilfe, z.B. bezüglich Fortführung der Therapie Zusammenspiel mehrerer Fragestellungen: Prognose, Therapie, Qualitätsmanagement – als Surrogat-Zielgröße erforderlich zur schnelleren Beurteilung neuer Therapien / Behandlungsstrategien WS 2008/09 5 5 Risikofaktor vs. Prognosefaktor WS 2008/09 6 6 Prognosefaktor: Anforderungen An einen klinisch relevanten prognostischen Faktor werden die folgenden Anforderungen gestellt: mit guter Qualität reproduzierbar substanzieller prognostischer Wert zusätzlich zu etablierten prognostischen Faktoren klare therapeutische Implikation Bestätigung durch konfirmatorische Phase III Prognosestudien Unterschiede zwischen Risiko- und Prognosefaktoren für akuten Myokardinfarkt Quelle: WS 2008/09 7 7 WS 2008/09 8 8 Typen von Prognosestudien Raten zur Beschreibung der Prognose Präklinische Studien Phase I: Exploratorische Studien Phase II: Studien zum zusätzlichen Informationsbeitrag des Prognosefaktors Phase III: Therapeutische Bedeutung des Prognosefaktors Rate Definition* 5-JahresÜberlebensrate Prozentualer Anteil der Patienten, die 5 Jahre von einem bestimmten Punkt ihres Krankheitsverlaufes (z.B. Diagnosestellung) an überleben Letalität Prozentualer Anteil der Patienten mit einer Krankheit, die daran sterben (innerhalb eines Beobachtungszeitraums) krankheitsspezifische Mortalität Anzahl der Patienten pro 10 000 (oder 100 000) der Population, die an einer bestimmten Krankheit sterben Besserungsrate Prozentualer Anteil der Patienten, bei denen sich Hinweise für eine Besserung nach einer therapeutischen Maßnahme finden Remissionsrate Prozentualer Anteil der Patienten, die in eine Phase eintreten, in der die Krankheit makroskopisch nicht mehr feststellbar ist Rezidivrate Prozentualer Anteil der Patienten, die einen Rückfall der Krankheit nach einem „krankheitsfreien“ Intervall erleiden * Annahme: Zeit für Beobachtung ausreichend lange, so dass alle Ereignisse, die auftreten werden, beobachtet worden sind. Quelle: Fletcher, Fletcher, Wagner 1999 9 WS 2008/09 9 WS 2008/09 10 10 Endpunkte mit „Zeit“ Überlebenszeit Theorie der Überlebenszeit Krankheitsfreies Überleben Zeit bis Rezidiv Zeit bis zum Behandlungsversagen Zeit bis zu einer Infektion usw. WS 2008/09 11 11 WS 2008/09 12 12 Startzeitpunkt und Ereignis Rekrutierungs- und Beobachtungszeitraum * (rechts) zensierte Ende Rekrutierung Der Startzeitpunkt muss klar definiert sein: Beobachtung Studienende – z.B. Zeitpunkt der Diagnose, Zeitpunkt der Randomisierung, Geburtsdatum Der Startzeitpunkt ist für die einzelnen Patienten zu unterschiedlichen Kalenderzeiten Das Ereignis muss klar definiert sein – z.B. Tod, oder Rezidiv, … Das Datum des Ereignisses muss dokumentiert werden WS 2008/09 13 13 Datenerhebung 14 14 WS 2008/09 Beispiel: Rekrutierungs- und Beobachtungszeitraum Überlebensdaten werden meistens in prospektiven Kohortenstudien und randomisierten Studien erhoben – In die Studie werden Patienten (gemäß den Ein-/ Ausschlusskriterien) eingeschlossen, bei denen das relevante Endereignis noch nicht eingetreten ist Pat Startzeitpunkt Ereignis Überlebenszeit 1 12.01.2006 12.05.2006 120 2 14.02.2006 14.03.2007 393 3 23.03.2006 25.04.2006 33 4 04.04.2006 12.06.2006 69 Kalenderzeit Individuelle Zeit – Jeder Patient wird vom Startzeitpunkt bis zum Ereignis beobachtet – Überlebenszeit ist die Zeit, die zwischen Startzeitpunkt und Ereignis vergangen ist Rekrutierungszeitraum WS 2008/09 15 15 WS 2008/09 Beobachtungszeitraum 16 16 Probleme im Beobachtungszeitraum Survival Daten mit Zensierungen Pat Wie lange soll der Beobachtungszeitraum sein? Für Patienten, bei denen das Ereignis nicht eingetreten ist, kann keine Überlebenszeit berechnet werden – Die Beobachtungszeit kann als untere Grenze für die Überlebenszeit verwendet werden Startzeitpunkt Ereignis Überlebenszeit Ereignis 1 12.01.2006 12.05.2006 120 yes 2 14.02.2006 14.03.2007 393 yes 3 23.03.2006 25.04.2006 33 yes 4 04.04.2006 12.06.2006 69 yes 5 23.04.2006 01.07.2007 434+ no Kalenderzeit Individuelle Zeit – Die Überlebenszeit ist dann zensiert Auch für Patienten, die vorzeitig aus der Studie ausscheiden, liegt nur eine zensierte Überlebenszeit vor (drop-out, loss-to follow-up) Studienende WS 2008/09 17 17 Zensierte Überlebenszeit WS 2008/09 18 18 Zensierung Kaplan-Meier-Methode Bei Patienten mit Zensierungen ist nicht bekannt, zu welchen Zeitpunkt das interessierende Endereignis eintritt: es ist nur eine untere Grenze bekannt 1958 von den beiden Biostatistikern E.M. Kaplan und P. Meier entwickelte Methode Auch die Informationen von zensierten Patienten geht bei der Berechnung der Überlebenswahrscheinlichkeit bei dieser Methode mit ein Zensiert werden darf nur, wenn die Ursache der Zensierung unabhängig von der Prognose bzw. Zielgröße ist in jedem Intervall ein bzw. mehrere gleichzeitige(!) Ereignisse (event oder Zensierung) Andernfalls können sich falsch hohe Überlebenskurven ergeben! Daher sind alle Zensierungen (mit Ausnahme protokollgemäßes Ende der Studie) mit Angabe von Behandlungsgruppe, Zeitpunkt und Grund aufzulisten WS 2008/09 19 19 Ereigniszeitpunkt = Intervallbeginn WS 2008/09 20 20 Beispiel Kaplan-Meier-Kurve Patient Überlebenszeit Ereignis Zensiert 1 10 ja nein 2 20 ja nein 3 3 ja nein 4 15 ja nein 5 36 ja nein 6 22 ja nein 7 40 ja nein 8 6 nein ja 9 28 ja nein 10 32 nein ja x-Achse: Überlebenswahrscheinlichkeit Sprung: Ereignis konstant, wenn kein Ereignis eintritt Zensierte Überlebenszeit y-Achse: Zeit 21 21 WS 2008/09 Kaplan-Meier Kurve Im Beispiel: Werte für Kaplan-Meier-Kurve Überlebenswahrscheinlichkeit zum Zeitpunkt 3: 1*(9/10)=0,90 Sprung zum Zeitpunkt 3: 1/10=0,1 Überlebenswahrscheinlichkeit zum Zeitpunkt 10: 0,9*7/8=0,788 Sprung zum Zeitpunkt 10: 0,9*(1/8)=0,1125 Sprung zum Zeitpunkt t: Überlebenswahrscheinlichkeit vor t* (# Ereignisse /# unter Risiko vor t) Überlebenswahrscheinlichkeit: Überlebenswahrscheinlichkeit vor t* (# kein Ereignis / # unter Risiko vor t) Zeit bis zum Ereignis (z.B. Monate) Anzahl der Patienten unter Risiko Ereignisse 3 3 10 1 0 8 6 9 0 1 1 10 8 1 0 0.788 … … … … … … 7 40 1 1 0 0.000 Patient WS 2008/09 22 22 WS 2008/09 Zensierungen Überlebenswahrscheinlichkeit 0.900 23 23 Patient Zeit bis zum Ereignis (z.B. Monate) Anzahl der Patienten unter Risiko Ereignisse Zensierungen (1 = ja; 0 = nein) (1 = ja; 0 = nein) Überlebenswahrscheinlichkeit 3 3 10 1 0 8 6 9 0 1 1 10 8 1 0 0,788 4 15 7 1 0 0,675 2 20 6 1 0 0,563 6 22 5 1 0 0,450 9 28 4 1 0 0,338 10 32 3 0 1 5 36 2 1 0 0,169 7 40 1 1 0 0,000 WS 2008/09 0,900 24 24 Vergleich von zwei Überlebenskurven mittels Log-Rank Test Vergleich von zwei Überlebenskurven Nullhypothese: Die Kaplan-Meier Kurven 2er Gruppen unterscheiden sich nicht: gleiche Überlebenswahrscheinlichkeit in beiden Gruppen zu jedem Zeitpunkt Behandlung mit Medikament B Alternativhypothese: die Überlebenswahrscheinlichkeiten der beiden Gruppen unterscheiden sich an mindestens einem Zeitpunkt Ist der Unterschied statistisch signifikant? Idee: Vergleiche für jede Gruppe die unter der Nullhypothese (unter der Annahme gleicher Überlebenswahrscheinlichkeiten) zu erwartende Anzahl an Ereignissen mit der tatsächlich beobachteten Anzahl an Ereignissen. Behandlung mit Medikament A 25 25 WS 2008/09 Log-Rank Test Die unter der Nullhypothese zu erwartende Anzahl an Ereignissen berechnet sich aus Beispiel Ereignis Gruppe A diA kein Ereignis riA–diA unter Risiko riA EiA = riA*di / ri Berechnung dieser Kontingenztafel für jeden Ereigniszeitpunkt ! Gruppe B Summe diB di riB–diB ri–di riB ri Überlebenszeit Anzahl der Patienten unter # beobachteten Risiko Ereignisse # erwarteten Ereignisse A B Gesamt A B A B 3 5 5 10 1 0 0,500 0,500 6 4 5 9 0 0 10 3 5 8 1 0 0,375 0,625 15 2 5 7 1 0 0,286 0,714 20 1 5 6 0 1 0,167 0,833 22 1 4 5 0 1 0,200 0,800 28 1 3 4 1 0 0,250 0,750 32 0 3 3 0 0 36 0 2 2 0 1 0,000 1,000 40 0 1 1 0 1 0,000 1,000 4 4 1,778 6,222 Summe WS 2008/09 26 26 WS 2008/09 27 27 WS 2008/09 28 28 Berechnung der Log-Rank Teststatistik Zusammenfassung (OA − E A ) 2 (OB − EB ) 2 + LR := EA EB Überlebenszeitdaten enthalten auch Patienten mit unvollständigen Beobachtungen (4 − 1.778)² (4 − 6.222)² = 3.57 LR = + 1.778 6.222 Methoden der Überlebenszeitanalyse können nur verwendet werden, wenn der Grund für die Zensierung bekannt ist und unabhängig von der Zielgröße Deshalb können keine einfachen Analysemethoden eingesetzt werden Überlebenswahrscheinlichkeiten und die Überlebenskurve können mit der Kaplan-Meier Methode geschätzt werden Der Log-Rank Test ist das Standardverfahren für den Gruppenvergleich hinsichtlich der Überlebenszeit Verteilung: Die Teststatistik LR ist unter der Nullhypothese Chi²-verteilt mit einem Freiheitsgrad (1 FG). Entscheidung: Die Nullhypothese wird auf dem 5% Niveau abgelehnt, falls LR > 3.841 (1.96²) WS 2008/09 29 29 30 30 WS 2008/09 Qualität von Prognosestudien Jährlich werden mehrere Hundert prognostischer Modelle publiziert – jedoch werden nur wenige tatsächlich zur klinischen Entscheidungsfindung herangezogen. Qualitätssicherung von prognostischen Studien Hauptursachen: Mangel an klinischer Glaubwürdigkeit Fehlender Nachweis von Genauigkeit, Verallgemeinbarkeit (externe Validität) und Wirksamkeit Kriterien für die kritische Bewertung von Publikationen zu Prognosemodellen erforderlich (J.C. Wyatt, D.G. Altmann. Prognostic Models: Clinically Useful or Quickly Forgotten? BMJ 1995;311:1539) WS 2008/09 31 31 WS 2008/09 32 32 Qualitätskriterien prognostischer Studien (1) Qualitätskriterien prognostischer Studien (2) Kriterien Kriterien Definierte Einschluss- und Ausschlusskriterien Beobachtungszeit Genaue Beschreibung der Diagnostik Genaue Beschreibung der Stichprobengenerierung Patienten- Repräsentativität stichprobe Vollständige demographische und klinische Beschreibung der Patienten Zielgrößen Einheitlicher und definierter Zeitpunkt der Aufnahme in die Studie (meist Zeitpunkt der Diagnose, oder Behandlungsbeginn) 33 33 WS 2008/09 Kriterien Variablen objektiv, unverzerrt (z.B. Erhebung geblindet bzgl. Prognose) klar definiert transparent geeignet Vollständigkeit der Erhebung und der Verfügbarkeit WS 2008/09 34 34 Probleme systematischer Reviews / Meta-Analysen von Prognosestudien (1) Qualitätskriterien prognostischer Studien (3) Prognostische ausreichende Länge Schwierigkeit, alle publizierten Studien zu identifizieren Definition inkl. Messverfahren Genauigkeit der Messung Vollständigkeit der Information Publication Bias Ungenügende Beschreibung der Methoden Statistische Analyse Angemessene Analyse stetiger Variablen, Adjustierung aller wichtigen Prognosefaktoren Behandlung nach Aufnahme in die Kohorte / Studie Vollständige Beschreibung, einheitliche Behandlung Unabhängigkeit von der Prognose Unterschiede im Studiendesign Unterschiedliche Ein- und Ausschlusskriterien Meist retrospektiver Ansatz WS 2008/09 Mangel an anerkannten Qualitätskriterien für Prognosestudien ( Validierung von Prognosefaktoren) 35 35 WS 2008/09 36 36 Probleme systematischer Reviews / Meta-Analysen von Prognosestudien (2) Unterschiedliche Messverfahren / Diagnostiken Bitte lesen Sie folgendes Paper: Unterschiedliche statistische Vorgehensweisen - besonders bei stetigen Variablen - und der Adjustierung Altman DG. Systematic reviews of evaluations of prognostic variables. BMJ 2001; 323:224−8. Mangelhafte Berichterstattung besonders quantitativer Risikomaße Mangelhafte / fehlende Standardisierung der Ergebnispräsentation (z.B. Überlebensraten zu unterschiedlichen Zeitpunkten) WS 2008/09 37 37 Fragen zur Validität einer Prognosestudie (1) 38 38 Fragen zur Validität einer Prognosestudie (2) Weist das Spektrum der einbezogenen Patienten wesentliche Einschränkungen auf? War die Beobachtung hinreichend vollständig? Wenn Untergruppen von Patienten mit unterschiedlichen Prognosen identifiziert wurden, wurde eine Anpassung bezüglich wichtiger prognostischer Faktoren vorgenommen? Wurden relevante Zielgrößen zur Beschreibung der Prognose herangezogen? Wurde die Messung der Zielgrößen reliabel durchgeführt? Erfolgte die Messung der Zielgrößen in allen Beobachtungsgruppen gleichartig? Entsprachen die Charakteristika der Studienpatienten in etwa denen Ihrer eigenen Patienten? Werden diese Informationen klinisch bedeutsame Änderungen des Behandlungs- oder Beratungsangebots an Ihren Patienten nach sich ziehen? War der Beobachtungszeitraum ausreichend lang? WS 2008/09 WS 2008/09 39 39 WS 2008/09 40 40 Medline-Suchstrategien Literatur zu Prognosestudien Explode cohort studies (MeSH) incidence (MeSH) explode mortality (MeSH) follow-up studies (MeSH) mortality (subheading) prognos (text word) predict (text word) course (text word) Altman DG. Systematic Reviews of Evaluations of Prognostic Variables. BMJ 2001; 323: 224–8 Simon R, Altman DG. Statistical aspects of prognostic factor studies in oncology. British Journal of Cancer 1994; 6:979-985 Altman DG, Royston P. What do we mean by validating a prognostic model. Statistics in Medicine 2000; 19:453-473 McShane LM, Altman DG, Sauerbrei W, Taube SE, Gion M, Clark GM, for the Statistics Subcommittee of the NCI-EORTC Working Group on Cancer Diagnostics. Reporting Recommendations for Tumour MARKer Prognostic Studies (REMARK). Eur J Cancer 2005; 41, 1690–6 Schumacher M, Schulgen G. Methodik klinischer Studien. Springer, Heidelberg 2007 Hankey GJ, Jamrozik K, Broadhurst RJ, Forbes S, Anderson CS. Long-Term Disability After First-Ever Stroke and Related Prognostic Factors in the Perth Community Stroke Study, 1989-1990. Stroke 2002; 33: 1034–40 Hayden JA, Côté P, Bombardier C: Evaluation of the Quality of Prognosis Studies in Systematic Reviews. Ann Intern Med 2006; 144, 427–37. Fletcher RH, Fletcher S, Wagner E. Klinische Epidemiologie. Ullstein Medical 1999 D.G. Altmann: BMJ 2001; 323:224−8. WS 2008/09 41 41 WS 2008/09 42 42