Die Analyse von Überlebenszeiten
Transcription
Die Analyse von Überlebenszeiten
Analyse von Überlebenszeiten Die Analyse von Überlebenszeiten Heinz Tüchler Einleitung Welche Vorgänge lassen sich untersuchen? Überlebenskurven und damit zusammenhängende Berechnungen dienen der Darstellung und dem Vergleich von Überlebenszeiten. Dieselben Verfahren lassen sich zweckmäßig auch auf Remissionsdauer und viele andere Daten anwenden, wenn letztere Vorgänge beschreiben, die als eine geordnete Folge von Abschnitten betrachtet werden können. Wesentlich ist dabei, daß das betreffende Merkmal durch einen Vorgang zustande kommt, der nicht umkehrbar ist in dem Sinn, wie es für Überlebenszeiten zutrifft. Damit ist gemeint, daß jemand, der z.B. 5 Monate überlebt hat, insgesamt nur mehr länger nicht aber kürzer überleben kann. Dasselbe gilt für Remissionsdauer und alle anderen kumulativen Vorgänge. Beispiele währen die Ehedauer, die Zahl von Löchern in einem Schlauchboot bis es untergeht, die Zahl der Zahnarztbesuche bis zum dritten Gebiß, die Größe eines Tumors bis zur Diagnose. Unvollständige Beobachtungen - sogenannte zensierte Daten Erfaßt man z.B. die Remissionsdauer von Patienten, dann ist der Rückfall das Zielereignis. Tritt er ein, so ist die Remissionsdauer bestimmt und es liegt für diesen Patienten eine vollständige Beobachtung vor. Es liegt in der Natur der beobachteten Vorgänge, daß sie oft nicht bei allen interessierenden Fällen bis zu ihrem Ende, dem Erreichen des Zielereignisses, beobachtet werden. Das hat drei mögliche Ursachen: 1. Die Studie und damit die Beobachtung wird beendet, bevor alle im Rahmen der Studie untersuchten Fälle ihr Zielereignis erreicht haben. 2. Fälle gehen verloren. Z.B. Patienten wandern aus, und ihr Schicksal kann nicht weiter verfolgt werden. 3. Jemand kann das Zielereignis nicht mehr erreichen. Wenn z.B. ein Patient während seiner Remission an einem Unfall stirbt, dann ist die beobachtete rückfallfreie Zeit nur eine untere Grenze für seine mögliche rückfallfreie Zeit, und nicht zwangsläufig jene Remissionsdauer, die aufgrund der Therapie zu erwarten gewesen wäre. Es ist einzusehen, daß unvollständige Beobachtungen weder wie vollständige, noch wie nicht vorhandene behandelt werden sollen. Sie enthalten zweifelsfrei die Information über die untere Schranke, die der Betreffende erreicht hat. Die Methoden der Überlebenskurvenberechnung nehmen darauf Rücksicht. LBI für Leukämieforschung Seite 1 Analyse von Überlebenszeiten Ein ganz einfaches Beispiel (Beispiel 1) Angenommen es wären 100 Patienten mit einer bestimmten Erkrankung vom Tag der Diagnosestellung bis zu ihrem Tod beobachtet worden. Dann wäre die Überlebenszeit jedes Patienten bekannt. Man würde zuerst eine Tabelle erstellen wie Tabelle 1/1. Tabelle 1/1: Überlebenszeiten in Monaten für Beispiel 1 Monate Zahl der Patienten Prozentanteil Kumulativer %-anteil Hazard in Prozent 1 25 25 25 25 2 17 17 42 23 3 12 12 54 21 4 10 10 64 22 5 7 7 71 19 6 4 4 75 14 7 2 2 77 8 8 2 2 79 9 9 3 3 82 14 10 0 0 82 0 11 3 3 85 17 12 2 2 87 13 13 2 2 89 15 14 1 1 90 9 15 2 2 92 20 16 2 2 94 25 17 1 1 95 17 18 0 0 95 0 19 1 1 96 20 20 1 1 97 25 21 0 0 97 0 22 1 1 98 33 23 1 1 99 50 24 25 0 1 100 0 1 100% 99 100 0 100 Dort notiert man zu jedem Monat die Anzahl der Patienten mit entsprechender Überlebenszeit. Die nächste Zeile gibt die entsprechende Prozentzahl an. In unserem Beispiel unterscheiden sich diese Zahlen nicht, da wir zur Vereinfachung von 100 Patienten ausgegangen sind. Bild 1/1: Häufigkeitsverteilung der Überlebenszeiten (zu Beispiel 1) Schätzung für die Dichtefunktion f(t) Bild 1/1 zeigt ein Balkendiagramm der Überlebenszeiten. Jeder Monat wird durch einen Balken dargestellt. Seine Höhe entspricht der Zahl von Patienten, die gerade so viele Monate gelebt haben. Bild 1/1 zeigt die sogenannte 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Häufigkeitsverteilung der ÜberMonate lebenszeiten. Man kann dem Bild entnehmen, daß in den ersten Monaten viele Patienten sterben und später immer weniger. 25 Zahl der Patienten 20 15 10 5 0 Bild 1/2: Kumulative Verteilung der Überlebenszeiten (zu Beispiel 1) Schätzung für die Verteilungsfunktion F(t) In der Statistik ist auch eine andere Form der Darstellung üblich, jene des Bildes 1/2. Wir besprechen sie kurz des allgemeinen Überblicks wegen, da sie mit der Darstellung von Überlebenskurven in engstem Zusammenhang steht. Hier wurden zu jedem Monat die 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 kumulativen Prozentsätze von Monate gestorbenen Patienten aufgetragen. Die Höhe der Linien entspricht also der Zeile "kumulativer Prozentanteil" der Tabelle 1/1. Das ergibt eine Schätzung für die Verteilungsfunktion oder Summenfunktion der Überlebenszeit. Man sieht z.B., daß in den ersten drei Monaten 54% der Patienten (25%+17%+12%) gestorben sind, oder am Ende des 14.Monats bereits 90%. 100 90 80 70 Prozent 60 50 40 30 20 10 0 Zwei Anmerkungen sind zu machen: 1. Die Linie in Bild 2 ist so gezeichnet, daß die Gestorbenen immer erst am Ende des Monats berücksichtigt werden. 2. Wenn wir vom 1., 3. oder irgendeinem Monat sprechen, handelt es sich um den 1., 3. oder irgendwievielten "Überlebensmonat" eines Patienten und nicht um einen bestimmten Kalendermonat wie z.B. Mai 1986. Wir tun so, als hätten wir alle Patienten zugleich in die Studie aufgenommen. Das ist im allgemeinen zulässig, solange der wirkliche Zeitpunkt keinen Einfluß auf das Geschehen hat. (Unzulässig wäre es bei jahreszeitlichen Schwankungen oder Katastrophenfolgen.) LBI für Leukämieforschung Seite 2 Analyse von Überlebenszeiten Bild 1/3: Überlebenskurve (zu Beispiel 1) Schätzung für die Überlebensfunktion S(t) S(t) = 1 - F(t) Von Bild 1/2 zu Bild 1/3 ist es ein kleiner Schritt. Während Bild 1/2 den Prozentsatz der bis zu einem bestimmten Monat Gestorbenen zeigt, sieht man in Bild 1/3 den Prozentsatz der Lebenden am Beginn jeden Monats. Bild 1/3 ist die Darstellung einer Überlebenskurve. Die Überlebenskurve 100 90 80 70 Prozent 60 50 40 30 20 10 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Monate 14 15 16 17 18 19 20 21 22 23 24 25 26 Zur Wiederholung Wählen wir als Beispiel den Monat 5. Aus Bild 1 entnehmen wir, daß 7 Personen im 5.Überlebensmonat gestorben sind. Bild 2 zeigt, daß zu Beginn des 5.Monats bereits 64% der Patienten verstorben sind, Bild 1/3 gibt dementsprechend an, daß noch 36% der Patienten leben. Die durchschnittliche Überlebenszeit Oft besteht der Wunsch, eine vorliegende Überlebenskurve durch einen Kennwert, also durch eine einzige Zahl zu charakterisieren. Nun enthält aber die ganze Gestalt der Überlebenskurve Information und die läßt sich nicht so ohne weiteres "auf einen Nenner bringen". Will man die Kurve trotzdem mit einem einzigen Kennwert beschreiben, muß man einen finden, der "die wichtigere Information" enthält und weniger wichtige Details vernachlässigt. Welcher Kennwert das ist, hängt entscheidend von der Fragestellung und zusätzlich gemachten Annahmen ab. (Entspricht eine Überlebenskurve einer mathematisch definierten Funktion, dann läßt sie sich unter Umständen durch einen Parameter dieser Funktion charakterisieren. Die Exponentialfunktion, die in bestimmten Zusammenhängen als Überlebenskurve auftritt, wird beispielsweise bereits durch einen Kennwert vollständig bestimmt. Sehr oft macht man aber in der Therapieforschung keine Annahmen über die Form der Kurven. Dann gibt es auch keine funktionsspezifischen Kennwerte.) Man könnte sagen: Wenn es keine speziellen Kennwerte gibt, dann bestimmen wir einfach den Durchschnitt der Überlebenszeit. Als Durchschnittswerte bieten sich das arithmetische Mittel und der Median an. Beide stellen einen Durchschnitt dar, aber das Ergebnis ist im allgemeinen nicht dasselbe. Wir wollen erst beide Kennwerte kurz getrennt besprechen und dann miteinander vergleichen. Das arithmetische Mittel Das ist der Kennwert, den man am ehesten mit der Vorstellung eines Durchschnittes verbindet. Man errechnet ihn (falls keine zensierten Daten vorliegen), indem man die Überlebenszeiten aller Personen addiert und diese Summe durch die Zahl der Personen dividiert. Der Median Der Median ist jene Überlebenszeit, die 50% der Patienten nicht erreichen und die die anderen 50% der Patienten überschreiten. Wenn wir Bild 1/3 betrachten, sehen wir, daß am Beginn des 2.Monats 75% der Personen leben, am Beginn des 3.Monats 58% und am Beginn des 4.Monats 46%. Daraus ergibt sich, daß irgendwann im LBI für Leukämieforschung Seite 3 Analyse von Überlebenszeiten 3.Monat die 50% Marke erreicht wurde, d.h. die Hälfte der Patienten bereits gestorben war. Wann genau, läßt sich nicht feststellen und so betrachten wir 3 Monate als den Median der Überlebenszeit. Vergleich von arithmetischem Mittel und Median Angenommen, wir hätten eine Überlebenskurve für Patienten mit einer bestimmten Diagnose (z.B. eine Krankheit, die ab der Diagnose bis zum Tod einen Spitalsaufenthalt erfordert). Interessiert sich etwa die Spitalsverwaltung dafür, wie lange ein Patient dieser Diagnose durchschnittlich ein Bett belegt, werden wir mit dem arithmetischen Mittel antworten. Im Einzelfall wird das zwar eine ungenaue Prognose sein. Ein Patient lebt länger, der andere kürzer als der Durchschnitt. So weichen viele Patienten von der Prognose ab. Über längere Zeit werden sich die Abweichungen jedoch ausgleichen und die Zeit, die einige Patienten länger als der Durchschnitt leben, wird der entsprechen, die andere Patienten früher als der Durchschnitt sterben. Das arithmetische Mittel ist so bestimmt, daß (wenigstens in der Stichprobe, für die es berechnet wird) die Summe aller positiven und negativen Abweichungen Null ergibt. Wenn jedoch am Beginn einer Krankheit viele sterben und andrerseits einige sehr lang leben, dann gleichen sich zwar die Abweichungen immer noch auf null aus, aber es sterben viele vor Erreichen des Durchschnittes und wenige sterben lange nach dessen Überschreitung. Für die Spitalsverwaltung ist das gleich. Es macht ja keinen Unterschied, ob ein Bett durch einen Patienten ein Jahr oder durch zwölf Patienten je einen Monat belegt ist. Der Mediziner könnte aber den Median als Durchschnittsangabe vorziehen, denn wenn er diesen als Prognose verwendet, dann gleichen sich zwar die Abweichungen nicht auf Null aus, dafür hat er aber die Überlebenszeit genau bei 50% der Patienten unterschätzt und bei den anderen 50% überschätzt. Dazu kommt noch, daß man bei beiden Werten Abweichungen in Kauf nehmen muß. Wie oben gesagt, gleichen sich diese Abweichungen beim arithmetischen Mittel auf null aus, aber nur wenn man ihre Richtung berücksichtigt. (So wie "einmal eine Stunde zu früh kommen und zweimal eine halbe Stunde zuspätkommen ist drei mal pünktlich dort sein.") Will man aber, daß die Summe aller Abweichungen ohne Rücksicht auf deren Richtung möglichst gering ist, dann erfüllt der Median diese Forderung, das arithmetische Mittel aber nicht. (Letzteres minimiert die Summe der quadrierten Abeichungen, aber das betrifft uns hier nicht.) Anmerkung: Außerdem läßt sich der Median bereits dann bestimmen, wenn die Hälfte der Patienten gestorben ist (bzw. wenn die Überlebenskurve auf das 50%-Niveau abgesunken ist). Das arithmetische Mittel kann man erst bei Vorliegen aller Überlebenszeiten errechnen, also wenn alle gestorben sind (bzw. wenn der Patient mit der längsten Überlebenszeit gestorben ist). Die x-Jahres-Überlebensrate Ein anderer Kennwert, der zur Beschreibung von Überlebenskurven verwendet wird, ist die Überlebensrate nach einer bestimmten Zeit, z.B. die 5-Jahres-Überlebensrate. Diese entspricht einfach der Höhe der Kurve zu diesem Zeitpunkt. Die Hazardfunktion Gibt es gefährliche und weniger gefährliche Monate in unserem Beispiel? Gefährlich z.B. in dem Sinn, daß man die Patienten in bestimmten Monaten intensiver betreuen müßte, als in anderen. Betrachtet man Bild 1/1 , so sieht man, daß im ersten Monat die meisten sterben und dann, abgesehen von kleineren Schwankungen, immer weniger. Zum Zeitpunkt der Diagnose stellt es sich so dar, daß die Wahrscheinlichkeit im ersten Monat zu sterben 25% ist, im zweiten Monat 17% ist und so weiter. Das stimmt, ist aber nur eine der möglichen Antworten auf die Frage nach der Gefährlichkeit einzelner Monate. Im 10.Monat konnten z.B. nicht so viele sterben wie im 1.Monat, weil gar nicht mehr so viele gelebt haben. Um zu einer Abschätzung des Risikos zu kommen, setzt man deshalb die Todesfälle in einem Zeitabschnitt in Beziehung zu jenen, die in diesem Intervall sterben können, also zu jenen, die am Beginn des Intervalls LBI für Leukämieforschung Seite 4 Analyse von Überlebenszeiten noch gelebt haben und somit "unter Risiko standen". Genau das macht die in Bild 1/4 dargestellte Hazardfunktion. Bild 1/4: Hazardkurve (zu Beispiel 1) Schätzung für die Hazardfunktion λ(t) λ(t) = f(t)/(1 - F(t)); d.h.: λ(t) = f(t)/S(t) λ(t) ist der Anteil jener, die in einem Zeitintervall sterben, bezogen auf alle, die bis zu diesem Zeitintervall überlebt haben, d.h. in diesem Intervall unter Risiko stehen. 60 50 40 Prozent 30 20 10 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 tw Monate Sie zeigt den Anteil der Todesfälle pro Monat bezogen auf die Zahl der unter Risiko stehenden Patienten, also auf die Zahl jener, die am Monatsbeginn noch leben. Sie gibt die lokale oder bedingte Sterberate an. Wir sehen, daß in unserem Beispiel die ersten Monate gar nicht wesentlich gefährlicher sind als die späteren. Die Hazardfunktion bringt genau dieselbe Information zum Ausdruck wie die Überlebenskurve, allerdings in einer anderen Form. Zweites Beispiel (Quelle: Embury et al., Western J. Medicine 1977 zit. nach Neiß et al., Analyse von Überlebenskurven) Wie eingangs erwähnt, läßt sich die Methodik der Überlebenskurvenberechnung auch auf andere Daten anwenden. Das nun folgende Beispiel beschäftigt sich mit der Remissionsdauer von Patienten. Das Zielereignis ist hier der Rückfall. Wir kennen die Remissionsdauer von 11 Patienten. Sie war 9, 13, 13+, 18, 23, 28+, 31, 34, 45+, 48, 161+. Vier dieser Angaben sind mit "+" gekennzeichnet. Diese Patienten wurden 13, 28, 45 bzw. 161 Monate beobachtet ohne daß sie einen Rückfall gehabt hätten. Von ihnen liegen nur diese zensierten Daten vor. Tabelle 2/1: Remissionsdauer in Monaten zu Beispiel 2 Monate 9 13 18 23 28 31 34 45 48 161 Zahl der Patienten mit Rückfall 1 1 1 1 0 1 1 0 1 0 Zahl zensierter Patienten 0 1 0 0 1 0 0 1 0 1 Zahl bis dahin rückfallfreier Patienten monatlicher Anteil rückfallfreier Patienten Gesamter Anteil rückfallfreier Patienten 11 10 8 7 6 5 4 3 2 1 10/11=0.909 9/10=0.900 7/8=0.875 6/7=0.857 6/6=1.000 4/5=0.800 3/4=0.750 3/3=1.000 1/2=0.500 1/1=1.000 0.909 0.818 0.716 0.613 0.613 0.491 0.368 0.368 0.184 0.184 Es stellt sich die Frage, was man mit zensierten Beobachtungen tun soll. Grob gesehen gibt es vier Möglichkeiten mit unvollständigen Daten umzugehen: Lösung 1: Sie werden weggelassen. Lösung 2: Sie werden dem Verfahren von Kaplan und Meier entsprechend berücksichtigt. Lösung 3: Sie werden behandelt wie die anderen, also so, als hätten sie am Ende der Beobachtungszeit einen Rückfall gehabt. Lösung 4: Man behandelt sie, als würden sie nie einen Rückfall haben (d.h. die Remissionsdauer wäre unendlich) LBI für Leukämieforschung Seite 5 Analyse von Überlebenszeiten Bild 2/1: Überlebenskurve (zu Beispiel 2) Bild 2/1 zeigt, wie die "Überlebenskurven" aussehen, je nach dem, welche der vier Lösung man wählt. Sowohl die erste, als auch die dritte Möglichkeit ist nicht zufriedenstellend. Im ersten Fall vernachlässigt man den 0 10 20 30 40 50 Monate Informationsgehalt der Tatsache, daß 4 Patienten, solange sie beobachtet wurden, keinen Rückfall hatten, im anderen Fall verfälscht man die Daten, indem man fehlende Beobachtung mit Rückfall gleichsetzt. Die vierte Lösung ist wohl auch nicht überzeugend, da man dabei ja unterstellt, daß jene Patienten, die bis zum Ende der Beobachtung keinen Rückfall hatten, auch in Zukunft nie einen solchen haben werden. Eine einleuchtende Lösung zur Berücksichtigung zensierter Daten bietet das Verfahren von Kaplan und Meier(1958). 1 Prozent 0,9 Lösung 1 0,8 Lösung 2 0,7 Lösung 3 0,6 Lösung 4 0,5 0,4 0,3 0,2 0,1 0 Das Verfahren von Kaplan und Meier Erinnern wir uns an das erste Beispiel. Wir hatten alle Patienten bis zu deren Tod beobachtet und damit vollständige Daten. Daraus ließ sich die Überlebenskurve einfach konstruieren. Man brauchte nur für jeden Monat den Prozentsatz der Überlebenden berechnen, indem man die Zahl der noch Lebenden auf die Gesamtzahl der Patienten in der Studie bezog. Am Beginn des ersten Monats waren es 100%, am Beginn des zweiten Monats 75% und so fort. Diese Prozentsätze nennt man kumulative Überlebensrate. Die Hazardfunktion hingegen gab an, welcher Anteil von Patienten, die am Anfang eines Monats lebten, am Ende desselben Monats gestorben sein würde - die lokale Sterberate. Der Verlust an Patienten in einem bestimmten Monat läßt sich offensichtlich mit der "Gefährlichkeit" dieses Monats erklären. Um das Folgende einfacher erklären zu können, überlegen wir, daß jeder Monat eine "Gefährlichkeit" und eine "Überlebensfreundlichkeit" besitzt. Letztere sei das Gegenteil der "Gefährlichkeit". Der "Gefährlichkeit" entspricht die lokale Sterberate, der "Überlebensfreundlichkeit" die lokale Überlebensrate. Schauen wir z.B. den 7.Monat aus Beispiel 1 an. Die Hazardfunktion hat den Wert 8%, weil von den 27 Patienten, die den 7.Monat erreicht haben (25*0.08=2), 2 Patienten in diesem Monat gestorben sind. Andrerseits haben 92% (25*0.92=23), das sind 23 Patienten, den Monat überlebt. Die 92% wollen wir die "Überlebensfreundlichkeit" oder lokale Überlebensrate des 7.Monats nennen. Man sieht, daß "Gefährlichkeit" und "Überlebensfreundlichkeit" eines Monats zusammen 100% ergeben. Multipliziert man also die Ausgangszahl an Patienten mit der lokalen Überlebensrate ("Überlebensfreundlichkeit") des ersten Monats, erhält man die Überlebendenzahl am Ende des ersten Monats. Multipliziert man diese Zahl mit der lokalen Überlebensrate des zweiten Monats, erhält man die Überlebendenzahl (oder kumulative Überlebensrate) am Ende dieses Monats etc. Geht man statt von der Patientenzahl von der Zahl 100 aus, dann erhält man die Zahl der Überlebenden in Prozent bis zum Ende des jeweiligen Monats. Das sieht nach unnötiger Umständlichkeit aus, ist es aber nicht. Im ersten Beispiel ging es zwar einfacher, aber was wir jetzt überlegt haben ist dann interessant, wenn auch zensierte Daten vorliegen. Tabelle 2/1 zeigt in der fünften Spalte unter der Bezeichnung "monatlicher Anteil rückfallfreier Patienten" die lokale Überlebensrate (das, was wir vorher "Überlebensfreundlichkeit" genannt haben) in Teilen von 1.0, berechnet nach Kaplan und Meier. Man berechnet den Überlebendenanteil (die kumulative Überlebensrate in Teilen von 1.0) einfach als Zahl derer, die nicht im betreffenden Monat gestorben sind, dividiert durch die Zahl aller, die am Beginn des Monats gelebt haben. Personen, die nicht bis zum Erreichen des Zielereignisses (Tod oder Rückfall, etc.) beobachtet wurden (zensierte Daten), werden dabei für die ganze Zeit, in der sie beobachtet wurden, zu den Lebenden gezählt und danach ganz weggelassen, ohne irgendwann als gestorben verrechnet zu werden. Derart wird die Information, die in der unvollständigen Beobachtung steckt, zur Gänze genutzt. Anmerkung: Wenn in einen Monat sowohl Todesfälle als auch zensierte Daten fallen, dürfte dieses Verfahren die Überlebenskurve zu optimistisch schätzen. Kaplan und Meier empfehlen, in so einem Fall bei der Berechnung LBI für Leukämieforschung Seite 6 Analyse von Überlebenszeiten der lokalen Überlebensrate die Personen, deren zensierte Überlebenszeit im betreffenden Monat endet, bei den Überlebenden nur mit halbem Gewicht einzubeziehen. Es hat sich aber zu Unrecht eingebürgert, zensierte Daten auch in jenem Intervall, in dem die Zensierung erfolgt, mit vollem Gewicht zu verrechnen. Drittes Beispiel - zum Anschauen und Mitrechnen Wir gehen von folgenden erfundenen Überlebenszeiten für zwei Gruppen aus: Gruppe A 2 , 3+, 4 , 6 , 9 , 10 , 12+, 13+, 15 , 16 Gruppe B 5 , 6+, 7+, 8 , 9+, 10 , 11+, 14+, 15 , 16+ Bild 3/1: Häufigkeitsverteilungen der Überlebenszeiten (zu Beispiel 3) Gruppe A Fürs erste konzentrieren wir uns auf Gruppe A. Sie umfaßt 10 Personen und die "+" hinter den + + + Zahlen 3, 12 und 13 bedeuten 1 2 4 5 6 7 8 3 9 10 11 12 13 14 15 16 Monate zensierte Daten (und nicht, wie Gruppe B man im christlichen Abendland vermuten könnte, "gestorben"). + + + + + + Somit sind in Gruppe A 7 1 2 4 5 6 7 8 3 9 10 11 12 13 14 15 16 Monate Personen gestorben und von 3 +...zensiertes Datum liegen zensierte Beobachtungen vor. Es spielt zwar für die Berechnung keine Rolle, aber nehmen wir an, die Überlebenszeiten seien in Monaten angegeben. Bild 3/2: Überlebenskurven zweier Gruppen (zu Beispiel 3) Geschätzter Anteil Überlebender Zuerst wollen wir die Vorgangsweise des KaplanMeier-Verfahrens bildlich darstellen. Wir werden dazu die Bilder 3/3 und 3/4 miteinander vergleichen. Bild 3/3 zeigt am linken Rand, sozusagen am Beginn des ersten 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Monates, unsere 10 Personen als Monate kleine (geschlechtlich nicht spezifizierte, d.h. potentiell auch weibliche!) Männchen, eines über dem anderen aufgestellt. Jene Person mit der längsten Überlebenszeit steht ganz unten, die mit der kürzesten ganz oben. Da es sich um ein erfundenes Beispiel handelt, gestatten wir uns den Vergleich mit einem Brettspiel. Wir lassen nun jedes Männchen auf seiner Höhe so viele "Monatseinheiten" nach rechts ziehen, wie es seiner Überlebenszeit entspricht. Am Ende seiner Zeit zeichnen wir es nochmals ein. In Bild 3/3 lassen wir, wider besseren Wissens, auch die mit "+" gekennzeichneten Personen sterben. Das ergibt eine einfache Überlebenskurve und entspricht der Lösung 3 im Sinne des vorigen Beispiels. 1 0,9 0,8 Gruppe A Gruppe B 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 LBI für Leukämieforschung Seite 7 Analyse von Überlebenszeiten Bild 3/3: Überlebenskurve für Gruppe A (zu Beispiel 3) unter Vernachlässigung der Unvollständigkeit zensierter Daten Bild 3/4 sieht etwas anders aus. Es beginnt wie Bild 3/3, aber im 1 3.Monat geschieht etwas 2 2 0.9 Besonderes. 3 3 Das Männchen mit 3+ verläßt die 0.8 Bildfläche ohne zu sterben. Wir 4 4 0.7 haben es ja nicht bis zu seinem 6 6 0.6 Tod beobachtet. 9 9 0.5 Und weil niemand gestorben ist, 10 10 0.4 darf auch die Überlebenskurve 12 12 nicht fallen. 0.3 13 13 Die halten wir auf gleicher Höhe, 0.2 15 indem wir die verbleibenden 15 0.1 Männchen etwas wachsen lassen, 16 16 0 und zwar genau so viel, daß sie 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 zusammen das verschwundene Monate Männchen ersetzen. Das klingt nach Kindergarten, ist so unernst aber nicht! Es bedeutet soviel wie die Überlebenschancen des Verschwundenen gleichmäßig auf die Verbleibenden aufteilen. Mit jedem, der in Zukunft stirbt, stirbt auch "ein Teil" des nicht mehr beobachtbaren Männchens. Das hat zwei Unterschiede zu Bild 3/3 zur Folge: am Ende des dritten Monats spart man sich 1 den Abstieg der Überlebenskurve 2 2 um eine Stufe. 0.9 3+ 3+ Dafür wachsen die Männchen, 4 0.8 und alle folgenden Abstiege sind 4 6 6 0.7 dadurch größer. 6 0.6 9 9 Im zwölften und im dreizehnten 9 0.5 Monat geschieht das wieder und 10 10 10 man sieht, daß die zwei 0.4 12+ 12+ 13+ 12+ verbleibenden Männchen mehr 0.3 15 15 13+ als die doppelte Ausgangsgröße 13+ 0.2 15 erreicht haben. 15 15 0.1 Ihr Tod drückt die Kurve dann 16 16 16 16 16 0 um so mehr nach unten. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Die Darstellung in Bild 3/4 Monate entspricht - abgesehen vom Einzeichnen der Männchen - genau dem Ergebnis einer Überlebenskurvenberechnung nach dem Verfahren von Kaplan und Meier. Bild 3/4: Überlebenskurve für Gruppe A nach der Methode von Kaplan und Meier Zum Berechnen der Überlebenskurve, wie sie in Bild 3/4 dargestellt ist, legen wir folgende Tabelle an (siehe Tabelle 3/1). Tabelle 3/1: Überlebenskurvenberechnung für Gruppe A in Beispiel 3 Zeitpunkt Zahl der Pers. mit erreichtem Zielereignis Zahl der Personen mit zensiertem Datum Zahl der Personen mit Überlebenszeit >= t lokale Überlebensrate kumulative Überlebensrate Streuungsberechnungen SE nach Kaplan und Meier SE nach TNM-Klassifikation SE nach Peto et al. t d z n λ 1-λ S 2 1 0 10 9/10 .90 .90 .09 .10 .09 3 0 1 9 9/9 1.00 .90 4 1 0 8 7/8 .87 .79 6 1 0 7 6/7 .85 .67 9 1 0 6 5/6 .83 .56 10 1 0 5 4/5 .80 .45 .09 .13 .14 .13 .16 .18 .15 .16 .20 .15 .16 .23 .15 12 0 1 4 4/4 1.00 .45 .17 13 0 1 3 3/3 1.00 .45 15 1 0 2 1/2 .50 .23 16 1 0 1 0/1 .00 .00 .19 .18 .29 .14 .00 .00 .00 In die erste Zeile schreiben wir die Zeitpunkte, zu denen jemand gestorben ist oder zensiert wurde, in aufsteigender Reihe. LBI für Leukämieforschung Seite 8 Analyse von Überlebenszeiten Das entspricht den nach Größe geordneten Überlebenszeiten. Dabei werden mehrfach auftretende Zeiten (das kommt in diesem Beispiel ohnehin nicht vor) aber nur einmal notiert. Die zweite Zeile gibt an, wieviele Personen zum entsprechenden Zeitpunkt das Zielereignis erreicht haben, also gestorben sind. Im Beispiel sind das zu jedem Zeitpunkt eine Person oder niemand - dann nämlich, wenn zu diesem Zeitpunkt jemand ausgeschieden ist ohne zu sterben. Die Zahl dieser zensierten Beobachtungen gibt die dritte Zeile an. Die vierte Zeile zeigt, wieviele Personen unmittelbar vor jedem Zeitpunkt unter Beobachtung standen und somit auch dem Risiko, zu sterben, ausgesetzt waren. Am Anfang waren es alle 10 Personen und mit jedem Toten oder Zensierten wurden es um einen weniger. Diese drei Zeilen erhält man, wie zu sehen, durch abzählen. Die lokale Überlebensrate in der fünften Zeile muß man ausrechnen. Sie nennt sich "lokal", weil sie den Überlebendenanteil derer angibt, die unmittelbar vor dem entsprechenden Moment "unter Risiko" standen. Beispielsweise standen vor dem 2.Monat alle 10 Personen unter Sterberisiko. Eine ist im 2.Monat gestorben, daher ist das lokale Sterberisiko im 2.Monat 9/10=.9 . Vor dem dritten Monat stehen 9 Personen unter Risiko. Eine scheidet zwar aus, aber niemand stirbt, und das ergibt eine lokale Überlebensrate von 9/9=1. Zeitpunkte, zu denen zwar jemand ausscheidet aber niemand stirbt, haben daher immer eine lokale Überlebensrate von 1. Sie haben, wie wir sehen werden, keinen Einfluß auf die Höhe der Überlebenskurve. So soll es auch sein. Die nächste Zeile - die kumulative Überlebensrate - gibt die Höhe der Überlebenskurve an. Die Überlebenskurve ist ja die graphische Darstellung der kumulativen Überlebensrate. Wie die lokale Überlebensrate drückt man auch die kumulative Überlebensrate üblicherweise in Teilen von 1.0 aus. Wer Prozentangaben vorzieht, multipliziert das Ergebnis mit 100. Man errechnet die kumulative Überlebensrate für einen Zeitpunkt, indem man den Wert, den sie unmittelbar vor dem Zeitpunkt hat, mit der lokalen Überlebensrate des betreffenden Zeitpunktes multipliziert. Am Beginn hat die kumulative Überlebensrate den Wert 1.0, denn am Anfang leben noch alle. Also ist der Überlebendenanteil 1.0. Zum Zeitpunkt des ersten Todesfalles sinkt sie auf die lokale Überlebensrate dieses Zeitpunktes ab, in unserem Beispiel auf 0.9. Im vierten Monat sinkt die kumulative Überlebensrate auf 0.90*0.87=0.79 und so weiter. Zu den Zeitpunkten mit Todesfällen sinkt sie auf die errechnete Höhe ab. Diese Höhe erhält man, indem man die aktuelle Höhe mit der lokalen Überlebensrate multipliziert. Da die lokale Überlebensrate an Zeitpunkten von Todesfällen immer kleiner 1.0 ist, sinkt die Überlebenskurve dort. Andrerseits bleibt sie an Stellen, an denen nur zensierte Daten anfallen, gleich hoch, da dort die lokale Überlebensrate 1.0 beträgt und daher eine Multiplikation keine Veränderung bewirkt. Ist die längste beobachtete Überlebenszeit eine zensierte Beobachtung, so ist die Höhe der Überlebenskurve ab diesem Zeitpunkt unbestimmt in den Grenzen ihrer letzten Höhe und 0. Ist die längste Überlebenszeit keine zensierte Beobachtung dann fällt die Kurve auf 0.0, da die lokale Überlebensrate dieses Zeitpunktes 0.0 beträgt und damit auch die mit 0.0 multiplizierte kumulative Überlebensrate. Bestimmung des Medianes der Überlebenszeit In der Überlebenskurvenberechnung definiert man den Median - etwas abweichend vom sonstigen Gebrauch - als den Zeitpunkt bzw. die Mitte des Zeitintervalles wo die Überlebenskurve die 50%-Höhe durchschreitet, bzw. erreicht. Bild 3/2 zeigt die Überlebenskurve für Beispiel 3/Gruppe A in der allgemein üblichen Form (durchgezogene Linie). Wie zu sehen, durchtritt die Kurve die 50%-Höhe am Ende des 10.Monates. Bestimmung des Mittelwertes der Überlebenszeit Der Mittelwert der Überlebenszeit entspricht der Fläche unter der Überlebenskurve. Diese ist nur dann eindeutig bestimmt, wenn die längste Beobachtung eine unzensierte ist, und die Kurve somit auf Null absinkt. Andernfalls behilft man sich mit der Begrenzung der Fläche zum Zeitpunkt der längsten Beobachtung. Das führt zu einer systematischen Unterschätzung des wahren Mittelwertes. Für Gruppe A im Beispiel 4 beträgt der Mittelwert 10.43. LBI für Leukämieforschung Seite 9 Analyse von Überlebenszeiten Konfidenzintervall einer Überlebenskurve Wenn wir für eine bestimmte Patientengruppe eine Überlebenskurve berechnen, tun wir das z.B., um den natürlichen Verlauf einer Krankheit oder jenen unter Einfluß einer speziellen Therapie darzustellen. Wir interessieren uns für etwas, wovon die beobachteten Daten ein Teil - eine Stichprobe sind. Wir erwarten bei anderen Patienten ähnliche, aber doch nicht exakt dieselben Ergebnisse, auch wenn sie der gleichen Diagnosegruppe angehören oder der gleichen Therapie unterzogen werden. Wir erwarten also zufällige Schwankungen der Ergebnisse. Je mehr Patienten wir beobachten, desto kleiner werden diese Schwankungen sein. Wir stellen uns vor, daß es eine wahre Überlebenskurve gibt, die wir erhalten, wenn wir alle in Betracht kommenden Patienten (die sogenannte Grundgesamtheit) beobachten. (Das ist normalerweise nicht möglich, da viele Grundgesamtheiten als unendlich groß gedacht sind.) Alle Überlebenskurven, die wir aus den einzelnen Stichproben erhalten, schwanken um diese (gedachte) Überlebenskurve. Unter gewissen Annahmen kann man den Abstand zwischen "wahrer" und aus der Stichprobe stammender Überlebenskurve berechnen, der nur mehr von einem bestimmten kleinen Teil von "Stichprobenkurven" überschritten wird. Zeichnet man nun über und unter der errechneten Kurve diesen Abstand ein - wie es in Bild 3/5 geschehen ist (gestrichelte Linien), dann kann man sagen, daß der so begrenzte Bereich mit einer Wahrscheinlichkeit von 95% die "wahre" Überlebenskurve miteinschließt. Anmerkung: Leider ist diese Erklärung in mehrfacher Hinsicht nicht ganz (genau genommen gar nicht) korrekt. Es überschreitet aber den gegebenen Rahmen, die Diskussion rund um die richtige Interpretation eines Konfidenzintervalles hier darzustellen. Dieses Konfidenzintervall ist nach einer Näherungsformel berechnet. Das sieht man auch daran, daß das Konfidenzintervall Bereiche außerhalb von 0% und 100% einschließt, was natürlich nicht richtig sein kann, denn eine Überlebenskurve kann nur zwischen 0% und 100% liegen. Trotzdem gibt das Konfidenzintervall einen guten Eindruck von den möglichen Zufallsschwankungen, die das Ergebnis mitbeeinflußt haben. Der zweite Teil der Tabelle 3/1 zeigt die Ergebnisse von Streuungsberechnungen nach drei verschiedenen Formeln, die in der Literatur zu finden sind. Bild 3/5: Konfidenzbereich der Überlebenskurve für Gruppe A (zu Beispiel 3) Geschätzter Anteil Überlebender 1,2 1 0,8 0,6 0,4 0,2 0 0 1 2 3 4 5 6 7 8 9 Monate 10 11 12 13 14 15 16 17 In Bild 3/5 wurde das Konfidenzintervall aufgrund der Streuungsformel, die Kaplan und Meier angeben, eingezeichnet. Will man zu einer vorhandenen Überlebenskurve das Konfidenzintervall ohne Computerprogramm berechnen, empfiehlt es sich die Formel nach Peto et al. (1977) zu verwenden. Sie lautet: SE(S)=S*√((1-S)/n) dabei bedeutet: SE(S) Standardfehler der Überlebenskurve S Höhe der Überlebenskurve zum betreffenden Zeitpunkt n Zahl der Personen unter Risiko zum betreffenden Zeitpunkt in Worten: der Standardfehler der Überlebenskurve ergibt sich aus der Höhe der Überlebenskurve multipliziert mit der Wurzel aus 1-S durch die Zahl der Personen unter Risiko. Diesen Ausdruck berechnet man für jeden Zeitpunkt, an dem sich die Zahl der Personen unter Risiko ändert. Die Formel gibt den Standardfehler an. Diesen Standardfehler muß man, wenn man ein 95%Konfidenzintervall erhalten will, mit 2 (oder scheinbar oder anscheinend genauer mit 1.96) multiplizieren. LBI für Leukämieforschung Seite 10 Analyse von Überlebenszeiten Die maximale Höhe der Überlebenskurve zu einem bestimmten Zeitpunkt beträgt dann S+SE(S)*1.96 und die Minimalhöhe S-SE(S)*1.96. Konfidenzintervall des Medianes Ein Konfidenzintervall läßt sich auch für den Median bestimmen. Dazu gibt es verschiedene Ansätze. Sie führen im allgemeinen auch zu unterschiedlichen Ergebnissen, und die Berechnungen sind mühsam. Wir wollen hier darauf verzichten. Man kann sich aber überlegen, daß der Median in Beispiel 3 zwischen 6 Monaten und 16 Monaten schwanken würde, wenn die Überlebenskurve im gestrichelten Bereich, also im Rahmen ihres Konfidenzintervalles, schwankt. Vergleich mehrerer Gruppen Die Patienten in Beispiel 3 Gruppe A hatten die Überlebenszeiten 2, 3+, 4, 6, 9, 10, 12+, 13+, 15, 16. Nun wollen wir sie mit den Überlebenszeiten von Gruppe B vergleichen. Die 10 Patienten der Gruppe B hatten folgende Überlebenszeiten: 5, 6+, 7+, 8, 9+, 10, 11+, 14+, 15, 16+. Wir zeichnen die Überlebenskurven wie in Bild 3/2 zu sehen. Hier sieht man, daß die Gruppe B zu jedem Zeitpunkt über der Gruppe A liegt. Das Sterberatenverhältnis Um die unterschiedlichen Überlebensaussichten der Patienten der beiden Gruppen abschätzen zu können, überlegen wir folgendes: wenn wir beide Gruppen gemeinsam betrachten, stellen wir im 2., 4., 5., ... Monat einen Todesfall fest. Angenommen, die Patienten in beiden Gruppen hätten gleich große Überlebenschancen, dann sollten sich auch die Todesfälle gleichmäßig auf beide Gruppen aufteilen. Würden in einem Monat 2 Patienten sterben, so sollte einer davon aus der Gruppe A und einer aus der Gruppe B sein. Selbstverständlich werden sich die Todesfälle nie genau aufteilen und, wenn gerade nur einer stirbt, gar nicht aufteilen lassen, aber über die ganze Studie gesehen, wäre doch ein Gleichgewicht zu erwarten. Dabei ist noch zu bedenken, daß sich die Todesfälle nur dann 1:1 aufteilen sollen, wenn in beiden Gruppen gleich viele Personen unter Risiko stehen. Bestünde hingegen eine Gruppe zu einem bestimmten Zeitpunkt aus 60 Personen und die andere aus 20, dann wäre eine Aufteilung von 3:1 entsprechend. Nennen wir die Zahl von erwarteten Todesfällen in einer Gruppe "erwartete Häufigkeit" - im Gegensatz zur tatsächlichen Zahl der Todesfälle in der Gruppe der "beobachteten Häufigkeit". Wir berechnen diese erwartete Häufigkeit (in Tabelle 3/2 wird sie Ea für Gruppe A und Eb für Gruppe B genannt), indem wir für jeden Zeitpunkt eines Todesfalles, egal in welcher Gruppe er eintritt, den "gerechten" Anteil jeder Gruppe bestimmen (in der Tabelle in den mit e(a) und e(b) bezeichneten Zeilen zu finden), und dann alle diese erwarteten Anteile für jede Gruppe zusammenzählen. Es stört beim Errechnen der einzelnen Anteile nicht, daß oft "halbe Tote" herauskommen. Nun bilden wir für jede Gruppe den Bruch Da/Ea bzw. Db/Eb. Wir vergleichen die wirkliche Zahl der Todesfälle mit der erwarteten. Bei Gruppe A gibt das 1.333 , bei Gruppe B 0.695 . Bei Gruppe A sind somit um ein Drittel mehr Patienten gestorben als erwartet, bei Gruppe B um ein Drittel weniger. Das Sterberatenverhältnis zwischen beiden Gruppen ist 1.33/0.69=1.92 . Die Chance auf einen Todesfall steht zwischen den Gruppen auf 1.92:1 , also rund 2:1 d.h. wenn in beiden Gruppen gleich viele Personen unter Risiko stehen und zu einem Zeitpunkt eine stirbt, so steht die Chance 2:1, daß sie aus Gruppe A ist. (Wie man sieht, wird der Begriff Chance hier wertfrei gebraucht.) Anmerkung: Dieses Sterberatenverhältnis ist eine gute Näherung für den Proportionalitätsfaktor im Proportional-HazardModel von Cox. Das Modell wird später erklärt, dann wird diese Anmerkung verständlich werden. LBI für Leukämieforschung Seite 11 Analyse von Überlebenszeiten Zufallskritische Beurteilung von Unterschieden Wir haben nun festgestellt, daß die Aussichten in beiden Gruppen nicht gleich sind. Es stellt sich aber die Frage, ob dieser Unterschied nicht auf zufällige Schwankungen zurückzuführen ist. Zwar ist die Überlebenskurve von Gruppe B immer höher als die von Gruppe A (siehe Bild 3/2), bedenkt man aber, wie sehr diese Ergebnisse schwanken können (siehe das Konfidenzintervall in Bild 3/5), dann scheint der Unterschied nicht gesichert. Um das zu prüfen, rechnen wir einen statistischen Test, den Logrank-Test(auch Mantel-Haenszel-Test, generalized Savage-Test oder Mantel-Cox-Test genannt). Anmerkungen: 1. Hier wird die einfachste approximative Berechnung des Logrank-Tests nach Peto et al.(1977) dargestellt. Die Testgröße X-Quadrat ist näherungsweise Chi-Quadrat-verteilt mit Gruppenzahl - 1 Freiheitsgraden. 2. Es gibt weitere Tests, die unter denselben Bedingungen anwendbar sind, z.B. der generalized Wilcoxon (Gehan-Wilcoxon) oder Breslow-Test und der Taron-Ware Test. Sie unterscheiden sich in der Gewichtung, die sie vornehmen. Der Wilkoxon-Test ist auf Unterschiede zwischen den Kurven nahe dem Zeitpunkt Null besonders empfindlich, während der Logranktest Unterschiede gegen Ende der Kurven stärker als die anderen Tests berücksichtigt. 3. Für den Fall von mehr als zwei Gruppen, die in eine interpretierbare Reihung gebracht werden können (z.B. drei unterschiedlich intensive Therapieprotokolle), gibt es zu allen genannten Tests auch Versionen, die auf das Vorliegen eines Trends prüfen. Gesamtgruppenvergleich Wir brauchen dabei nur die Ergebnisse von vorhin zu verwenden. Mit den Werten Ea, Da, Eb, Db bilden wir die Testgröße X-Quadrat, wie sie in der Mitte von Tabelle 3/2 beschrieben ist. Wenn X-Quadrat größer als 3.84 ist, dann kann man sagen, daß ein so großer oder noch größerer Unterschied zwischen zwei Überlebenskurven in nur 5% aller Untersuchungen zu erwarten ist, wenn sich die Grundgesamtheiten, aus denen die beiden Gruppen stammen, in Wirklichkeit nicht unterscheiden. Tabelle 3/2: Vergleich zweier Gruppen - Sterberatenverhältnis und Logranktest für die Gruppen A und B des Beispiels 3 t Gruppe A d z n(a) e(a) Gruppe B d z n(b) e(b) gesamt d(ges) n(ges) 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 0 10 .50 0 1 9 .00 1 0 8 .44 0 0 7 .41 1 0 7 .44 0 0 6 .00 0 0 6 .46 1 0 6 .50 1 0 5 1.00 0 0 4 .00 0 1 4 .00 0 1 3 .00 0 0 2 .00 1 0 2 1.00 1 0 1 .50 0 0 10 .50 0 0 10 .00 0 0 10 .56 1 0 10 .59 0 1 9 .56 0 1 8 .00 1 0 7 .54 0 1 6 .50 1 0 5 1.00 0 1 4 .00 0 0 3 .00 0 0 3 .00 0 1 3 .00 1 0 2 1.00 0 1 1 .50 1 20 0 19 1 18 1 17 1 16 0 14 1 13 1 12 2 10 0 8 0 7 0 6 0 5 2 4 1 2 LBI für Leukämieforschung Seite 12 Analyse von Formeln und Ergebnisse: e(a)=n(a)*d(ges)/n(ges) e(b)=n(b)*d(ges)/n(ges) Überlebenszeiten Da=SUMME(d(a))=7 Ea=SUMME(e(a))=5.25 Db=SUMME(d(b))=4 Eb=SUMME(e(b))=5.75 Sterberatenverhältnis: Definition: R=(Da/Ea)/(Db/Eb) Ergebnis: R=1.92 Logranktest: (Da − Ea)2 (Db − Eb) 2 2 = + X Ea Eb Ergebnis des Tests: X =1.1, df=1; nicht signifikant Nachtrag - Überlebenskurve für Gruppe B: t d z n(b) λ 1-λ S 2 0 0 10 1 1 3 0 0 10 1 1 4 0 0 10 1 1 5 1 0 10 .90 .90 6 0 1 9 1 7 0 1 8 1 8 1 0 7 .89 .77 9 0 1 6 1 10 1 0 5 .80 .62 11 0 1 4 1 12 0 0 3 1 13 0 0 3 1 14 0 1 3 1 15 1 0 2 .50 .31 16 0 1 1 1 .31 So ein Ergebnis nennt man signifikant auf dem 5%-Niveau. Wäre X-Quadrat größer als 6.64 , so würde das Ergebnis als auf dem 1%-Niveau gesichert gelten. Anmerkung: Es handelt sich um einen zweiseitigen Test. Die kritischen Werte 3.84 und 6.64 gelten für den hier beschriebenen Vergleich zweier Gruppen. Der Vergleich mittels X- Quadrat ist auch bei mehreren Gruppen möglich. Die Formel für X- Quadrat wird dazu um die entsprechenden Summanden erweitert und die kritischen Werte finden sich in Tabellen der Chi-Quadrat Verteilung. Ist ein Ergebnis auf einem vorher gewählten Niveau signifikant, dann heißt das, ein so großer oder größerer Unterschied wäre kaum durch zufällige Unterschiede zwischen den beiden Gruppen zustandegekommen. Das legt die Vermutung nahe, daß ein beobachteter signifikanter Unterschied nicht durch Zufall, sondern durch inhaltliche Verschiedenheiten der Gruppen entstanden ist. In unserem Fall könnten das unterschiedliche Therapieformen sein (wenn der Unterschied signifikant wäre!). Unser X-Quadrat beträgt 1.1 und ist damit gar nicht signifikant. Der beeindruckende Unterschied kann ganz gut rein zufällig aufgetreten sein. Er ist ungefähr so groß, wie er durchschnittlich zufallsbedingt zu erwarten ist. Das bedeutet nicht, daß der Unterschied an sich klein ist, sondern, daß man viel mehr Patienten beobachten müßte, um dann einen gleich großen Unterschied als signifikant ausweisen zu können. Würde man weiterhin Personen in die Studie aufnehmen und so lange beobachten, bis man rund 50 Todesfälle verzeichnet, hätte man eine Chance von 50%, einen derartigen Unterschied als signifikant ausweisen zu können, wenn der Unterschied zwischen den beiden Gruppen in Wahrheit einem Sterberatenverhältnis von 1:2 entspräche. Besteht hingegen in Wahrheit kein Unterschied zwischen den Patientengruppen, ist zu erwarten, daß sich das Sterberatenverhältnis mit zunehmender Patientenzahl dem Wert 1 nähert. Das prinzipielle Konzept eines Signifikanztests ist problematisch, und eher den Bedürfnissen einer "reinen Wissenschaft" angepaßt. Dort kann man den Standpunkt vertreten, es sei besser etwas nicht zu wissen, als es irrtümlich für wahr zu halten. Die Therapieforschung dient aber mehr der Verbesserung von Entscheidungen, die auf jeden Fall getroffen werden müssen. Es ist nicht möglich, sich wegen Nichtwissens nicht zu entscheiden, da jedes therapeutische Vorgehen oder Nichtvorgehen implizit eine Entscheidung darstellt. Daher ist es zuerst wichtig, beispielsweise unterschiedliche Wirksamkeit von Therapien abzuschätzen, und die Genauigkeit der Schätzung in einem entscheidungstheoretischen Gesamtzusammenhang zu sehen. Hier führt es zu weit, diese Fragen zu behandeln, und so sei das oben Gesagte nur als Andeutung gesehen. Anmerkung: Es ist wichtig, die unterschiedlichen Fragestellungen, die dem Sterberatenverhältnis und dem Logranktest zugrundeliegen, auseinanderzuhalten. LBI für Leukämieforschung Seite 13 Analyse von Überlebenszeiten Das Sterberatenverhältnis ist ein Maß für den Unterschied im Absterbevorgang zwischen zwei Gruppen. Es beschreibt, wie sich zwei tatsächlich beobachtete Gruppen voneinander unterscheiden. Damit liefert es auch eine Schätzung, wie sich zwei derartige Gruppen im allgemeinen unterscheiden würden. Der Logranktest untersucht, ob ein festgestelltes Sterberatenverhältnis mit großer Wahrscheinlichkeit durch Zufallsschwankungen zustandegekommen sein könnte oder ob relativ sicher auch bei weiteren Untersuchungen unter gleichen Bedingungen zwischen zwei derartigen Gruppen ein von 1 verschiedenes Sterberatenverhältnis zu beobachten sein würde. Man erinnere sich daran, daß bei einem Sterberatenverhältnis ein Wert von 1 !! Unterschiedslosigkeit bedeutet. Das hieße z.B., eine Therapie, die zur anderen ein Sterberatenverhältnis von 1:1 bewirkt, verändert die Sterbechancen der Patienten nicht. Periodenvergleich Neben dem Vergleich zweier oder mehrerer Gruppen über die gesamte Beobachtungszeit hinweg, kann man sich auch für Unterschiede zwischen diesen Gruppen in bestimmten Perioden interessieren. Sowohl das Sterberatenverhältnis als auch der Logranktest lassen sich auf den Vergleich innerhalb einer bestimmten Periode beschränken. Will man z.B. die unterschiedliche Wirksamkeit zweier Therapien im ersten Behandlungsjahr vergleichen, so errechnet man sowohl die D's als auch die E's nur für das erste Jahr und bildet daraus das Sterberatenverhältnis R und X-Quadrat. Stehen die Perioden, für die man Vergleiche durchführen will, nicht bereits vor Kenntnis der Daten fest, sollte man bei der Interpretation etwa gefundener großer, bzw. signifikanter Unterschiede sehr vorsichtig sein. Der geschichtete Gruppenvergleich Wir haben im Zusammenhang mit Beispiel 3 den Vergleich zweier Gruppen dargestellt. Nun sollen zwei Therapiearme in Beispiel 4 untersucht werden. Beispiel 4 ist frei erfunden. Dabei wurde nicht auf Plausibilität geachtet. Es wurde so konstruiert, daß Konzepte einer multivariaten Auswertung leicht darstellbar sind. Tabelle 4/1 und Bild 4/1 zeigen den Vergleich zwischen den Therapien A und B. Bild 4/1: Überlebenskurven Therapie A / Therapie B 1 Therapie A 0,9 Therapie B 0,8 0,7 0,6 Anteil 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 Monate 4500 Personen wurden mit A behandelt und 3000 mit B. Nach 6 Monaten wurde ausgewertet. Das Sterberatenverhältnis beträgt .79 oder 1/1.26 . Anmerkung: Es ist sinnvoll, bei einem Verhältnis immer auch den Kehrwert anzugeben, also .79 und 1/1.26 ,da das Ergebnis nur davon abhängt, ob man A zu B oder B zu A in Verhältnis setzt. Die Sterberaten in A und B verhalten sich wie .79 zu 1. Das ist gleichbedeutend damit, daß sich die Sterberaten von B zu A wie 1.26 zu 1 verhalten. LBI für Leukämieforschung Seite 14 Analyse von Überlebenszeiten Tabelle 4/1: Vergleich zweier Therapiegrupppen - Sterberatenverhältnis und Logranktest für Therapie A zu Therapie B des Beispiel 4 Zeitpunkt - - -> GRUPPE A: 00+01 = Therapie A d(a)..Tote z(a)..Zenierte n(a)..P unter Risiko sr(a)..lokale Überlebensrate S(a)..kumulative Überlebensrate e(a)..erw Tote GRUPPE B: 10+11 = Therapie B d(b)..Tote z(b)..Zensierte n(b)..P unter Risiko sr(b)..lokale Überlebensrate S(b)..kumulative Überlebensrate e(b)..erw Tote d(gesamt) n(gesamt) 1 2 3 4 5 6 SUMMEN 1190 0 4500 .74 .74 1344 743 0 3310 .78 .57 819.95 618 0 2567 .76 .43 670.13 357 0 1949 .82 .35 380.60 231 0 1592 .85 .30 244.25 245 1116 1361 .82 .25 256.21 3384 1116 4500 1050 0 3000 .65 .65 896 560 0 1950 .71 .46 483.05 415 0 1390 .70 .33 362.87 214 0 975 .78 .25 190.40 130 0 761 .83 .21 116.75 130 501 631 .79 .17 118.79 2240 7500 1303 5260 1033 3957 571 2924 361 2353 375 1992 Sterberatenverhältnis = .79 =1/1.26; 3715.14 2499 501 3000 2167.86 X-Quadrat = 80.10, df = 1 Mit dem Ergebnis könnten wir zufrieden sein, aber nun fällt unser Blick auf Tabelle 4/2. Wir sehen, daß 500 junge und 4000 alte Patienten Therapie A erhalten haben sowie 1000 junge Patienten und 2000 alte Patienten Therapie B. (Wann die Jugend aufhört und das Alter beginnt, ist hier belanglos.) Tabelle 4/2: Vergleich der Altersstruktur in den beiden Therapiegruppen Zahl der Therapiegruppe Patienten A B Junge 500 1000 Alte 4000 2000 Verhältnis 1:8 1:2 In Therapiegruppe A gibt es also 8 mal soviele Alte wie Junge, in der Gruppe B nur doppelt so viele. Das gibt zu denken, da Junge oft bessere Heilungschancen haben als Alte. Das Sterberatenverhältnis von .79 bedeutet, daß unter A weniger sterben als unter B. Jetzt, da wir wissen, daß in Therapiegruppe A wesentlich mehr alte Patienten waren als in Gruppe B, vermuten wir, daß der Vergleich von Therapie A und B noch deutlicher für A ausgefallen wäre, wenn wir die ungleiche Altersstruktur berücksichtigt hätten. Das wollen wir nachholen. Wir vergleichen dazu Therapie A mit B zuerst nur bei jungen Patienten (Tabelle 4/3), und dann nur bei alten Patienten (Tabelle 4/4). In beiden Fällen erhalten wir ein Sterberatenverhältnis von .67 oder 1/1.49 . Die beiden Therapien unterscheiden sich in den Untergruppen ( oder Schichten, daher die Bezeichnung "geschichteter Vergleich" ) deutlicher, als nach dem Gesamtvergleich zu erwarten war. Hat man ein Ergebnis, wie in diesem konstruierten Beispiel, wird man natürlich schließen, daß .67 das unverzerrte Verhältnis von A zu B ist, während das erste Ergebnis, nämlich .79, durch die Unterschiede in der Altersstruktur verzerrt war. Im allgemeinen erhält man aber in den einzelnen Untergruppen nicht genau das gleiche Ergebnis und man kombiniert dann die Einzelergebnisse nach der Formel in Tabelle 4/5. Im Beispiel erhalten wir dann .68 oder 1/1.45 also etwa dasselbe Ergebnis wie in den einzelnen Altersschichten. LBI für Leukämieforschung Seite 15 Analyse von Überlebenszeiten Tabelle 4/3: Vergleich der Therapieformen A und B nur für junge Patienten Zeitpunkt - - -> GRUPPE A: 00 = Therapie A;Junge d(a)..Tote z(a)..Zenierte n(a)..P u Risiko sr(a)..lok Üblrat S(a)..kum Üblrat e(a)..erw Tote 1 2 3 4 5 6 SUMMEN 70 0 500 .86 .86 93.33 52 0 430 .88 .76 68.38 49 0 378 .87 .66 64.47 33 0 329 .90 .59 42.91 24 0 296 .92 .54 31.20 27 245 272 .90 .49 34.92 255 245 500 GRUPPE B: 10 = Therapie B;Junge d(b)..Tote z(b)..Zensierte n(b)..P u Risiko sr(b)..lok Üblrat S(b)..kum Üblrat e(b)..erw Tote 210 0 1000 .79 .79 186.67 142 0 790 .82 .65 125.62 126 0 648 .81 .52 110.53 78 0 522 .85 .44 68.09 54 0 444 .88 .39 46.80 58 332 390 .85 .33 50.08 280 1500 194 1220 175 1026 111 851 78 740 85 662 d(gesamt) n(gesamt) Sterberatenverhältnis = .67 = 1/1.49; 335.22 668 332 1000 587.78 X-Quadrat = 30.15, df = 1 Tabelle 4/4: Vergleich der Therapieformen A und B nur für alte Patienten Zeitpunkt - - -> GRUPPE A: 01 = Therapie A;Alte d(a)..Tote z(a)..Zenierte n(a)..P u Risiko sr(a)..lok Üblrat S(a)..kum Üblrat e(a)..erw Tote 1 2 3 4 5 6 SUMMEN 1120 0 4000 .72 .72 1306.67 691 0 2880 .76 .55 790.57 569 0 2189 .74 .41 640.79 324 0 1620 .80 .32 359.48 207 0 1296 .84 .27 227.38 218 871 1089 .80 .22 237.45 3129 871 4000 GRUPPE B: 11 = Therapie B;Alte d(b)..Tote z(b)..Zensierte n(b)..P u Risiko sr(b)..lok Üblrat S(b)..kum Üblrat e(b)..erw Tote 840 0 2000 .58 .58 653.33 418 0 1160 .64 .37 318.43 289 0 742 .61 .23 217.21 136 0 453 .70 .16 100.52 76 0 317 .76 .12 55.62 72 169 241 .70 .08 52.55 1831 169 2000 d(gesamt) n(gesamt) 1960 6000 1109 4040 858 2931 460 2073 283 1613 290 1330 Sterberatenverhältnis = .67 = 1/1.49 3562.35 1397.65 X-Quadrat = 187.07, df = 1 Tabelle 4/5: Geschichteter Vergleich der Therapieformen A und B Schichtungsvariable ist das Alter in zwei Gruppen (zu Beispiel 4) Da = Ea = 255 335.22 + 3129 + 3562.35 = = 3384 3897.57 Db = Eb = 668 587.78 + 1831 + 1397.65 = = 2499 1985.43 Ster beraten ver hältnis = D a*E b 3384*1985.43 = =.689 = 1/1.45 D b*E a 2499*3897.57 Sehen wir uns die zugehörigen Grafiken an. Bild 4/1 zeigt die Überlebenskurven von Therapie A und Therapie B, Bild 4/2 zeigt die Kurven für die einzelnen Untergruppen. Die Hazardfunktionen der vier Untergruppen sind in Bild 4/3 dargestellt. Ihnen entnimmt man, nach welchen Vorgaben das Beispiel konstruiert wurde. Betrachten wir zuerst die Patienten, die mit Therapie A behandelt wurden und jung sind. LBI für Leukämieforschung Seite 16 Analyse von Überlebenszeiten Bild 4/2: Überlebenskurven der 4 Untergruppen Therape A; Junge 1 Therapie B; Junge 0,9 Therape A; Alte 0,8 Therapie B; Alte 0,7 Anteil 0,6 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 Monate Sie haben im ersten Monat einen Hazard von .14, im 2.Monat einen von .12, in den folgenden .13, .10, .08, .10 . Das bedeutet, wie anhand des ersten Beispieles erklärt, daß von allen 500 Patienten im ersten Monat 14 Prozent sterben, daß von denen, die den Beginn des zweiten Monates erleben, im zweiten Monat 13 Prozent sterben und so weiter. Bild 4/3: Hazardfunktionen der 4 Untergruppen (zu Beispiel 4) Vergleicht man die Hazardfunktion dieser Untergruppe mit jener der jungen Patienten unter Therapie B, dann sieht man, daß sich die Hazardfunktion der Untergruppe B; Jung aus der Funktion der ersten Untergruppe errechnen 1 2 3 4 5 6 läßt. Monate Multipliziert man den Hazard für den 4.Monat (.10) mit 1.5 erhält man den Hazard der Untergruppe B; Jung im 4.Monat nämlich .15 . Das gilt für jeden Monat. Die beiden Hazardfunktionen unterscheiden sich nur um einen Proportionalitätsfaktor von 1.5 . Einen entsprechenden Vergleich kann man auch zwischen Therapie A und B für die alten Patienten anstellen. Er ergibt denselben Faktor, obwohl der Hazard für alte Patienten an sich höher als für junge ist. Der Unterschied zwischen jungen und alten Patienten läßt sich analog durch einen Proportionalitätsfaktor darstellen. Vergleicht man nach Therapien getrennt junge und alte Patienten, dann bekommt man jedesmal einen Faktor 2. Alte Patienten haben im Beispiel 4 ein doppelt so großes Sterberisiko wie junge Patienten unter der jeweils gleichen Therapie. In diesem Beispiel hat der Altersunterschied eine größere Bedeutung als die verschiedenen Therapieformen. Proportionaler Hazard besteht dann, wenn eine Gruppe eine beliebige Hazardfunktion hat, von der sich die Hazardfunktion einer anderen Gruppe nur mehr um einen Proportionalitätsfaktor unterscheidet. Die Berechnungen zum Beispiel 4 haben ein geschichtetes Sterberatenverhältnis zwischen den Therapien von .689 oder 1/1.45 ergeben. Das stimmt recht gut mit dem Proportionalitätsfaktor der vorgegebenen Hazardfunktionen von 1.5 überein. 0,45 Therapie A; Junge Therapie B; Junge 0,4 0,35 Therapie A; Alte Therapie B; Alte 0,3 Prozent 0,25 0,2 0,15 0,1 0,05 0 Anmerkung: 1. Breslow (1975) behandelt eingehend die Frage, wieweit sich das Sterberatenverhältnis als Schätzer für den Proportionalitätsfaktor eignet. 2. Im Beispiel 4 wurden die Überlebenszeiten in Monaten angegeben und dadurch die Todesfälle gruppiert. Die Zeit wurde also als diskrete Variable behandelt und nicht, wie die Modelle voraussetzen, als kontinuierliche. Das bedingt kleine Unterschiede der Ergebnisse, die aber für das Verständnis der Modellvorstellung eines Proportional-Hazard-Models nicht bedeutend sind. 3. Man kann zwar ein Sterberatenverhältnis auch errechnen, wenn die Situation proportionaler Hazards nicht gegeben ist, es läßt sich dann jedoch nicht leicht interpretieren und ist systematisch von der Beobachtungsdauer abhängig. Einem Mittelwerts- oder Medianvergleich ist es unter Umständen auch dann noch vorzuziehen. LBI für Leukämieforschung Seite 17 Analyse von Überlebenszeiten geschichteter Logranktest Mit den Werten für Da, Ea, Db und Eb, die man zur Berechnung des geschichteten Sterberatenverhältnisses verwendet hat, kann man auch einen geschichteten Logranktest rechnen. Man setzt dazu nur diese Werte in die Formel für X-Quadrat ein und vergleicht das Ergebnis mit denselben kritischen Werten, wie beim Gesamtgruppenvergleich (siehe Mantel, Haenszel 1959 und Mantel 1963). ein Proportional-Hazard-Model (siehe Cox 1972, Breslow 1975) Wir haben vorerst das geschichtete Sterberatenverhältnis zwischen den beiden Therapieformen in Beispiel 4 ausgerechnet und dann die Hazardfunktionen der einzelnen Untergruppen betrachtet. Da das Beispiel rigoros unrealistisch konstruiert ist, lassen sich die Proportionalitätsfaktoren (die, wie oben erwähnt durch das Sterberatenverhältnis geschätzt werden können) für Therapie A zu Therapie B und für Jung zu Alt aus Bild 4/3 gut bestimmen. Die Hazardfunktionen von Therapie A zu B verhalten sich wie 1 zu 1.5 und von Jung zu Alt wie 1 zu 2. Betrachtet man den Hazard der Untergruppe Therapie A; Jung in einem bestimmten Monat als den BasisHazard, dann erhält man den Hazard einer Person in einer anderen Untergruppe, indem man den BasisHazard bei Anwendung der Therapie B mit 1.5 multipliziert oder, wenn die Person alt ist, mit 2. Hat eine junge Person mit Therapie A im 5.Monat einen Hazard von .08 so hat eine junge Person mit Therapie B im selben Monat einen Hazard von .08*1.5=.12 oder eine alte Person mit Therapie A einen Hazard von .08*2=.16 . Eine Person, die Therapie B erhält und alt ist, hat dann einen Hazard von .08*1.5*2=.24 . Die Einflüsse der einzelnen Faktoren - Therapie und Alter - werden, wie zu sehen, miteinander multipliziert. Das P-H-Modell macht also zwei wichtige Annahmen: 1. die Annahme der proportionalen Hazardfunktionen. 2. die Annahme des multiplikativen Zusammenhanges der einzelnen Faktoren. Im Beispiel 4 sind beide Annahmen erfüllt. Wir können daher die oben beschriebenen Zusammenhänge formal wie in Tabelle 4/6 darstellen. Tabelle 4/6: Darstellung der Zusammenhänge in Beispiel 4 Ein einfaches Proportional-Hazard-Model nach Breslow (1975) Kodierung der Kovariablen (z1,z2) : z1 ... Therapie: A =0, z2 ... Altersgruppe: Jung = 0 , B Alt =1 =1 Hazard einer Person mit den Kovariablenwerten z1,z2 zum Zeitpunkt t: λ(t;z1,z2) = λ0(t) * exp(ß1*z1+ß2*z2) λ(t;z1,z2) = λ0(t) * R1 z1 * R2 z2 mit Ri = exp(ßi) Ri: Sterberatenverhältnis zwischen Gruppe 1 und Gruppe 2 der Kovariablen i. Prognoseindex: PI = ß1*z1 + ß2*z2 λ(t;PI) = λ0(t) * exp(PI) LBI für Leukämieforschung Seite 18 Analyse von Überlebenszeiten Tabelle 4/7: Zusammenfassung der Sterberatenverhältnisse in den verschiedenen Untergruppen Vergleich Therapie A/Therapie B Therapie A/Therapie B Therapie A/Therapie B Therapie A/Therapie B junge Pat / alte Pat junge Pat / alte Pat junge Pat / alte Pat junge Pat / alte Pat einfach nur junge Patienten nur alte Patienten geschichtet nach jung/alt einfach nur Therapie A nur Therapie B geschichtet nach Therapie A/Therapie B Sterberatenverhältnis .79 = 1/1.26 .67 = 1/1.49 .67 = 1/1.49 .69 = 1/1.45 .58 = 1/1.72 .50 = 1/2.00 .51 = 1/1.97 .54 = 1/1.86 siehe Tab 4/1 Tab 4/3 Tab 4/4 Tab 4/5 Dabei werden die Einflußfaktoren Therapie und Alter, wie in der Literatur üblich, Kovariablen genannt. Eine einfache Form, die Zugehörigkeit zu einer Untergruppe zu beschreiben, besteht darin, für jede Person in einer Therapievariablen die angewandte Therapieform mit 0 bzw. 1 zu vermerken, entsprechend Therapie A bzw. B. Die Altersgruppe Jung bzw. Alt wird ebenso vermerkt. Nach dieser Kodierung braucht man nur mehr in die Formel einzusetzen: λ(t;z1, z2)=λ0(t) * R1 z1 * R2 z2 Berechnen wir als Beispiel den Hazard einer alten Person unter Therapie A im 2.Monat: λ0(2), der Basishazard im 2.Monat beträgt .12 . Das ist der Hazard der Jungen unter Therapie A oder allgemein, der Hazard jener Personen, die in allen Kovariablen den Wert 0 haben. R1 ist der Proportionalitätsfaktor der Kovariable Therapie (1.5) und R2 der Faktor der Kovariable Alter (2.0), z1 und z2 sind die Werte der Beispielperson in den Kovariablen. Eine Person unter Therapie A hat z1=0 und, wenn sie alt ist z2=1. so ergibt sich der Hazard mit λ(2;0, 1)=0.12 * 1.50 * 2.01 λ(2;0, 1)=0.12 * 1 * 2.0 λ(2;0, 1)=0.24 Anmerkung: Weiters gilt, wenn der Hazard λ(t;z1, z2, z3, ...)=λ0(t)*prop dann ist die Überlebenskurve S(t;z1, z2, z3, ...)=S0(t)prop . prop sei der Faktor, der sich aus Berücksichtigung aller Kovariablen ergibt. In der Literatur ist folgende äquivalente Darstellung üblich: λ(t;z1, z2, ...)=λ0(t)*exp(ß1*z1+ß2*z2+...) mit Ri = exp(ßi) oder ßi=ln(Ri) Das läßt sich umformen in ln(λ(t;z1, z2, ...)/λ0(t))=ß1*z1+ß2*z2+... Danach definiert man den Prognoseindex: PI=ß1*z1+ß2*z2+... und kann weiter schreiben: λ(t;z1, z2, ...)=λ0(t)*exp(PI) . Das Modell ist nicht, wie in Beispiel 4 auf zwei Kovariablen beschränkt. Es lassen sich neben dichotomen auch mehrkategorielle und kontinuierliche Variablen einbeziehen. Prüfung der Annahmen: Weiter oben haben wir die zwei wesentlichen Annahmen des P-H- Modells erwähnt. Praktisch hängt es vom verwendeten Computerprogramm ab, welche Möglichkeiten man hat, die Annahmen zu prüfen. Theoretisch mögliche Prüfungen werden in der Literatur dargestellt (siehe Andersen 1982, Cox 1979, Elashoff 1983). Interpretation: Die Analyse im Rahmen des P-H-Modells kann mit einer schrittweisen logistischen Regression erfolgen. Es werden Proportionalitätsfaktoren für ein Set von Kovariablen geschätzt. Dieses Vorgehen ist für die Interpretation der Ergebnisse von wesentlicher Bedeutung. Es führt aber zu weit, es in diesem Rahmen darzustellen. Setzen wir voraus, bereits vor der Auswertung einige wenige Kovariablen zu kennen, und deren Einfluß auf die Überlebenszeit abschätzen zu wollen. LBI für Leukämieforschung Seite 19 Analyse von Überlebenszeiten In dieser Situation schätzen wir mit einem Computerprogramm die Proportionalitätsfaktoren der einzelnen Kovariablen. Im allgemeinen ist damit auch eine Signifikanzprüfung der einzelnen Einflüsse verbunden. Das Ergebnis für Beispiel 4 sieht dann wie in Tabelle 4/8 aus. Tabelle 4/8: Ergebnisse einer Analyse der Daten aus Beispiel 4 entsprechend dem Cox-proportional hazard model Variable Therapie Alter B -.4050 -.6930 S.E. .0275 .0374 Wald 216.9809 343.3977 df 1 1 Sig .0000 .0000 R -.0464 -.0585 Exp(B) .6670 .5001 Wir können dann anhand der Größe der Faktoren (in Zusammenhang mit der Kodierung der Kovariablen) die Stärke der Einflüsse der einzelnen Kovariablen beurteilen. Außerdem läßt sich ein Prognoseindex bilden. Bei seiner Verwendung ist auf zwei wesentliche Punkte zu achten. Erstens darf er nur auf Personen angewandt werden, die mit jenen vergleichbar sind, auf deren Daten die Schätzung beruht. Zweitens hängt die Brauchbarkeit stark von der Genauigkeit der Schätzung der einzelnen Faktoren und im Fall einer schrittweisen Selektion - von der Auswahl der Kovariablen ab. Grundsätzlich ist eine korrekte Interpretation der Ergebnisse einer multivariaten Analyse schwierig. Das gilt nicht nur für das Cox' sche P-H Modell. Die Situation ist jener bei der multiplen Regression oder bei der logistischen Regression vergleichbar. Besonders in der Onkologie ist die Verwendung des P-H Modelles sehr modern (Stand 1993), aber die Interpretation der Ergebnisse zeigt, daß sich Computerprogramme zur Berechnung eines Modelles wesentlich schneller verbreiten, als das notwendige Verständnis zur entsprechenden Interpretation der Ergebnisse. Im gegebenen Rahmen können auch wir nur warnen. Weiteres Neben dem Proportional-Hazard-Model gibt es eine Reihe anderer multivariater Modelle für die Analyse von Überlebensdaten (siehe u.a. Kalbfleisch und Prentice, 1980). Vergleiche der Ergebnisse von Auswertungen mit verschiedenen Modellen findet man u.a. bei Hudec und Platz (1982). Mir ist wenig weiterführende Literatur bekannt, die ich für ähnlich einfach lesbar halte wie dieses Skriptum. Empfehlenswert scheint mir der zweiteilige Artikel von Peto et al. (1976, 1977). Er behandelt neben Kaplan-Meier-Verfahren und Logranktest wichtige Punkte der Planung randomisierter Studien. Dort findet man auch eine Tabelle, die die Chance eines signifikanten Ergebnisses unter verschiedenen Bedingungen abschätzen hilft (Tabelle für den Fehler 2.Art). Der Artikel von Breslow (1975) stellt das P-H-Modell ausführlich in Zusammenhang mit dem geschichteten Logranktest dar. Dieser Darstellung bin ich über weite Strecken gefolgt. Breslow führt weitere Aspekte aus, die hier nicht besprochen werden konnten. Die im Literaturverzeichnis angegebenen deutschsprachigen Artikel sind i.a. sehr leicht verständlich, gehen aber inhaltlich kaum über den dargestellten Bereich hinaus. Selbstverständlich gibt es aber eine große Zahl guter und tiefergehender englischsprachiger Bücher zum Thema. Schlußbemerkung Das Skriptum soll Grundlagen der Überlebenskurvenberechnung ohne Ansprüche an statistische und mathematische Vorbildung darstellen. Dabei können viele wichtige Themen nicht oder nur unzureichend behandelt werden. Deren Behandlung findet man in Standardlehrbüchern der Statistik. Text erstellt 1993, geringfügige Korrekturen 2001 LBI für Leukämieforschung Seite 20 Analyse von Überlebenszeiten Literatur Andersen PK.: Testing goodness-of-fit of Cox' s regression and life model. Biometrics 1982;38:67-77. Berchtold W.: Klinische Studien:Berechnen und Vergleichen von Überlebenskurven.Schweiz. med. Wschr. 1981;111:128-133. Breslow NE.: Contribution to the discussion of the paper by DR Cox. J R Statist Soc B 1972;34:216-7. Breslow NE.: Analysis of survival data under the proportional hazard model.Int Stat Rev 1975;1:45-58. Cox D.R.: Analysis of binary data. Chapman and Hall, London, 1970. Cox D.R.: Regression models and life tables (with discussion). J R Statist Soc B 1972;34:187-220. Cox D.R.:A note on the graphical analysis of survival data. Biometrika 1979;66, 188-190. Cutler S.J., Ederer F.: Maximum utilization of the life table method in analyzing survival. J Chron Dis. 1958;8:699-712. Elashoff J.D.: Surviving Proportional Hazards. Hepatology 1983;Vol 3, No 6:1031-1035. Hudec M.: Survival Analysis in Heterogenous Populations - Statistical Models and Concepts. In:Stochastic Modelling of Social Process, 1984. Hudec M., Platz H.: Fitting Regression Models to Censored Survival Data. Statistics in Medicine 1982;2:287-293. Kalbfleisch JD., Prentice RL.: The statistical Analysis of failure time data.New York:John Wiley and Sons, 1980. Kaplan E.L., Meier P.: Nonparametric estimation from incomplete observations. J Amer Statist Ass. 1958;53:457-481. Lienert G. A.: Verteilungsfreie Methoden in der Biostatistik, Band I und II. Hain, Meisenheim 1973. Mantel N.: Chi-Square Tests with one Degree of Freedom;Extensions of the Mantel-Haenszel Procedure. American Statistical Association Journal 1963;690-700. Mantel N., Haenszel W.: Statistical Aspects of the Analysis of Data from Retrospective Studies of Disease. J of the National Cancer Institute 1959;22, 4, 719-748. Neiß A., Selbmann H.K., Messerer D.: Analyse von Überlebenskurven. 29.Jahrestagung der Deutschen und Österreichischen Gesellschaften für Hämatologie und Onkologie (1984) Peto R., Pike MC., Armitage P., et.al.: Design and Analysis of randomized clinical trials requiring prolonged observation of each Patient. I Introduction and Design. Brit J Cancer 1976;34:585-612. II. Analysis and Examples. Brit J Cancer 1977;35;1-39. Selbmann, H.K.: Statistische Auswertungsverfahren in der klinisch-therapeutischen Forschung.In:Klinische Pharmakologie Hrsg.:Kuemmerle H.P. (1984) TNM-Klassifikation der malignen Tumoren:Statistische Behandlung von Überlebenszeiten.Berlin (1979) Tsiatis A.A.:A large sample study of Cox' s regression Model. The Annals of Statistics 1981;9, 1, 93-108. LBI für Leukämieforschung Seite 21