Analyse des durées de survie
Transcription
Analyse des durées de survie
Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique Analyse des durées de survie Examen final du 8 janvier 2013 Instructions : Durée 2h – Les documents sont interdits. La qualité de la présentation sera prise en compte dans la notation. On étudie le jeu de données myélome composé de 48 patients atteints de myélome multiple. Cette maladie se développe dans la moelle osseuse et détruit petit à petit le tissu osseux. Elle est caractérisée par des plasmocytes anormaux, une anémie, des hémorragies et une une faiblesse générale du patient. Le but de cette étude est d’étudier les effets de facteurs de risque (Bun, Ca, P cells, Hb, sex, age, P rotein) sur le temps de survie des patients atteints de myélome multiple. Pour chaque patient, nous disposons des variables suivantes. – la variable time : la durée de survie du patient si status = 1 ou durée de censure si status = 0. Cette durée est mesurée en mois. – la variable status : 1 si le patient décède du myélome multiple, 0 si le patient est censuré. – la variable P rotein : indique si oui ou non la protéine de Bence-Jones était présente dans l’urine du patient. 0 =absent, 1 =present. Les porteurs de ce type de protéine sont très souvent atteints du myélome multiple. – la variable sex : indique si le patient est un homme si sex = 1 ou une femme si sex = 0. – la variable BunLog : représente les niveaux de l’urée sanguine (substance organique issue des acides aminés) en échelle logarithmique et en milligrammes par décilitre. – la variable Ca : représente la calcémie du patient, c’est à dire la quantité de calcium dans le sang. Elle est mesurée en milligrammes par décilitre. – la variable age : représente l’âge du patient, en années. – la variable Hb : indique le taux d’hémoglobine, en milligrammes par décilitre. – La variable P cells : représente le pourcentage de cellules plasmatiques dans la moelle osseuse. Dans la suite on note T le temps de survie d’un patient, C sa variable de censure et δ l’indicateur de censure associé. On observe alors un échantillon (Xi , δi ), 1 ≤ i ≤ 48, de variables aléatoires indépendantes et de même loi que (X, δ) où X = min(T, C) et δ = 1T ≤C . (i) (i) On note également Z (i) = (Z1 , . . . , Zp )T le vecteur des p covariables de l’individu i, 1 ≤ i ≤ 48. Les programmes R se trouvent à la fin de l’énoncé. A titre purement informatif, quelques résultats de statistiques descriptives des variables univariées sont présentés au début de ces programmes. I. Estimateur de Kaplan-Meier et tests de comparaison 1. Quel est le pourcentage d’observations censurées dans le jeu de données ? 2. Quelle quantité est estimée par l’estimateur de Kaplan-Meier ? Commenter le graphique représentant l’estimateur de Kaplan-Meier pour tous les groupes confondus. On donnera notamment les estimations des quartiles de la loi de T (c’est à dire les quantiles d’ordre 25%, 50% et 75%). 3. A combien estimez-vous la probabilité qu’un patient atteint de myélome multiple vive moins de 20 mois ? Qu’il vive plus de 38 mois ? 4. On s’intéresse dans un premier temps à l’influence de la protéine sur la survie des patients. D’un point de vue descriptif vous semble-t-il que la présence de la protéine permette d’augmenter la durée de vie des patients ? 5. Quel(s) test(s) statistique(s) proposez-vous pour comparer la survie des patients en fonction de la protéine ? Commenter les sorties R associées. 6. On s’intéresse à présent à la survie des patients en fonction de la variable sex. Commenter le graphique ainsi que le test associé permettant de comparer la survie des patients en fonction du sexe. Vous semblet-il que les patients hommes ou femmes ont une durée de vie différente ? Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique 7. On s’intéresse enfin à la survie des patients en fonction du taux d’hémoglobine. Puisque la variable Hb est une variable quantitative, elle a été tout d’abord transformée en une variable à deux modalités : la variable HbCut qui contient les modalités Bas et Elevé. Commenter le graphique ainsi que le test associé permettant de comparer la survie des patients en fonction de cette nouvelle variable. Le taux d’hémoglobine vous semble-t-il avoir un impact sur la durée de vie d’un patient ? Par exemple, au bout de 60 mois, donner une estimation de la probabilité d’être toujours en vie en fonction du taux d’hémoglobine (on donnera une valeur approchée à la lecture du graphique). II. Modèles de régression univariés 1. On propose maintenant d’expliquer la variable temps de survie en fonction de la variable protein par un modèle de Cox. Écrire le modèle de Cox correspondant. 2. Donner la définition du rapport de risques (ou hazard ratio) comparant le groupe ayant la protéine avec le groupe n’ayant pas la protéine. Donner son interprétation en fonction du (des) paramètre(s) du modèle de Cox. 3. Proposer un estimateur du (des) paramètre(s) du modèle. Rappeler l’expression de la pseudo-vraisemblance de Cox (sans refaire les calculs). 4. Donner les hypothèses de test de l’influence de la variable protein sur le temps de survie. 5. Proposer trois tests de l’influence de la variable protein sur le temps de survie. Pour ces trois tests, donner la loi sous l’hypothèse nulle de la statistique de test (on ne demande pas d’écrire la statistique de test), la forme de la zone de rejet ainsi que la p-valeur. 6. Commenter le programme correspondant et les résultats obtenus. Que concluez-vous ? 7. Commenter brièvement le modèle de Cox univarié pour la variables sex. Quel est le rapport de risque de décès entre un homme et une femme atteints de myélome multiple. Le sexe a-t-il un effet sur la survie des patients ? 8. Commenter brièvement le modèle de Cox univarié pour la variables pcells. Comment s’interprète le paramètre de régression pour un tel modèle ? Le pourcentage de cellules plasmatique dans la moelle osseuse a-t-il un effet sur la survie des patients ? 9. On s’intéresse cette fois-ci au modèle de Cox avec la variable ca. On notera que la variable ca a été centrée autour de sa moyenne avant d’être implémentée dans le modèle de Cox. Quel est le rapport de risque entre un patient qui a 12 mg/dl de calcium dans le sang et un autre patient qui a 10 mg/dl ? 10. On s’intéresse cette fois-ci au modèle de Cox avec la variable age. Cette variable a également été centrée autour de sa moyenne avant d’être implémentée dans un modèle de Cox. Quel est le rapport de risque entre un patient qui a 68 ans et un autre patient qui a 58 ans ? 11. On s’intéresse également au modèle de Cox avec la variable bunLog. Au regard de ce modèle et des deux modèles précédents, quelles sont les variables qui ont un effet significatif sur la survie parmi les variables bunLog, age et ca ? 12. Enfin, on s’intéresse au modèle de Cox reliant la durée de vie des patients avec le taux d’hémoglobine. Deux modèles ont été proposés : l’un (coxhb) avec la variable hb qui a été centrée autour de sa moyenne et un autre (coxhbCut) avec la variable hbCut qui est une variable catégorielle ne contenant que deux modalités (ceux ayant un taux d’hémoglobine élevé et ceux ayant un taux d’hémoglobine bas). Quel est l’intérêt d’utiliser le modèle coxhbCut plutôt que coxhb ? Quel est l’inconvénient ? Au regard de ces deux modèles, le taux d’hémoglobine a-t-il un impact sur la durée de vie des patients ? III. Modèles de Cox multivarié 1. On propose tout d’abord un modèle de Cox prenant en compte les variables hbCut et bunC. Ecrire le modèle de Cox correspondant. 2. Quel est le rapport de risque entre deux patients ayant le même niveau d’urée sanguine, l’un ayant un taux d’hémoglobine élevé et l’autre ayant un taux d’hémoglobine bas ? 3. Commenter le résultat renvoyé par R. On commentera notamment l’impact des covariables sur le modèle. 4. La commande R suivante permet de réaliser un test de rapport de vraisemblances pour comparer le modèle hbCut + bunC et le modèle bunC. Que cherche-t-on à prouver ? Comment le test est il réalisé (on donnera brièvement la statistique de test ainsi que sa loi sous l’hypothèse nulle) ? Qu’en conclu-t-on ? 5. On étudie à présent le modèle de Cox avec les variables hbCut, bunC et sex. Quelles sont les variables influentes dans ce nouveau modèle ? Cela vous semble-t-il surprenant ? 6. La commande R suivante permet de réaliser un test de rapport de vraisemblances pour comparer le modèle hbCut+bunC+sex et le modèle hbCut. Que cherche-t-on à prouver cette fois-ci ? Expliquer comment le nombre de degrés de liberté de la statistique de ce test est calculé. page 2 de 12 Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique 7. On étudie à présent le modèle de Cox avec les variables hbCut, bunC, sex et protein. Quel est le rapport de risque entre un homme dont le logarithme du niveau d’urée sanguine est de 5 et une femme dont le logarithme du niveau d’urée sanguine est de 4, les autres variables étant égales par ailleurs (c’est à dire même taux d’hémoglobine et même protéine) ? 8. Quelles sont les variables influentes dans ce nouveau modèle ? 9. La commande R suivante permet de réaliser un test de rapport de vraisemblances pour comparer le modèle hbCut+bunC+sex+protein et le modèle hbCut+bunC+protein. Que cherche-t-on à prouver cette fois-ci ? Qu’en conclu-t-on ? 10. Parmi tous les modèles possibles contenant les variables hbCut, bunC, sex, protein qui ont été étudiés aux questions précédentes, lequel vous semble avoir les meilleures qualités prédictives ? 11. Discuter les effets des différentes variables dans le modèle de Cox complet. 12. Proposer une méthode de sélection de variables pour le modèle de Cox. On définira soigneusement le critère utilisé. 13. Quelles sont les variables sélectionnées par ce critère ? On détaillera brièvement les deux dernières étapes de la fonction step sur le jeu de donnée (suppression de la dernière variable et arrêt du programme). 14. Quelles sont les hypothèses de modélisation que doit vérifier un modèle de Cox ? Détaillez votre réponse. 15. Commenter les sorties R suivantes (lignes de code après la procédure step jusqu’à la comande cox.zph). On précisera ce que l’on cherche à vérifier et la méthode utilisée pour cela. Le modèle composé des variables hbCut+bunC+protein vous semble-t-il vérifier les hypothèses de modélisation du modèle de Cox ? 16. La fin des commandes R considère le modèle de Cox stratifié par rapport à la variable bunCut qui est une nouvelle variable catégorielle contenant deux modalités (ceux ayant un niveau d’urée sanguine élevé et ceux ayant un niveau d’urée sanguine bas). Écrire mathématiquement ce modèle. Quel est l’utilité d’un tel modèle ? Son défaut ? 17. Comment s’interprète les paramètres de ce nouveau modèle, appelé coxStra ? Commenter. 18. Commentez la dernière sortie R. Programmes et résultats > head(myelome) 1 2 3 4 5 6 time status age sex bunLog ca hb pcells protein 13 1 66 1 3.22 10 14.6 18 1 52 0 66 1 2.56 11 12.0 100 0 6 1 53 2 2.71 13 11.4 33 1 40 1 69 1 2.30 10 10.2 30 1 10 1 65 1 3.00 10 13.2 66 0 7 0 57 2 2.48 8 9.9 45 0 > prop.table(table(sex)) sex 0 1 0.3958333 0.6041667 > prop.table(table(protein)) protein 0 1 0.6875 0.3125 > summary(age) Min. 1st Qu. 50.00 58.75 Median 62.50 Mean 3rd Qu. 62.90 68.25 Max. 77.00 > prop.table(table(ca)) ca 8 9 10 11 12 13 15 0.10416667 0.33333333 0.33333333 0.08333333 0.08333333 0.04166667 0.02083333 > summary(pcells) page 3 de 12 Université Paris Descartes - Université Paris 11 Min. 1st Qu. 3.00 21.25 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique Median 33.00 Mean 3rd Qu. 42.94 63.00 Max. 100.00 Median 10.20 Mean 3rd Qu. 10.25 12.58 Max. 14.60 Mean 3rd Qu. 3.201 3.670 Max. 5.147 > summary(hb) Min. 1st Qu. 4.90 8.65 > summary(bunLog) Min. 1st Qu. 1.792 2.621 Median 3.045 > base=Surv(time,status==1) > n=48 > sum(status)/n [1] 0.75 > > fit<- survfit(base~1) summary(fit) time n.risk n.event survival std.err lower 95% CI upper 95% CI 1 48 3 0.9375 0.0349 0.8715 1.000 4 44 2 0.8949 0.0445 0.8118 0.986 5 42 4 0.8097 0.0571 0.7051 0.930 6 38 2 0.7670 0.0616 0.6554 0.898 8 35 1 0.7451 0.0636 0.6304 0.881 10 34 4 0.6575 0.0696 0.5343 0.809 12 28 1 0.6340 0.0710 0.5091 0.789 13 26 1 0.6096 0.0723 0.4832 0.769 14 25 1 0.5852 0.0734 0.4577 0.748 15 24 1 0.5608 0.0743 0.4326 0.727 16 22 2 0.5098 0.0758 0.3810 0.682 17 20 1 0.4844 0.0762 0.3559 0.659 18 19 2 0.4334 0.0762 0.3071 0.612 23 15 1 0.4045 0.0764 0.2793 0.586 24 14 1 0.3756 0.0762 0.2524 0.559 36 13 1 0.3467 0.0756 0.2261 0.532 40 12 2 0.2889 0.0732 0.1758 0.475 50 9 1 0.2568 0.0718 0.1485 0.444 51 8 1 0.2247 0.0696 0.1224 0.412 65 5 1 0.1798 0.0687 0.0850 0.380 66 4 1 0.1348 0.0646 0.0527 0.345 88 2 1 0.0674 0.0576 0.0126 0.359 91 1 1 0.0000 NaN NA NA > plot(fit, xlab='Mois', ylab='Estimateur de Kaplan-Meier') page 4 de 12 Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique 0.8 0.6 0.4 0.2 0.0 Estimateur de Kaplan−Meier 1.0 Estimateur de Kaplan Meier (tous groupes confondus) 0 20 40 60 80 Mois > fitPro<- survfit(base~protein) > plot(fitPro, col = c(1,2),lty=c(1,2)) 0.2 0.4 0.6 0.8 Absent Présent 0.0 Estimation de la fonction de survie 1.0 Durées de survie en fonction de la présence de la protéine 0 20 40 60 80 Mois > survdiff(base~protein,rho=0) N Observed Expected (O-E)^2/E (O-E)^2/V protein=0 33 24 20.1 0.755 2.05 protein=1 15 12 15.9 0.955 2.05 Chisq= 2 on 1 degrees of freedom, p= 0.153 > survdiff(base~protein,rho=1) Chisq= 2.1 on 1 degrees of freedom, p= 0.148 > fitSex=survfit(base~sex) > plot(fitSex, col = c(1,2),lty=c(1,2)) page 5 de 12 Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique 0.2 0.4 0.6 0.8 Homme Femme 0.0 Estimation de la fonction de survie 1.0 Durées de survie en fonction du sexe 0 20 40 60 80 Mois > survdiff(base~sex,rho=0) N Observed Expected (O-E)^2/E (O-E)^2/V sex=0 19 14 13.5 0.020 0.0358 sex=1 29 22 22.5 0.012 0.0358 Chisq= 0 on 1 degrees of freedom, p= 0.85 > survdiff(base~sex,rho=1) Chisq= 0 on 1 degrees of freedom, p= 0.96 > hbCut=cut(hb,c(0,11,15),label=c("Bas","Elevé")) > fitHb=survfit(base~hbCut) > plot(fitHb, col = c(1,2),lty=c(1,2)) 0.2 0.4 0.6 0.8 Taux d'hémoglobine bas Taux d'hémoglobine élevé 0.0 Estimation de la fonction de survie 1.0 Durées de survie en fonction du taux d'hémoglobine 0 20 40 60 80 Mois > survdiff(base~hbCut,rho=0) N Observed Expected (O-E)^2/E (O-E)^2/V hbCut=Bas 30 25 19.2 1.73 4.05 hbCut=Elevé 18 11 16.8 1.99 4.05 Chisq= 4.1 on 1 degrees of freedom, p= 0.0441 page 6 de 12 Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique > survdiff(base~hbCut,rho=1) Chisq= 3.9 on 1 degrees of freedom, p= 0.0491 > coxPro=coxph(base~protein) > summary(coxPro) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) protein -0.5540 0.5747 0.3879 -1.428 0.153 Likelihood ratio test= 2.17 Wald test = 2.04 Score (logrank) test = 2.08 on 1 df, on 1 df, on 1 df, exp(-coef) lower .95 upper .95 1.74 0.2687 1.229 p=0.1409 p=0.1532 p=0.1489 > coxSex=coxph(base~sex) > summary(coxSex) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) sex -0.06461 0.93744 0.35463 -0.182 0.855 Likelihood ratio test= 0.03 Wald test = 0.03 Score (logrank) test = 0.03 on 1 df, on 1 df, on 1 df, exp(-coef) lower .95 upper .95 1.067 0.4678 1.878 p=0.8558 p=0.8554 p=0.8554 > coxPcells=coxph(base~pcells) > summary(coxPcells) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) pcells 0.001588 1.001589 0.005680 0.28 0.78 Likelihood ratio test= 0.08 Wald test = 0.08 Score (logrank) test = 0.08 on 1 df, on 1 df, on 1 df, exp(-coef) lower .95 upper .95 0.9984 0.9905 1.013 p=0.781 p=0.7798 p=0.7798 > mean(ca) [1] 9.9375 > caC=ca-10 > coxCa=coxph(base~caC) > summary(coxCa) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) caC -0.08889 0.91495 0.13247 -0.671 0.502 Likelihood ratio test= 0.47 Wald test = 0.45 Score (logrank) test = 0.45 on 1 df, on 1 df, on 1 df, exp(-coef) lower .95 upper .95 1.093 0.7057 1.186 p=0.4909 p=0.5022 p=0.502 > mean(age) [1] 62.89583 > ageC=age-63 > coxAge=coxph(base~age) > summary(coxAge) page 7 de 12 Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique n= 48, number of events= 36 coef exp(coef) se(coef) z age 0.01037 1.01042 0.02797 0.371 Likelihood ratio test= 0.14 Wald test = 0.14 Score (logrank) test = 0.14 on 1 df, on 1 df, on 1 df, Pr(>|z|) 0.711 exp(-coef) lower .95 upper .95 0.9897 0.9565 1.067 p=0.7104 p=0.7109 p=0.7108 > mean(bunLog) [1] 3.201447 > bunC=bunLog-3.2 > coxBun=coxph(base~bunC) > summary(coxBun) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) bunC 0.5942 1.8115 0.3041 1.954 0.0507 Likelihood ratio test= 3.69 Wald test = 3.82 Score (logrank) test = 3.85 on 1 df, on 1 df, on 1 df, exp(-coef) lower .95 upper .95 0.552 0.9981 3.288 p=0.05476 p=0.05072 p=0.04975 > mean(hb) [1] 10.25208 > hbC=hb-10.25 > coxhb=coxph(base~hbC) > summary(coxhb) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) exp(-coef) lower .95 upper .95 hbC -0.13467 0.87400 0.05929 -2.271 0.0231 * 1.144 0.7781 0.9817 Likelihood ratio test= 5.02 Wald test = 5.16 Score (logrank) test = 5.31 on 1 df, on 1 df, on 1 df, p=0.0251 p=0.02313 p=0.02126 > coxhbCut=coxph(base~hbCut) > summary(coxhbCut) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) exp(-coef) lower .95 upper .95 hbCutElevé -0.7266 0.4835 0.3683 -1.973 0.0485 * 2.068 0.2349 0.9953 Likelihood ratio test= 4.17 Wald test = 3.89 Score (logrank) test = 4.06 on 1 df, on 1 df, on 1 df, p=0.04109 p=0.04851 p=0.04403 > coxhbBun=coxph(base~hbCut+bunC) > summary(coxhbBun) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) hbCutElevé -0.6439 0.5253 0.3721 -1.730 0.0836 bunC 0.5081 1.6622 0.3069 1.656 0.0978 Likelihood ratio test= 6.87 Wald test = 6.71 Score (logrank) test = 6.98 on 2 df, on 2 df, on 2 df, exp(-coef) lower .95 upper .95 1.9038 0.2533 1.089 0.6016 0.9108 3.033 p=0.03227 p=0.03487 p=0.0305 page 8 de 12 Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique > anova(coxhbBun,coxBun,test='Chisq') Analysis of Deviance Table Cox model: response is base Model 1: ~ hbCut + bunC Model 2: ~ bunC loglik Chisq Df P(>|Chi|) 1 -103.91 2 -105.49 3.1777 1 0.07465 > coxhbBunS=coxph(base~hbCut+bunC+sex) > summary(coxhbBunS) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) hbCutElevé -0.7294 0.4822 0.4117 -1.772 0.0764 bunC 0.4742 1.6068 0.3171 1.495 0.1348 sex 0.1900 1.2092 0.3956 0.480 0.6311 Likelihood ratio test= 7.1 on 3 df, Wald test = 6.99 on 3 df, Score (logrank) test = 7.31 on 3 df, exp(-coef) lower .95 upper .95 2.0738 0.2152 1.081 0.6224 0.8630 2.992 0.8270 0.5569 2.626 p=0.06879 p=0.07234 p=0.06265 > anova(coxhbBunS,coxhbCut) Analysis of Deviance Table Cox model: response is base Model 1: ~ hbCut + bunC + sex Model 2: ~ hbCut loglik Chisq Df P(>|Chi|) 1 -103.79 2 -105.25 2.9272 2 0.2314 > coxhbBunSP=coxph(base~hbCut+bunC+sex+protein) > summary(coxhbBunSP) n= 48, number of events= 36 coef exp(coef) se(coef) z hbCutElevé -0.7375 0.4783 0.4172 -1.768 bunC 0.6004 1.8229 0.3335 1.801 sex 0.2016 1.2234 0.3923 0.514 protein -0.7840 0.4566 0.4018 -1.951 Likelihood ratio test= 11.22 Wald test = 11.27 Score (logrank) test = 11.94 on 4 df, on 4 df, on 4 df, Pr(>|z|) 0.0771 0.0718 0.6074 0.0510 exp(-coef) lower .95 upper .95 2.0906 0.2111 1.084 0.5486 0.9482 3.504 0.8174 0.5670 2.639 2.1902 0.2077 1.004 p=0.02424 p=0.02367 p=0.01782 > coxhbBunP=coxph(base~hbCut+bunC+protein) > anova(coxhbBunSP,coxhbBunP) Analysis of Deviance Table Cox model: response is base Model 1: ~ hbCut + bunC + sex + protein Model 2: ~ hbCut + bunC + protein loglik Chisq Df P(>|Chi|) 1 -101.73 2 -101.86 0.2663 1 0.6059 > summary(coxhbBunP) page 9 de 12 Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) exp(-coef) lower .95 upper .95 hbCutElevé -0.6503 0.5219 0.3811 -1.706 0.0880 1.9161 0.2473 1.102 bunC 0.6346 1.8863 0.3232 1.963 0.0496 * 0.5302 1.0011 3.554 protein -0.7829 0.4571 0.4029 -1.943 0.0520 2.1878 0.2075 1.007 Likelihood ratio test= 10.95 on 3 df, Wald test = 10.91 on 3 df, Score (logrank) test = 11.5 on 3 df, p=0.012 p=0.01221 p=0.009309 > coxAll=coxph(base~hbCut+bunC+sex+protein+age+caC+pcells) > summary(coxAll) n= 48, number of events= 36 hbCutElevé bunC sex protein age caC pcells coef exp(coef) -0.751529 0.471645 0.624798 1.867869 0.213547 1.238062 -0.744052 0.475184 -0.011042 0.989019 -0.028775 0.971635 0.001912 1.001914 Likelihood ratio test= 11.54 Wald test = 11.92 Score (logrank) test = 12.73 se(coef) 0.418308 0.345104 0.402919 0.421348 0.029049 0.131012 0.006604 on 7 df, on 7 df, on 7 df, z Pr(>|z|) -1.797 0.0724 1.810 0.0702 0.530 0.5961 -1.766 0.0774 -0.380 0.7039 -0.220 0.8262 0.290 0.7722 exp(-coef) lower .95 upper .95 2.1202 0.2078 1.071 0.5354 0.9497 3.674 0.8077 0.5621 2.727 2.1044 0.2081 1.085 1.0111 0.9343 1.047 1.0292 0.7516 1.256 0.9981 0.9890 1.015 p=0.1168 p=0.1033 p=0.07896 > step(coxAll) Start: AIC=217.14 base ~ hbCut + bunC + sex + protein + age + caC + pcells - caC - pcells - age - sex <none> - bunC - protein - hbCut Df 1 1 1 1 AIC 215.19 215.22 215.28 215.42 217.14 1 218.38 1 218.49 1 218.53 Step: AIC=215.19 base ~ hbCut + bunC + sex + protein + age + pcells - pcells - age - sex <none> - bunC - hbCut - protein Df AIC 1 213.27 1 213.35 1 213.43 215.19 1 216.57 1 216.60 1 216.67 Step: AIC=213.27 base ~ hbCut + bunC + sex + protein + age - age - sex <none> Df AIC 1 211.46 1 211.54 213.27 page 10 de 12 Université Paris Descartes - Université Paris 11 - hbCut - bunC - protein Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique 1 214.60 1 214.64 1 215.43 Step: AIC=211.46 base ~ hbCut + bunC + sex + protein - sex <none> - bunC - hbCut - protein Df AIC 1 209.73 211.46 1 212.64 1 212.73 1 213.58 Step: AIC=209.73 base ~ hbCut + bunC + protein Df AIC <none> 209.73 - hbCut 1 210.80 - bunC 1 211.54 - protein 1 211.81 Call: coxph(formula = base ~ hbCut + bunC + protein) coef exp(coef) se(coef) z p hbCutElevé -0.650 0.522 0.381 -1.71 0.088 bunC 0.635 1.886 0.323 1.96 0.050 protein -0.783 0.457 0.403 -1.94 0.052 Likelihood ratio test=10.9 on 3 df, p=0.012 n= 48, number of events= 36 > bunCut=cut(bunC,c(-2,quantile(bunC,(1:2)/2)),label=c("Bas","Elevé")) > > > > par(mfrow=(c(3,1))) plot(survfit(coxph(base~hbCut+bunC+strata(protein))),fun="cloglog",main="Protein") plot(survfit(coxph(base~bunC+protein+strata(hbCut))),fun="cloglog",main="Hb") plot(survfit(coxph(base~protein+hbCut+strata(bunCut))),fun="cloglog",main="Bun") page 11 de 12 Université Paris Descartes - Université Paris 11 Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique −3 −2 −1 0 1 Protein 1 2 5 10 20 50 100 20 50 100 20 50 100 −3 −2 −1 0 1 Hb 1 2 5 10 −3 −2 −1 0 1 Bun 1 2 5 10 > cox.zph(coxhbBunP) rho chisq p hbCutElevé -0.0482 0.0882 0.7664 bunC -0.2360 3.5819 0.0584 protein 0.0826 0.2547 0.6138 GLOBAL NA 3.6161 0.3060 > coxStra=coxph(base~protein+hbCut+strata(bunCut)) > summary(coxStra) n= 48, number of events= 36 coef exp(coef) se(coef) z Pr(>|z|) protein -0.6097 0.5435 0.3928 -1.552 0.1206 hbCutElevé -0.8396 0.4319 0.4361 -1.925 0.0542 Likelihood ratio test= 6.29 Wald test = 5.71 Score (logrank) test = 5.86 on 2 df, on 2 df, on 2 df, exp(-coef) lower .95 upper .95 1.840 0.2517 1.174 2.315 0.1837 1.015 p=0.04297 p=0.05758 p=0.05338 > cox.zph(coxStra) rho chisq p protein 0.0538 0.0954 0.757 hbCutElevé -0.1160 0.5970 0.440 GLOBAL NA 0.7312 0.694 page 12 de 12