Analyse des durées de survie

Transcription

Analyse des durées de survie
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
Analyse des durées de survie
Examen final du 8 janvier 2013
Instructions : Durée 2h – Les documents sont interdits. La qualité de la présentation sera prise en
compte dans la notation.
On étudie le jeu de données myélome composé de 48 patients atteints de myélome multiple. Cette maladie
se développe dans la moelle osseuse et détruit petit à petit le tissu osseux. Elle est caractérisée par des
plasmocytes anormaux, une anémie, des hémorragies et une une faiblesse générale du patient. Le but de cette
étude est d’étudier les effets de facteurs de risque (Bun, Ca, P cells, Hb, sex, age, P rotein) sur le temps de
survie des patients atteints de myélome multiple. Pour chaque patient, nous disposons des variables suivantes.
– la variable time : la durée de survie du patient si status = 1 ou durée de censure si status = 0. Cette
durée est mesurée en mois.
– la variable status : 1 si le patient décède du myélome multiple, 0 si le patient est censuré.
– la variable P rotein : indique si oui ou non la protéine de Bence-Jones était présente dans l’urine du
patient. 0 =absent, 1 =present. Les porteurs de ce type de protéine sont très souvent atteints du myélome
multiple.
– la variable sex : indique si le patient est un homme si sex = 1 ou une femme si sex = 0.
– la variable BunLog : représente les niveaux de l’urée sanguine (substance organique issue des acides
aminés) en échelle logarithmique et en milligrammes par décilitre.
– la variable Ca : représente la calcémie du patient, c’est à dire la quantité de calcium dans le sang. Elle
est mesurée en milligrammes par décilitre.
– la variable age : représente l’âge du patient, en années.
– la variable Hb : indique le taux d’hémoglobine, en milligrammes par décilitre.
– La variable P cells : représente le pourcentage de cellules plasmatiques dans la moelle osseuse.
Dans la suite on note T le temps de survie d’un patient, C sa variable de censure et δ l’indicateur de
censure associé. On observe alors un échantillon (Xi , δi ), 1 ≤ i ≤ 48, de variables aléatoires indépendantes et
de même loi que (X, δ) où
X = min(T, C) et δ = 1T ≤C .
(i)
(i)
On note également Z (i) = (Z1 , . . . , Zp )T le vecteur des p covariables de l’individu i, 1 ≤ i ≤ 48. Les programmes R se trouvent à la fin de l’énoncé. A titre purement informatif, quelques résultats de statistiques
descriptives des variables univariées sont présentés au début de ces programmes.
I. Estimateur de Kaplan-Meier et tests de comparaison
1. Quel est le pourcentage d’observations censurées dans le jeu de données ?
2. Quelle quantité est estimée par l’estimateur de Kaplan-Meier ? Commenter le graphique représentant
l’estimateur de Kaplan-Meier pour tous les groupes confondus. On donnera notamment les estimations
des quartiles de la loi de T (c’est à dire les quantiles d’ordre 25%, 50% et 75%).
3. A combien estimez-vous la probabilité qu’un patient atteint de myélome multiple vive moins de 20 mois ?
Qu’il vive plus de 38 mois ?
4. On s’intéresse dans un premier temps à l’influence de la protéine sur la survie des patients. D’un point
de vue descriptif vous semble-t-il que la présence de la protéine permette d’augmenter la durée de vie
des patients ?
5. Quel(s) test(s) statistique(s) proposez-vous pour comparer la survie des patients en fonction de la protéine ? Commenter les sorties R associées.
6. On s’intéresse à présent à la survie des patients en fonction de la variable sex. Commenter le graphique
ainsi que le test associé permettant de comparer la survie des patients en fonction du sexe. Vous semblet-il que les patients hommes ou femmes ont une durée de vie différente ?
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
7. On s’intéresse enfin à la survie des patients en fonction du taux d’hémoglobine. Puisque la variable Hb
est une variable quantitative, elle a été tout d’abord transformée en une variable à deux modalités :
la variable HbCut qui contient les modalités Bas et Elevé. Commenter le graphique ainsi que le test
associé permettant de comparer la survie des patients en fonction de cette nouvelle variable. Le taux
d’hémoglobine vous semble-t-il avoir un impact sur la durée de vie d’un patient ? Par exemple, au
bout de 60 mois, donner une estimation de la probabilité d’être toujours en vie en fonction du taux
d’hémoglobine (on donnera une valeur approchée à la lecture du graphique).
II. Modèles de régression univariés
1. On propose maintenant d’expliquer la variable temps de survie en fonction de la variable protein par
un modèle de Cox. Écrire le modèle de Cox correspondant.
2. Donner la définition du rapport de risques (ou hazard ratio) comparant le groupe ayant la protéine
avec le groupe n’ayant pas la protéine. Donner son interprétation en fonction du (des) paramètre(s) du
modèle de Cox.
3. Proposer un estimateur du (des) paramètre(s) du modèle. Rappeler l’expression de la pseudo-vraisemblance
de Cox (sans refaire les calculs).
4. Donner les hypothèses de test de l’influence de la variable protein sur le temps de survie.
5. Proposer trois tests de l’influence de la variable protein sur le temps de survie. Pour ces trois tests,
donner la loi sous l’hypothèse nulle de la statistique de test (on ne demande pas d’écrire la statistique
de test), la forme de la zone de rejet ainsi que la p-valeur.
6. Commenter le programme correspondant et les résultats obtenus. Que concluez-vous ?
7. Commenter brièvement le modèle de Cox univarié pour la variables sex. Quel est le rapport de risque de
décès entre un homme et une femme atteints de myélome multiple. Le sexe a-t-il un effet sur la survie
des patients ?
8. Commenter brièvement le modèle de Cox univarié pour la variables pcells. Comment s’interprète le
paramètre de régression pour un tel modèle ? Le pourcentage de cellules plasmatique dans la moelle
osseuse a-t-il un effet sur la survie des patients ?
9. On s’intéresse cette fois-ci au modèle de Cox avec la variable ca. On notera que la variable ca a été
centrée autour de sa moyenne avant d’être implémentée dans le modèle de Cox. Quel est le rapport de
risque entre un patient qui a 12 mg/dl de calcium dans le sang et un autre patient qui a 10 mg/dl ?
10. On s’intéresse cette fois-ci au modèle de Cox avec la variable age. Cette variable a également été centrée
autour de sa moyenne avant d’être implémentée dans un modèle de Cox. Quel est le rapport de risque
entre un patient qui a 68 ans et un autre patient qui a 58 ans ?
11. On s’intéresse également au modèle de Cox avec la variable bunLog. Au regard de ce modèle et des deux
modèles précédents, quelles sont les variables qui ont un effet significatif sur la survie parmi les variables
bunLog, age et ca ?
12. Enfin, on s’intéresse au modèle de Cox reliant la durée de vie des patients avec le taux d’hémoglobine.
Deux modèles ont été proposés : l’un (coxhb) avec la variable hb qui a été centrée autour de sa moyenne
et un autre (coxhbCut) avec la variable hbCut qui est une variable catégorielle ne contenant que deux
modalités (ceux ayant un taux d’hémoglobine élevé et ceux ayant un taux d’hémoglobine bas). Quel
est l’intérêt d’utiliser le modèle coxhbCut plutôt que coxhb ? Quel est l’inconvénient ? Au regard de ces
deux modèles, le taux d’hémoglobine a-t-il un impact sur la durée de vie des patients ?
III. Modèles de Cox multivarié
1. On propose tout d’abord un modèle de Cox prenant en compte les variables hbCut et bunC. Ecrire le
modèle de Cox correspondant.
2. Quel est le rapport de risque entre deux patients ayant le même niveau d’urée sanguine, l’un ayant un
taux d’hémoglobine élevé et l’autre ayant un taux d’hémoglobine bas ?
3. Commenter le résultat renvoyé par R. On commentera notamment l’impact des covariables sur le modèle.
4. La commande R suivante permet de réaliser un test de rapport de vraisemblances pour comparer le
modèle hbCut + bunC et le modèle bunC. Que cherche-t-on à prouver ? Comment le test est il réalisé
(on donnera brièvement la statistique de test ainsi que sa loi sous l’hypothèse nulle) ? Qu’en conclu-t-on ?
5. On étudie à présent le modèle de Cox avec les variables hbCut, bunC et sex. Quelles sont les variables
influentes dans ce nouveau modèle ? Cela vous semble-t-il surprenant ?
6. La commande R suivante permet de réaliser un test de rapport de vraisemblances pour comparer le
modèle hbCut+bunC+sex et le modèle hbCut. Que cherche-t-on à prouver cette fois-ci ? Expliquer
comment le nombre de degrés de liberté de la statistique de ce test est calculé.
page 2 de 12
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
7. On étudie à présent le modèle de Cox avec les variables hbCut, bunC, sex et protein. Quel est le rapport
de risque entre un homme dont le logarithme du niveau d’urée sanguine est de 5 et une femme dont le
logarithme du niveau d’urée sanguine est de 4, les autres variables étant égales par ailleurs (c’est à dire
même taux d’hémoglobine et même protéine) ?
8. Quelles sont les variables influentes dans ce nouveau modèle ?
9. La commande R suivante permet de réaliser un test de rapport de vraisemblances pour comparer le
modèle hbCut+bunC+sex+protein et le modèle hbCut+bunC+protein. Que cherche-t-on à prouver
cette fois-ci ? Qu’en conclu-t-on ?
10. Parmi tous les modèles possibles contenant les variables hbCut, bunC, sex, protein qui ont été étudiés
aux questions précédentes, lequel vous semble avoir les meilleures qualités prédictives ?
11. Discuter les effets des différentes variables dans le modèle de Cox complet.
12. Proposer une méthode de sélection de variables pour le modèle de Cox. On définira soigneusement le
critère utilisé.
13. Quelles sont les variables sélectionnées par ce critère ? On détaillera brièvement les deux dernières étapes
de la fonction step sur le jeu de donnée (suppression de la dernière variable et arrêt du programme).
14. Quelles sont les hypothèses de modélisation que doit vérifier un modèle de Cox ? Détaillez votre réponse.
15. Commenter les sorties R suivantes (lignes de code après la procédure step jusqu’à la comande cox.zph).
On précisera ce que l’on cherche à vérifier et la méthode utilisée pour cela. Le modèle composé des
variables hbCut+bunC+protein vous semble-t-il vérifier les hypothèses de modélisation du modèle de
Cox ?
16. La fin des commandes R considère le modèle de Cox stratifié par rapport à la variable bunCut qui est
une nouvelle variable catégorielle contenant deux modalités (ceux ayant un niveau d’urée sanguine élevé
et ceux ayant un niveau d’urée sanguine bas). Écrire mathématiquement ce modèle. Quel est l’utilité
d’un tel modèle ? Son défaut ?
17. Comment s’interprète les paramètres de ce nouveau modèle, appelé coxStra ? Commenter.
18. Commentez la dernière sortie R.
Programmes et résultats
> head(myelome)
1
2
3
4
5
6
time status age sex bunLog ca
hb pcells protein
13
1 66
1
3.22 10 14.6
18
1
52
0 66
1
2.56 11 12.0
100
0
6
1 53
2
2.71 13 11.4
33
1
40
1 69
1
2.30 10 10.2
30
1
10
1 65
1
3.00 10 13.2
66
0
7
0 57
2
2.48 8 9.9
45
0
> prop.table(table(sex))
sex
0
1
0.3958333 0.6041667
> prop.table(table(protein))
protein
0
1
0.6875 0.3125
> summary(age)
Min. 1st Qu.
50.00
58.75
Median
62.50
Mean 3rd Qu.
62.90
68.25
Max.
77.00
> prop.table(table(ca))
ca
8
9
10
11
12
13
15
0.10416667 0.33333333 0.33333333 0.08333333 0.08333333 0.04166667 0.02083333
> summary(pcells)
page 3 de 12
Université Paris Descartes - Université Paris 11
Min. 1st Qu.
3.00
21.25
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
Median
33.00
Mean 3rd Qu.
42.94
63.00
Max.
100.00
Median
10.20
Mean 3rd Qu.
10.25
12.58
Max.
14.60
Mean 3rd Qu.
3.201
3.670
Max.
5.147
> summary(hb)
Min. 1st Qu.
4.90
8.65
> summary(bunLog)
Min. 1st Qu.
1.792
2.621
Median
3.045
> base=Surv(time,status==1)
> n=48
> sum(status)/n
[1] 0.75
>
>
fit<- survfit(base~1)
summary(fit)
time n.risk n.event survival std.err lower 95% CI upper 95% CI
1
48
3
0.9375 0.0349
0.8715
1.000
4
44
2
0.8949 0.0445
0.8118
0.986
5
42
4
0.8097 0.0571
0.7051
0.930
6
38
2
0.7670 0.0616
0.6554
0.898
8
35
1
0.7451 0.0636
0.6304
0.881
10
34
4
0.6575 0.0696
0.5343
0.809
12
28
1
0.6340 0.0710
0.5091
0.789
13
26
1
0.6096 0.0723
0.4832
0.769
14
25
1
0.5852 0.0734
0.4577
0.748
15
24
1
0.5608 0.0743
0.4326
0.727
16
22
2
0.5098 0.0758
0.3810
0.682
17
20
1
0.4844 0.0762
0.3559
0.659
18
19
2
0.4334 0.0762
0.3071
0.612
23
15
1
0.4045 0.0764
0.2793
0.586
24
14
1
0.3756 0.0762
0.2524
0.559
36
13
1
0.3467 0.0756
0.2261
0.532
40
12
2
0.2889 0.0732
0.1758
0.475
50
9
1
0.2568 0.0718
0.1485
0.444
51
8
1
0.2247 0.0696
0.1224
0.412
65
5
1
0.1798 0.0687
0.0850
0.380
66
4
1
0.1348 0.0646
0.0527
0.345
88
2
1
0.0674 0.0576
0.0126
0.359
91
1
1
0.0000
NaN
NA
NA
> plot(fit, xlab='Mois', ylab='Estimateur de Kaplan-Meier')
page 4 de 12
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
0.8
0.6
0.4
0.2
0.0
Estimateur de Kaplan−Meier
1.0
Estimateur de Kaplan Meier (tous groupes confondus)
0
20
40
60
80
Mois
> fitPro<- survfit(base~protein)
> plot(fitPro, col = c(1,2),lty=c(1,2))
0.2
0.4
0.6
0.8
Absent
Présent
0.0
Estimation de la fonction de survie
1.0
Durées de survie en fonction de la présence de la protéine
0
20
40
60
80
Mois
> survdiff(base~protein,rho=0)
N Observed Expected (O-E)^2/E (O-E)^2/V
protein=0 33
24
20.1
0.755
2.05
protein=1 15
12
15.9
0.955
2.05
Chisq= 2
on 1 degrees of freedom, p= 0.153
> survdiff(base~protein,rho=1)
Chisq= 2.1
on 1 degrees of freedom, p= 0.148
> fitSex=survfit(base~sex)
> plot(fitSex, col = c(1,2),lty=c(1,2))
page 5 de 12
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
0.2
0.4
0.6
0.8
Homme
Femme
0.0
Estimation de la fonction de survie
1.0
Durées de survie en fonction du sexe
0
20
40
60
80
Mois
> survdiff(base~sex,rho=0)
N Observed Expected (O-E)^2/E (O-E)^2/V
sex=0 19
14
13.5
0.020
0.0358
sex=1 29
22
22.5
0.012
0.0358
Chisq= 0
on 1 degrees of freedom, p= 0.85
> survdiff(base~sex,rho=1)
Chisq= 0
on 1 degrees of freedom, p= 0.96
> hbCut=cut(hb,c(0,11,15),label=c("Bas","Elevé"))
> fitHb=survfit(base~hbCut)
> plot(fitHb, col = c(1,2),lty=c(1,2))
0.2
0.4
0.6
0.8
Taux d'hémoglobine bas
Taux d'hémoglobine élevé
0.0
Estimation de la fonction de survie
1.0
Durées de survie en fonction du taux d'hémoglobine
0
20
40
60
80
Mois
> survdiff(base~hbCut,rho=0)
N Observed Expected (O-E)^2/E (O-E)^2/V
hbCut=Bas
30
25
19.2
1.73
4.05
hbCut=Elevé 18
11
16.8
1.99
4.05
Chisq= 4.1
on 1 degrees of freedom, p= 0.0441
page 6 de 12
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
> survdiff(base~hbCut,rho=1)
Chisq= 3.9
on 1 degrees of freedom, p= 0.0491
> coxPro=coxph(base~protein)
> summary(coxPro)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|)
protein -0.5540
0.5747
0.3879 -1.428
0.153
Likelihood ratio test= 2.17
Wald test
= 2.04
Score (logrank) test = 2.08
on 1 df,
on 1 df,
on 1 df,
exp(-coef) lower .95 upper .95
1.74
0.2687
1.229
p=0.1409
p=0.1532
p=0.1489
> coxSex=coxph(base~sex)
> summary(coxSex)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|)
sex -0.06461
0.93744 0.35463 -0.182
0.855
Likelihood ratio test= 0.03
Wald test
= 0.03
Score (logrank) test = 0.03
on 1 df,
on 1 df,
on 1 df,
exp(-coef) lower .95 upper .95
1.067
0.4678
1.878
p=0.8558
p=0.8554
p=0.8554
> coxPcells=coxph(base~pcells)
> summary(coxPcells)
n= 48, number of events= 36
coef exp(coef) se(coef) z
Pr(>|z|)
pcells 0.001588 1.001589 0.005680 0.28
0.78
Likelihood ratio test= 0.08
Wald test
= 0.08
Score (logrank) test = 0.08
on 1 df,
on 1 df,
on 1 df,
exp(-coef) lower .95 upper .95
0.9984
0.9905
1.013
p=0.781
p=0.7798
p=0.7798
> mean(ca)
[1] 9.9375
> caC=ca-10
> coxCa=coxph(base~caC)
> summary(coxCa)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|)
caC -0.08889
0.91495 0.13247 -0.671
0.502
Likelihood ratio test= 0.47
Wald test
= 0.45
Score (logrank) test = 0.45
on 1 df,
on 1 df,
on 1 df,
exp(-coef) lower .95 upper .95
1.093
0.7057
1.186
p=0.4909
p=0.5022
p=0.502
> mean(age)
[1] 62.89583
> ageC=age-63
> coxAge=coxph(base~age)
> summary(coxAge)
page 7 de 12
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
n= 48, number of events= 36
coef exp(coef) se(coef)
z
age 0.01037
1.01042 0.02797 0.371
Likelihood ratio test= 0.14
Wald test
= 0.14
Score (logrank) test = 0.14
on 1 df,
on 1 df,
on 1 df,
Pr(>|z|)
0.711
exp(-coef) lower .95 upper .95
0.9897
0.9565
1.067
p=0.7104
p=0.7109
p=0.7108
> mean(bunLog)
[1] 3.201447
> bunC=bunLog-3.2
> coxBun=coxph(base~bunC)
> summary(coxBun)
n= 48, number of events= 36
coef exp(coef) se(coef) z
Pr(>|z|)
bunC 0.5942
1.8115
0.3041 1.954
0.0507
Likelihood ratio test= 3.69
Wald test
= 3.82
Score (logrank) test = 3.85
on 1 df,
on 1 df,
on 1 df,
exp(-coef) lower .95 upper .95
0.552
0.9981
3.288
p=0.05476
p=0.05072
p=0.04975
> mean(hb)
[1] 10.25208
> hbC=hb-10.25
> coxhb=coxph(base~hbC)
> summary(coxhb)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|) exp(-coef) lower .95 upper .95
hbC -0.13467
0.87400 0.05929 -2.271
0.0231 * 1.144
0.7781
0.9817
Likelihood ratio test= 5.02
Wald test
= 5.16
Score (logrank) test = 5.31
on 1 df,
on 1 df,
on 1 df,
p=0.0251
p=0.02313
p=0.02126
> coxhbCut=coxph(base~hbCut)
> summary(coxhbCut)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|)
exp(-coef) lower .95 upper .95
hbCutElevé -0.7266
0.4835
0.3683 -1.973
0.0485 *
2.068
0.2349
0.9953
Likelihood ratio test= 4.17
Wald test
= 3.89
Score (logrank) test = 4.06
on 1 df,
on 1 df,
on 1 df,
p=0.04109
p=0.04851
p=0.04403
> coxhbBun=coxph(base~hbCut+bunC)
> summary(coxhbBun)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|)
hbCutElevé -0.6439
0.5253
0.3721 -1.730
0.0836
bunC
0.5081
1.6622
0.3069 1.656
0.0978
Likelihood ratio test= 6.87
Wald test
= 6.71
Score (logrank) test = 6.98
on 2 df,
on 2 df,
on 2 df,
exp(-coef) lower .95 upper .95
1.9038
0.2533
1.089
0.6016
0.9108
3.033
p=0.03227
p=0.03487
p=0.0305
page 8 de 12
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
> anova(coxhbBun,coxBun,test='Chisq')
Analysis of Deviance Table
Cox model: response is base
Model 1: ~ hbCut + bunC
Model 2: ~ bunC
loglik Chisq Df P(>|Chi|)
1 -103.91
2 -105.49 3.1777 1
0.07465
> coxhbBunS=coxph(base~hbCut+bunC+sex)
> summary(coxhbBunS)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|)
hbCutElevé -0.7294
0.4822
0.4117 -1.772
0.0764
bunC
0.4742
1.6068
0.3171 1.495
0.1348
sex
0.1900
1.2092
0.3956 0.480
0.6311
Likelihood ratio test= 7.1 on 3 df,
Wald test
= 6.99 on 3 df,
Score (logrank) test = 7.31 on 3 df,
exp(-coef) lower .95 upper .95
2.0738
0.2152
1.081
0.6224
0.8630
2.992
0.8270
0.5569
2.626
p=0.06879
p=0.07234
p=0.06265
> anova(coxhbBunS,coxhbCut)
Analysis of Deviance Table
Cox model: response is base
Model 1: ~ hbCut + bunC + sex
Model 2: ~ hbCut
loglik Chisq Df P(>|Chi|)
1 -103.79
2 -105.25 2.9272 2
0.2314
> coxhbBunSP=coxph(base~hbCut+bunC+sex+protein)
> summary(coxhbBunSP)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
hbCutElevé -0.7375
0.4783
0.4172 -1.768
bunC
0.6004
1.8229
0.3335 1.801
sex
0.2016
1.2234
0.3923 0.514
protein
-0.7840
0.4566
0.4018 -1.951
Likelihood ratio test= 11.22
Wald test
= 11.27
Score (logrank) test = 11.94
on 4 df,
on 4 df,
on 4 df,
Pr(>|z|)
0.0771
0.0718
0.6074
0.0510
exp(-coef) lower .95 upper .95
2.0906
0.2111
1.084
0.5486
0.9482
3.504
0.8174
0.5670
2.639
2.1902
0.2077
1.004
p=0.02424
p=0.02367
p=0.01782
> coxhbBunP=coxph(base~hbCut+bunC+protein)
> anova(coxhbBunSP,coxhbBunP)
Analysis of Deviance Table
Cox model: response is base
Model 1: ~ hbCut + bunC + sex + protein
Model 2: ~ hbCut + bunC + protein
loglik Chisq Df P(>|Chi|)
1 -101.73
2 -101.86 0.2663 1
0.6059
> summary(coxhbBunP)
page 9 de 12
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|)
exp(-coef) lower .95 upper .95
hbCutElevé -0.6503
0.5219
0.3811 -1.706
0.0880
1.9161
0.2473
1.102
bunC
0.6346
1.8863
0.3232 1.963
0.0496 * 0.5302
1.0011
3.554
protein
-0.7829
0.4571
0.4029 -1.943
0.0520
2.1878
0.2075
1.007
Likelihood ratio test= 10.95 on 3 df,
Wald test
= 10.91 on 3 df,
Score (logrank) test = 11.5 on 3 df,
p=0.012
p=0.01221
p=0.009309
> coxAll=coxph(base~hbCut+bunC+sex+protein+age+caC+pcells)
> summary(coxAll)
n= 48, number of events= 36
hbCutElevé
bunC
sex
protein
age
caC
pcells
coef exp(coef)
-0.751529 0.471645
0.624798 1.867869
0.213547 1.238062
-0.744052 0.475184
-0.011042 0.989019
-0.028775 0.971635
0.001912 1.001914
Likelihood ratio test= 11.54
Wald test
= 11.92
Score (logrank) test = 12.73
se(coef)
0.418308
0.345104
0.402919
0.421348
0.029049
0.131012
0.006604
on 7 df,
on 7 df,
on 7 df,
z
Pr(>|z|)
-1.797
0.0724
1.810
0.0702
0.530
0.5961
-1.766
0.0774
-0.380
0.7039
-0.220
0.8262
0.290
0.7722
exp(-coef) lower .95 upper .95
2.1202
0.2078
1.071
0.5354
0.9497
3.674
0.8077
0.5621
2.727
2.1044
0.2081
1.085
1.0111
0.9343
1.047
1.0292
0.7516
1.256
0.9981
0.9890
1.015
p=0.1168
p=0.1033
p=0.07896
> step(coxAll)
Start: AIC=217.14
base ~ hbCut + bunC + sex + protein + age + caC + pcells
- caC
- pcells
- age
- sex
<none>
- bunC
- protein
- hbCut
Df
1
1
1
1
AIC
215.19
215.22
215.28
215.42
217.14
1 218.38
1 218.49
1 218.53
Step: AIC=215.19
base ~ hbCut + bunC + sex + protein + age + pcells
- pcells
- age
- sex
<none>
- bunC
- hbCut
- protein
Df
AIC
1 213.27
1 213.35
1 213.43
215.19
1 216.57
1 216.60
1 216.67
Step: AIC=213.27
base ~ hbCut + bunC + sex + protein + age
- age
- sex
<none>
Df
AIC
1 211.46
1 211.54
213.27
page 10 de 12
Université Paris Descartes - Université Paris 11
- hbCut
- bunC
- protein
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
1 214.60
1 214.64
1 215.43
Step: AIC=211.46
base ~ hbCut + bunC + sex + protein
- sex
<none>
- bunC
- hbCut
- protein
Df
AIC
1 209.73
211.46
1 212.64
1 212.73
1 213.58
Step: AIC=209.73
base ~ hbCut + bunC + protein
Df
AIC
<none>
209.73
- hbCut
1 210.80
- bunC
1 211.54
- protein 1 211.81
Call:
coxph(formula = base ~ hbCut + bunC + protein)
coef exp(coef) se(coef)
z
p
hbCutElevé -0.650
0.522
0.381 -1.71 0.088
bunC
0.635
1.886
0.323 1.96 0.050
protein
-0.783
0.457
0.403 -1.94 0.052
Likelihood ratio test=10.9
on 3 df, p=0.012
n= 48, number of events= 36
> bunCut=cut(bunC,c(-2,quantile(bunC,(1:2)/2)),label=c("Bas","Elevé"))
>
>
>
>
par(mfrow=(c(3,1)))
plot(survfit(coxph(base~hbCut+bunC+strata(protein))),fun="cloglog",main="Protein")
plot(survfit(coxph(base~bunC+protein+strata(hbCut))),fun="cloglog",main="Hb")
plot(survfit(coxph(base~protein+hbCut+strata(bunCut))),fun="cloglog",main="Bun")
page 11 de 12
Université Paris Descartes - Université Paris 11
Masters M2-IMSV/M2-MA-MSB/ M2-Santé Publique
−3
−2
−1
0
1
Protein
1
2
5
10
20
50
100
20
50
100
20
50
100
−3
−2
−1
0
1
Hb
1
2
5
10
−3
−2
−1
0
1
Bun
1
2
5
10
> cox.zph(coxhbBunP)
rho chisq
p
hbCutElevé -0.0482 0.0882 0.7664
bunC
-0.2360 3.5819 0.0584
protein
0.0826 0.2547 0.6138
GLOBAL
NA 3.6161 0.3060
> coxStra=coxph(base~protein+hbCut+strata(bunCut))
> summary(coxStra)
n= 48, number of events= 36
coef exp(coef) se(coef)
z
Pr(>|z|)
protein
-0.6097
0.5435
0.3928 -1.552
0.1206
hbCutElevé -0.8396
0.4319
0.4361 -1.925
0.0542
Likelihood ratio test= 6.29
Wald test
= 5.71
Score (logrank) test = 5.86
on 2 df,
on 2 df,
on 2 df,
exp(-coef) lower .95 upper .95
1.840
0.2517
1.174
2.315
0.1837
1.015
p=0.04297
p=0.05758
p=0.05338
> cox.zph(coxStra)
rho chisq
p
protein
0.0538 0.0954 0.757
hbCutElevé -0.1160 0.5970 0.440
GLOBAL
NA 0.7312 0.694
page 12 de 12

Documents pareils