Voir le Programme

Transcription

Voir le Programme
Journée de Statistique
Médicale
Vendredi 14 décembre 2012
Faculté de médecine de Nancy
Bâtiment E, rez-de-chaussée, salle ED 36
Programme
8h30 : Ouverture de la journée
8h35-9h45 : Daniel COMMENGES, Université Bordeaux 2
Titre - Analyse de survie: principes et applications
Résumé - Je donnerai d’abord les grands principes de l’analyse de survie.
Qu’est-ce que les données de survie et pourquoi requièrent-elles des méthodes
spéciales. Cela entraine une réflexion sur la question du temps et du vieillissement. Puis je présenterai quelques modèles permettant d’expliquer la
variabilité individuelle grâce à des variables explicatives. Ensuite je donnerai
quelques méthodes pour l’inférence dans ces modèles. J’évoquerai l’extension
de ces méthodes à la situation où il y a plusieurs événements d’intérêt. Finalement je concluerai par des applications.
9h45-10h45 : Jérôme SARACCO, Institut Polytechnique de
Bordeaux
Titre - A semiparametric approach to estimate reference curves
for biophysical properties of the skin
Résumé - Reference curves which take one covariable into account such as
the age, are often required in medicine, but simple systematic and efficient
1
statistical methods for constructing them are lacking. Classical methods are
based on parametric fitting (polynomial curves). In this talk, we describe
a methodology for the estimation of reference curves for data sets, based
on nonparametric estimation of conditional quantiles. The derived method
should be applicable to all clinical or more generally biological variables that
are measured on a continuous quantitative scale. To avoid the curse of dimensionality when the covariate is multidimensional, a semiparametric approach
is proposed. This procedure combines a dimension-reduction step (based on
sliced inverse regression) and kernel estimation of conditional quantiles step.
The usefulness of this semiparametric estimation procedure is illustrated on
a simulated data set and on a real data set collected in order to establish reference curves for biophysical properties of the skin of healthy French women.
10h45-11h00 : Pause café
11h00-12h15 : Mounir MESBAH, Université Pierre et Marie
Curie
Titre - Analyse de l’évolution de la Qualité de Vie mesurée par
deux instruments différents
Résumé - La Qualité de Vie Liée à la Santé (HRQoL) est généralement
mesurée à l’aide d’un questionnaire qui joue le rôle d’un instrument de mesure
au même titre qu’un thermomètre pour mesurer la température ou une balance pour mesurer le poids.
Ce questionnaire de HRQoL est généralement constitué d’ensembles unidimensionnels (c’est-à-dire mesurant le même trait) de questions (que nous
appellerons aussi “ items ”). Les possibilités de réponses à ces questions
sont presque toujours des variables catégorielles dichotomiques (c’est-à-dire
à deux modalités de réponse, par exemple oui ou non) ou polytomiques (par
exemple excellente, très bonne, bonne, médiocre, mauvaise) le plus souvent
ordinales.
Dans ce travail, nous analysons l’évolution de la HRQoL d’une cohorte de
patients HIV sous multi thérapies, pour lesquels les mesures ont été faites
successivement à l’aide d’un questionnaire HRQoL générique (le SF12) et
spécifique (Le “ WHOQOL HIV Brief ”).
2
Nous développons des modèles de réponses aux items qui nous permettront
d’analyser correctement l’évolution de la variable latente (HRQoL) après
égalisation (“ equating ”) des mesures obtenues par les deux questionnaires.
12h15-13h50 : Pause déjeûner
13h50-15h05 : Stéphane ROBIN, INRA / AgroParisTech
Titre - Some Statistical Models and Algorithms for Change-Point
Problems in Genomics
Résumé - Change-point problems often arise in genomic applications, such
as the detection of genomic alterations or copy number variations. The general problem can be stated as follows: consider a series of observations along
time, the distribution of which is subject to abrupt changes, can we infer the
number of change-points, their location, the magnitude of the change, etc.?
Such problems have been intensively studied in the statistical literature
and raise several types of issues in terms of model selection (how many
change-points?), algorithmics (the segmentation-space grows exponentially
large with respect to the length of the series) or modelling (how to account
for some dependency between the series).
We will present a series of models and corresponding inference algorithms,
focusing on deterministic methods. We will also limit ourselves to algorithms
that recover exactly the optimal segmentation (in terms of likelihood) or provide the exact posterior distribution of various quantities of interest. These
methods will be illustrated with application in genomics.
15h05-16h10 : Christophe BIERNACKI, Université Lille 1
Titre - Classification à base de modèles : principes, logiciels et
applications
Résumé - Les méthodes de classification sont une composante majeure de
l’analyse exploratoire des données. Les groupes obtenus permettent de faire
émerger du sens dans les données grâce à la simplification qu’ils apportent.
La classification à base de modèles de mélanges probabilistes fait aujourd’hui
3
référence dans le domaine d’un point de vue théorique et pratique. Du point
de vue théorique, elle offre tout à la fois le cadre rigoureux de la statistique
mathématique (estimation, choix du nombre de groupes) et la généralisation
de méthodes traditionnelles basées sur des critères géométriques (kmeans par
exemple). Du point de vue pratique, les domaines où elle a été utilisée avec
succès sont innombrables (biologie, marketing, géologie,...) et de nombreux
logiciels permettent aujourd’hui une mise en oeuvre très aisée (Rmixmod,
mclust, blockcluster,...). L’objectif de cet exposé est dans un 1er temps de
donner un aperçu des modèles utilisés selon le type de données à traiter
(quantitatives, qualitatives, ordinales, rangs, mixtes, haute dimension, intervalles,...) et selon d’objectif recherché (classification simple des individus
ou bien classification simultanée des individus et des variables). Les algorithmes d’estimation (EM, CEM, SEM, VBEM,...) et les critères de choix
de modèles associés seront aussi décrits dans les grandes lignes (BIC, ICL et
leurs versions non asymptotiques). Dans un second temps, les logiciels gratuits, et interfacés avec R, les plus courants seront présentés pour illustrer les
méthodes sur des applications issues de différents domaines, en particulier la
biologie.
16h15 : Clôture de la journée
4

Documents pareils