Voir le Programme
Transcription
Voir le Programme
Journée de Statistique Médicale Vendredi 14 décembre 2012 Faculté de médecine de Nancy Bâtiment E, rez-de-chaussée, salle ED 36 Programme 8h30 : Ouverture de la journée 8h35-9h45 : Daniel COMMENGES, Université Bordeaux 2 Titre - Analyse de survie: principes et applications Résumé - Je donnerai d’abord les grands principes de l’analyse de survie. Qu’est-ce que les données de survie et pourquoi requièrent-elles des méthodes spéciales. Cela entraine une réflexion sur la question du temps et du vieillissement. Puis je présenterai quelques modèles permettant d’expliquer la variabilité individuelle grâce à des variables explicatives. Ensuite je donnerai quelques méthodes pour l’inférence dans ces modèles. J’évoquerai l’extension de ces méthodes à la situation où il y a plusieurs événements d’intérêt. Finalement je concluerai par des applications. 9h45-10h45 : Jérôme SARACCO, Institut Polytechnique de Bordeaux Titre - A semiparametric approach to estimate reference curves for biophysical properties of the skin Résumé - Reference curves which take one covariable into account such as the age, are often required in medicine, but simple systematic and efficient 1 statistical methods for constructing them are lacking. Classical methods are based on parametric fitting (polynomial curves). In this talk, we describe a methodology for the estimation of reference curves for data sets, based on nonparametric estimation of conditional quantiles. The derived method should be applicable to all clinical or more generally biological variables that are measured on a continuous quantitative scale. To avoid the curse of dimensionality when the covariate is multidimensional, a semiparametric approach is proposed. This procedure combines a dimension-reduction step (based on sliced inverse regression) and kernel estimation of conditional quantiles step. The usefulness of this semiparametric estimation procedure is illustrated on a simulated data set and on a real data set collected in order to establish reference curves for biophysical properties of the skin of healthy French women. 10h45-11h00 : Pause café 11h00-12h15 : Mounir MESBAH, Université Pierre et Marie Curie Titre - Analyse de l’évolution de la Qualité de Vie mesurée par deux instruments différents Résumé - La Qualité de Vie Liée à la Santé (HRQoL) est généralement mesurée à l’aide d’un questionnaire qui joue le rôle d’un instrument de mesure au même titre qu’un thermomètre pour mesurer la température ou une balance pour mesurer le poids. Ce questionnaire de HRQoL est généralement constitué d’ensembles unidimensionnels (c’est-à-dire mesurant le même trait) de questions (que nous appellerons aussi “ items ”). Les possibilités de réponses à ces questions sont presque toujours des variables catégorielles dichotomiques (c’est-à-dire à deux modalités de réponse, par exemple oui ou non) ou polytomiques (par exemple excellente, très bonne, bonne, médiocre, mauvaise) le plus souvent ordinales. Dans ce travail, nous analysons l’évolution de la HRQoL d’une cohorte de patients HIV sous multi thérapies, pour lesquels les mesures ont été faites successivement à l’aide d’un questionnaire HRQoL générique (le SF12) et spécifique (Le “ WHOQOL HIV Brief ”). 2 Nous développons des modèles de réponses aux items qui nous permettront d’analyser correctement l’évolution de la variable latente (HRQoL) après égalisation (“ equating ”) des mesures obtenues par les deux questionnaires. 12h15-13h50 : Pause déjeûner 13h50-15h05 : Stéphane ROBIN, INRA / AgroParisTech Titre - Some Statistical Models and Algorithms for Change-Point Problems in Genomics Résumé - Change-point problems often arise in genomic applications, such as the detection of genomic alterations or copy number variations. The general problem can be stated as follows: consider a series of observations along time, the distribution of which is subject to abrupt changes, can we infer the number of change-points, their location, the magnitude of the change, etc.? Such problems have been intensively studied in the statistical literature and raise several types of issues in terms of model selection (how many change-points?), algorithmics (the segmentation-space grows exponentially large with respect to the length of the series) or modelling (how to account for some dependency between the series). We will present a series of models and corresponding inference algorithms, focusing on deterministic methods. We will also limit ourselves to algorithms that recover exactly the optimal segmentation (in terms of likelihood) or provide the exact posterior distribution of various quantities of interest. These methods will be illustrated with application in genomics. 15h05-16h10 : Christophe BIERNACKI, Université Lille 1 Titre - Classification à base de modèles : principes, logiciels et applications Résumé - Les méthodes de classification sont une composante majeure de l’analyse exploratoire des données. Les groupes obtenus permettent de faire émerger du sens dans les données grâce à la simplification qu’ils apportent. La classification à base de modèles de mélanges probabilistes fait aujourd’hui 3 référence dans le domaine d’un point de vue théorique et pratique. Du point de vue théorique, elle offre tout à la fois le cadre rigoureux de la statistique mathématique (estimation, choix du nombre de groupes) et la généralisation de méthodes traditionnelles basées sur des critères géométriques (kmeans par exemple). Du point de vue pratique, les domaines où elle a été utilisée avec succès sont innombrables (biologie, marketing, géologie,...) et de nombreux logiciels permettent aujourd’hui une mise en oeuvre très aisée (Rmixmod, mclust, blockcluster,...). L’objectif de cet exposé est dans un 1er temps de donner un aperçu des modèles utilisés selon le type de données à traiter (quantitatives, qualitatives, ordinales, rangs, mixtes, haute dimension, intervalles,...) et selon d’objectif recherché (classification simple des individus ou bien classification simultanée des individus et des variables). Les algorithmes d’estimation (EM, CEM, SEM, VBEM,...) et les critères de choix de modèles associés seront aussi décrits dans les grandes lignes (BIC, ICL et leurs versions non asymptotiques). Dans un second temps, les logiciels gratuits, et interfacés avec R, les plus courants seront présentés pour illustrer les méthodes sur des applications issues de différents domaines, en particulier la biologie. 16h15 : Clôture de la journée 4