stage_selVar_PV (92,96 Ko)
Transcription
stage_selVar_PV (92,96 Ko)
Comparaison d’approches de sélection de variables pour la détectiondesignalenpharmacovigilance La pharmacovigilance a pour objectif de détecter le plus précocement possible les effets indésirables de médicaments commercialisés. Traditionnellement, elle s’appuie sur l’analyse de données de notifications spontanées (une notification étant la déclaration par des professionnels de santé (médecins, pharmaciens, ...) à des centres de pharmacovigilance de la survenue d’événements indésirables dont l’origine suspectée est médicamenteuse). A l’échelle nationale, ces notifications spontanées constituent de grands ensembles de données ce qui a motivé le développement d’outils statistiques de génération de signaux permettant l’identification de couples médicaments – événements indésirables potentiellement associés. Ces outils statistiques ont tout d’abord reposé sur l’analyse des notifications sous une forme agrégée, i.e. croisant l’ensemble des médicaments avec l’ensemble des événements indésirables présents dans la base. Plus récemment, avec l’amélioration des capacités de calcul, la possibilité de retourner à l’analyse des données individuelles est apparue et des approches par régression logistique ont été proposées, notamment la régression logistique LASSO. Le LASSO est une méthode dite pénalisée, développée pour permettre l’ajustement de modèles en grande dimension. Avec ces approches, l’idée est de régresser chaque événement indésirable sur l’ensemble des médicaments de la base (plusieurs milliers). Une des difficultés dans l’application du LASSO réside dans la détermination de son paramètre de pénalisation, en particulier lorsque l’objectif est de faire de la sélection de variables (par opposition à de la prédiction) et de contrôler des critères d’erreurs statistiques tels que le False Discovery Rate. Récemment, des méthodes approches associant le LASSO et le ré-échantillonage (Bootstrap) ont vu le jour pour répondre à cette problématique (Bécu, Grandvalet, Ambroise, & Dalmasso, 2015; Meinshausen & Bühlmann, 2010; Meinshausen, Meier, & Bühlmann, 2009). L’une d’entre elles (Ahmed, Pariente, & Tubert-Bitter, 2016) a été proposée avec l’idée de prendre en compte les spécificités des données de pharmacovigilance, notamment le fait que la variable réponse y est binaire et très déséquilibrée (un événement indésirable donné est en général très rare). L’objectif général de ce stage est d’explorer et comparer par simulations ces approches dans un contexte de variables réponses binaires et très déséquilibrées. Un volet du stage pourra aussi concerner l’illustration de l’application de ces approches à la base nationale de pharmacovigilance. Ce stage, d’une durée de 6 mois, est proposé à un étudiant en M2 Biostatistique / Statistique ou en troisième année d’école d’ingénieur (ENSAI, ENSAE, ISUP, INSA, ENSIMAG…) avec un intérêt pour les questions en santé et avec de bonnes compétences en programmation R. Le stage sera effectué au sein de l’équipe « Biostatistique et Pharmacoépidémiologie » de l’unité Inserm U1181 B2PHI « Biostatistique, Biomathématique, Pharmacoépidémiologie et Maladies Infectieuses » (http://b2phi.inserm.fr). Le lieu du stage est l’hôpital Paul Brousse à Villejuif (accès métro ligne 7). Le stage sera co-encadré par Ismaïl Ahmed (Inserm U1181) et Cyril Dalmasso (Laboratoire de Mathématiques et Modélisation d'Évry, http://www.math-evry.cnrs.fr/welcome). Afin de postuler à ce stage, le candidat est invité à envoyer un CV, une lettre de motivation à Ismaïl Ahmed ([email protected]). Idéalement il devrait aussi faire parvenir le relevé de ses notes ainsi que le nom d’un ou de deux référents (ou des lettres de recommandation). Gratification de stage : environ 500-550 euros nets par mois (grille Inserm) Bibliographie Ahmed, I., Pariente, A., & Tubert-Bitter, P. (2016). Class-imbalanced subsampling lasso algorithm for discovering adverse drug reactions. Stat Methods Med Res. doi:10.1177/0962280216643116 Bécu, J.-M., Grandvalet, Y., Ambroise, C., & Dalmasso, C. (2015). Beyond support in two-stage variable selection. Stat Comput. doi:10.1007/s11222-015-9614-1 Meinshausen, N., & Bühlmann, P. (2010). Stability selection. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 72(4), 417-473. doi:10.1111/rssb.2010.72.issue-4 Meinshausen, N., Meier, L., & Bühlmann, P. (2009). Values for High-Dimensional Regression. Journal of the American Statistical Association, 104(488), 1671-1681. doi:10.1198/jasa.2009.tm08647