stage_selVar_PV (92,96 Ko)

Transcription

stage_selVar_PV (92,96 Ko)
Comparaison d’approches de sélection de variables pour la
détectiondesignalenpharmacovigilance
La pharmacovigilance a pour objectif de détecter le plus précocement possible les effets
indésirables de médicaments commercialisés. Traditionnellement, elle s’appuie sur l’analyse de
données de notifications spontanées (une notification étant la déclaration par des professionnels de
santé (médecins, pharmaciens, ...) à des centres de pharmacovigilance de la survenue d’événements
indésirables dont l’origine suspectée est médicamenteuse). A l’échelle nationale, ces notifications
spontanées constituent de grands ensembles de données ce qui a motivé le développement d’outils
statistiques de génération de signaux permettant l’identification de couples médicaments –
événements indésirables potentiellement associés. Ces outils statistiques ont tout d’abord reposé
sur l’analyse des notifications sous une forme agrégée, i.e. croisant l’ensemble des médicaments
avec l’ensemble des événements indésirables présents dans la base. Plus récemment, avec
l’amélioration des capacités de calcul, la possibilité de retourner à l’analyse des données
individuelles est apparue et des approches par régression logistique ont été proposées, notamment
la régression logistique LASSO. Le LASSO est une méthode dite pénalisée, développée pour
permettre l’ajustement de modèles en grande dimension. Avec ces approches, l’idée est de
régresser chaque événement indésirable sur l’ensemble des médicaments de la base (plusieurs
milliers).
Une des difficultés dans l’application du LASSO réside dans la détermination de son paramètre de
pénalisation, en particulier lorsque l’objectif est de faire de la sélection de variables (par opposition
à de la prédiction) et de contrôler des critères d’erreurs statistiques tels que le False Discovery Rate.
Récemment, des méthodes approches associant le LASSO et le ré-échantillonage (Bootstrap) ont
vu le jour pour répondre à cette problématique (Bécu, Grandvalet, Ambroise, & Dalmasso, 2015;
Meinshausen & Bühlmann, 2010; Meinshausen, Meier, & Bühlmann, 2009). L’une d’entre elles
(Ahmed, Pariente, & Tubert-Bitter, 2016) a été proposée avec l’idée de prendre en compte les
spécificités des données de pharmacovigilance, notamment le fait que la variable réponse y est
binaire et très déséquilibrée (un événement indésirable donné est en général très rare).
L’objectif général de ce stage est d’explorer et comparer par simulations ces approches dans un
contexte de variables réponses binaires et très déséquilibrées. Un volet du stage pourra aussi
concerner l’illustration de l’application de ces approches à la base nationale de pharmacovigilance.
Ce stage, d’une durée de 6 mois, est proposé à un étudiant en M2 Biostatistique / Statistique ou en
troisième année d’école d’ingénieur (ENSAI, ENSAE, ISUP, INSA, ENSIMAG…) avec un intérêt
pour les questions en santé et avec de bonnes compétences en programmation R.
Le stage sera effectué au sein de l’équipe « Biostatistique et Pharmacoépidémiologie » de l’unité
Inserm U1181 B2PHI « Biostatistique, Biomathématique, Pharmacoépidémiologie et Maladies
Infectieuses » (http://b2phi.inserm.fr). Le lieu du stage est l’hôpital Paul Brousse à Villejuif (accès
métro ligne 7).
Le stage sera co-encadré par Ismaïl Ahmed (Inserm U1181) et Cyril Dalmasso (Laboratoire de
Mathématiques et Modélisation d'Évry, http://www.math-evry.cnrs.fr/welcome).
Afin de postuler à ce stage, le candidat est invité à envoyer un CV, une lettre de motivation à Ismaïl
Ahmed ([email protected]). Idéalement il devrait aussi faire parvenir le relevé de ses notes
ainsi que le nom d’un ou de deux référents (ou des lettres de recommandation).
Gratification de stage : environ 500-550 euros nets par mois (grille Inserm)
Bibliographie
Ahmed, I., Pariente, A., & Tubert-Bitter, P. (2016). Class-imbalanced subsampling lasso algorithm
for discovering adverse drug reactions. Stat Methods Med Res. doi:10.1177/0962280216643116
Bécu, J.-M., Grandvalet, Y., Ambroise, C., & Dalmasso, C. (2015). Beyond support in two-stage
variable selection. Stat Comput. doi:10.1007/s11222-015-9614-1
Meinshausen, N., & Bühlmann, P. (2010). Stability selection. Journal of the Royal Statistical
Society: Series B (Statistical Methodology), 72(4), 417-473. doi:10.1111/rssb.2010.72.issue-4
Meinshausen, N., Meier, L., & Bühlmann, P. (2009). Values for High-Dimensional Regression.
Journal
of
the
American
Statistical
Association,
104(488),
1671-1681.
doi:10.1198/jasa.2009.tm08647