Analyse d`images histopathologiques haute-résolution

Transcription

Analyse d`images histopathologiques haute-résolution
Analyse d’images histopathologiques haute-résolution guidées par des
connaissances expertes pour l’aide au diagnostic
Établissement de rattachement : Université de Strasbourg (Unistra)
Directeur : Cédric Wemmert (Unistra - Maı̂tre de conférences HDR)
Encadrants : Benoı̂t Naegel (Unistra - Maı̂tre de conférences) - Germain Forestier (UHA - Maı̂tre de conférences)
Unité d’accueil : Laboratoire des Sciences de l’Ingénieur, de l’Informatique et de l’Imagerie (ICube) UMR Unistra/CNRS
7357
Contexte
Les avancées récentes en analyse d’image donnent un potentiel considérable pour améliorer le diagnostic et le traitement
des patients atteints de cancer. Dans ce cadre, la disponibilité d’images de coupes histologiques entières offre ainsi une
nouvelle dimension d’analyse [1, 2, 3]. Lors de travaux antérieurs, nous avons développé avec succès une méthode d’analyse
d’image orientée objet afin d’évaluer la structure inflammatoire micro-environnemental (iTME) du cancer du sein à partir
d’images microscopiques de biopsies [4]. Nous souhaitons étendre notre approche, en nous concentrant dans un premier
temps sur le cancer du sein héréditaire, afin de prouver la pertinence et l’intérêt de notre approche. Au delà de l’évaluation
classique du cancer du sein, la nécessité de disposer de techniques d’analyse permettant d’identifier les patients qui pourraient
bénéficier de nouvelles thérapies ciblant le micro-environnement tumoral, apparaı̂t comme crucial. L’objectif de ce travail
sera de compléter les techniques d’évaluation classiques de l’évolution du cancer, en intégrant des connaissances expertes
et des informations sémantiques issues d’analyses spatiales et quantitatives d’images histopathologiques, informations ne
pouvant pas être obtenues par l’évaluation visuelle directe ou par analyse manuelle.
Sujet
Le principal objectif de cette thèse sera de proposer de nouvelles techniques d’analyse d’images guidées par des connaissances expertes afin d’améliorer le diagnostic de l’évolution du cancer sur des échantillons de tissus. Les défis à résoudre
pour atteindre cet objectif sont les suivants :
– L’intégration de données complexes et multimodales (images, données cliniques, information moléculaire) ;
– La gestion de la qualité variable des données images en fonction du prétraitement des tissus, des colorants utilisés,
de l’acquisition (bruit, éclairage), et d’autres facteurs qui ne peuvent que partiellement être contrôlés lors des études
cliniques utilisant de vrais échantillons de biopsie.
– L’analyse d’images à des résolutions différentes afin de détecter les différents objets d’intérêt dans l’image, comme par
exemple la présence de tissus normaux adjacents à la tumeur, la classification des compartiments du stroma tumoral,
l’extraction et la classification des cellules, l’évaluation des structures subcellulaires, etc.
– La mise en œuvre d’algorithmes d’analyse d’images orientés objets afin de combler le fossé sémantique entre l’information objective présente dans les images (c’est-à-dire les valeurs de pixel) et les structures de haut niveau utilisées
par l’expert pour les interpréter (par exemple les différents types de cellules, leur distribution spatiale, etc).
– La formalisation des différents niveaux de connaissances des experts pathologistes.
– La réalisation d’études de concordance pour évaluer la robustesse de l’annotation des tissus par des pathologistes
experts et la qualité des résultats de l’approche proposée par rapport à ces annotations manuelles.
Dans ce contexte, le travail de thèse visera à développer une approche globale pour mieux répondre à ces défis. Pour cela,
nous proposons une approche innovante, ayant les 4 caractéristiques originales :
1. Basée sur la connaissance : Afin de réduire la participation des experts humains au cours du processus et rendre le processus le plus automatique possible, il est nécessaire, d’une part, d’étudier, de formaliser et d’utiliser ces connaissances
expertes sur les objets d’intérêt et leurs relations mutuelles, indépendamment de leurs représentations dans l’ensemble
1
de données et, d’autre part, de définir les mécanismes, à l’aide de ces connaissances, nécessaires pour leur extraction
et leur reconnaissance. Une des pistes envisagées est d’utiliser une représentation des connaissances sous la forme
d’ontologies qui seront par la suite utilisées lors des traitements. L’objectif est de guider, mais aussi de reconsidérer le
processus d’analyse et d’identification des différents objets d’intérêt en fonction de cette connaissance.
2. Multi-échelle : Les microscopes standards fournissent des images cytologiques ayant des résolutions différentes. Nous
proposons de profiter de cette quantité d’information en proposant un processus d’analyse multi-échelle utilisant
la résolution la mieux adaptée pour extraire les différents objets d’intérêt et les relations entre eux. L’objectif est
d’optimiser la qualité de l’analyse (extraction et identification) mais également de proposer des temps de calcul
raisonnables afin d’envisager une utilisation en milieu clinique.
3. Basée sur les interactions spatiales : Nous sommes convaincus que les modèles conventionnels de diagnostic essentiellement basés sur le comptage des cellules peuvent être enrichis par des informations spatiales. En effet, l’organisation
spatiale des différents sous-types de cellules permet d’identifier la dynamique du processus biologique représenté dans
l’image. L’objectif sera de montrer que le microenvironnement des cellules joue un rôle pronostique important.
4. Évaluée par comparaison à des données cliniques : L’évaluation qualitative et quantitative du processus d’analyse et
de l’information fournie par les nouveaux schémas définis est un aspect essentiel de ce travail. La difficulté d’une
telle évaluation est l’intégration de données hétérogènes (images, données pathologiques et cliniques). L’objectif est
d’évaluer la méthode sur une grande base de données cliniques disponibles et in situ sur les nouveaux cas reçus par le
centre de référence allemand du cancer au cours de la thèse.
Pour relever les défis décrits ci-dessus, le candidat devra lever les verrous scientifiques suivants :
– Proposer et valider de nouveaux modèles d’interaction extraits des images histopathologiques qui pourraient aider
le pathologiste dans sa démarche de diagnostique. Ces modèles seront obtenus par des algorithmes d’apprentissage
automatique à l’aide de métriques de distance biologiquement pertinentes et de la caractérisation des relations spatiales
entre les objets détectés dans les images, en fonction des connaissances immunologiques.
– Formaliser les connaissances expertes des pathologistes sous forme d’ontologies afin qu’elles soient accessibles et
utilisables lors du processus d’extraction. Cette formalisation devra permettre de combler le fossé sémantique entre
les modèles immunologiques des pathologistes, et les caractéristiques extraites de l’image.
– Définir un processus de validation basé sur la comparaison des données cliniques de patients, données classiques de
pathologie et des motifs extraits des images.
Comme l’un des objectifs est de proposer un prototype de logiciel pour évaluer le potentiel de l’approche en environnement
clinique dans un centre de référence allemand pour le cancer, les verrous technologiques suivants seront à relever :
– Définir des algorithmes efficaces capables de traiter de très grandes images (images entières de coupes histologiques
env. 30000 × 30000 pixel) dans un délai raisonnable pour être utilisés dans un contexte clinique ;
– Définir un processus d’analyse capable de s’adapter à la qualité des données et des connaissances. Il est nécessaire
d’évaluer la qualité des données pour identifier les données aberrantes et éventuellement adapter le processus lui-même,
en fonction de cette qualité.
Collaborations
Ce travail de thèse sera réalisé en collaboration avec les experts pathologistes du Hannover Medical School - Pathology Institute, et en particulier avec le Dr. Friedrich Feuerhake avec lequel nous travaillons depuis trois ans sur l’analyse
automatique d’images histopathologiques.
Références
[1] Farzad Ghaznavi, Andrew J Evans, Anant Madabhushi, and Michael D Feldman. Digital imaging in pathology : Wholeslide imaging and beyond. Annual Review of Pathology : Mechanisms of Disease, 8(1), 2012.
[2] Vincent Roullier, Olivier Lézoray, Vinh-Thong Ta, and Abderrahim Elmoataz. Multi-resolution graph-based analysis of
histopathological whole slide images : application to mitotic cell extraction and visualization. Computerized Medical
Imaging and Graphics, 35(7) :603–615, 2011.
[3] Ajay Nagesh Basavanhally, Shridar Ganesan, Shannon Agner, James Peter Monaco, Michael D Feldman, John E Tomaszewski, Gyan Bhanot, and Anant Madabhushi. Computerized image-based detection and grading of lymphocytic
infiltration in her2+ breast cancer histopathology. Biomedical Engineering, IEEE Transactions on, 57(3) :642–653, 2010.
[4] Juliane M. Krüger, Cédric Wemmert, Ludovic Sternberger, Christel Bonnas, Gabriele Dietmann, Pierre Gançarski, and
Friedrich Feuerhake. Combat or surveillance ? evaluation of the heterogeneous inflammatory breast cancer microenvironment. The Journal of Pathology, 2013. to appear.
2