Formulaire de proposition de sujet de thèse
Transcription
Formulaire de proposition de sujet de thèse
Formulaire de proposition de sujet de thèse Titre : (en français et en Anglais) Biologie intégrative – interprétation de Données Expérimentales par Simulation et Visualisation Moléculaire Interactive Integrative Biology – decrypting Experimental Data via Interactive Molecular Simulation and Visualisation Mots clés : (en français et en Anglais) Visualisation moléculaire, Simulation Moléculaire Interactive, Mur d’image, Optimisation de code, Parallélisation, Portage et Optimisation sur GPU, calcul en temps réel Molecular Visualization, Interactive Molecular Simulation, Display wall, Code optimization, parallelization, GPU implementation and optimization, real time calculation Description du sujet : (~1 page, en français et en Anglais) Encadrants : (Co-encadrement) Nom, prénom du Directeur de thèse : Baaden, Marc Organisme : CNRS Adresse : Laboratoire de Biochimie Théorique/CNRS UPR 9080, Paris 5e Téléphone : 01 58 41 51 76 Mél : [email protected] Etes-vous titulaire d’une HDR ou d’un doctorat d’Etat (oui, non, en cours) ? oui. Nombre de doctorants qui seront encadrés au cours de la prochaine année ? 1 Nombre de thèses déjà encadrées ? 3 Co-Encadrant scientifique - Nicolas Férey – Maître de Conférences – [email protected] – Laboratoire d’Informatique pour la Mécanique pour les Sciences de l’Ingénieur/CNRS UPR 3251 Etablissement d’inscription potentiel ? Univ Paris Diderot Ecole doctorale potentielle ? ECOLE DOCTORALE "Médicament, Toxicologie, Chimie, Imageries" Ce sujet est-il susceptible de faire l’objet d’un co-financement entre la Maison de la Simulation et un autre établissement : Oui - Non Le cas échant, établissement partenaire : Les masses de données biologiques maintenant générées de manière routinière par une multitude de techniques biophysiques (SAXS, Cryo-EM, FRET, MS, ..) ouvrent la voie à la Biologie Intégrative qui combine toutes ces informations afin de converger vers des modèles de plus en plus réalistes. Modélisation et visualisation moléculaire représentent des outils indispensables pour réaliser cette tâche. Dans cette thèse nous ferons évoluer et converger notre outil de simulation BioSpring vers un logiciel intégré avec le visualiseur UnityMol, particulièrement adapté pour l’affinement et l’interprétation interactive de tels modèles. Au LIMSI et au LBT, nous développons conjointement une approche multi-échelle basée sur des réseaux de ressorts, résumant fidèlement les propriétés mécaniques des biomolécules, quels que soient la taille des grains utilisés (atome, gros grain, résidu...) et le type de biomolécule modélisée (protéine, ARN, ADN…). Cette approche interactive, concrétisée dans le logiciel BioSpring (code parallélisé avec OpenMP et OpenCL, et partiellement avec HMPP - projet de portage GENCI PPLC3D 2010), sera au coeur du projet de thèse et a déjà démontré son efficacité [1-3]. Il reste à l'optimiser et à améliorer le passage à l’échelle (portage hybride multicoeur MPI/OpenMP ou manycoeur GPU-OpenCL) pour pouvoir traiter des systèmes de grande envergure (capside de virus, ribosome). La visualisation représente un élément clé dans cette approche. A partir de la dernière version de notre logiciel UnityMol [4-5] il est maintenant possible de guider et interagir avec des simulations en cours à travers des périphériques adaptés comme des bras haptiques. Ici nous intégrerons une visualisation originale, intuitive et immersive des données biologiques en tirant profit de supports de visualisation avancés comme les murs d’image (à la Maison de la simulation ; bientôt aussi à l’IBPC) et les CAVEs (au LIMSI) qui permettront un travail immersif et collaboratif particulièrement adapté aux tâches qui nécessitent de réunir un nombre important d’expertises complémentaires. L’affichage interactif dans UnityMol sera renseigné par des simulations BioSpring dont l’utilisateur peut en temps interactif visualiser le résultat, et appliquer des contraintes de forces sur certains atomes. Les derniers travaux que nous avons menés intègrent des données expérimentales nouvelles comme des enveloppes moléculaires (SAXS et CryoEM) dans ce processus [1]. Ces contraintes expérimentales sont prises en compte durant la simulation, ce qui permet de manipuler la molécule d’intérêt « sous le contrôle » de ses propriétés biophysiques intégrées dans le modèle. Dans toutes ces recherches, tant au niveau de l'optimisation de la simulation que de la visualisation, le concours de la Maison de la Simulation sera extrêmement précieux. [1] Molza et al., Innovative interactive flexible docking method for multi-scale reconstruction elucidates dystrophin molecular assembly (2014), Faraday Discuss., 169, 45-62; [2] Delalande et al., Multi-resolution approach for interactively locating functionally linked ion binding sites by steering small molecules into electrostatic potential maps using a haptic device (2010), In Proceedings of Pacific Symposium on Biocomputing (PSB'10), Vol.15, 205-215 ; [3] Saladin et al., Modeling the early stage of dna sequence recognition within reca nucleoprotein filaments (2010), Nucleic Acid Research, 38, 6313-6323 ; [4] Lv et al., Game on, Science - how video game technology may help biologists tackle visualization challenges (2013), PLoS ONE 8(3):e57990. doi:10.1371/journal.pone.0057990 ; [5] Pérez et al., ThreeDimensional Representations of Complex Carbohydrates and Polysaccharides. SweetUnityMol: A Video Game Based Computer Graphic Software (2014), Glycobiology; doi: 10.1093/glycob/cwu133