Details - UMR CNRS 5558 Laboratoire de Biométrie et Biologie

Transcription

Details - UMR CNRS 5558 Laboratoire de Biométrie et Biologie
Sujet stage M2 2015­2016 : Analyse bioinformatique de la conservation évolutive de modifications épigénétiques
Responsable : Emmanuelle Lerat
Coordonnées : emmanuelle.
lerat(AT)univ­lyon1.fr
Laboratoire « Biométrie et Biologie Évolutive » UMR5558 CNRS LYON 1
Lieu de stage : LBBE
Les modifications épigénétiques correspondent à des changements héritables causés par des modifications de la structure de la chromatine mais pas de la séquence d'ADN. Il existe au moins trois mécanismes: la méthylation de l'ADN, les modifications d'histones et l’interférence à ARN. Les effets de ces modifications sont principalement de moduler l'expression des gènes. Les génomes eucaryotes sont formés de différents éléments parmi lesquels les gènes codant les protéines représente une minorité. Par exemple, chez l'homme, seulement 2% du génome code pour des protéines, les 98% restant étant formés de régions non codantes et d'éléments répétés. Parmi ces derniers, les éléments transposables (ET) sont présents en millions de copies (45% du génome) [1]. Du fait de leur abondance et de leur capacité à se déplacer, les ET ont un impact significatif sur l'évolution des génomes [2]. En effet, les ET peuvent promouvoir différents types de mutations [3­5]. Comprendre les mécanismes impliqués dans l’initiation, la maintenance et l'héritabilité des états épigénétiques est important pour mieux comprendre le fonctionnement cellulaire et évaluer leurs implications dans l'évolution des génomes. Les modifications épigénétiques ayant un impact crucial sur les gènes et le fonctionnement cellulaire, on peut se demander si des contraintes sélectives agissent sur ces modifications et si il existe une conservation évolutive de l'épigénome liée avec la conservation des séquences ADN à l'intérieur et entre espèces. La question est donc de déterminer comment les modifications sont conservées et quel est le rôle des ET dans cette conservation. Pour essayer de répondre à cette question, deux niveaux seront explorés : intraspécifique et interspécifique
• Conservation de l'épigénome au niveau intraspécifi
que
(chez l'homme et la drosophile)
Le 1er aspect sera de mesurer, dans une condition environnementale donnée, la divergence des modifications épigénétiques associées à des gènes dupliqués (paralogues). Il faudra ainsi définir des familles de gènes et tenir compte des processus ayant permis la formation de ces paralogues, de leur age et de la conservation de leur séquence. Nous déterminerons si la présence différentielle d'ET, le temps depuis la duplication et la divergence de fonction de gène ont un impact sur la conservation des modifications épigénétiques parmi les paralogues. Le 2ème aspect sera de comparer des données pour un même gène dans différentes conditions cellulaires. Cela permettra de mesurer l'impact des ET sur les changements épigénétiques quand les conditions environnementales changent. • Conservation de l'épigénome au niveau interspécifique (comparaison homme et souris)
D'un point de vue évolutif, on s'attend à ce qu'une association fonctionnelle importante entre des marques épigénétiques et un environnement particulier en ET soit conservé au cours du temps du fait de contraintes sélectives. Nous allons donc déterminer si des gènes orthologues entre homme et souris présentent les mêmes types de modifications épigénétiques (associées avec une expression particulière dans un tissu donné) et si la présence d'ET peut jouer un rôle dans cette conservation. • Modifications épigénétiques des séquences répétées Actuellement, il existe peu de méthode permettant de déterminer directement les modifications épigénétiques associées aux séquences répétées dans les génomes. Celles existantes ne donnent que des informations très générales. Un troisième point de ce stage serait de développer une approche permettant d'associer les modifications épigénétiques aux copies individuelles des séquences répétées, ce qui permettrait d'évaluer la part de la situation génomique de ces séquences dans les modifications qui leur sont associées.
Des approches couplées en statistique et bio­informatique seront utilisées pour analyser des données publiques afin d'identifier les relations entre ET et modifications épigénétiques. De nombreuses données provenant de projets de “Next Generation Sequencing” (NGS) ont été publiées (consortium ENCODE and modENCODE) et donnent des informations concernant différentes modifications épigénétiques pour la séquence entière des génomes (homme, souris, drosophiles) provenant de différents tissus ou stades de développement. Ces analyses nécessiteront le développement d'outils informatiques pour analyser des fichiers particulièrement grands de données NGS, l'utilisation d'outils spécifiques dédiés à l'analyse de NGS, et une très bonne maîtrise des outils statistiques et évolutifs.
Références:
1­ Lander ES et al. (2001) Initial sequencing and analysis of the human genome. Nature 409:860­921
2­ Biémont C, Vieira C (2006) Genetics: junk DNA as an evolutionary force. Nature 443:521­524
3­ Kines KJ, Belancio VP (2012) Expressing genes do not forget their LINEs: transposable elements and gene expression. Front Biosci. 17:1329­1344
4­ Lerat E, Sémon M (2007) Influence of the transposable element neighborhood on human gene expression in normal and tumor tissues. Gene 396:303­311
5­ Mortada H, Vieira C, Lerat E (2010) Genes devoid of full­length transposable element insertions are involved in development and in the regulation of transcription in human and closely­related species. J Mol Evol 71:180­191.