Raz-de-marée sur l`ADN - Reflexions
Transcription
Raz-de-marée sur l`ADN - Reflexions
Reflexions, le site de vulgarisation de l'Université de Liège Raz-de-marée sur l'ADN 06/02/08 Outil mathématique performant et compétitif, les ondelettes sont devenues un maillon fort dans l'avancée des sciences et des techniques. Appliquées à la biologie, elles offrent de nouvelles voies d'exploration de l'ADN. Samuel Nicolay est co-auteur de deux articles importants qui traitent de cette application encore balbutiante des ondelettes. Et les premiers résultats obtenus autorisent bien des espoirs. Les ondelettes ont fait leur entrée en astrophysique, en climatologie, en géographie, en médecine, en finances, etc. Leur mission principale : le traitement du signal, la détection de singularité, la réduction de bruit, etc. Les ondelettes forment un microscope mathématique capable de décomposer tout signal compliqué en une somme de signaux filtrés, un peu comme une mélodie résulte de la composition de différentes notes. Le signal compliqué est observé à travers différents «grossissements» qui enregistrent chacun le signal avec son niveau propre de précision et de bruit. Au terme du processus, la transformée en ondelettes continue déroule tout signal à une dimension dans un espace à deux dimensions, à savoir la position et le grossissement. L'idée est d'introduire une certaine redondance dans les données dont on espère tirer de nouvelles informations. © Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017 -1- Reflexions, le site de vulgarisation de l'Université de Liège En plus des signaux (1D), les ondelettes peuvent être appliquées aux images (2D). Dans ce domaine, elles ont déjà révolutionné le monde de la compression d'images en donnant naissance au programme JPEG 2000. L'idée est de substituer à une image gourmande en espace disque une série d'images correspondant à différents lissages et recombinables par la suite. Le stockage de cet ensemble d'images polies requiert beaucoup moins d'espace que l'image initiale. Les ondelettes sont un outil idéal également pour la détection de bords, l'étude du cours d'une action en bourse, l'analyse de turbulences, etc. Le mathématicien Samuel Nicolay de l'ULg travaille, quant à lui, sur leur application à la biologie et, en particulier, à l'étude de séquences d'ADN des organismes vivants. © Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017 -2- Reflexions, le site de vulgarisation de l'Université de Liège L'ADN renferme l'entièreté du bagage génétique d'un être vivant, d'où l'effervescence qui entoure son décryptage. Il est constitué de deux brins complémentaires qui peuvent être vus chacun comme un immense mot de plusieurs millions de lettres, issues d'un alphabet de base de quatre lettres appelées nucléotides et notées A, C, G et T. Ce mot renferme toutes les particularités d'un individu. Le séquençage du génome humain consiste à lire l'immense mot inscrit dans notre ADN. Il a été entrepris en 1990 et s'est achevé en 2003. Depuis, les génomes de différents organismes ont également été séquencés. Les biologistes sont donc parvenus à retranscrire cette succession de nucléotides A, T, C, T, G, A, C, etc. qu'est le génome humain. Ce séquençage n'est qu'une première étape dans le déchiffrage d'un génome : il faut encore le lire pour comprendre ce que signifie cet enchaînement de nucléotides. Pour cela, il importe de découvrir sa structure. La physique et les mathématiques fourmillent de méthodes adaptables à l'exploration d'un génome. Différentes approches sont donc possibles. Les bioinformaticiens, par exemple, recherchent les occurrences de groupes de nucléotides dans les séquences d'ADN. Mais la succession de lettres issue du séquençage du génome peut aussi être confiée aux mathématiciens, comme Samuel Nicolay, qui la convertissent en un simple signal auquel peuvent ensuite être appliquées différentes techniques de traitement du signal, comme la transformée de Fourier ou la transformée en © Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017 -3- Reflexions, le site de vulgarisation de l'Université de Liège ondelettes. Les mathématiciens disposent de plusieurs lois pour réaliser cette conversion du séquençage de l'ADN en un simple signal. La plus utilisée associe un 0 à chaque A et T, et un 1 à chaque C et G, avant de sommer le tout. Par exemple, le fragment ATCCAGCT devient 00122344. Le signal ainsi obtenu à partir d'un matériel biologique devient similaire à n'importe quel signal issu du monde de la physique, les deux pouvant être manipulés avec les mêmes outils mathématiques. Les signaux associés à l'ADN de différents organismes vivants ont été « traités » dans l'espoir de mettre en évidence l'existence de corrélations au sein de cette longue chaîne de nucléotides qu'est l'ADN. En particulier, existe-t-il des corrélations à longue portée ? «Là-dessus et jusqu'il y a peu, les avis divergeaient, explique Samuel Nicolay. Pour certains, ce qui se passe à un endroit donné du génome peut influencer ce qui se passe des millions de nucléotides plus loin. Pour d'autres, ce n'est pas le cas. Le désaccord provenait en grande partie de la présence dans les signaux de tendances qu'il importe de soustraire pour révéler les corrélations. Or, les méthodes telles la transformée de Fourier qu'ils utilisaient pour traiter le signal ne le permettent pas : si une fonction oscille autour d'un comportement globalement croissant par exemple, la transformée de Fourier ne permet pas de s'affranchir de cette croissance globale pour ne conserver que le comportement oscillant. Aussi chacun y est allé de sa petite soustraction manuelle, ce qui explique la gamme des conclusions obtenues...» La transformée en ondelettes offre l'avantage de pouvoir s'affranchir des tendances. C'est pourquoi, l'équipe du professeur Alain Arneodo du Laboratoire Joliot Curie de Lyon, à laquelle s'est joint Samuel Nicolay, a entrepris d'appliquer les ondelettes aux séquences d'ADN de différents organismes vivants. Les résultats obtenus ont mis enfin tout le monde d'accord : «les ADN de certains organismes présentent effectivement des corrélations à longue portée, mais ce n'est pas le cas pour toutes les espèces, précise Samuel Nicolay. La collaboration avec des biologistes a permis de préciser ces conclusions : l'ADN d'un eucaryote présente systématiquement des corrélations à longue portée. Celui d'un procaryote n'en a pas, sauf s'il s'agit d'une archéobactérie. Or, le mécanisme de compaction à l'œuvre dans les archéobactéries ressemble davantage à celui des eucaryotes qu'à celui des bactéries traditionnelles. Les corrélations mises en lumière participent donc au mécanisme de compaction chez les organismes plus évolués. Notre recherche doit se poursuivre afin de préciser le rôle joué par ces corrélations à longue portée.» © Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017 -4- Reflexions, le site de vulgarisation de l'Université de Liège Samuel Nicolay s'est ensuite tourné plus particulièrement vers le génome humain qui conserve une grande part de mystère, notamment concernant la fonction de l'intergène. «Notre matériel génétique se trouve sur les gènes qui sont des morceaux d'ADN, décrit Nicolay. Cependant, 90% du génome humain n'est pas formé de gènes. Ces derniers sont séparés par ce qu'on appelle l'intergène et on ignore tout de son utilité.» Pour y voir plus clair, la recherche et la compréhension des corrélations évoquées ci-dessus sont importantes. D'autres particularités de l'ADN peuvent également aider. C'est le cas des symétries. Dans l'ADN, un © Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017 -5- Reflexions, le site de vulgarisation de l'Université de Liège nucléotide A s'apparie forcément avec un T, un C avec un G, et inversement. Cette symétrie est à l'origine de la complémentarité des deux brins d'ADN : un nucléotide A sur un brin s'associe avec un nucléotide T sur l'autre brin. «Une deuxième loi de symétrie, plus spéculative, est pressentie, reprend Samuel Nicolay. Un brin devrait contenir autant de A que de T, et autant de C que de G. Les scientifiques pensent que lorsque la vie est apparue sur Terre, cette symétrie était totale. Mais avec le temps, le nombre de mutations génétiques a augmenté, entraînant l'apparition d'asymétries qui se sont amplifiées de génération en génération.» Des asymétries importantes ont été localisées sur le génome humain. Les phénomènes les plus susceptibles d'en être à l'origine sont la transcription qui recopie les gènes et la réplication qui reproduit les gènes et l'intergène. «Les ondelettes sont très efficaces pour étudier les écarts à la seconde loi de symétrie dans le génome humain. Nous avons analysé près de 12500 gènes. Cette étude a montré l'existence d'un biais mutationnel lié à la transcription. Ces biais participent à l'asymétrie totale observée entre les nucléotides. Ensuite, les ondelettes nous ont également permis de démontrer le rôle de la réplication dans l'instauration d'un biais à grande échelle chez l'homme. Ce travail donné lieu à un algorithme de recherche d'origines de réplication dans le génome humain. Seules une dizaine d'origines étaient connues chez l'homme. Nous avons localisés 1153 origines putatives. Ce qui est tès excitant, c'est que les premières études expérimentales confirment nos prédictions.» On le voit, les ondelettes peuvent être très présentes et très utiles dans les différents types d'études portant sur les génomes et, en particulier, sur le génome humain. Ces études associant les ondelettes et l'ADN ne font que commencer. Mais on devine l'enjeu scientifique et médical qui est derrière. Après avoir révolutionné le monde des technologies, les ondelettes s'apprêtent à faire de même dans le monde des biotechnologies. «L'application des ondelettes à la biologie est une mine d'or», avait confié le professeur Alain Arneodo à Samuel Nicolay lors de leur première rencontre. Cela ne fait plus aucun doute. © Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017 -6-