Raz-de-marée sur l`ADN - Reflexions

Transcription

Raz-de-marée sur l`ADN - Reflexions
Reflexions, le site de vulgarisation de l'Université de Liège
Raz-de-marée sur l'ADN
06/02/08
Outil mathématique performant et compétitif, les ondelettes sont devenues un maillon fort dans l'avancée des
sciences et des techniques. Appliquées à la biologie, elles offrent de nouvelles voies d'exploration de l'ADN.
Samuel Nicolay est co-auteur de deux articles importants qui traitent de cette application encore balbutiante
des ondelettes. Et les premiers résultats obtenus autorisent bien des espoirs.
Les ondelettes ont fait leur entrée en astrophysique, en climatologie, en géographie, en médecine, en finances,
etc. Leur mission principale : le traitement du signal, la détection de singularité, la réduction de bruit, etc.
Les ondelettes forment un microscope mathématique capable de décomposer tout signal compliqué en une
somme de signaux filtrés, un peu comme une mélodie résulte de la composition de différentes notes. Le signal
compliqué est observé à travers différents «grossissements» qui enregistrent chacun le signal avec son niveau
propre de précision et de bruit. Au terme du processus, la transformée en ondelettes continue déroule tout
signal à une dimension dans un espace à deux dimensions, à savoir la position et le grossissement. L'idée
est d'introduire une certaine redondance dans les données dont on espère tirer de nouvelles informations.
© Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017
-1-
Reflexions, le site de vulgarisation de l'Université de Liège
En plus des signaux (1D), les ondelettes peuvent être appliquées aux images (2D). Dans ce domaine, elles
ont déjà révolutionné le monde de la compression d'images en donnant naissance au programme JPEG
2000. L'idée est de substituer à une image gourmande en espace disque une série d'images correspondant
à différents lissages et recombinables par la suite. Le stockage de cet ensemble d'images polies requiert
beaucoup moins d'espace que l'image initiale. Les ondelettes sont un outil idéal également pour la détection
de bords, l'étude du cours d'une action en bourse, l'analyse de turbulences, etc. Le mathématicien Samuel
Nicolay de l'ULg travaille, quant à lui, sur leur application à la biologie et, en particulier, à l'étude de séquences
d'ADN des organismes vivants.
© Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017
-2-
Reflexions, le site de vulgarisation de l'Université de Liège
L'ADN renferme l'entièreté du bagage génétique d'un être vivant, d'où l'effervescence qui entoure son
décryptage. Il est constitué de deux brins complémentaires qui peuvent être vus chacun comme un immense
mot de plusieurs millions de lettres, issues d'un alphabet de base de quatre lettres appelées nucléotides
et notées A, C, G et T. Ce mot renferme toutes les particularités d'un individu. Le séquençage du génome
humain consiste à lire l'immense mot inscrit dans notre ADN. Il a été entrepris en 1990 et s'est achevé en
2003. Depuis, les génomes de différents organismes ont également été séquencés.
Les biologistes sont donc parvenus à retranscrire cette succession de nucléotides A, T, C, T, G, A, C, etc.
qu'est le génome humain. Ce séquençage n'est qu'une première étape dans le déchiffrage d'un génome : il
faut encore le lire pour comprendre ce que signifie cet enchaînement de nucléotides. Pour cela, il importe de
découvrir sa structure. La physique et les mathématiques fourmillent de méthodes adaptables à l'exploration
d'un génome. Différentes approches sont donc possibles. Les bioinformaticiens, par exemple, recherchent les
occurrences de groupes de nucléotides dans les séquences d'ADN.
Mais la succession de lettres issue du séquençage du génome peut aussi être confiée aux mathématiciens,
comme Samuel Nicolay, qui la convertissent en un simple signal auquel peuvent ensuite être appliquées
différentes techniques de traitement du signal, comme la transformée de Fourier ou la transformée en
© Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017
-3-
Reflexions, le site de vulgarisation de l'Université de Liège
ondelettes. Les mathématiciens disposent de plusieurs lois pour réaliser cette conversion du séquençage de
l'ADN en un simple signal. La plus utilisée associe un 0 à chaque A et T, et un 1 à chaque C et G, avant de
sommer le tout. Par exemple, le fragment ATCCAGCT devient 00122344. Le signal ainsi obtenu à partir d'un
matériel biologique devient similaire à n'importe quel signal issu du monde de la physique, les deux pouvant
être manipulés avec les mêmes outils mathématiques.
Les signaux associés à l'ADN de différents organismes vivants ont été « traités » dans l'espoir de mettre en
évidence l'existence de corrélations au sein de cette longue chaîne de nucléotides qu'est l'ADN. En particulier,
existe-t-il des corrélations à longue portée ? «Là-dessus et jusqu'il y a peu, les avis divergeaient, explique
Samuel Nicolay. Pour certains, ce qui se passe à un endroit donné du génome peut influencer ce qui se passe
des millions de nucléotides plus loin. Pour d'autres, ce n'est pas le cas. Le désaccord provenait en grande partie
de la présence dans les signaux de tendances qu'il importe de soustraire pour révéler les corrélations. Or, les
méthodes telles la transformée de Fourier qu'ils utilisaient pour traiter le signal ne le permettent pas : si une
fonction oscille autour d'un comportement globalement croissant par exemple, la transformée de Fourier ne
permet pas de s'affranchir de cette croissance globale pour ne conserver que le comportement oscillant. Aussi
chacun y est allé de sa petite soustraction manuelle, ce qui explique la gamme des conclusions obtenues...»
La transformée en ondelettes offre l'avantage de pouvoir s'affranchir des tendances. C'est pourquoi, l'équipe
du professeur Alain Arneodo du Laboratoire Joliot Curie de Lyon, à laquelle s'est joint Samuel Nicolay, a
entrepris d'appliquer les ondelettes aux séquences d'ADN de différents organismes vivants. Les résultats
obtenus ont mis enfin tout le monde d'accord : «les ADN de certains organismes présentent effectivement
des corrélations à longue portée, mais ce n'est pas le cas pour toutes les espèces, précise Samuel Nicolay.
La collaboration avec des biologistes a permis de préciser ces conclusions : l'ADN d'un eucaryote présente
systématiquement des corrélations à longue portée. Celui d'un procaryote n'en a pas, sauf s'il s'agit d'une
archéobactérie. Or, le mécanisme de compaction à l'œuvre dans les archéobactéries ressemble davantage
à celui des eucaryotes qu'à celui des bactéries traditionnelles. Les corrélations mises en lumière participent
donc au mécanisme de compaction chez les organismes plus évolués. Notre recherche doit se poursuivre afin
de préciser le rôle joué par ces corrélations à longue portée.»
© Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017
-4-
Reflexions, le site de vulgarisation de l'Université de Liège
Samuel Nicolay s'est ensuite tourné plus particulièrement vers le génome humain qui conserve une grande
part de mystère, notamment concernant la fonction de l'intergène. «Notre matériel génétique se trouve sur les
gènes qui sont des morceaux d'ADN, décrit Nicolay. Cependant, 90% du génome humain n'est pas formé de
gènes. Ces derniers sont séparés par ce qu'on appelle l'intergène et on ignore tout de son utilité.»
Pour y voir plus clair, la recherche et la compréhension des corrélations évoquées ci-dessus sont importantes.
D'autres particularités de l'ADN peuvent également aider. C'est le cas des symétries. Dans l'ADN, un
© Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017
-5-
Reflexions, le site de vulgarisation de l'Université de Liège
nucléotide A s'apparie forcément avec un T, un C avec un G, et inversement. Cette symétrie est à l'origine
de la complémentarité des deux brins d'ADN : un nucléotide A sur un brin s'associe avec un nucléotide T sur
l'autre brin. «Une deuxième loi de symétrie, plus spéculative, est pressentie, reprend Samuel Nicolay. Un brin
devrait contenir autant de A que de T, et autant de C que de G. Les scientifiques pensent que lorsque la vie
est apparue sur Terre, cette symétrie était totale. Mais avec le temps, le nombre de mutations génétiques a
augmenté, entraînant l'apparition d'asymétries qui se sont amplifiées de génération en génération.»
Des asymétries importantes ont été localisées sur le génome humain. Les phénomènes les plus susceptibles
d'en être à l'origine sont la transcription qui recopie les gènes et la réplication qui reproduit les gènes et
l'intergène. «Les ondelettes sont très efficaces pour étudier les écarts à la seconde loi de symétrie dans
le génome humain. Nous avons analysé près de 12500 gènes. Cette étude a montré l'existence d'un biais
mutationnel lié à la transcription. Ces biais participent à l'asymétrie totale observée entre les nucléotides.
Ensuite, les ondelettes nous ont également permis de démontrer le rôle de la réplication dans l'instauration
d'un biais à grande échelle chez l'homme. Ce travail donné lieu à un algorithme de recherche d'origines
de réplication dans le génome humain. Seules une dizaine d'origines étaient connues chez l'homme. Nous
avons localisés 1153 origines putatives. Ce qui est tès excitant, c'est que les premières études expérimentales
confirment nos prédictions.»
On le voit, les ondelettes peuvent être très présentes et très utiles dans les différents types d'études portant
sur les génomes et, en particulier, sur le génome humain. Ces études associant les ondelettes et l'ADN ne
font que commencer. Mais on devine l'enjeu scientifique et médical qui est derrière. Après avoir révolutionné
le monde des technologies, les ondelettes s'apprêtent à faire de même dans le monde des biotechnologies.
«L'application des ondelettes à la biologie est une mine d'or», avait confié le professeur Alain Arneodo à
Samuel Nicolay lors de leur première rencontre. Cela ne fait plus aucun doute.
© Université de Liège - http://reflexions.ulg.ac.be/ - 23 February 2017
-6-

Documents pareils