Étude de cas : conformation de molécules

Transcription

Étude de cas : conformation de molécules
CollInE – Collectif, Interaction, Emergence
Étude de cas : conformation de molécules
La recherche de médicaments
La biologie structurale s’intéresse au rapport entre la structure des molécules et leur activité
biologique. De manière générale, on peut dire que le domaine recouvre des questions relevant
notamment de la pharmacologie. C’est ainsi que pour un récepteur membranaire connu, il
s’agit de trouver un ligand, i.e. une molécule médicamenteuse complémentaire. C’est la
problématique du « docking », i.e. l’ensemble des mécanismes et interactions intervenant lors
de la formation de complexes moléculaires.
L’étude par simulation plutôt qu’expérimentale du docking a une longue histoire et nombre
d’algorithmes sont utilisés quotidiennement tant dans le milieu académique que par les
laboratoires pharmaceutiques. Le docking moléculaire est au centre d’applications pratiques
comme l’ingénierie des protéines, la conception de médicaments et le criblage des banques de
molécules potentiellement actives. Il a ainsi déjà aidé à la conception de nouveaux ligands
pour des agents antisida et anti-cancer, et pour le traitement de diabètes.
Si l’on veut obtenir des avancées significatives, il est nécessaire de développer de nouvelles
méthodes pour faciliter les techniques de docking en améliorant nos capacités à comprendre et
à analyser les interactions de docking et à développer des hypothèses pour lesquelles les
molécules sont susceptibles d’interagir plus favorablement. La connaissance du processus
d’agencement spatial des molécules (le folding) en interaction est essentielle et c’est le sujet
de cette étude de cas.
Les interactions atomiques
Une molécule est un assemblage d’atomes par des liaisons de covalence. Ce sont des liaisons
fortes qui définissent des distances inter-atomiques quasi-stables (de l’ordre de l’Angström)
pour un couple particulier d’atomes. De telles liaisons fortes sont complétées par des
impositions directionnelles strictes dues à des liaisons dites faibles. Ces liaisons faibles, pour
avoir une quelconque efficacité, ne peuvent agir qu’à des courtes distances, et en grand
nombre.
La conformation spatiale d’une molécule résulte des distances inter-atomiques définies par les
liaisons fortes et des interactions dues aux liaisons faibles. Pour simplifier nous dirons qu’une
conformation spatiale consiste à minimiser l’énergie faible résiduelle sur l’ensemble de la
molécule, tout en respectant les contraintes des liaisons fortes. C’est cet objectif que les
théories de l’émergence devront indiquer sur cette étude de cas.
Dans les relations inter-atomiques, le rôle fondamental est tenu par les électrons
périphériques, appartenant aux orbitales les plus externes des atomes intéressés. L’union entre
atomes résulte de modifications touchant à la répartition dans l’espace de leurs électrons
périphériques. Une liaison de covalence c’est une liaison par mise en commun bilatérale
d’électrons
Lorsque deux atomes se rapprochent l’un de l’autre, il se manifeste à partir d’une certaine
distance (1 nanomètre environ) une attraction entre le noyau de l’un et les électrons de l’autre
(et réciproquement). Cette attraction devient notable lorsque la distance séparant les noyaux
n’est plus que de 500 picomètres. Mais, à partir de cette distance, l’encombrement
Étude de cas : conformation de molécules
1/3
CollInE – Collectif, Interaction, Emergence
électronique et les forces de répulsion entre charges de même signe tendent à compenser
l’attraction. Il s’établit un équilibre à une distance définie, caractéristique pour chaque atome :
c’est le rayon de Van der Waals. Sa valeur est, à titre d’exemples, de : 120 pm pour
l’hydrogène, 140 pm pour l’oxygène, 285 pm pour le soufre. Les forces de Van der Waals
mettent en jeu une énergie faible (1kcal/mole environ). Dans la cohésion des structures
moléculaires, elles n’ont donc d’intérêt que si elles sont nombreuses et si elles s’exercent
entre atomes à courte distance les uns des autres.
La fonction énergie pour les liaisons faibles suit une loi dont la forme indiquée sur la courbe
suivante et où l’abscisse représente la distance inter-atomique (en Angström).
La résolution de la conformation spatiale par émergence
La recherche de la conformation spatiale d’une molécule (trouver le minima d’énergie
résiduelle) est un problème NP-Complet c'est-à-dire non réalisable en temps de calculs
polynomiaux relativement à la taille de la molécule en nombre d’atomes.
Ce qui est passionnant, c’est que non seulement les protéines s’auto-assemblent dans la
nature, mais elles le font avec une rapidité étonnante. Certaines le font si vite que cela se
compte en millionièmes de seconde. Alors que ce temps est très court du point de vue de la
personne, il est remarquablement long quand on fait une simulation par ordinateur. En fait,
cela prend environ un jour pour simuler une nanoseconde (1/1 000 000 000ième de seconde).
Malheureusement, les protéines se plient sur une échelle de temps de l’ordre de la
microseconde (10,000 nanosecondes). Il faudrait donc 10,000 jours CPU pour simuler un
repliement -- autrement dit, cela prendrait 30 ans CPU ! Ce rapport temporel entre nature et
simulation s’aggrave d’autant plus que la molécule est longue, car la nature fait fi des
considérations de la NP-complétude !!
La résolution de ce type de problème par émergence doit satisfaire les contraintes suivantes:
1. Le calcul doit être distribué (physiquement ou logiquement) de telle manière que
l’algorithme local ne dispose pas de la totalité des informations sur la molécule.
2. Le calcul doit être émergent dans le sens où les calculs locaux ignorent l’information sur
l’énergie résiduelle globale de la molécule.
3. Idéalement (un résultat sensationnel !!) vous pourriez démontrer (par expérimentation ou
formellement) que votre algorithme trouve une solution dans un temps borné par un
polynôme (dépendant du nombre d’atomes).
Étude de cas : conformation de molécules
2/3
CollInE – Collectif, Interaction, Emergence
Sources d’information
Des formats standard de description de molécules existent. Par exemple de très nombreuses
protéines sont décrites dans le format PDB. Un fichier PDB comprend autant de lignes que
d'atomes, ce nombre variant de 100 à 10000 atomes par molécule.
ATOM
ID
2
CA
MET A
1
-5.725
Acide
Aminé
-8.816
21.543
1.00
C
Coordonnées 3D
Exemple de ligne d'un fichier PDB
Cette ligne modélise un atome de carbone appartenant a la méthionine (un des 25 acides
aminés composant nos protéines), elle contient ses coordonnées 3D, son numéro
d'identification dans la molécule, le numéro d'identification de l'acide aminé auquel il
appartient, etc.
Des informations sur les méthodes ‘usuelles’ de calcul par « grid computing » peuvent être
trouvées notamment sur le site de folding@home.
Folding@Home
http://folding.stanford.edu/
Le criblage virtuel dans l’ère génomique par Didier Rognan
http://med-chem.u-strasbg.fr/~didier/vs.pdf
The Protein Data Bank
http://www.rcsb.org/pdb/
À VOS ALGOS !!!
Étude de cas : conformation de molécules
3/3