Nouveaux outils pour la prédiction de structures peptidiques

Transcription

Nouveaux outils pour la prédiction de structures peptidiques
TECHNOLOGIE APPLIQUÉE
Marie Hélène VAN EYCK1, Marc DECAFFMEYER2, Robert BRASSEUR2
Nouveaux outils
pour la prédiction
de structures peptidiques
RÉSUMÉ
Les peptides, qu’ils soient inhibiteurs, agonistes, tags, vecteurs etc, constituent des molécules
d’intérêt pour différents domaines d’applications dans des secteurs variés (biotechnologie,
biopharmaceutique, agrobiologie,…). Valoriser ces molécules et leurs fonctions nécessite toutefois la
connaissance de leur structure tridimensionnelle, structure et fonction étant très étroitement liées. Des
méthodes expérimentales de détermination de la structure des peptides existent et font l’objet d’un
perfectionnement constant. Ces techniques démontrent que les peptides ont rarement une conformation
univoque. La conformation peut varier avec le solvant, les additifs au milieu (détergents, lipides). A coté
des méthodes expérimentales existent également des méthodes de calcul in silico.
A ce jour, trois méthodes sont disponibles : Pepstr, Robetta et PepLook. Nous avons réalisé en 2006 une
étude de celles-ci en effectuant une comparaison de leurs résultats avec des structures déterminées
par résonance magnétique nucléaire (RMN). Pepstr, est essentiellement fondée sur la prédiction de
structure secondaire. La deuxième, Rosetta, est plus spécifiquement dévolue au calcul de la structure 3D
de protéines par homologie. Enfin, la plus récente, PepLook prend en compte la diversité structurale des
peptides par le calcul et l’analyse des 99 conformations de plus basse énergie. Cette procédure donne
accès non seulement à une distribution structurale (ou polymorphisme) du peptide mais également à sa
stabilité ainsi qu’à la prédiction de sa capacité à lier un partenaire externe.
MOTS-CLÉS
Peptides, in silico, structure, prédiction
New tools for the prediction of peptide structures
SUMMARY
Outilss
Peptides, either inhibitors, agonists, tags or vectors have an interesting biotechnological potential. Developping this
potential requires the knowledge of the three-dimensional structure of peptides since structure and function are
very closely related. Experimental methods for determining peptide structures exist and are steadily improving.
These techniques show that peptides seldom have an unique conformation. The latter often varies with the solvent,
with additives in the medium (detergent, lipids). In silico methods of calculation also exist.
To date, three methods are available: Pepstr, Robetta and PepLook. We recently compared their achievements
with NMR structures of peptides. Pepstr is mainly based on a secondary structure prediction; Robetta, is more
specifically dedicated to the prediction of 3D structures of proteins. The most recent, PepLook takes into account
the structural diversity of peptides by providing 99 conformations of lower energy. This procedure also gives access
to the characterization of structural diversity (or polymorphism) and to the peptide stability and ability to bind to
external partners.
KEYWORDS
Peptides, in silico, Structure, Prediction
1
Biosiris SA – Parc Créalys 5032 Gembloux Belgique – Tél. : +32 81 713430 – Fax : +32 81 713439 – E-Mail : [email protected]
Centre de Biophysique Moléculaire Numérique (FSAGx) Passage des Déportés – 2 5030 Gembloux – Belgique – Tél. : +32 81 622521 – Fax : +32 81 622522
E-Mail : decaff[email protected] et [email protected]
2
SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007
25
TECHNOLOGIE APPLIQUÉE
I - Introduction
Un des challenges de la pharmacologie actuelle
est la conception de produits plus sélectifs,
plus efficaces et sans effet secondaire. Les problèmes sous-tendus par la quête de ces « perles
rares » sont multiples. Sans aborder les questions liées à la production ou à la galénique,
ces molécules devraient idéalement présenter
une bonne stabilité biologique, une bonne perméabilité cellulaire, être sélectives et se trouver métabolisées sans engendrer de toxicité.
L’industrie pharmaceutique a longtemps puisé
dans les principes actifs des plantes et des produits naturels connus de mémoire ancestrale.
Parmi ces produits, elle a sélectionné des molécules chimiques simples dont elle a amélioré
principalement l’efficacité. Cependant, notre
corps produit naturellement des effecteurs
biologiques sélectifs ; ce sont souvent des peptides, parfois des protéines. Emprunter cette
voie pour élaborer de nouveaux médicaments
apparaît tentant, mais quand est-il de sa faisabilité ? Comparés aux médicaments existants,
les peptides sont de grosses molécules. L’augmentation de taille va de paire avec une diversification des mécanismes mis en jeu et une
augmentation de la complexité des relations
entre la structure et les fonctions. La compréhension de ces relations structure-fonction est
donc essentielle.
II - Les approches expérimentales
de la structure des peptides.
Tableau I
Comparaison
des méthodes
de prédiction
de structures
peptidiques
actuellement
disponibles.
26
La structure des peptides est classiquement
abordée par des techniques expérimentales :
dichroïsme circulaire, spectroscopie infra Rouge, RMN et parfois cristallisation pour la diffraction des Rayons X. Ces techniques se sont
améliorées sous la pression d’une demande
grandissante mais la discordance trop fréquente de leurs résultats révèle un point essentiel :
la structure des peptides est rarement univoque ; elle varie souvent avec le milieu, que ce
soit le solvant, la présence de lipides ou de détergents, etc. Il est fréquent que les données
de dichroïsme fluctuent avec le solvant. De
même, il n’est pas rare d’obtenir des structures
RMN différentes lorsque les conditions (milieu
aqueux de vésicules lipidiques) varient.
La stabilité intrinsèque d’une molécule est liée
à sa capacité de générer des interactions intramoléculaires qui stabilisent une conformation.
Comparativement aux protéines, la petite taille
des peptides limite ces possibilités et donne
aux interactions avec le solvant ou avec des
partenaires externes une plus grande importance relative.
III - Les approches in silico
de la structure des peptides
A coté des techniques expérimentales, des méthodes de calcul de structures in silico ont été
développées (tableau I). Le fait que l’idée de
polymorphisme structural des peptides ait été
récemment admise a contribué à faire progresser ces méthodes.
En 2006, nous avons fait le point sur les diverses possibilités de calcul in silico disponibles
en comparant aux modèles RMN les structures
calculées par trois outils de détermination in
silico accessibles en ligne (1). La dernière méthode de calcul développée, PepLook ouvre des
possibilités intéressantes. Cette méthode se
différencie de celles qui l’ont précédée car elle
ne se limite pas à la recherche de la conformation unique mais explore un large panel de
possibilités structurales et retient les 99 modèles de plus basse énergie donc de meilleure stabilité intrinsèque. L’analyse et la comparaison
des conformations permet à cet outil d’estimer
le polymorphisme du peptide, sa stabilité et sa
capacité à se lier à un partenaire.
IV - Un peu de technique
Rappelons que les méthodes in silico partent
des séquences. Trois méthodes sont disponibles via des serveurs web : PepStr (2), Robetta
(3-5) et PepLook (1) par chronologie de création des sites (tableau 1). PepLook évite la modélisation par homologie qui est performante
sur les protéines mais inappropriée aux pep-
Outils
URL
Entrée
Taille
Méthode
Solvant
Sortie
Pepstr
www.imtech.res.in/raghava/pepstr
Séquence/solvant
7-25 résidus
Prédiction structure sec.
Vide/hydrophobe/hydrophile
PDB unique
Robetta
http://robetta.bakerlab.org/
Séquence
> 20 résidus
Homologie + Ab Initio
Pas spécifié
10 PDB
PepLook
www.biosiris.com
Séquence/solvant/pH/bloquant
5-30 résidus
Ab Initio stochastique
hydrophobe/hydrophile
1 Prime + 98 structures
Analyse
de la structure
Non
Non
Polymorphisme + Stabilité
SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007
Technologie appliquée
Nouveaux outils pour la prédiction de structures peptidiques.
tides comme le montre l’analyse des modèles
calculés par Robetta. Robetta a été développée
par le groupe de David Baker (Département
de biochimie, université de Washingon, ÉtatsUnis) à partir de l’algorithme Rosetta dédié aux
protéines. L’approche PePstr, développée par le
Groupe de GPS Raghava (Institut de technologie microbienne, Chandigarh, Inde) (2), est
basée sur la prédiction de structures secondaires. Calibrés sur des données protéiques ces
deux outils ne sont pas véritablement adaptés
aux peptides. En revanche, PepLook (1, 6) est
spécifiquement dédié aux peptides.
Les peptides sont, comme les protéines, des
polymères linéaires d’acides aminés. Tous les
acides aminés (à l’exception de la proline) ont
le même squelette de base qui constitue la
charpente (hélice, brins beta principalement)
de la structure des protéines ou des peptides.
Sur cette charpente, les chaînes latérales des
acides aminés pointent comme autant de fonctions chimiques dont l’organisation spatiale est
stabilisatrice de la structure et/ou porteuse de
l’activité biologique.
Les possibilités théoriques de conformations
de peptides et de protéines sont énormes : on
estime qu’une petite protéine de 100 résidus
pourrait adopter au moins 1320 conformations
différentes. Toutefois si cette valeur est très
importante, elle n’est pas pour autant infinie
et c’est cette caractéristique qui permet à PepLooK d’aboutir à un résultat. Ainsi, à partir
de la séquence primaire, cet outil calcule par
échantillonnage aléatoire une large population
de conformations et les classe en « bonnes » et
« mauvaises » solutions en fonction de critères
objectifs principalement l’énergie des interactions intramoléculaires.
Après ce premier round de calcul, le processus est réitéré. A chaque round, le tirage aléatoire des paramètres de calcul conduisant à de
mauvaises solutions est défavorisés au profit
de ceux conduisant à de bonnes solutions. Une
telle procédure se fonde sur un algorithme
de calcul stochastique boltzmanienne (1, 6).
Quand les calculs « cyclent » sur un panel de
structures constant, la procédure est arrêtée et
les 99 conformations de plus basse énergie sont
collectées. Nous avons montré que les modèles in silico étaient comparables aux modèles
RMN et que l’on obtenait une adéquation entre polymorphisme des conformations expérimentales et polymorphisme des conformations
calculées.
Ces données obtenues par le groupe de recherche fondamentale du Centre de biophysique Moléculaire Numérique de l’université de
Gembloux (Belgique) ont été exploitées par la
société Biosiris (voir note 1) qui s’est chargée
de la mise en ligne du site de prédiction de
structures PepLook (www.biosiris.com).
Pour les biologistes, les structures PDB (Pro-
tein Data Bank), qu’elles soient calculées ou
obtenues sur base de données expérimentales,
sont des images et rares sont ceux qui en tirent facilement des informations exploitables
pour leurs recherches. Cependant le potentiel
réactif des peptides est large, ils peuvent notamment constituer des inhibiteurs sélectifs,
des vecteurs de transfection, des agents antigéniques, des appâts sélectifs pour une purification…, soit un ensemble de caractéristiques
qui doivent être détectées et, si nécessaire,
modulées. Un des traits majeurs de l’outil PepLook est qu’il a été conçu de façon à fournir
un ensemble d’informations directement associées à ces caractéristiques. Ainsi, outre les 99
structures qui sont déterminées, Biosiris réalise une analyse de ces structures. Pour cela,
des paramètres d’évaluation abordés plus loin
dans cet article (voir VI - Comment évaluer le
polymorphisme des epptides) ont été calibrés
(RMSd, score de stabilité, …).
NOTE 1
Biosiris
Parc Créalys
5032
Gembloux
Belgique
www.biosiris.com
V - Le polymorphisme structural.
Le polymorphisme du peptide constitue son
potentiel de désordre, sa capacité à exister sous
la forme d’une population de conformations et
non d’une structure unique. Le désordre des
protéines constitue une notion qui suscite
aujourd’hui un intérêt certain. Cet intérêt se
fonde sur la capacité de cette notion à réconcilier des caractéristiques biologiques et des
avatars expérimentaux. Ainsi, une molécule
polymorphe s’impose, de fait, comme une molécule difficile à cristalliser puisque la cristallisation requiert une homogénéité structurale.
Une molécule désordonnée se révèle souvent
plus sensible à l’action des protéases puisque
les mouvements de structure contribuent à
donner un accès aux liaisons peptidiques hydrolysées par les enzymes. Autre exemple, une
molécule désordonnée va se caractériser par
une tendance à l’agrégation plus importante en
raison des mouvements de sa structure susceptibles de démasquer des sites hydrophobes.
A côté de ces points qu’on pourrait être tenté
de qualifier de négatifs, on peut également citer d’autres caractéristiques positives. Ainsi,
une molécule polymorphe, susceptible de lier
des partenaires différents, pourra « sélectionner » une conformation.
D’autres propriétés biologiques apparaissent
liées au désordre. Ainsi pour les peptides, nos
travaux nous ont récemment conduit à proposer que polymorphisme et perméabilité membranaire sont liés (6). L’existence de plusieurs
conformations pourraient permettre une variabilité de l’hydrophobicité apparente et l’existence de formes solubles dans l’eau et solubles
dans les lipides à partir de la même séquence.
SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007
27
TECHNOLOGIE APPLIQUÉE
VI - Comment évaluer
le polymorphisme des peptides
Figure 1
Comparaison des
modèles fournis
par Robetta,
Pepstr et PepLook
avec les modèles
expérimentaux
(RMN) pour le
Transportan (A) et la
Magainin2 (B).
A)
La structure de chacun des 99 modèles calculés
par PepLook est comparée à celle du meilleur
modèle, c’est à dire à celle du peptide de plus
basse énergie (encore qualifié de Prime).
La comparaison est effectuée par superposition des modèles et calcul d’une valeur de
divergence structurale (le RMSd pour Root
Mean Square deviation) qu’elle soit globale à
toute la structure ou locale, c’est à dire appliquée à un fragment du peptide (une fenêtre
de la séquence). La première valeur (globale)
donne une idée de la diversité structurale globale, les secondes (locales) cartographient la
diversité structurale le long de la séquence. Il
est ainsi possible de savoir si le polymorphisme est du à l’une des extrémités, au centre ou
à tout le peptide. Par exemple, le polymorphisme du Transportan (un domaine de transduction) est lié à son extrémité N, celle du peptide
de fusion de HA2 à son extrémité C, celle du
fragment 9-32 de la calcitonine humaine qui
est utilisée comme vecteur de transfection à
toute la longueur de la séquence (1).
VII - Comment évaluer la stabilité
d’une conformation peptidique
B)
Figure 2
Score de stabilité
(possibilité de lier un
partenaire externe)
donné dans l’analyse
de la Magainin2.
28
SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007
Comme nous l’avons évoqué précédemment
une conformation moléculaire donnée doit sa
stabilité propre à ses interactions intramoléculaires. La société Biosiris a quantifié ces interactions en analysant, sur 500 protéines de
structure tridimensionnelle stable la distribution des distances entre couples d’atomes non
covalemment liés. Ces courbes de fréquence,
traduites en courbe d’énergie ont permis de
calculer le potentiel moyen (mean force potential (MFP)) de chaque acide aminé dans
les strutures PDB de protéines stables et ainsi
d’établir des valeurs de référence. Ces valeurs
de référence sont utilisées pour évaluer la
stabilité des modèles peptidiques (1, 6). Les
structures obtenues par PepLook pour la Magainin 2 (un peptide présentant une activité
antimicrobienne) se rapprochent étroitement
des résultats obtenus par RMN (figure 1). Elles montrent clairement une hélice légèrement
désordonnée à ses extrémités. Il est intéressant de constater que le score de stabilité des
résidus du peptide le long de la séquence est
bon à l’exception de trois phénylalanines pour
lesquelles il est médiocre. Ces trois résidus
aromatiques sont localisés du même coté de
l’hélice et constituent donc un site d’interaction potentiel puisque leur orientation et leur
faible stabilisation les rend disponibles pour
un partenaire extérieur commun (figure 2).
On notera que pour faciliter ce type d’analyse la
Technologie appliquée
Nouveaux outils pour la prédiction de structures peptidiques.
société Biosiris accompagne les modèles PDB
calculés d’un rapport commentant et illustrant
le polymorphisme et la stabilité du peptide.
VIII - Polymorphisme et stabilité
sont-ils deux termes décrivant
une même propriété ?
S’ils sont fréquemment liés, polymorphisme
et stabilité ne sont pas univoques. Dans le cas
d’un peptide à caractère polyélectrolyte, on
peut obtenir une conformation monomorphe
parce que la molécule est restreinte dans ses
mouvements par répulsion de charges. Mais la
structure, bien qu’unique, est peu stabilisée en
raison de l’absence d’interactions intramoléculaires (répulsion de charges). En revanche, un
peptide très flexible pourra engendrer plusieurs
conformations différentes (polymorphisme)
qui peuvent se retrouver toutes stabilisées via
des interactions intramoléculaires.
IX - Le design
de nouveaux peptides
Par sa procédure de calcul et l’utilisation d’une
description atomique des acides aminés, la
méthode PepLook peut être utilisée non seulement avec des acides aminés naturels mais
aussi non naturels ou modifiés (par exemple, des acides aminés phosphatés, méthylés,
acylés, des acides aminés dextrogyres ou encore des acides aminés beaucoup plus exotiques (Citruline, Sarcosine, Phenylethanine,
acide pipecolique). Elle est donc très généraliste et utilisable dans un grand nombre de cas.
Elle peut notamment être mise en œuvre pour
optimiser les propriétés d’un peptide dont on
connaît la cible moléculaire (7) ou pour définir
un peptide de propriétés choisies à partir d’acides aminés non naturels (8). Par ailleurs, comme nous l’avons souligné plus haut, la structure
de nombreux peptides est sensible au milieu,
PepLook intègre cette caractéristique et les
calculs réalisés prennent en compte la nature
du milieu, phase aqueuse/phase hydrophobe et
plus récemment, interface membranaire.
En revanche, cet outil traite le milieu par ses
propriétés moyennes ce qui ne permet pas de
simuler l’interaction spécifique d’un peptide
avec un lipide donné. D’autres approches sont
nécessaires (et disponibles) pour modéliser ce
type d’interaction comme par exemple la dynamique moléculaire.
X - Conclusion
Pepstr, Robetta et PepLook constituent les trois
outils de calcul de structure in silico les plus
appropriés pour les peptides. Parmi ces approches, PepLook est la seule qui prend en compte
la diversité structurale spécifique aux peptides
et associée à la nature du milieu.
L’utilisation en ligne de cet outil permet d’obtenir, d’une part, la structure de plus basse
énergie seule, à l’instar des résultats produits
par la diffraction des rayons X et, d’autre part,
les 98 modèles de plus basse énergie comme
obtenu par RMN. Enfin, ces structures sont
accompagnées d’un rapport de commentaires
sur le polymorphisme des peptides étudiés et
la stabilité de leurs conformations.
BIBLIOGRAPHIE
(1) THOMAS A., DESHAYES S., DECAFFMEYER M. et al., Prediction
of Peptide Structure: how far are we? Protein Structure Function
and Bioinformatics, 2006, 65, 889-897.
(6) DESHAYES S., DECAFFMEYER M., BRASSEUR R. et al. Structural
Polymorphism, a Parameter Required for Cellular Uptake of Peptides – Soumis pour publication.
(2) http://www.imtech.res.in/raghava/pepstr/
(7) DECAFFMEYER M., LINS L., CHARLOTEAUX B. et al. Rational
design of complementary peptides to the βAmyloid 29–42 fusion peptide n: An application of PepDesign, BBA Biomembranes,
2006, 1758(3), 320-327.
(3) http://robetta.bakerlab.org/
(4) SIMONS KT, KOOPERBERG C., HUANG E. et al., Assembly of
protein tertiary structures from fragments with similar local sequences using simulate annealing and Bayesian scoring functions. J. Mol. Biol., 1997, 268, 209-225.
(8) LINS L., CHARLOTEAUX B., HEINEN C. et al., «De novo» design of peptides with specific lipid-binding properties, Biophys.
J., 2006, 90, 470-479.
(5) KIM DE, CHIVIAN D., BAKER D., Protein structure prediction
and analysis using the Robetta server. Nucleic Acids Res., 2004, 32
(Web Server issue) W526-W531.
SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007
29