Nouveaux outils pour la prédiction de structures peptidiques
Transcription
Nouveaux outils pour la prédiction de structures peptidiques
TECHNOLOGIE APPLIQUÉE Marie Hélène VAN EYCK1, Marc DECAFFMEYER2, Robert BRASSEUR2 Nouveaux outils pour la prédiction de structures peptidiques RÉSUMÉ Les peptides, qu’ils soient inhibiteurs, agonistes, tags, vecteurs etc, constituent des molécules d’intérêt pour différents domaines d’applications dans des secteurs variés (biotechnologie, biopharmaceutique, agrobiologie,…). Valoriser ces molécules et leurs fonctions nécessite toutefois la connaissance de leur structure tridimensionnelle, structure et fonction étant très étroitement liées. Des méthodes expérimentales de détermination de la structure des peptides existent et font l’objet d’un perfectionnement constant. Ces techniques démontrent que les peptides ont rarement une conformation univoque. La conformation peut varier avec le solvant, les additifs au milieu (détergents, lipides). A coté des méthodes expérimentales existent également des méthodes de calcul in silico. A ce jour, trois méthodes sont disponibles : Pepstr, Robetta et PepLook. Nous avons réalisé en 2006 une étude de celles-ci en effectuant une comparaison de leurs résultats avec des structures déterminées par résonance magnétique nucléaire (RMN). Pepstr, est essentiellement fondée sur la prédiction de structure secondaire. La deuxième, Rosetta, est plus spécifiquement dévolue au calcul de la structure 3D de protéines par homologie. Enfin, la plus récente, PepLook prend en compte la diversité structurale des peptides par le calcul et l’analyse des 99 conformations de plus basse énergie. Cette procédure donne accès non seulement à une distribution structurale (ou polymorphisme) du peptide mais également à sa stabilité ainsi qu’à la prédiction de sa capacité à lier un partenaire externe. MOTS-CLÉS Peptides, in silico, structure, prédiction New tools for the prediction of peptide structures SUMMARY Outilss Peptides, either inhibitors, agonists, tags or vectors have an interesting biotechnological potential. Developping this potential requires the knowledge of the three-dimensional structure of peptides since structure and function are very closely related. Experimental methods for determining peptide structures exist and are steadily improving. These techniques show that peptides seldom have an unique conformation. The latter often varies with the solvent, with additives in the medium (detergent, lipids). In silico methods of calculation also exist. To date, three methods are available: Pepstr, Robetta and PepLook. We recently compared their achievements with NMR structures of peptides. Pepstr is mainly based on a secondary structure prediction; Robetta, is more specifically dedicated to the prediction of 3D structures of proteins. The most recent, PepLook takes into account the structural diversity of peptides by providing 99 conformations of lower energy. This procedure also gives access to the characterization of structural diversity (or polymorphism) and to the peptide stability and ability to bind to external partners. KEYWORDS Peptides, in silico, Structure, Prediction 1 Biosiris SA – Parc Créalys 5032 Gembloux Belgique – Tél. : +32 81 713430 – Fax : +32 81 713439 – E-Mail : [email protected] Centre de Biophysique Moléculaire Numérique (FSAGx) Passage des Déportés – 2 5030 Gembloux – Belgique – Tél. : +32 81 622521 – Fax : +32 81 622522 E-Mail : decaff[email protected] et [email protected] 2 SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007 25 TECHNOLOGIE APPLIQUÉE I - Introduction Un des challenges de la pharmacologie actuelle est la conception de produits plus sélectifs, plus efficaces et sans effet secondaire. Les problèmes sous-tendus par la quête de ces « perles rares » sont multiples. Sans aborder les questions liées à la production ou à la galénique, ces molécules devraient idéalement présenter une bonne stabilité biologique, une bonne perméabilité cellulaire, être sélectives et se trouver métabolisées sans engendrer de toxicité. L’industrie pharmaceutique a longtemps puisé dans les principes actifs des plantes et des produits naturels connus de mémoire ancestrale. Parmi ces produits, elle a sélectionné des molécules chimiques simples dont elle a amélioré principalement l’efficacité. Cependant, notre corps produit naturellement des effecteurs biologiques sélectifs ; ce sont souvent des peptides, parfois des protéines. Emprunter cette voie pour élaborer de nouveaux médicaments apparaît tentant, mais quand est-il de sa faisabilité ? Comparés aux médicaments existants, les peptides sont de grosses molécules. L’augmentation de taille va de paire avec une diversification des mécanismes mis en jeu et une augmentation de la complexité des relations entre la structure et les fonctions. La compréhension de ces relations structure-fonction est donc essentielle. II - Les approches expérimentales de la structure des peptides. Tableau I Comparaison des méthodes de prédiction de structures peptidiques actuellement disponibles. 26 La structure des peptides est classiquement abordée par des techniques expérimentales : dichroïsme circulaire, spectroscopie infra Rouge, RMN et parfois cristallisation pour la diffraction des Rayons X. Ces techniques se sont améliorées sous la pression d’une demande grandissante mais la discordance trop fréquente de leurs résultats révèle un point essentiel : la structure des peptides est rarement univoque ; elle varie souvent avec le milieu, que ce soit le solvant, la présence de lipides ou de détergents, etc. Il est fréquent que les données de dichroïsme fluctuent avec le solvant. De même, il n’est pas rare d’obtenir des structures RMN différentes lorsque les conditions (milieu aqueux de vésicules lipidiques) varient. La stabilité intrinsèque d’une molécule est liée à sa capacité de générer des interactions intramoléculaires qui stabilisent une conformation. Comparativement aux protéines, la petite taille des peptides limite ces possibilités et donne aux interactions avec le solvant ou avec des partenaires externes une plus grande importance relative. III - Les approches in silico de la structure des peptides A coté des techniques expérimentales, des méthodes de calcul de structures in silico ont été développées (tableau I). Le fait que l’idée de polymorphisme structural des peptides ait été récemment admise a contribué à faire progresser ces méthodes. En 2006, nous avons fait le point sur les diverses possibilités de calcul in silico disponibles en comparant aux modèles RMN les structures calculées par trois outils de détermination in silico accessibles en ligne (1). La dernière méthode de calcul développée, PepLook ouvre des possibilités intéressantes. Cette méthode se différencie de celles qui l’ont précédée car elle ne se limite pas à la recherche de la conformation unique mais explore un large panel de possibilités structurales et retient les 99 modèles de plus basse énergie donc de meilleure stabilité intrinsèque. L’analyse et la comparaison des conformations permet à cet outil d’estimer le polymorphisme du peptide, sa stabilité et sa capacité à se lier à un partenaire. IV - Un peu de technique Rappelons que les méthodes in silico partent des séquences. Trois méthodes sont disponibles via des serveurs web : PepStr (2), Robetta (3-5) et PepLook (1) par chronologie de création des sites (tableau 1). PepLook évite la modélisation par homologie qui est performante sur les protéines mais inappropriée aux pep- Outils URL Entrée Taille Méthode Solvant Sortie Pepstr www.imtech.res.in/raghava/pepstr Séquence/solvant 7-25 résidus Prédiction structure sec. Vide/hydrophobe/hydrophile PDB unique Robetta http://robetta.bakerlab.org/ Séquence > 20 résidus Homologie + Ab Initio Pas spécifié 10 PDB PepLook www.biosiris.com Séquence/solvant/pH/bloquant 5-30 résidus Ab Initio stochastique hydrophobe/hydrophile 1 Prime + 98 structures Analyse de la structure Non Non Polymorphisme + Stabilité SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007 Technologie appliquée Nouveaux outils pour la prédiction de structures peptidiques. tides comme le montre l’analyse des modèles calculés par Robetta. Robetta a été développée par le groupe de David Baker (Département de biochimie, université de Washingon, ÉtatsUnis) à partir de l’algorithme Rosetta dédié aux protéines. L’approche PePstr, développée par le Groupe de GPS Raghava (Institut de technologie microbienne, Chandigarh, Inde) (2), est basée sur la prédiction de structures secondaires. Calibrés sur des données protéiques ces deux outils ne sont pas véritablement adaptés aux peptides. En revanche, PepLook (1, 6) est spécifiquement dédié aux peptides. Les peptides sont, comme les protéines, des polymères linéaires d’acides aminés. Tous les acides aminés (à l’exception de la proline) ont le même squelette de base qui constitue la charpente (hélice, brins beta principalement) de la structure des protéines ou des peptides. Sur cette charpente, les chaînes latérales des acides aminés pointent comme autant de fonctions chimiques dont l’organisation spatiale est stabilisatrice de la structure et/ou porteuse de l’activité biologique. Les possibilités théoriques de conformations de peptides et de protéines sont énormes : on estime qu’une petite protéine de 100 résidus pourrait adopter au moins 1320 conformations différentes. Toutefois si cette valeur est très importante, elle n’est pas pour autant infinie et c’est cette caractéristique qui permet à PepLooK d’aboutir à un résultat. Ainsi, à partir de la séquence primaire, cet outil calcule par échantillonnage aléatoire une large population de conformations et les classe en « bonnes » et « mauvaises » solutions en fonction de critères objectifs principalement l’énergie des interactions intramoléculaires. Après ce premier round de calcul, le processus est réitéré. A chaque round, le tirage aléatoire des paramètres de calcul conduisant à de mauvaises solutions est défavorisés au profit de ceux conduisant à de bonnes solutions. Une telle procédure se fonde sur un algorithme de calcul stochastique boltzmanienne (1, 6). Quand les calculs « cyclent » sur un panel de structures constant, la procédure est arrêtée et les 99 conformations de plus basse énergie sont collectées. Nous avons montré que les modèles in silico étaient comparables aux modèles RMN et que l’on obtenait une adéquation entre polymorphisme des conformations expérimentales et polymorphisme des conformations calculées. Ces données obtenues par le groupe de recherche fondamentale du Centre de biophysique Moléculaire Numérique de l’université de Gembloux (Belgique) ont été exploitées par la société Biosiris (voir note 1) qui s’est chargée de la mise en ligne du site de prédiction de structures PepLook (www.biosiris.com). Pour les biologistes, les structures PDB (Pro- tein Data Bank), qu’elles soient calculées ou obtenues sur base de données expérimentales, sont des images et rares sont ceux qui en tirent facilement des informations exploitables pour leurs recherches. Cependant le potentiel réactif des peptides est large, ils peuvent notamment constituer des inhibiteurs sélectifs, des vecteurs de transfection, des agents antigéniques, des appâts sélectifs pour une purification…, soit un ensemble de caractéristiques qui doivent être détectées et, si nécessaire, modulées. Un des traits majeurs de l’outil PepLook est qu’il a été conçu de façon à fournir un ensemble d’informations directement associées à ces caractéristiques. Ainsi, outre les 99 structures qui sont déterminées, Biosiris réalise une analyse de ces structures. Pour cela, des paramètres d’évaluation abordés plus loin dans cet article (voir VI - Comment évaluer le polymorphisme des epptides) ont été calibrés (RMSd, score de stabilité, …). NOTE 1 Biosiris Parc Créalys 5032 Gembloux Belgique www.biosiris.com V - Le polymorphisme structural. Le polymorphisme du peptide constitue son potentiel de désordre, sa capacité à exister sous la forme d’une population de conformations et non d’une structure unique. Le désordre des protéines constitue une notion qui suscite aujourd’hui un intérêt certain. Cet intérêt se fonde sur la capacité de cette notion à réconcilier des caractéristiques biologiques et des avatars expérimentaux. Ainsi, une molécule polymorphe s’impose, de fait, comme une molécule difficile à cristalliser puisque la cristallisation requiert une homogénéité structurale. Une molécule désordonnée se révèle souvent plus sensible à l’action des protéases puisque les mouvements de structure contribuent à donner un accès aux liaisons peptidiques hydrolysées par les enzymes. Autre exemple, une molécule désordonnée va se caractériser par une tendance à l’agrégation plus importante en raison des mouvements de sa structure susceptibles de démasquer des sites hydrophobes. A côté de ces points qu’on pourrait être tenté de qualifier de négatifs, on peut également citer d’autres caractéristiques positives. Ainsi, une molécule polymorphe, susceptible de lier des partenaires différents, pourra « sélectionner » une conformation. D’autres propriétés biologiques apparaissent liées au désordre. Ainsi pour les peptides, nos travaux nous ont récemment conduit à proposer que polymorphisme et perméabilité membranaire sont liés (6). L’existence de plusieurs conformations pourraient permettre une variabilité de l’hydrophobicité apparente et l’existence de formes solubles dans l’eau et solubles dans les lipides à partir de la même séquence. SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007 27 TECHNOLOGIE APPLIQUÉE VI - Comment évaluer le polymorphisme des peptides Figure 1 Comparaison des modèles fournis par Robetta, Pepstr et PepLook avec les modèles expérimentaux (RMN) pour le Transportan (A) et la Magainin2 (B). A) La structure de chacun des 99 modèles calculés par PepLook est comparée à celle du meilleur modèle, c’est à dire à celle du peptide de plus basse énergie (encore qualifié de Prime). La comparaison est effectuée par superposition des modèles et calcul d’une valeur de divergence structurale (le RMSd pour Root Mean Square deviation) qu’elle soit globale à toute la structure ou locale, c’est à dire appliquée à un fragment du peptide (une fenêtre de la séquence). La première valeur (globale) donne une idée de la diversité structurale globale, les secondes (locales) cartographient la diversité structurale le long de la séquence. Il est ainsi possible de savoir si le polymorphisme est du à l’une des extrémités, au centre ou à tout le peptide. Par exemple, le polymorphisme du Transportan (un domaine de transduction) est lié à son extrémité N, celle du peptide de fusion de HA2 à son extrémité C, celle du fragment 9-32 de la calcitonine humaine qui est utilisée comme vecteur de transfection à toute la longueur de la séquence (1). VII - Comment évaluer la stabilité d’une conformation peptidique B) Figure 2 Score de stabilité (possibilité de lier un partenaire externe) donné dans l’analyse de la Magainin2. 28 SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007 Comme nous l’avons évoqué précédemment une conformation moléculaire donnée doit sa stabilité propre à ses interactions intramoléculaires. La société Biosiris a quantifié ces interactions en analysant, sur 500 protéines de structure tridimensionnelle stable la distribution des distances entre couples d’atomes non covalemment liés. Ces courbes de fréquence, traduites en courbe d’énergie ont permis de calculer le potentiel moyen (mean force potential (MFP)) de chaque acide aminé dans les strutures PDB de protéines stables et ainsi d’établir des valeurs de référence. Ces valeurs de référence sont utilisées pour évaluer la stabilité des modèles peptidiques (1, 6). Les structures obtenues par PepLook pour la Magainin 2 (un peptide présentant une activité antimicrobienne) se rapprochent étroitement des résultats obtenus par RMN (figure 1). Elles montrent clairement une hélice légèrement désordonnée à ses extrémités. Il est intéressant de constater que le score de stabilité des résidus du peptide le long de la séquence est bon à l’exception de trois phénylalanines pour lesquelles il est médiocre. Ces trois résidus aromatiques sont localisés du même coté de l’hélice et constituent donc un site d’interaction potentiel puisque leur orientation et leur faible stabilisation les rend disponibles pour un partenaire extérieur commun (figure 2). On notera que pour faciliter ce type d’analyse la Technologie appliquée Nouveaux outils pour la prédiction de structures peptidiques. société Biosiris accompagne les modèles PDB calculés d’un rapport commentant et illustrant le polymorphisme et la stabilité du peptide. VIII - Polymorphisme et stabilité sont-ils deux termes décrivant une même propriété ? S’ils sont fréquemment liés, polymorphisme et stabilité ne sont pas univoques. Dans le cas d’un peptide à caractère polyélectrolyte, on peut obtenir une conformation monomorphe parce que la molécule est restreinte dans ses mouvements par répulsion de charges. Mais la structure, bien qu’unique, est peu stabilisée en raison de l’absence d’interactions intramoléculaires (répulsion de charges). En revanche, un peptide très flexible pourra engendrer plusieurs conformations différentes (polymorphisme) qui peuvent se retrouver toutes stabilisées via des interactions intramoléculaires. IX - Le design de nouveaux peptides Par sa procédure de calcul et l’utilisation d’une description atomique des acides aminés, la méthode PepLook peut être utilisée non seulement avec des acides aminés naturels mais aussi non naturels ou modifiés (par exemple, des acides aminés phosphatés, méthylés, acylés, des acides aminés dextrogyres ou encore des acides aminés beaucoup plus exotiques (Citruline, Sarcosine, Phenylethanine, acide pipecolique). Elle est donc très généraliste et utilisable dans un grand nombre de cas. Elle peut notamment être mise en œuvre pour optimiser les propriétés d’un peptide dont on connaît la cible moléculaire (7) ou pour définir un peptide de propriétés choisies à partir d’acides aminés non naturels (8). Par ailleurs, comme nous l’avons souligné plus haut, la structure de nombreux peptides est sensible au milieu, PepLook intègre cette caractéristique et les calculs réalisés prennent en compte la nature du milieu, phase aqueuse/phase hydrophobe et plus récemment, interface membranaire. En revanche, cet outil traite le milieu par ses propriétés moyennes ce qui ne permet pas de simuler l’interaction spécifique d’un peptide avec un lipide donné. D’autres approches sont nécessaires (et disponibles) pour modéliser ce type d’interaction comme par exemple la dynamique moléculaire. X - Conclusion Pepstr, Robetta et PepLook constituent les trois outils de calcul de structure in silico les plus appropriés pour les peptides. Parmi ces approches, PepLook est la seule qui prend en compte la diversité structurale spécifique aux peptides et associée à la nature du milieu. L’utilisation en ligne de cet outil permet d’obtenir, d’une part, la structure de plus basse énergie seule, à l’instar des résultats produits par la diffraction des rayons X et, d’autre part, les 98 modèles de plus basse énergie comme obtenu par RMN. Enfin, ces structures sont accompagnées d’un rapport de commentaires sur le polymorphisme des peptides étudiés et la stabilité de leurs conformations. BIBLIOGRAPHIE (1) THOMAS A., DESHAYES S., DECAFFMEYER M. et al., Prediction of Peptide Structure: how far are we? Protein Structure Function and Bioinformatics, 2006, 65, 889-897. (6) DESHAYES S., DECAFFMEYER M., BRASSEUR R. et al. Structural Polymorphism, a Parameter Required for Cellular Uptake of Peptides – Soumis pour publication. (2) http://www.imtech.res.in/raghava/pepstr/ (7) DECAFFMEYER M., LINS L., CHARLOTEAUX B. et al. Rational design of complementary peptides to the βAmyloid 29–42 fusion peptide n: An application of PepDesign, BBA Biomembranes, 2006, 1758(3), 320-327. (3) http://robetta.bakerlab.org/ (4) SIMONS KT, KOOPERBERG C., HUANG E. et al., Assembly of protein tertiary structures from fragments with similar local sequences using simulate annealing and Bayesian scoring functions. J. Mol. Biol., 1997, 268, 209-225. (8) LINS L., CHARLOTEAUX B., HEINEN C. et al., «De novo» design of peptides with specific lipid-binding properties, Biophys. J., 2006, 90, 470-479. (5) KIM DE, CHIVIAN D., BAKER D., Protein structure prediction and analysis using the Robetta server. Nucleic Acids Res., 2004, 32 (Web Server issue) W526-W531. SPECTRA ANALYSE n° 257 • Septembre - Octobre 2007 29