MEMOIRE LE DIPLOME DE MAGISTER

Transcription

MEMOIRE LE DIPLOME DE MAGISTER
REPUBLIQUE ALGERIENNE DEMOCRATI QUE ET POPULAIRE
MINISTERE DE L ’ENSEIGNEMENT SUPERIEUR
ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITE D’ORAN ES-SENIA
FACULTE DES S CIENCES
DEPARTENT DE PHYSIQ UE
MEMOIRE
présenté par
Melle Samira NAIR
Pour obtenir
LE DIPLOME DE MAGISTER
Spécialité : Physique
Option : BioPhysique Mathématique & Simulations
intitulé:
les Phénomènes de Repliement et de Dépliement des Protéines :
Exemple: Protéine d’ubiquitine
Etude de Simulation et Conséquences Médicales
soutenu le : 05.05.2009 .à la salle de conférences de la Faculté des Sciences
devant le Jury composé des membres suivants :
SLIMANI MILOUD
:
Professeur à l’Univ. d’Oran Es-sénia, Algérie
(Président)
DJEMAÏ Abed-El-Farid : Professeur à l’Univ. d’Oran Es-sénia, Algérie
(Rapporteur)
BOUKREDIMI Djamel : Maître de Conférences à l’Univ. d’Oran
- Es-sénia,
Algérie
(Examinateur)
BELHADJI Maâmar
: Professeur à l’Univ. d’ OranEs-sénia , Algérie
(Examinateur)
Ce travail est dédié à ma mère qui est partie trop
tôt. A mon père, a mes frères et mes sœurs.
Remerciements
Je tiens à remercier ...
Tout
particulièrement
Le
professeur
A.E.F.Djemai,
mon
encadreur,
Responsable de la Post- Graduation de Biophysique Mathématique & simulations,
pour la confiance et la liberté qu'il m'a accordée et pour la collaboration fructueuse
que nous avons eue, autant sur un plan scientifique, dans notre effort de combiner
des approches théoriques et expérimentales, que sur un plan humain, et le soutien
qu’il m’a témoigné tout au long de cette mémoire. Je le remercie, pour toutes les
discussions que nous avons pu avoir et pour les précieux conseils qu'il m'a donnés,
et pour sa patience et ses encouragements qui m’ont permis de travailler dans les
meilleures conditions. Je le remercie sincèrement d’avoir inspiré ce mémoire avec
enthousiasme.
Je remercie le professeur Slimani Miloud, pour l’honneur qu’il me fait de
présider le jury de mémoire, Merci également au professeur Belhadj Maâmar et
Docteur Boukredimi Djamel, qui ont bien voulu examiner et me faire l’honneur de
juger et de corriger mon travail et pour leur encouragement et leur disponibilité.
J’adresse également mes plus vifs remerciements au professeur N.Karam, et
au professeur S.Hiadsi, pour leurs conseils, soutien et disponibilité.
Un merci tout particulier à Zouambi
Leila pour son encouragement,
sa
gentillesse et sa disponibilité en toutes circonstances.
Je remercie Mr M.O.Bensaid Pour les longues discussions et les conseils en
simulation qui a contribué à la réussite de ce travail, ainsi Melle F.Benyatou pour ses
conseils et sa disponibilité.
Merci à tous les étudiants en thèse de mémoire rencontrés: Mr M.Amraoui,
O.Bouhacina, M.Boukabcha, pour leur soutien et disponibilité.
Merci aussi à vous que je ne cite pas ici mais qui avez contribué à ce mémoire
par vos conseils ou votre amitié.
Sommaire
Chapitre I : Structure et Fonction des Protéines
1. Introduction
2. Eléments de base en biologie moléculaire
2.1. Eucaryotes et procaryotes
2.2. Acide aminé (AA)
2.3. Acide nucléique, bases azotées et nucléoti des
2.5. Structure et transformations de l’ADN et types d’ARN
2.6. Ribosome
2.7. Code génétique
3. Biosynthèse des protéines
3.1. Mécanisme de la traduction
3.1.1. L’initiation
3.1.2 .l’élongation
3.1.3. La terminaison
4. Structure des protéines
4.1. Structure générale
4.2 Les acide ami nés
4.2.1 Le carbone central (chiral)
4.2.2 Propriétés physico-chimiques des aci des aminés
4.2.2.1 Ionisation
4.2.2.2 Propriétés physiques
4.2.2.2.1 Aspect
4.2.2.2.2 Isomère optique
4.2.2.2.3 Absorption dans l’ultraviolet
4.2.2.1.4 Solubilité
4.2.3 Propriétés chimique des aci des aminés
4.2.3.1 Réactions dues à la présence du carboxyle
4.2.3.1.1 Formation des sels
4.2.3.1.2 Décarboxylation
4.2.3.2 Réaction dues à la présence du groupement aminé
4.2.3.2.1 N-alkylation et N-arylation
4.2.3.2.2 N-acylation
4.2.3.2.3. Action de formol
4.2.3.2.4. Action de l’acide nitreux
4.2.3.2.5. Désamination
4.3 Séquence
4.4 Classification des α-aminoacides selon la nature des chaînes
latérales
4.4.1 Les acides amines polaires
4.4.2 Les acides amines chargées
4.4.3 Les acides aminés hydrophobes
4.5 La liaison peptidique
4.5.1 Formation de la liaison peptidique
4.5.2 Propriétés géométriques de la liaison peptidique
4.5.3 L’isomérie cis et trans
4.6 Les angle de la chaîne peptidique
4.6.1 Les propriétés des angl es des chaines peptidiques
4.7. Diagramme de ramachandran
4.8. Les différents niveaux de structure des protéines
4.8.1. Liaison intervenant dans la structure spatiale des
protéines
4.8.1.1 liaisons disulfures ou pont disulfure
4.8.1.2 Liaison ionique ou saline
4.8.1.3 Liaison hydrogène
4.8.1.4 Liaison hydrophobe
4.8.2. La structure primaire
4.8.3. La structure secondaire
4.8.3.1 Les hélices
4.8.3.1.1 L’hélice α
4.8.3.1.2 Autres structures hélicoïdales
4.8.3.2 Le feuillet β
4.8.3.3 Coudes et boucles
4.8.4 Structure tertiaire des protéines
4.8.5 Structure quaternaire des protéines
5. Les types des protéines
5.1 Classification des protéines suivant leurs formes
5.2 Classification des protéines suivant leur fonction biologique
5.3 Classification des protéines suivant leur composition
6. techniques de séparation des protéines
6.1
6.2
6.3
6.4
6.5
Gel de filtration
Précipitation suivant leur solubilité
Chromatographie d’affinité
Chromatographie échangeuse d ’ion
Electrophorèse
7. Propriétés des protéines
7.1 Propriétés physico-chimique
7.1.1 Solubilité
7.1.1.1 Influence de la concentration en sel (force ionique µ)
7.1.1.2 Influence du pH
7.1.1.3 Influence de la température et de solvants organiques
7.1.1.4 Propriétés électriques
7.2. Propriétés physi ques
7.2.1 Sédimentation
7.2.2 Viscosité
7.2.3 Propriétés optiques
7.2.4 Masse molaire
7.3 Propriétés chimiques
7.3.1 Propriétés de la liaison peptidique
7.3.2 Propriétés des chai nes latérales
7.5 Propriétés biologiques
8. Relation structure fonction dans les protéines
9. Conclusion
______________________
Chapitre II : Stabilité des Protéines
(Repliement et Dépliement)
1. Introduction
2. Stabilité des protéines et cinétique de repliement
2.1. Une stabilité marginale
2.2. Les effets di fférents qui influençant la stabilité de la structure native
2.2.1. Interactions électrostatiques
2.2.2. Effets hydrophobes et solvatation
2.2.3. Ponts disulfure
3. Cœur hydrophobe
4. Dénaturation des protéines
5. Repliement des protéines
6. L’Aspect cinétique et thermodynamique du repliement
7. Approche théorique pour l’étude de repliement des protéines
7.1. « Random Ener gy Model » et Protéines
7.1.1. Le Random Ener gy Model (REM)
7.1.2. Application naïve au cas des hétér opolymères aléatoires
7.1.3. Le paramètre d’ordre pertinent :
7.2. Cinétiques de repliement des pr otéines
7.2.1. Repliement : cinétique de 1er ordre réarrangement
intramoléculaire
8. Modèles pour l’effet de repliement
8.1. L’effondrement hydrophobe :
8.2. Le modèl e de nucléation-propagation
8.3. Le modèl e de diffusion-collision
8.4. Le modèl e « Framework »
8.5. Le modèl e hiérarchique
8.6. Le modèl e « Jigsaw Puzzle »
8.7. Le modèl e de « l’entonnoir énergétique de repliement
8.8. Les modèl es expérimentaux de repliement
8.8 .1. Le repliement à deux états
9. Caractérisation des différents états impliqué dans l’effet de
repliement
9.1 L’´etat natif
9.2 L’´etat dénatur e – La pelote statistique
9.3 Les états intermédiaires du repliement – Le « molten globule »
10. Forces de repliement
11. Chaperons et repliement des protéines in vivo
12. Modèles théoriques pour étudier le repliement
13. Une description théorique simple
14. Dépliement des protéines
15. Etude du repliement des protéines par des simulations de
dépliement
15.1. Mécanismes de repliement simple
15.2. Mécanismes de repliement complexe
16. Rigidité et souplesse des protéines
16.1. Dynamique des pr otéines
16.2. Facteurs de température
17. La prédiction de structure
18. Conclusion
______________________
Chapitre III : Etude Théorique du Repliement
et Simulation Numérique
1 .Introduction
2. L'espace CARTÉSIEN et Déterminations des symboles, notations
3. Degrés de liberté, fonction d'interaction et équations de
mouvement
4. HAMILTONIEN et fonction d'interaction : Champs de forces
utilisés
4.1. Champ de for ce
4.1.1. Interactions entre atomes liés
4.1.1.1. Elongation des liaisons covalentes entre atomes
4.1.1.2. Déformation des angles entre atomes liés
4.1.1.3. Termes de torsion, angles dièdres et impropres
4.1.2. Interactions non-liées
4.1.2.1. Interactions de LENNARD-JONES
4.1.2.2. Interactions électrostatiques
4.1.3. Forces spéciales dues aux contr aintes
4.1.4. Inclusion de la polarisabilité
5. Mécanique et dynamique moléculaires
5.1. Minimisation de l'énergie
5.2 .Dynamique moléculaire
5.2.1. Principe
5.2.2. Résolution de l’équation du mouve ment
6 .Systèmes dans le vide
7. Système dans un milieu solvates (non vide)
7.1. Solvant explicite
7.2. Solvant implicite (modèle de Born généralisé)
8. Modélisation de la dynamique de la chaîne peptidique des
protéines en solution par RMN à travers les couplages dipolaires.
8.1. Couplage dipolaires résiduels et dinarique (Base théorique)
8.1.1. L’Interaction Dipôle-Dipôle Directe
8.1.2. Couplages Di polaires Résiduels en milieux orientant
8.2. Utilisation des CDR dans l’étude dynamique
8.2.1. Traitement théorique
8.2.2. Modèle à symétrie axiale
8.2.3. Modèle des Fluctuations Axiales Gaussiennes
8.2.4. Modèle du saut à deux sites
8.3. Méthodes numériques
8.3.1. Le Tenseur d’Alignement
8.3.2. Calcul du paramètre de dynamique
9. Logiciel TINKER :
10. Description des algorithmes
11. Analyse des repliements (Utilisation des repliements sur les génomes)
12. Banques et Classifications (Banques de str uctures)
13. Simulation de dynamique moléculaire
13.1. Réalisation d’une dynamique moléculaire
13.1.1. Structure initiale de la molécule
134.1.2. Paramétrisation
13.1.3. Minimisation de la structure
14. Ensemble appliquée à la dynamique moléculaire
15. Topologie du système
16. Protéine d’Ubiquitine
16.1. Protéine d’ubiquitine
16.2. Structure de l’ubiquitine
16.3. Mécanisme d'action
17. Théorie et méthodes
17.1. Modèles de protéine et fonctions d’énergie
18. Modèle de protéine à simuler
18.1. Protéine ubiquitine (VPS27)1o06
18.2. Régions de 1o06
19. Résultats et discussion
20. Conclusion
______________________
Chapitre IV : Conséquences Médicales
1. Introduction
2. La protéine prion et prion pathogène
3. L’ubiquitine et la protéine chaperonne
4. Le système d’ubiquitination
4.1. Enzyme activant l’ubiquitine, E1
4.2. Enzymes conjuguant l ’ubiquitine, E2S
4.3. Les ubiquitines-Ligases E3S et leur classification
5. protéasome-ubiquitine
6. La voie ubiquitine–protéasome
7. Maladies pathologiques impliquant l'ubiquitine
8. Maladies neuro-dégénératives
8.1. Maladie d'Alzheimer
8.2. La maladie de Parkinson
8.3. Maladie de Creutzfeldt-Jakob
9. Conclusion
Légende des Figures :
Chapitre 1 :
Fig1 : Squelette d’un brin d’ADN.
Fig2 : Les quatre bases azotées.
Fig3 : Liaison A=T : deux li aisons hydrogène.
Fig4 : Liaison CΞG : trois liaisons hydrogène.
Fig5 : Sucre des nucléotides = ribose
Fig6 : Structure de l’ADN
Fig7 : Conformation de la double hélice de l'ADN dans sa conf ormation usuelle
(ADN-B). Rouge: le brin phosphodiester. Bleu: Guanine. Jaune: Cyt osine.
Fig8 : Structure générale de l’ADN.
Fig9 : le processus de la réplication de l’ADN.
Fig10 : Le déroulement de la transcription avec l’élément ARN polymérase.
Fig11 : structure de l’ARN messager.
Fig12 : Represente la structure generale d’un ARNt.
Fig13 : figure représente le ribosome.
Fig14 : représente la transcription et la traduction des protéines
Fig15 : Structure de l’ARN messager avec ces codons
Fig16 :l’initiation de la traduction de protéine
Fig17 : Enchaînement de 2 AA
Fig18 :l’étape de l’élongation
Fig19 : Résultat final de la traduction « la protéine »
Fig20 : structure générale d’une protéine
Fig21 : représente une structure générale théorique des α-acide amines
N’existe pas en réalité.
Fig22 : Figure représente les di fférentes catégori es des acides aminés
Fig23 : géométrie dans l’espace des types d’acides aminés
Fig24 : réactions représentent la formation de la liaison peptidique
Fig25 : distance de liaison peptidique
Fig26 : Configurations trans et cis
Fig27 : Configurations trans et cis pour des liaisons peptidique du types Xpro
Fig28 : les angles dièdres des chai nes peptidiques
Fig29 : les angles dièdres des chai nes peptidiques
Fig30 :representation de Newman se sont troix exemples de valeur d’angles
diéddres
Fig31: Le graphique de Ramachandran
Fig32 : Carte de Ramachandr an représente des glycines
Fig33 : les différents niveaux de structure des pr otéines
Fig34 : La structure primaire d’une protéine
Fig35 : les hélices α
Fig36 : exemple d’un feuillet β
Fig37 : feuillets plissés β Parallèles
Fig38: feuillets plissés β Antiparallèles
Fig39 : Coudes d’inversion; Reverse turn ou β turn
Fig40 : Exemple d’une présentation en structure tertiaire d’une protéine
Fig41 : Exemple d’une représentation en structure quaternaire d’une
protéine
Fig42 : Relation entre les différentes catégories de str uctures
Chapitre 2 :
Fig. 1 : Les protéines sont marginalement stabl es « Effets compensatoi res ».
Fig. 2: Représentes les di fférents effets qui influence la stabilité d’une protéine.
Fig. 3 : Une protéine mal repliée peut encor e retrouver sa conformation correcte.
Fig.4 : Dénaturation et renaturation spontanée d’une petite protéi ne.
Fig. 5 : Représentation explicite et implicite de l’eau et simulation du repliement.
Une conformation dénaturée (à gauche) et repliée (à droite) de la petite protéine
Trpcage.
Fig.6 :(repliement) La protéine assemblée se replie pour former une structure
tridimensionnelle précise.
Fig. 7 : diagramme représente le Repliement en entonnoir schématique d’une
protéine. La largeur de l’entonnoir représente l’entropie, la profondeur, l’énergie—
“Folding funnel” of a pro tein . Wi d t h and depth respectively represent entropy and
energy.
Fig. 8 : a) Paysage énergétique plat de type trou d’un terrain de golf correspondant
au Paradoxe de Levinthal b) paysage énergétique présentant un chemin de
repliement de A vers l’état natif N. c) paysage énergétique idéal qui guide les
conformations vers la conformation native N d) paysage énergétique pour lequel il
existe un repliement rapide de A vers N et un processus lent de B vers N avec un
état intermédiaire transitoire.
Fig.9 : Entropie pour le Random Ener gy Model .
Fig. 10 : Détermination graphi que de la température de repliement.
Fig. 11 : Représentation schématique des deux modèles de repliements d’âpres.
Fig. 12: Représentation schématique de la structure cristalline du lysozyme. Sur la
droite, le domaine a est constitué de cinq hélices (en rouge et jaune). Sur la gauche,
le domaine b est constitué de trois bri ns b (en bleu) et d’une hélice.
Fig.13 : Représentation schématique du dépliement (a -> f) ou du repliement (f -> a)
du
Lysozyme à six étapes différentes d’une trajectoire de dépliements obtenus par
simulation de dynamique moléculaire. Les hélices a sont représentées par des
serpentins en bleu et les feuillets b par des flèches rouges.
Chapitre 3 :
Fig.1 : Modèles (e,R*) et (e,s) des paramètres de VAN DER WAALS pour Une
molécule diatomique de type X-X. Energie d'interaction en Fonction de la distance de
séparation entre les deux atomes.
Fig.2 : Représentation de la méthode du champ de r éaction. L'atome i auCentre de
la sphère de rayon
est entouré de charges
situées À
Le champ de
réaction est créé par les charges images à .
Fig.3 : Inconvénient des méthodes de gr adient : le minimum local atteint par les deux
Boules a et b est di fférent et dépend de la position (configuration) initiale.
Fig. 4 : Schéma représente les deux spins, de l’orientation du champ magnétique B 0
et de l’angle q.
Fig.5 : représentation des Orientation du champ B0 et du vecteur internucléaire dans
le repère lié à la molécule.
Fig.6 : A gauche : Coordonnées d ’un vecteur internucléaire dans le repère principal
du tenseur d’alignement. A droite : Isocontours des CDR par rapport à un tenseur
d’alignement ; la valeur des CDR va cr oissant du gris au noir en passant par le blanc.
Fig.7 : Milieu orientant
Fig. 8 : Illustration du mouvement FAG et du passage du r epère peptidique au
repère principal de la molécule par la rotation d’angle (a,b,g). Le vecteur N-NH est en
jaune
Fig.9: Comparaison entre le modèle FAG (trait plein) et saut à deux sites (pointillés), D étant
la valeur du couplage (pas à l’échelle) (a = b = g = 60°, Aa = 20.10-4, Ar = 13.10-4)
Fig.10 : Représentation de La structure de l’ubiquitine.
Fig.11: surface moléculaire de l'ubiquitine
Fig.12 : la structure de l’ubiquitine (VPS27)1o06.
Fig.13 : Séquence de la chai ne A d’après les clase de scop,DSSP ,PDB.
Fig.14 : structure secondai re de la chaine A.
Fig.15 : Interface TINKER (Keywords set (Édition des paramètres) à gauche,
visualisation graphiqueà droite de la protéine 1o06.
Fig.16 : Structure native de l’Ubiquitine (1o06), prise par TINKER.
Fig.17 : Structure de l’ubiquitine (1o06) analysée par PDB XYZ.
Fig.18 : Evolution dynamique de la structure de l’ubiquitine (1o06)
sous le champ de for ce AMBER99, T INKER. Photos pri ses toutes les trois mn.
Fig.19 : Graphe représentant la variation de l’énergie potentielle V en fonction du
temps t.
Fig.20 : les phases de la dynamique de l’ubiquitine (1o06), champ de for ce
AMBER99, TINKER.
Fig.21 : Graphe représentant la variation de l’énergie potentielle V en fonction du
temps t.
Fig.22 : Graphe représentant la variation de l’énergie potentielle V en fonction de la
température T.
Fig.23 : Graphe représentant la variation de la température T en fonction du temps t,
Fig.24: L’évolution de la DM de la protéine 1o06 sous l’ensemble NPE chaque
100picosecande.
Fig.25: Graphe représentant la variation de l’énergie potentielle V en fonction du
temps t.
Fig.26 : Graphe représentant la variation de l’énergie potentielle V en fonction de la
température T.
Fig.27 : Graphe représentant la variation de la température T en fonction du temps t,
Fig.28 : L’évolution de la DM de la protéine 1o06 sous l’ensemble NPT chaque
100picosecande.
Fig.29 : Graphe représentant la variation de l’énergie potentielle V en fonction du
temps t.
Fig.30: Graphe représentant la variation de l’énergie potentielle V en fonction de la
température T.
Fig.31 : Graphe représentant la variation de la température T en fonction du temps t,
Fig.32 :L’évolution de la DM de la protéine 1o06 sous l’ensemble NVE chaque
100picosecande.
Fig.33 : Graphe représentant la variation de l’énergie potentielle V en fonction du
temps t.
Fig.34 : Graphe représentant la variation de l’énergie potentielle V en fonction de la
température.
Fig.35: Graphe représentant la variation de la température T en fonction du temps t
Fig.36 : L’évolution de la DM de la protéine 1o06 sous l’ensemble NVT chaque
100picosecande.
Fig.37: Graphe représentant la variation de l’énergie potentielle V en fonction du
temps t.
Fig.38: Graphe représentant la variation de l’énergie potentielle V en fonction de la
température.
Fig.39: Graphe représentant la variation de la température T en fonction du temps t
Chapitre 4 :
Fig.1 : Modèle de la protéine prion PrP2
Fig.2 : Structure cristalline de l'ubiquitine
Fig.3 : Représentation du protéasome obtenue par Diffractométrie de rayons X après
cristallisation. Le cœur catalytique 20S est en bleu. Les deux co mplexes régulateurs
11S sont en rouge.
Fig.4 : Interaction entre la voie « loi N-terminale » et le système ubiqui tine
protéasome.
Fig.5 : Représentation de la dégradation des protéines par l’ubiquitine-protéasome.
Fig.6 :Modèle de dégradation de CD4 en pr ésence de Vpu (Margottin et al.,1998).
Fig.7 : figure représente une cell ule en début de mitose, et une cell ule en interphase,
et la protéine Vpu, visualisée grâce a un ant icorps couplé à un fluorochome vert, est
présente dans des compar timents péri-nucléaires (Golgi, réticulum).
Fig.8 : Schéma de l a structure cristalline de l’ubiquitine avec la
Représentation des feuill ets β (4) et de la longue hélice α (résidus 23 à 34).
Fig.9 : Représentation schémati que de la famille De gènes ayant une fusi on
naturelle à l’ubiquitine UBI1…
Fig.10 : Aspect des lésions observées dans la maladie d’Alzheimer à
l’examen microscopique.
Fig.11 : schéma représente le Mécanismes mis en jeu dans la mort des neurones
dopaminergiques.
Fig.12 : Voies moléculaires impliquées dans la pathogéni e de la maladie de
Parkinson.
Fig.13 : Maladie de Parkinson et voie protéolytique ubiquitine-protéasome.
Légende des Tableaux :
Chapitre 1 :
Tableau1 : présente les différents radi caux des acides ami nés
Tableau 2 : Le tableau de code génét ique
Tableau 3 : Tableau du modèle « sphère solides » les valeurs limitent
Chapitre2 :
Tableau 1 : représentes des di fférents mouvements des protéines.
Chapitre4 :
Tableau 1 : Influence de l’acidose métabolique sur le métabolisme protéique au
cours des maladies rénales et chez les sujets sains.
Tableau 2 : Résultats obtenus à par tir de test de viabilité cellulaire (MTT) sur des
cellules PC12 utilisant différents peptides β dont la taille varie de 40 à 42 aci des
aminés et dont la Séquence vari e du sauvage à une séquence mutée au ni veau de
la méthionine 35.
INTRODUCTION GENERALE
INTRODUCTION GENERALE :
Une protéine est une macromolécule biologique constituée par une ou
plusieurs chaines d’acides aminés reliées entre elles par des liaisons peptidiques.
Généralement, on parl e de « protéine » lorsque la chaîne contient pl us de 100 acides
aminés. Quoique dans le cas contraire, on parle de « peptides » ou de
« polypeptides », mais plus souvent si mplement de « petite protéine ».
Les protéines sont donc des macromolécules polymériques possédant des
propriétés physico-chimiques très importantes au sein des organismes vivants. Elles
sont consi dérées à juste titre comme étant l es molécules de la « vie ».
Leurs structures définissent leurs fonctions au sein des différents organismes
vivants. En fait, la structure de base des protéines, nommée structure primaire, est
la séquence linéaire des acides aminés. Toutefois, une protéine ne garde jamais une
forme strictement linéaire. En effet, l'énergie contenue dans les liaisons hydrogène,
les ponts disulfures, l'attraction entre les charges positives et négatives, et les
radicaux hydrophobes ou hydr ophiles, exigent de la protéine d’adopter une structure
secondaire en hélice alpha ou en feuillet bêta. D’ailleurs, les protéines sont encore
plus compactes en adoptant une structure tertiaire. Cependant, quand une
protéine est formée de plus d'une chaîne polypeptidique, tel que l'hémoglobine et
certaines enzymes, on di t qu'elle a une structure quaternaire.
On distingue plusieurs types de protéines. Leur classification peut se faire de
plusieurs façons : selon la structure, selon la fonction biologique ou selon leur
composition.
L’étude des confor mations structur elles des protéines constitue un des thème s
de recherche fondamental e et expérimentale actuelle de grande importance. En effet,
beaucoup de scientifiques de différentes disciplines s’intéressent de plus en plus à
ce thème dont l ’importance en médeci ne commence à se pr éciser davantage.
Dans ce contexte, le phénomène du repliement des protéines a été expliqué
comme étant le passage d’une chaîne d’acides aminés vers une structure
tridimensionnelle native bien déterminée et permettant à la protéine d’exercer sa
fonction biologique. C’est la dernière étape de l’emploi de l’information contenue
dans l’ADN. Or, la structure native est totalement prédéfinie par l’ordre des acides
aminés dans la chaîne polypeptidique.
ADN
Transcription ARN
Traduction chaîne polypeptidique Repliement Protéine
En effet, le passage de la structure primaire à la structure tertiaire se fait par
un processus purement physique, appelé repliement. En pratique, cela veut dire,
qu’une protéine en s’écartant fortement de sa structure native, suite par exemple à
un choc avec une autre macromolécule, erre parmi ses multiples états non-natifs
pendant un temps très élevé à l’échelle atomique, en tentant de retrouver sa
structure native.
Plus précisément, ce phénomène de repliement produit une ségrégation des
groupes alcanes au sein de la protéine ainsi qu’une exposition au solvant des
chaînes latérales les plus polaires. Cette ségrégation réduit les zones de contact
alcane-eau, et ceci se répercute sur la potentielle thermodynamique de la protéine.
Dans ce cas, on dira que la structure repliée est stabilisée par l’effet hydrophobe des
groupes alcanes. Par contre, l’état déplié, quant à lui, est stabilisé par le nombre
énorme de confor mations, et donc car actérisé par une grande entropie.
Néanmoins, le mécanisme exact qui conduit au phénomène de repliement de
ces protéines reste à ce jour une énigme. Certes, plusieurs hypothèses ont été
émises pour expliquer ce phénomène. Toutefois, cet énigme a été formalisé
correctement dans le cadre de ce qui est appelé le paradoxe de Levinthal. Ce
paradoxe peut être levé par le concept de chemin de repliement, qui consiste à dire
que la protéine ne cherche pas sa structure native « par hasard », mais plutôt par un
« chemin spécifique» parmi les différentes structures non-natives qui mènera vers un
minimum local d’énergie, c'est-à-dire vers sa structure native qui est la plus
stable au niveau thermodynamique, et ce dans les meilleurs délais.
En pratique, il a été remarqué qu’une protéine à température ambiante se
replie en quelques secondes, voire même quelques millisecondes, que cela soit in
vitro ou in vivo. En théorie, pour une protéine composée d’une séquence de « n »
acides aminés, possédant chacun « m » conformations possibles, le nombre total de
conformations possibles que peut adopter cette protéine (dans sa recherche de sa
structure native) est égal à m n. Sachant que le temps de passage d ’une confor mation
à une autre est d’environ 10-13s, et si on considère par exemple que m=2 et n=100,
ceci se traduit par un temps égal à environ 1010 années (même ordre de grandeur
que l’âge présumé de l ’Univers)!!!.
Récemment, les méthodes numériques ont connues un essor très important
dans différents domaines d’application. En particulier, les simulations de dynamique
moléculaire, qui permettent d’étudier le comportement d’un système moléculaire
complexe en fonction du temps, se sont développées énormément par le biais de
logiciels de plus en plus performant et évolués. En fait, ces simulations permettent
d’échantillonner un espace de conformation important et inabordable aux
expériences de minimisation d’énergie.
Le but de ce mémoire est d’étudier le phénomène de repliement (et de
dépliement) des protéines par une approche de simulation de dynamique
moléculaire en utilisant le logiciel TINKER version 4.2 /2004.
En particulier, on s’est intéressé à la molécule d’ubiquitine. Cette protéine
particulière est employée comme marqueur de protéines cibles. Elle est très
importante en médecine, vu que le processus d’ubiquitination, qui indique la fixation
spécifique et régulée d’ubiquitine sur une protéine cible, a pour but de reconnaître la
protéine ciblée (malade) afin de permettre son élimination. La protéine d’ubiquitine
est décrite par une séquence de 73 acides aminés et ses propriétés ont été puisées
du site Protein Data Bank, en termes de fichiers pdb.
Ce mémoire est organisé comme suit. Le chapitre 1 est consacré à une revue
des éléments de base de la biologie moléculaire ainsi qu’une rétrospective sur la
biosynthèse des protéines, leurs différentes structures, leurs types, leurs propriétés
et leurs fonctions.
Le chapitre 2 est quant à lui consacré à la présentation du phénomène de
repliement (et de dépliement), ses aspects cinétique et thermodynamique, sa
description théorique ainsi que la recherche de la stabilité des protéines.
Dans le chapitre 3, on présente le formalisme de la simulation de dynamique
moléculaire, le logiciel TINKER ainsi que la protéine simulée d’ubiquitine. On
présente aussi nos résultats obtenus et nos interprétations et concl usions.
Dans le chapitre 4, on présente l’importance de la protéine choisie dans le
domaine médical. De même, on discute les répercussions médicales du phénomène
de repliement.
MOTS CLES :
Ubiquitine, TINKER, Repliement et dépliement des protéines, Protéine 1o06,
Dynamique moléculaire.
Chapitre I
Structure et Fonction des Protéines
1. Introduction :
La protéine est reconnue comme étant l’un des principaux éléments
constitutifs cellulaires. D’ailleurs, le terme « protéine », qui a été proposé en 1838
par Mulder, vient du mot grec « proteios » signifiant : premier en position ou de
première importance, [1].
En effet, les protéines sont des constituants très importants des cellules
vivantes, dont la diversité et la complexité structurale sont les plus élevées, aussi
bien d’un point de vue quantitatif (elles représentent en général plus de la moitié
du poids sec des cellules), que du point de vue qualitatif, puisqu’on trouve des
protéines ayant un rôle biologique principal à coté des protéines dites
structurales, en particulier les enzymes, catalyseurs biologiques nécessaires à la
suite des réactions dans les cellules des organismes vivants, [2] .
Ainsi, les protéines sont des macromolécules naturelles complexes formées
par l’enchainement linéaire de résidus peptidiques-NH-CH- CO-. En milieu acide
aqueux elles se dégradent en libérant des α-amines qui peuvent être reconnues
par chromatographie, [3].
En général, les protéines sont une union de petites molécules (ou résidus)
nommées acide aminé de série L, [1]. D’ailleurs, il existe 20 acides aminés
différents qui séquencent les protéines.
Toutes les protéines contiennent les quatre éléments : C, H, O et N.
Nombreuses sont celles qui contiennent du soufre, et certaines d’entre elles
renferment du phosphore. La quantité en azote des protéines est en général au
voisinage de 16% (en masse), [2]. De plus, les protéines sont l’un des quatre
matériaux de base de tout organisme, avec les lipides, les glucides, et les acides
nucléiques.
En général, les protéines possèdent de multiples fonctions structurales et
fonctionnelles. Dans ce chapitre, on rappelle les éléments de base en biologie
moléculaire qui nous permettront de décrire les structures et les fonctions des
protéines.
2. Eléments de Base en Biologie Moléculaire :
2.1. Eucaryo tes et procaryotes :
Tous les organismes vivants sont cl assés en deux grandes catégories :
ü les eucaryotes
ü les procaryotes.
En effet, à l ’intérieur de chacune de leurs cellules, les eucaryotes ont un
noyau : petit sac entouré d’une membrane semi perméable enfermant les
chromosomes. Ainsi, l’homme, les animaux et les plantes sont considérés
comme des eucaryotes. Quant aux procaryotes, tels que les bactéries, ils
ne possèdent pas de vrai noyau mais une structure beaucoup plus simple
non entourée d’une membrane. C’est de ce « proto-noyau » que vient le
nom générique qui les désigne.
Chez les eucaryotes, les gènes sont généralement composés de deux
types de séquence nucléotidique : l’une dite codante (appelée exon) et
l’autre non codante (appelée intron). Les exons portent l’information qui
sera directement servie pour produire les protéines et les introns, qui se
disposent entre les exons, ne sont pas lus lors de la traduction. Du fait de
cette disposition alternée exon/intron, on emploie l’expression gène
mosaïque [4-5].
2.2. Acide aminé (AA) :
Comme son nom l’indique, un acide aminé est une petite molécule qui
possède une fonction acide et une fonction amine primaire. En effet, les acides
aminés sont des composés organiques bi-fonctionnels qui contiennent un groupe
amine basique (-NH2) et un acide carboxylique (-COOH), dont l’enchainement
compose les protéines : on dit qu’une protéine est un polymère d’acides aminés
(les monomères). Dans la nature, il existe 20 acides aminés différents (voir
tableau1), [4], et qui possèdent des fonctions et propriétés diverses en fonction de
la nature de la chaîne latérale -R. Par exemple, dans l’alanine, la chaîne latérale
-R est (-CH3), alors que, dans la cystéine, elle est (-CH2-SH).
Tableau1 : Les différents radicaux des acides aminés.
On traitera les acides aminés, avec un peu plus de détails dans l’étude de la
structure des protéines.
2.3. Acides nucléiques, bases azotées et nucléotides :
Les acides nucléiques sont des polymères formés par l’enchainement de
nucléotides. Ils jouent un rôle primordial dans le stockage, le maintien et le
transfert de l’information génétique, [4]. On distingue, deux types d’acide
nucléique : l’acide ribonucléique (ARN) et l’acide désoxyr ibonucléique (ADN).
L’ADN, dont l’appellation dérive du mot Acide Désoxyribo-Nucléique, est
une molécule de support génétique qui existe dans tous les organismes
vivants. Elle contient sous forme codée toutes les informations relatives à la
vie d’un organisme vivant, du plus simple au plus complexe, animal, végétal,
bactérien, viral, [6]. En effet, l’acide désoxyribonucléique joue le rôle, dans
chaque cellule, d’une « banque de données », [7]. L’information qui y est
amoncelé permet à chaque composant cel lulaire d’être synthétisé, rassemblé
et régulé.
Une molécule d’ADN est formée de deux brins d’ADN complémentaires qui
s’associent en orientation opposée et qui s’emboîtent tout en s’enroulant l’une
autour de l’autre pour former une double hélice droite constituant ainsi une
macromolécule composée de 150 milliards d’atomes, découverte en 1953, [6] .
En fait, l’ADN est un polymère de bases désoxyribonucléiques, plus couramment
appelées nucléotides. Chaque nucléotide est constitué d'un groupe de phosphate lié
au désoxyribose (un sucre), lui-même lié à une base azotée. C’est d’ailleurs le
sucre qui donne son nom à l’ADN. Ces bases azotées sont au nombre de quatre :
l'Adénine (A), la Thymine (T), la Cytosine (C) et la Guanine (G). Donc, Le squelette
de l'ADN est formé par la répétition sucre-phosphate, [6].
(Les phosphates, en jaune, les
sucres
(Désoxyribose), en bleu, et les bases
azotées, en vert.)
Fig1 : Squelette d’un brin d’ADN.
On distingue deux familles de bases azotées : la famille des purines
(l’adénine (A) et la guanine (G)) et la famille des pyrimidines (La thymine (T) et la
cytosine (C)). Un nucléotide = sucre (ose) + base azotée + groupement
phosphorique, [8].
Les bases azotées sont complémentaires deux à deux (voir figure2,3,4):
l'adénine s'associant avec la thymine et la guanine avec la cytosine. Le
second bri n d'ADN est donc compl émentaire au premier et les bases azotées
complémentaires sont reliées entre elles grâce à des liaisons hydrogènes, [6].
Fig2 : Les quatre bases azotées.
Fig3 : Liaison A=T : deux liaisons hydrogène.
Fig4 : Liaison CΞG : trois liaisons hydrogène.
L’Acide RiboNucléique (ARN) est un acide nucléique constitué d’une seule
chaîne de nucléotides. C’est donc un Polymère de nucléotides reliés entre eux par
des fonctions esters, de structure analogue à celle de l’ADN. Il existe pourtant des
différences chimiques entre ces deux acides nucléiques qui donnent à l’ARN
certaines propriétés particulières. L’ARN est produit par transcription de l’ADN et
possède quatre bases Adénine, Guanine, Cytosine et Uracile (à la place de la
Thymine), [8].
Fig5 : Sucre des nucléotides = ribose.
2.4. Structure et transformations de l’ADN et types d’ARN:
L’ADN a deux brins qui ont trois propriétés primordiales, [6] :
ü Antiparallèles
ü Complémentaires
ü hélicoïdaux
Fig6 : Structure de l’ADN.
Fig7 : Conformation de la double hélice
de l'ADN dans sa conformation usuelle
(ADN-B). Rouge: le brin phosphodiester.
Bleu: Guanine. Jaune: Cytosine.
Fig8 : Structure générale de l’ADN
L’ADN est une macr omolécule formée de deux br ins relies par des liaisons
Hydrogènes, formant une structure de double hélice à pas droit (voir
figure6,7,8). On remarque que les plans des bases sont perpendiculaires à
l’axe de l’hélice d’où les bases s’empilent. Il existe 10 paires de bases par
pas d’hélice où le pas de l’hélice est égal à 3,4 nm et le diamètre de l’hélice
est égal à 2 nm, [8].
L’ADN peut subir trois différentes transformations biochimiques : La
Réplication, la Transcription et la Traduction.
En effet la biosynthèse de l’ADN est nécessaire à la multiplication des cellules,
car elle permet de transmettre l’information génétique de la cellule mère aux cellules
filles : on parle donc de réplication ou de duplication, [2].
L’étude de la réplication de l’ADN a débuté il y a environ 40 ans, quoique ce
processus ne soit pas encore compris avec tous ces détails au niveau des
mécanismes moléculaire, [2]. Alors, Meselson et Stahl ont prouvé à travers leurs
expériences que la réplication du ADN se faisait selon le mode semi-conservatif.
Donc, pour toute division (mitose), la molécule d’ADN double-brin est copiée en
deux molécules d'ADN double brin filles dont chacune hérite un brin de la molécule
d'ADN initiale ou « mère » et d'un brin néo-synthétisé à partir de nucléotides libres.
Ainsi, lors de la réplication, les paires de bases sont tout d'abord séparées par la
rupture des liaisons hydrogènes de l'ADN par une enzyme appelée ARN hélicase
(figure 9).Cependant, une fourche de réplication va alors se former donnant 2 brins
d'ADN simple-brin différents, tel que chacun de ces brins va être copié par l'action
des ARN polymérases, pour former 2 nouvelles molécules d'ADN double brin
identiques à la molécule mère, [6].
Fig9 : le processus de la réplication de l’ADN.
La transcription, [9], est l’ensemble des mécanismes par lequel l’ARN messager
(mARN) est synthétisé. Ainsi, le mARN est une copie d’une portion de l’ADN (figure
10). Cependant, certaines portions de l’ADN sont transcrites et ces séquences
seront dites gènes. Ainsi, un gène comprend la séquence en nucléotides qui sera
transcrite ensuite traduite en acides aminés, mais également des séquences
admettant de réguler cette fabrication de protéine en fonction des conditions
cellulaires. La longueur d’un gène peut varier de quelques centaines, à plus d’un
million de nucléotides, [4]. En fait, seul l’un des deux brins d’ADN est copié en
mARN. La transcription est donc la configuration de l’étape préliminaire nécessaire
pour la biosynthèse protéique ou traduction.
Fig10 : Le déroulement de la transcription avec l’élément ARN polymérase.
Quoique, la transcription ne produit pas uniquement des mARN, mais aussi des
tARN (ARN de transfert), des rARN (ARN ribosomique) et des snARN (ARN small
nuclear). Ce dernier est un acide ribonucléique nucléaire qui se trouve uniquement
dans le noyau et participe à la régulation post-transcriptionnelle, [8].
L’acide ribonucléique messager (mARN) est la copie du gène qui serait traduite
en protéines (figure11).Il sert à porter l’information génétique de son lieu de
stockage (le chromosome) vers le lieu de synthèse des protéines (les ribosomes), [4].
En effet le mARN est une molécule qui a une conformation de ruban, issue de la
transcription de l’ADN, et porteuse du code autorisant L’élaboration des protéines
par « traduction » du code génétique.
Fig11 : structure de l’ARN messager.
Le rARN est le composant principal des ribosomes, la machinerie cellulaire où a
lieu la traduction en protéines de l’information qui se trouve dans les mARN, [8].
Quant à l’ARN de transfert (tARN) (figure12), il est responsable du transport des
acides aminés jusqu’aux ribosomes lors de la traduction des mARN. En fait, chaque
tARN transfert un acide aminé, de façon particulière. Sa séquence conçoit une série
de trois nucléotides, appelée anticodon, qui reconnait le codon coïncidant à l’acide
aminé qu’il transporte, [4].
Fig12 : Represente la structure generale d’un ARNt.
2.5. Ribosome :
On savait déjà que la synthèse des protéines se faisait dans le ribosome,
particule ribonucléoprotéique qu’on nommait alors par microsome, malgré que
l’existence de l’ARN messager ne fût pas encore découverte. Ce n’est que vers la fin
des années 50 et le début des années 60, que ces particules furent isolées
entièrement, en particulier d’E.colli. En même temps que leur isolement était achevé,
une analyse sérieuse de la composition des ribosomes a pu être établie, [10]. Ainsi, le
ribosome est la plus petite structure cellulaire visible seulement au microscope
électronique.
Fig13 : figure représente le ribosome.
En effet, le ribosome est formé de deux sous-unités, une petite et une
grande, pour les eucaryotes 40s et 60s, et chez les procaryotes 30s et 70s
(voir figure 13). Chaque unité est formée d’un mélange d’ARN (ARNr) et de
protéines (environ 60% ARNr et 40% protéines), [5].
2.6. Code génétique :
Le code génétique, est un système de correspondance permettant de
traduire une séquence d’acide nucléique en protéine. Dans ce système, un
triplet de nucléotides, ou codon, désigne un acide aminé. Comme il existe 4
nucléotides, il y a 4×4×4=64 codons différents. À un codon donné,
correspond un seul et unique acide aminé.
Par contre, il n’existe que 20 acides aminés différents dans les protéines
de ce fait plusieurs codons codent avec le même acide aminé. Certains de
ces 64 codons ne codent avec aucun acide aminé. Ces codons dits « nonsens » indiquent à la machinerie cellulaire la fin de la lecture de l’information
qui est dans les gènes, et incitent l’arrêt de fabrication des protéines. On les
nomme aussi codons-stop.
Tous les êtres vivants (à quelques variantes prés) possèdent le même
code génétique, que ce soit chez l’homme, l’animal, le végétal ou la bactérie,
donc il est universel, [4].
U
C
A
C
U
Phe (F)
Phe (F)
Leu (F)
Leu (F)
Leu (L)
Leu (L)
Leu (L)
Leu (L)
Ile
(I)
Ile
(I)
Ile
(I)
Met (M)
Val (V)
Val (V)
Val
(V)
Val
(V)
C
Ser
Ser
Ser
Ser
Pro
Pro
Pro
Pro
Thr
Thr
Thr
Thr
Ala
Ala
Ala
Ala
(S)
(S)
(S)
(S)
(P)
(P)
(P)
(P)
(T)
(T)
(T)
(T)
(A)
(A)
(A)
(A)
A
Tyr (Y)
Tyr (Y)
STOP
STOP
His (H)
His (H)
Gln (Q)
Gln (Q)
Asn (N)
Asn (N)
Lys (K)
Lys (K)
Asp (D)
Asp (D)
Glu (E)
Glu (E)
G
Cys (C)
Cys (C)
STOP
Trp (W)
Arg (R)
Arg (R)
Arg (R)
Arg (R)
Ser (S)
Ser (S)
Arg (R)
Arg (R)
Gly (G)
Gly (G)
Gly (G)
Gly (G)
U
C
A
G
U
C
A
G
U
C
A
G
U
C
A
G
Tableau2 : Le tableau de code génétique.
3. Biosynthèse des protéines :
La difficulté qui se pose à propos de la biosynthèse des protéines,
c’est de connaître comment les organismes vivants peuvent se regrouper,
dans un ordre bien définit et sans faire d’erreurs, des centaines
d’aminoacides .ou encore, il faut se demander comment est programmée
cette biosynthèse, comment est déterminée la structure primaire (la
séquence des aminoacides) d’une protéine dont on va l’étudier par suite.
Nous savons simultanément que l’information renfermée dans l’ADN est
transcrite, grâce
à la ARN-polymérase-ADN dépendante, en ARN
messager .maintenant on va voir comment cet ARN messager commande
l’incorporation des aminoacides dans un ordre déterminer et permet ainsi la
synthèse d’une protéine caractéristique ou de multiples protéines
caractéristiques, [2].
Fig14 : représente la transcription et la traduction des protéines.
3.1. Mécanisme d e la traduction, [11] :
La traduction se fait dans le cytoplasme pour l’eucaryote, or la traduction se
passe avec la transcription dans le même endroit pour les procaryotes. Alors :
ü Le passage du gène à la protéine ce fait grâce au code génétique.
ü Dans le code génétique, un acide aminé coïncide à une succession de 3
nucléotides : TRIPLET ou CODON.
ü Le code génétique est dégénéré, puisque plusieurs triplets peuvent avoir la
même sensation, c’est-à-dire codé pour le même acide aminé.
Fig15 : Structure de l’ARN messager avec ces codons.
En effet, la traduction est la modification d’un message contenu dans
un acide nucléique, et l’ARNm, en une chaîne polypeptidique. Elle est
effectue au niveau des ribosomes avec l’intervention des ARNt (t comme
transfert)
en
trois
phase.
3.1.1. L’initiation :
Commençons par L’ARNt initiateur se fixe sur un codon de l’ARNm.
Cet ARNt est relié à la Méthionine puisque le premier codon est toujours
AUG (Adénine, Uracile, Guanine).En ce momon, les 2 sous-unités du
ribosome parviennent se fixer à l’ARNm.
Fig16 :l’initiation de la traduction de protéine.
Fig17 : Enchaînement de 2 AA.
3.1.2. L’élongation :
Durant l’élongation, il y a Fixation d’un nouvel ARNt en face du 2ème
codon de l’ARNm et formation d’une liaison peptidique entre deux acides
aminés. Ainsi que une Translocation du ribosome d’un codon et mise en
place d’un 3ème acide aminé. L’ARNt de la seconde retourne dans le
cytoplasme et ai nsi de suite (figure 18).
Fig18 :l’étape de l’élongation.
3.1.3. La t erminaison :
En fin, Le ribosome vi ent à un codon STOP ou NON SENS ( UAA, UAG,
UGA) auquel ne correspond aucun acide aminé, donc aucun ARNt. La
chaîne protéique se détache donc du ribosome. Alors, après qu’en lisant
toute la séquence d'ARN messager, le ribosome fabrique une longue
chaîne d'acides aminés, qui forment la protéine (figure19).
Fig19 : Résultat final de la traduction « la protéine ».
4. Structure des protéines :
4.1. Structure générale :
Les protéines se sont des polymères d’acides aminés ou des
macromolécules, formées par des enchainements d’aminoacides liés entre
eux par les liaisons peptidiques (fonction amide), Qui constituent le squelette
de la molécule (figure20).
En effet, Une liaison peptidique se forme entre le groupe amine (-NH2)
d’un acide aminé et le groupe car boxylique (-COOH) d’un autre.
Or, La formule générale d’un acide aminé est H2 N –CHR –COOH. Le
groupe latéral –R peut être n’importe quoi à partir d’un simple atome jusqu’à
une molécule complexe. Le terme “polypeptide” se réfère simplement à une
longue chaîne d’acides aminés. Ainsi que, une fois la chaîne protéique
regroupée, elle doit être repliée correctement pour affirmer sa fonction. Bien
que, La structure et la conformation (c'est-à-dire repliement) de chaque
protéine est spécifique.
Mais, on ne sai sit pas encor e entièrement la manière dont la séquence en
acides aminés détermine la conformation de la protéine. Donc une “protéine”
peut être constituée d’un ou multiples polypeptides séparés; elle peut être
formée de feuillets (des chaînes d’acides aminés alignées ensemble) qui ont
des structures en enroulements.
On distingue clairement que les Propriétés des polypeptides et protéines
dépendent de leur composition en acides aminés, [12].
Généralement, en fonction du nombre d’acides aminés, on parle de
protéines donc inferieure de 10 on emploie le non peptide, et de 10 à 100
polypeptide, après seulement on parl era de protéines, [13].
Fig20 : structure générale d’une protéine
4.2. Les acides aminés :
4 .2.1 Le carbo ne central (chiral) :
Les acides amines ce sont des unités monomériques des protéines.
Dans le monde de vivant, on perçoit deux groupes. La première conçoit vingt
α-aminoacides constitutifs de toutes les protéines ; les fonctions amine et
carboxyle sont donc tenues par le même atome de carbone dit α, ou le
carbone où s’attache-la fonction amine est nommée carbone α et sera noté
par la suite Cα. Or, ce carbone est lié à quatre groupes divers (COOH, NH 2,
H et R), il est chiral (a l’exception la glycine où R est unHydrogène) , [14].
La deuxième regroupes tous les autres aminoacides, ceux que l’on trouve
à l’état libre et qui jouent souvent un rôle métabolique important et ceux
recentrés dans quelque petits peptides (moins de vingt aminoacides) faits
par des micro-organismes ou des plantes uniquement. Nous en s’intéresse
surtout a la première classe, car comme on a dit auparavant les vingt αaminoacides constitutifs des protéines, jouent aussi des rôles métabolise
important en tant que annonci ateurs d’autres constituants cellulair es, [2].
Fig21 : représente une structure générale théorique des α-acide amines
N’existe pas en réalité.
.
Il faut noter qu’il ya plusieurs catégorie d’acides amines, au pl us des αacides aminés il ya types (ß, δ,..)D’acide amine ou les deux fonctions amine
et carboxyle sont portées par des atomes de carbone distincts (figure 22), [2].
Fig22 : Figure représente les différentes catégories des acides aminés.
4.2.2 Propriétés physico-chimiques des acides aminés :
4.2.2.1. Ionisation :
L’ionisation c’est une propriété physique et chimique à la fois. Alors, pour
tous les amines acide ont au moins deus groupes ionisables, le carboxyle et
l’amine ; donc ils sont amphotères, ou le groupement carboxyle d’un acide
aminé peut donner un proton et il devient un anion, par cantre le groupement
aminé peut immobiliser un proton et formé un cation, [2].Or, il ya trois formes
possibles pour un acide ami nés neutre :
ü Cation NH3+ : charge nette +1
ü Anion C00- : charge nette -1
ü Zwitterion NH3+ et C00- : charge nette 0.
Forme zwitterionique : valeurs de pH Physi ologique.
Remarque : On appelle « zwitterions » les composés qui possèdent une charge positive sur un atome
et une charge négative sur l'autre. Or, La charge des acides aminés varie en fonction du pH.
Ainsi que, il n’ya pas d’ionisation dans les protéines avec COOH et NH2 de la
chaînes commune, les charges arrivent des chaînes latérales R, [13].
4 .2.2.2. Prop riétés physiques :
4.2.2.2.1.Aspect :
En générales, les acides aminés on un aspect d’un Poudre blanche Des fois
cristallisés, [16].
4.2.2.1.2 Isomère optique :
Tous les aminoacides ont un carbone α asymétrique, ou les quatre
valences sont liées à des atomes ou à des groupements différents, à
l’exception de la glycine qui a deux H sur le carbone α. Par exemple dans le
cas de l’alanine on peut écrire la formule spatiale de deux isomères optiques
ou énantiomères, dont le mélange forme un racémique, non applicables car
l’un est l’image de l’autre par rapport à un miroir plan, et dont les propriétés
physique et chimiques sont semblables, sauf le pouvoir de rotatoire. On
remarque, ainsi pour chaque aminoacide un isomère D, et un isomère L,
selon que la structure spatiale est semblable à celle du D ou du L
glycéraldéhyde, duquel la configuration absolue est connue. Bien que, les
formules spatiales sont assez compliquées à noter, et l’on favorise d’utiliser
les formules planes en projection données par Fischer ; pour modalité on
écrit les aminoacides de la série D avec le groupement aminé droite, et ceux
de la série L avec le NH2 à gauche ;or, il est remarquable que les
aminoacides constitutifs des protéines sont tous de la série L .mais dans
différents peptides bactériens, spécialement ceux qui entrent dans la
composition de la paroi cellulaire, ou encore dans certains peptides doués
d’activité antibiotique, on voit les aminoacides de la série D .notons que Dacides aminés c’est le symétrique de L par rapport à un miroir et
l’appartenance à la série D ou L n’a rien à voir avec le sens dans le quel
l’aminoacide fait dévier le plans de la lumière polariser, [2].
Fig23 : géométrie dans l’espace des types d’acides aminés.
4.2.2.2.3 Ab sorption dans l’ultraviolet :
Les acides amines montrent une absorption importante aux longueurs
d’onde moindres à 230nm (2300A) ; en effet, certains d’entre eux absorbent
entre 250 et 300nm pour l’existence dans leur chaîne R de chromophores,
comme le noyau phényle (Tyr) ou le noyau indole (Trp) admettant ainsi le
dosage spectr ophotométrique des protéines, [2].
4.2.2.1.5 Solubilité :
La solubilité dans l’eau diminue avec le nombre d’atome de carbone de la
chaîne aliphatique. Or, s’il ya un agent polaire, la solubilité augmente, [13]. En effet,
en générale les acides aminés sont solubles dans l’eau Si pH très bas ou très élevé,
[13]
.
4.2.3 Propriétés chimique des acides aminés, [2] :
Les amines acides possèdent des propriétés chimiques attribuées par
le groupement carboxyle. Ainsi que, Le groupement aminé et le radiale R,
mais ne citerons que les plus importantes, et surtout celles auxquelles nous
ferons appel par la suite lorsqu’ on va faire l’étude sur des protéines.
4.2.3.1 Réact ions dues à la présence du carboxyle :
4.2.3.1.1 F ormation des sels :
La propriété de formation des sels, peut être utilisée pour désigner les
aminoacides, mais à cause de la faible dissociation du carboxyle, il faut aller
à des pH élevés, entre 11 et 12 pours voir la saturation totale sauf si l’on titre
en présence de formol.
4.2.3.1.2 Décarb oxylation :
La décarboxylation, elle peut être effectuée en laboratoire, mais elle a
lieu enzymatiquement dans les cell ules vivantes.
4.2.3.2 Réact ion dues à la présence d u groupement aminé :
4.2.3.2.1 N -alkylation et N-arylation :
En général, les H du NH 2 on peut les remplaces par des radicaux :
ü Aliphatiques, dans le plus simple est CH3 ; on peut avoir des dérivés Nméthylés,N-diméthylés et N-triméthylés.
ü Aromatiques, comme les dérivés dinitrophénylés(DNP) que l’on utilise pour
la détermination de l’acide aminés N-terminal des protéines.
4.2.3.2.2 N-acylation :
Les N-acylation, ce sont
Des radicaux formyle, acétyle (facilement
hydrolysable) ou carbobenzoxyle (C6H5-CH2-O-CO-, facilement éliminé par
hydrogénation) sont utilisés au laboratoire en raison de permettre d’arrêter
momentané la fonction aminé.Or in vivo, on distingue les dérivés N-acétylé et Nbenzoyle de la glycine formés au cour de la détoxication, il faut noter que la Nformyl-méthionine qui joue un rôle principal dans l’initiation de la biosynthèse des
protéines chez les bactéries et ainsi que les organites.
4.2.3.2.3 Act ion de formol :
Le formol, ou formaldéhyde ou encore méthanal, réagie sur le NH2 des
acides amines à température ordinaire et à pH neutre pour construire des
dérivés dihydr oxyméthylés qui sont des aminés tertiaire et non plus primaires,
or se sont des bases plus faible, ou le pk est plus bas, et en peut neutraliser
les acides amines par une base en pr ésence de phénol phtaléines, alors sans
être forcer d’aller à des pH aussi grand qu’en absence de formol. C’est ce
qu’en nomme le formol titration de Sorensen.
4.2.3.2.4 Action de l’acide nitreux :
L’acide nitreux réagit sur le groupement NH2 en délivrant de l’azote.
4.2.3.2.5 Désamination :
La désamination et la transamination, se sont deux réactions enzymatiques
très importantes, dont ils provoquant la disparition du groupement aminé.
4.3 Séquence :
Comme on a dit au par avant que Toutes les protéines sont formées par
l’enchaînement du motif ou le groupement chimique R, nommé chaîne latérale et
soutenu par un carbone nommé Cα, inclus à une liste de vingt cas.au motif coïncide
l’élément monomère nommé acide aminé, dont les deux groupes terminaux ont été
écrites sous leur forme chargé.
4.4 Classification des α-aminoacides selon la nature des chaînes
latérales, [14] :
Puisque il ya 20 acide aminés naturels donc 20 différents chaînes latérales R,
qui forment les protéines. L’abréviation peut être à trois lettres, et dans le cas
général les trois premières lettres du nom, ou à une lettre acceptent de les appeler
de la manière générale. On peut les ordonner suivant leur réactivité chimique on
trois classe :
ü Polaires
ü Chargés
ü Hydrophobes
4.4.1 Les aci des amines polaires :
Les acides amines polaires mais non chargés se sont la thréonine, la
sérine, la tyrosine, la glutamine, l’asparagine et la cystéine. Quoi que, Leurs
chaînes latérales a un groupement hydroxyle, phénol, amide ou thiol. Or, Le
groupement thiol de la cystéine compose souvent un pont désulfure avec
une autre monomère cystéine après oxydation. Ainsi que, Les ponts
désulfures
jouent un rôle essentiel dans la structure des protéines en
produisant une liaison covalente entre deux régions différentes de la chaîne
où entre deux chaînes protéiques distinctes.
4.4.2 Les aci des amines chargées :
Les acides aminés chargés ce sont l’acide glutamique, l’acide
aspartique, l’arginine ,la lysine, or dans quelque cas l’ arginine ,l’histidine et
la lysine sont chargées positivement donc l’acide aspartique et la glutamique
sont chargés négativement à pH physiologiques. Dont La charge positive de
l’histidine dépend de son environnement du quel le pKa de l’acide composé
de l’histidine, dont le cycle imidazole est protoné égale a 6,1.
4.4.3 Les aci des aminés hydrophobes :
En effet, les acides aminés hydrophobes possèdent des chaînes
latérales non chargées et non polaires. Ce sont la valine, la leucine, la
glycine, l’alanine, la méthionine, la Phénylalanine, l’isoleucine, le tryptophane
et la proline. Or, Entre ces acides aminés, à la qualité d’avoir une fonction
amine secondaire et un cycle qui exige des contraintes de forme à la chaîne
capitale. Tendis que, Les chaînes latérales de la tyrosine et de la
phénylalanine ont des groupements aromatiques ou la complication stérique
est importante et utiles.
4.5 La liaison peptidique :
4.5.1 Formation de la liaison peptidique :
L’or de la synthèse d’une protéine par une cellule vivante, le groupe
carboxyle d'un acide aminé réagit avec le groupe amino d'un autre acide
aminé pour former une liaison peptidique (CO—NH) ou cette liaison à deux
caractéristiques principale qui déterminent les propriétés Biologiques des
protéines. Quoi que, la liaison peptidique est une structure plane et rigide. Et
aussi le carbone asymétrique qui porte à la fois le radical et les deux
groupements -NH2 et -COOH donne une articulation libre autour de laquelle
les radicaux tournent librement .en effet, la planéité de cette liaison a été
observer expérimentalement par des études cristallographique sur les acides
amines et les peptides, [14]. Ainsi que Le groupe carboxyle du deuxième
acide aminé réagit de la même manière avec l e groupe ami no d'un troisième,
et ainsi de suite, jusqu'à la construction d'une chaîne, ou peptide, qui peut
tenir de deux à divers de centaines d'acides aminés. Les deux aminoacides
aux extrémités de la chaîne sont nommés : N-terminal pour celui qui a sa
fonction α-aminée libre et C-terminal pour celui qui a sa fonction α-COOH
libre, [15].
Fig24 : réactions représentent la formation de la liaison peptidique.
4.5.2 Propriétés géométriques de la liaison peptidique :
Les calculs de la mécanique quantique et les diagrammes de rayons X
de cristaux de dipeptides (union de deux acides aminés comme une chaîne)
ou d’oligopeptides, ont montrent que la distance C-N dans la liaison
peptidique est 1,325A°, beaucoup plus proche de la distance dans la double
liaison C=N (1,25A°) que dans une si mple liaison.par exemple, la distance NCα dans la chaîne peptidique est de 1,455A°.
Ce qualité de double liaison de la liaison C-N et le fait que la position
trans, des atomes O et H est plus stable de 4Kcal/mole que la position cis,
mènent à pl acer les quatre atomes C, O, N, H dans en mê me plan, [16].
Fig25 : distance de liaison peptidique.
4.5.3 L’isomérie cis et trans :
En réalité la liaison peptidique peut être sous deux configurations : le
première est la configuration cis ou en distingue le O du C=O est de même
coté de la liaison peptique que le H du NH et la configuration trans ou en
voient les deux atomes sont de part et d’autre de la liaison. Or la
configuration trans est énormément plus stable que la configuration cis car il
y a moins de gène sur le plan stérique pou es deux groupes proches de R.
alors, c’est donc particulièrement sous la configuration trans que seront
partagés les atomes autour de la liaison peptidique, [17].
En générale, une liaison peptidique est dans une conformation trans, or
les Cα qui s’accompagnent sont de part et d’autre de la liaison qui les unit,
[18]
.
Fig26 : Configurations trans et cis.
Mais des liaisons peptidiques du type X-Pro peuvent exister dans les
conformations cis et trans, [19].
Fig27 : Configurations trans et cis pour des liaisons peptidique du types X-pro.
4.6 Les angles de la chaîne p eptidique :
On distingue deux types d’angles qu’on peut les voir dans les chaines
peptidique, se sont les angles de valences et les angles dièdre. Or, les
angles de valence se sont les angles d’ouverture entre deus liaison
successi ves, ainsi que les angles dièdres ou encore des angles de torsion se
sont les angles entre deux pl ans autour s d’une liaison.
Alors, comme on a di t au par avant que La liaison peptide est plane et
rigide, donc la chaîne essentielle et principales polypeptidique n'a que deux
degrés de liberté de rotation autour des liaisons NH-Ca et Ca-CO. Dont,
Les valeurs des angles de rotation autour de ces liaisons peuvent être
évaluées par les angles dièdres f (C'-N-Ca-C) et y (N-Ca-C-N'), [20].
Fig28 : les angles dièdres des chaines peptidiques.
4.6.1 Les p ropriétés des angles des chaines peptidiques :
Tendis que le plan de la structure de la liaison peptidique est rigide, il
interdit la rotation des atomes des fonctions acide et amine. Or, l’unique
liaison ou l’orientation reste libre se sont celles qui enferment chacun des
carbones asymétriques porteurs des chaines latérale. En général les angles
dièdres est définit comme suit : Φ (phi) =CO (i-1)-NH(i)-Cα(i)-CO(i) et
Ψ
(psi) =NH (i)- Cα(i)- C(i)- NH (i+1).
Quoi que, la liaison (C-NH) qui se trouve à l’extrémité NH2-terminale peut
pivoter librement, donc, l’angle de rotation de cette liaison est nommes angle
Φ (phi). Ainsi que la liaison(C-CO) qui se trouve vers l’extrémité COOHterminale peut aussi pivoter ou l’angle de rotation de cette liaison est
nommes angl e Ψ (psi). Et en remarque que la li aison peptidique (NH-CO) est
de qualités proportionnellement double, ou la rotation est limité. Or, l’angle
de rotation de cette liaison est nommes angle ω (oméga) et optera dans le
cas général la valeur 180º (trans) ou parfois de 0º (cis). En effet,
Fréquemment Les angles et subsistent eux aussi près de 180º (trans) mais
avec un peu plus de changement que l’angle ω, grâce à leur qualités de
liaison simple, [20].
Fig29 : les angles dièdres des chaines peptidiques.
Si en prend La représentation de Newman, on peut apercevoir ces angles
dièdres dans la figure qui suit (figure30). En distingue la liaison Cα-N avec
l’azote à l’avant plan, ou l’angle φ est l’ongle qui se trouve entre deux
carbones C des groupes carboxyliques. Et aussi pour l’angle ψ c’est l’angle
qui se situe entre les deux azotes quand on observe la liaison Cα-C avec le
carbone Cα en plan premier.
Fig30 :representation de Newman se sont troix exemples de valeur d’angles diéddres.
4.7 Diag ramme de ramachand ran :
G.N. Ramachandran (1922–2001), c’est un chercheur qui a beaucoup
travaillé sur les peptides. Alors en nomme la carte de Ramachandran
lorsqu’on prend sur un graphe les deux angles dièdre φ et ψ, on construisant
un espace de deux dimensions, [14].
En effet, un diagramme de Ramachandran peut être construit de deux
façon différentes, la manière la plus simple c’est le modèle de la « sphère
solide » dont
les atomes sont comptés comme des sphères
« impénétrables »les unes par les autre tel que le rayon de Van der
Waals qu’en vas l’étudier dans le chapitre suivant. Où, les sphères ne
peuvent s’avancer à moins d’une distance donnée. Or, on utilise deux
valeurs limites, la première c’est la limite « normale » et la deuxièmes c’est la
limite « intérieure » on envisager sa dans le tableau suivant (tableau 3).
liaison
limite
«normale »
limite
"intérieure"
C-C
C-O
C-N
C-H
O-O
N-N
H-H
2 ,8
2,8
2,9
2,4
2,8
2,7
2,0
2,7
2,7
2 ,8
2,2
2 ,7
2,6
1,9
Tableau 3 : Tableau du modèle « sphère solides » les valeurs limitent.
Or, la deuxième façon ou méthodes c’est de calculer l’énergie de la protéine
pour des diverses valeurs des angles φ et ψ, [21].
Fig31 : Le graphique de Ramachandran .
Ramachandran a eu l’idée de composer un modèle limité de peptide où il
pouvait faire tourner Les angles φ et ψ de 360°.Pour représenté sur un graphe
les structures secondaires possibles en classées la variation de l’angle Ψ et
en abscisse la variation de l’angle φ, on aura un tableau dont il montre les
plus probables entre ces structure le graphique de Ramachandr an. En plus
en remarque que les acides aminés Gly et Proline sont éliminé parce que
leurs chaines latérales ou aussi l’absence de chaîne, pour la glycine leur
donnent des différentes propriétés.
En effet, la glycine le seul acide aminé sans carbone β, comme
étant L’hydrogène est énormément moins encombrant qu’une chaîne latérale
Carbonée, donc la carte de Ramachandr an pour l’acide aminé glycine
montre plus de confor mations abordabl es que pour plus gros résidu.
Fig32 : Carte de Ramachandran représente des glycines
Ainsi que, Toutes les structures secondaires figurées par les
coordonnées de ce graphe ne peuvent pas s’effectuer par suite de
l'encombrement stérique des atomes voisins. Or, il y a des zones
avantagé es acceptant la composition d'hélices ou de feuillets avec lequel les
angles sont dévisagés habituellement dans les protéines, [20].
Alors, Ramachandr an à réalisé l’analyse de forme sur des tris peptides
et transcrit sur des diagrammes du même nom les valeurs des angles  φ et 
ψ des formes les plus stable, or ces formes ou encore conformations
conviennent à la convergence de plusieurs des différents critères, des
critères de stériques d’encombrement de l’espace et des critères de
répulsion électrostatique entre les liaisons covalentes, ce qui conduit
totalement à un mi nimum énergétique.
Dans ces di agrammes où les deux axe s montrent les angles dièdres f
et y de part et d’autre d’un carbone α, des nombreuses zones différentes
apparaissent, spécialement les zones en hélice α, en brin ß, en hélice
gauche et en triple hélice. Où, Ce diagramme est asymétrique du fait de la
forme L des acides aminés. Quoi que, Les résultat expérimentales acquises
par cristallographie des rayons X ou RMN des angles dièdres sont
régulièrement dans les zones autorisées du diagramme de Ramachandran,
sauf comme on a dit au par avant les glycines ils n'ont pas de carbone
asymétrique, ainsi que les prolines, [22].
4.8. Les différents niveaux d e structure des protéines :
Les protéines sont constitues de lentes chaines polypeptidique et nous
connaîtrons maintenant comment la séquence des acide aminé de ces
chaines peut être définie. Cependant, chaque protéines à une conformation,
qui lui est spécifique, prouvée par d’autres types de liaison peptidique, on
plus de la structure primaire, on affirme que la protéine « native »a une
structure
secondaire, tertiaires même quaternaire dans quelque cas.
Mais avant d’apercevoir ces différentes structures, il faut savoir l’interaction
qui lui rend possibles, [2].
Structure
Primaire
quaternaire
structure
secondaire
structure
structure
tertiaire
Fig33 : les différents niveaux de structure des protéines.
4.8.1 Liaison intervenant dans la structure spatiale des p rotéines,
[2]
:
4.8.1.1 liaisons disulfures ou pont disulfure :
C’est une liaison covalente donc forte qui est placé entre deux acides
amines de cystéine appartenant soit à la même chaine peptidique, soit à
deux différentes chaines.
4.8.1.2 Liaison ionique ou saline :
C’est une liaison électrovalentielle, non covalente donc plus faible, qui est
placé entre un radical chargé positivement et un radiale chargé
négativement, attachant ainsi soit deux parties d’une même chaines
différentes .ce type d’interaction accepte même la liaison entre deux
molécules différentes, or l’ exemple dans les complexes nucléoprotéiques,
entre les acides nucléiques chargés négativement et les protéines basique
spécialement les histones sont chargées positivement.
4.8.1.3 Liaison hydrogène :
La liaison d’hydrogène, c’est une liaison non covalente, se produit
lorsque sont à pr oximité l’un de l’autre, d’une part un atome d ’hydrogène lié à
un azote ou un oxygène, et d’autre part un doublet électronique non partagé
d’un autre azote ou d ’un autre oxygène. Alors ces liaisons sont placées :
ü Entre les C=O et les N-H de la liaison peptidique
ü Entre les radicaux des monomère d’acide amine, et mêle
par exemple le groupement a mide de la glutamine.
4.8.1.4 Liaison hydrophobe:
Quel que nombre d’acide aminé possèdent une chaine latérale
hydrophobe, non polaire tel que ALa, Val, Leu, Phe…, qui ne construit pas
de liaison hydrogène avec les molécules d’eau les quelles s’assemblent
entre elles par des liaisons hydrogène ; or ces chaines latérales ainsi
poussées disposent une aptitude à se reprocher, ce qui autorise ainsi des
interactions entre des parties différents d’une chaines peptidique ces
interaction sont du genr e de forces de Van der waals.
4.8.2 La st ructure primaire :
C’est l’ordre dans lequel sont placés les acides aminés, ou encore la
structure primaire elle coïncide à l’enchaînement des acides aminés dans la
protéine avec les ponts cystéines, car les liaison peptidique ne sont pas les
seules liaison malgré que se sont la base de la structure primaire, en effet,
les protéines sont formes de nombreux chaines polypeptidique différents, or
ces chaines sont unie entre elles par des liaisons secondaires, surtout des
liaison hydrogène et par des ponts di sulfures, [23].
Cette chaîne polypeptidique est dirigée et polarisée parce qu'une des
extrémités de la chaîne présente un groupement NH 3+ terminal libre, quoi
que l'autre extrémité à un groupement COO- libre.
Cα : blanc, C : gri, N : bleu, O : rouge
Fig34 : La structure primaire d’une protéine.
4.8.3 La structure secondaire :
La structure secondaire c’est le deuxième stade d’organisation, [16], le
première correspondant à la succession linaire des acides amines c’est la
structure primaire .En effet, la structure secondaire des protéines découle de
la potentialité de formation de liaisons hydrogène entre l’oxygène du
carbonyle et l’hydrogène de l’azote amide de la liaison peptidique :
—C= O………….H—N—.
Or, l’arrangement de la chaine polypeptidique en une structure ordonnée
peut s’effectutuer selon distincts modèles duquel les caractéristiques ont été
définit avec exactitude par Pauling et Corey [20].les deux structures
secondaires les plus courantes se sont les hélices α et les feuillets β, [14].
4.8.3.1 Les hélices :
Les hélices ont une structure secondaire en conformation de ressort. Bien
que, on peut définir sa forme par le nombre N d’unités peptidiques par tour
d’hélice et par son pas P c’est la distance entre deux tour s de vis, [14].
4.8.3.1.1 L ’hélice α :
La plus part des protéines possédant des régions ont une structure en
hélice α, que l’on peut imaginer couramment comme un enroulement autour
d’un cylindre imaginaire, composent une spirale régulière le pas de vis est de
5,4 A°, avec 3,6 restes d’acides aminés. Or, cette structure est stable grâce à
de plusieurs liaison d’hydrogènes entre les groupements CO et NH des
liaisons peptidique, [23].
En réalité, l’hélice comporte 3,7 monomères d’acide amine par tour de
spire. Ainsi que, les plans des liaisons peptidiques fabriquent entre eux un
angle de 80° environ, note que l’intersection entre les deux plans se retrouve
toujours au niveau du carbone α. Par qu’antre, les chaines latérales sont
dirigées vers l’extérieur et peuvent réagie entre elles ou avec le milieu, [2].
Généralement l’hélice α est toujours une hélice droite, ainsi que310et p
sont droites on va voir ces type dans le paragraphe suivant, [22]. Elle
s’éloigne en sinueux dans le sens des aiguilles d'une montre lorsque on
observe dans l’axe de la chaîne principale, [14].
Alors théoriquement, les acides aminés possédant des angles de torsions
construisant une hélice α sont égaux à –57° pour φ et –47° pour ψ. Mais,
dans les protéines, les angles sont souvent de –62° et -41° respectivement
pour l’hélice α, ce qui autorise à l'oxygène du carbonyle de s’éloigner de l'axe
de l’hélice, [14].
Donc La liaison hydrogène elle est moins linéaire donnant à l'oxygène
l’éventualité de constr uire des liaisons hydrogène concur remment avec l e NH
du monomère en Posi tion i+4 et avec l'eau ou des di fférents donneur s, [14].
Vue la nature des chaines latérales, sont souvent distribuées autour de
l’hélice, on peut soutenir un Qualité hydrophobe si la maturité des chaînes
sont hydrophobes ou amphiphile c'est-à-dire d’un côté Hydrophobe et d’un
autre hydrophile, si les monomères d’une face sont hydrophobes et ceux de
L’autre face hydrophile. Notons que Cette dernière obtention permet
l’assemblage des structures secondaires pour donner la structure tertiaire,
[14]
.
Fig35 : les hélices α.
4.8.3.1.2 Autres structures hélico ïdales :
Des exemples de d’autres structures hélicoïdales qui peuvent exister c’est
Le ruban 2,27, les hélices 310 et Π (4,46 ) On faite, l’écriture 2,27, 310 et 4,46
montrent comment les liaisons hydrogène sont placées le long de l’hélice.
Pour Le chiffre décimal donne le nombre de monomère par tour d’hélice et
l’entier en montre le nombre d’atomes dans l’anneau fermé par la liaison
hydrogène. Si en prend en considération ces notations, l’hélice α est une
hélice 3,613.
Au sein des protéines on trouve rarement des types des hélices autres
que α.
Alors, en trouve aussi d’autre structures tel que quaternaires hélicoïdales elle
existe surtout chez les protéines fibreuses tel que le collagène et la kératine,
qui sont des fibres d’hélices. Notons que la collagène est formé de 3 hélices
tordues les unes sur les autres, et pour la kératine est formée de dimères
c'est-à-dire deux hélices mélangées hélicoïdalement l’une dans l’autre de
manière à ce que les axes des héli ces arrangent aussi une hélice (Coiled coil
rod), [14].
Remarquant, que si on étire une hélice α, de structure hélicoïdale, on
arrive à la structure en feuillet plissé ß, [2].
4.8.3.2 Le feuillet β :
D’autre protéines, ou encore régions de protéines possédant une
forme β, c’est une structure en feuillets consécutifs construisant un angle
entre eux. Ainsi que, cette structure est stabilisée par des liaisons
hydrogène, [23].
Fig36 : exemple d’un feuillet β.
En effet, le feuillet β est une hélice tout à fait spécifique avec un axe
de symétrie d’ordre deux peut être formée avec deux chaines parallèles, ou
deux chaines antiparallèles. Quoi que, dans les deux cas il ya constitution
d’une structure β, plissée en forme d’accordéon, les chaines latérales R étant
périodiquement d’un coté et de l’autre de ruban.Or, la longueur de la liaison
hydrogène dans les feuillets β est en moyenne de 3 A°, tandis que la
participation de la liaison hydrogène à la stabilité de la structure secondaire
est plus élevée, [16].
Fig37 : feuillets plissés β
Parallèles
Fig38 : feuillets plissés β
Antiparallèles
4.8.3.3 Coudes et boucles :
Les coudes β sont des séquences de 4 acides aminés hydrophiles
constituant des plis de 180°stabilisés par une liaison hydrogène, à la surface
de protéines, [23].
Or, on parle généralement d’épingles à cheveux β (β hairpin) parce que
les deux extrémisées sont par allèles entre elles, [14].
Alors, pour les boucles Ω peuvent tenir plusieurs coudes β et possède
l’aspect de la lettre grecque majuscule. En la retrouve compactes parce que
leurs chaînes latérales ont l’aptitude à remplir l’intérieur de leurs creux, [14].
Fig39 : Coudes d’inversion; Reverse turn ou β turn.
4.8.4 Structure tertiaire des protéines :
La structure tertiaire c’est la structure spatiale complète d’une protéine, [23].or, la
chaine polypeptidique déjà arrangée en structure secondaire se replie sur elle même
pour composer une molécule assez compacte, montrant une configuration spatiale
bien déterminée. C’est cette géométrie tridimensionnelle de la molécule qui forme la
structure tertiaire, [24].
Notons que l’on peut trouver dans des protéines des architectures
semblables, avec les mêmes substances de structure secondaire prend la
même place dans l’espace, avec des différentes topologies, c'est-à-dire des
différentes liaisons de ces él éments de str ucture secondaire.
Donc, La structure tridimensionnelle peut être décrite de façon
hiérarchisée, par la catégorie de la protéine (a, b, a/b), l’architecture c'est-àdire la distribution des éléments de structure secondaire, la topologie c'est la
liaison entre les structures secondaires, ainsi que l’homologie de séquences
le squelette Ca des protéines est élaboré par des flèches (brins b) et des
tubes ou des hélices (hélices a), [22].
Fig40 : Exemple d’une présentation en structure tertiaire d’une protéine.
En effet, a partir des chaines latérales, se constitue un certain nombre de
liaisons intermoléculaires, des liaisons covalentes tel que les ponts disulfures
et aussi grand nombre de liaisons de faible énergie : liaison hydrogène,
liaison hydrophobes, liaison salines d’ailleurs on a discuté de ca dans le
paragraphe (4.8.1). Dont ces différentes liaisons donnèrent à la structure
tertiaire sa stabilité. Or, la nature des forces intermoléculaires et leur
importance dans le maintien de la configuration « native » des protéines en
solution serrant discuté en détail dans le chapitre suivant. D’ailleurs, ce sont
ces forces qui mises en jeu dans tout changement de configuration des
molécules protéiques, [24].
4.8.5 Structure quaternaire des protéines :
La
structure quaternaire résulte de l’assemblage de sous unités
protéiques et non protéique, [2] .Or, Les places de tangence entre sousunités sont très analogues à celles à l’intérieur d’une protéine à une seule
sous-unité. Elles comportent des chaînes latérales non polaires
rassemblées, des liaisons hydrogène et quel que cas des ponts disulfure
inter caténaires, [14]. Ainsi que, on peut considérer comme constituant une
structure quaternaire hétérogène une particule virale ou sont liés un acide
nucléique et une protéine, [2].
Fig41 : Exemple d’une représentation en structure quaternaire d’une protéine.
Fig42 : Relation entre les différentes catégories de structures
5. Les types des protéines, [13] :
On distingue plusieurs types des protéines, on peut les classer suivant la
forme, la fonction biologique et selon leur composi tion.
5.1 Classification des protéines suivant leurs formes:
ü Protéines fibreuses ce sont le collagène, élastines et kératine α et ß.
ü Protéines globulaires ce sont l’albumine, globuline et les histones qui formés
d’hélice α et de feuillets ß unis par des coudes ß ou par des pelotes
statistiques.
5.2 Classification des protéines suivant leur fonction biologique :
ü Protéines de structure ce sont, le collagène, élastine et Kératine.
Les enzymes.
ü Protéines contractiles ce sont l’actine et myosine du muscle.
ü Protéines de transport ce sont lipoprotéines c’est les lipides et hémoglobine.
5.3 Classification des protéines suivant leur composition :
ü Hétéroprotéines ce sont des acides amines plusse le groupement
prosthétique qui sont des non protéique lié de manière covalente, dons les
hétéroprotéines sont : chromoprotéines (hémoglobine), phosphoprotéines et
glycoprotéines ….
ü Holoprotéine comporte des acides amines seulement.
6. techniques de séparation des protéines,
[13]
:
Il existe plusieurs méthodes d ’obtention des protéines on le situera.
6.1 Gel de filtration :
Cette méthode est élaborer en fonction de la taille .or, cette technique est
réalisé à l’aide d’une colonne emplie de billes qui constitue de réseau très
fins. On infiltre les protéines par le dessus de la colonne et en observe la
distance qu’elles traversent. Remarquant que les petits protéines sont très
vite attraper par les réseaux des billes et ne descendent que peu plus bas
dans la colonne. Pour les moyennes protéines parviendront un peut plus bas
avant de se perdr e dans les réseaux de bill es.
En fin les grosse protéines seront trop grosse pour entrer dans les
réseaux de billes.ils passeront entre les billes et se apercevront en bas de la
colonne.
6.2 Précipitation suivant leur solubilité :
Cette technique est basée sur les propriétés physico chimique ; on sert
des sels qui vont faire accélérer certaines protéines et pas d’autre. Ainsi que,
On rajoute pour ceci des sels qui vont entre en rivalité avec les protéines sur
l’eau pour établir des liaisons avec une plus grande attirance sur le milieu
aqueux. Donc, les protéines n’en plus assez d’eau et accélèrent. Si en prend
comme exemple 50% de saturation en sel dans le plasma, on remarque que
la globuline précipite mais pas l’albumine.
6.3 Chromatographie d’affinité :
On utilise cette technique, quand il existe un mélange de protéines et que
l’on veut avoir qu’une seule. Donc, on applique le principe d’affinité des
protéines sur une résine ou sur des billes ou fixe un substrat non
métabolisable de l’enzyme. Simultanément on ajoute le mélange de
protéines en le faisait passer dans la colonne, elle se fixer la seul protéine
recherchée, par qu’autre les autre ne font que passer. Âpres on fait changer
le pH pour ôter la protéine de son substrat, que l’on reprit, alors elle est
purifier on utilise l’anticorps caractéristiques, or
ils vont reconnaitre
exactement la protéine pour permettre le dosage de celle-ci (réaction
antigène-anticorps).
6.4 Chromatographie échangeuse d’ion :
C’est une méthode de séparation mécanise, identique de celle des acides
aminés, or on distingue deux phase :
ü Phase stationnaire : formée d’une résine avec des groupements
sulfoniques (SO3-) conçoive des charges négatives le pH est a baissé à 2,
provoquant la protonation des acides amines sous la forme NH3+ qui se
fixent alors sur les SO3-.
ü Phase mobile : ajoutant une plaque mobile avec lequel le pH croit
doucement les protéines vont s’ôter un par un de la résine lorsque le pH de
la phase mobile aura abouti leur pHi, ils arriveront alors sous forme
anionique et seront dégagés de la résine et migreront alors avec la phase
mobile.
6.5 Elect rophorèse :
Cette méthode est baser sur la taille et de la charge. Donc, elle est en
fonction de la construction en acides amines et de leur charge négative,
positive ou nulle.
Or, les protéines vont partir vers la cathode (charge+) ou vers l’anode
(charge-) ou ne pas migre (charge nulle) sur un gel de polyacrylamide, c’est
un tamis dans lequel les grand protéines auront du mal à migrer, quoi que le
trajet est inversement relatif à la taille. En effet, le déplacement alors dépend
alors de la taille. On appliquant la coloration, on persuade le poids
moléculaire affectée par une échelle prévue.
7. Propriétés physiques, chimiques et biologiques des
protéines:
7.1. Masse molaire, [27-2] :
On peut déterminer la masse molaire des protéines à l’aide de la
technique de d’électrophorèse en gel de polyacrylamide avec SDS, (voir
section précédente) ,la technique de chromatographie , et aussi la technique
d’ultracentrifugation .On peut aussi déterminer la masse molaire à la
température et dans une solution de concentration massique par unité de
volume C ,en mesur ant la pression osmotique P :
P (Pression osmotique) = RTC/M
Où R représente constante de gaz parfait.
7.2. Solubilité :
La solubilité des protéines représente leur tendance à se dissoudre dans
l'eau. Cette solubilité est en fonction du pH, de la force ionique et de la
température du milieu, [25] elle est variable. En effet, certaines protéines sont
solubles dans l’eau pure telle que l’albumine. D’autres telles que les
globulines ne se dissolvent qu’en présence de sels neutres ou encore quand
le milieu est légèrement acide ou faiblement alcalin. Enfin, d’autres sont
insolubles telles que les scléroprotéines, [2].
En effet, un grand nombre de protéines sont solubles dans l’eau et les
solutions aqueuses. Or, cette solubilité est en fonction de la composition
ionique du milieu, spécifiquement du pH et de l a force ionique µ, [23] :
Où : Ci est la concentration de chaque ion(électro-valence) et Zi la charge
électrique.
Lorsque la force ionique est faible, les ions ( particulièrement les ions
monovalents) préferent la solubilation en immobilisant les groupes chargés
des proteines. Or, a force ionique forte , c’est l’inverse, les ions contractent à
accelere les proteines.sa se passe tout comme s’il y avait rivalité entre les
proteines et les ions vis-à-vis des molécules d’eau. Ce phenoméne est
nommé le relargage. Donc,la solubilité des proteines en présence de force
ioniques variées se décri t par l’equation :
log S = ß—K’µ .
S : la solubilité des proteines.
µ : la force ionique du milieu.
ß : une constante dépendan t de la proteine et du milieu.
K’ :constante de r elargage.
En général, la solubilité en fonction du pH est représentée par une courbe
en U avec un minimum au voisinage du point isoélectrique. Tout se passe
comme si au pHi la répulsion entre molécules protéiques était minimum, les
molécules visent à construire des accumul ations qui s’accélèrent, [25].
Les solvants organiques, en particulier l’éthanol et l’acétone, accélère les
protéines en les dénaturant. Mais, on peut éviter la dénaturation en agissant
à très basse tempér ature, [23].
7.3. Propriétés électriques, [23]:
Les protéines, formées d'acides aminés, ce sont des porteuses de charges
électriques qui varient en fonction du pH. Quoi que, chaque protéine a un pH
isoélectrique dont la mobilité dans un champ électrique est nulle c’est à dire à
charge électrique totale nulle.
7.4. Sédimentation:
En sédimentation on utilise une solution de saccharose de concentration
progressive vers le fond d’échantillon à la surface. C’est une solution de Séparation
des molécules en fonction de leur densité quand les protéines atteignent le gradient
[23]
correspondant à leur densité,
.
De plus, les molécules protéiques en solution, mise à une centrifugation à
grande
vitesse (60 000 tours / minute), [26].
7.5. Viscosité :
La viscosité d'une solution protéique est sa propriété qui vise à empêcher son
écoulement quand elle est mise à l'application d'une force. En effet, les solutions de
grande viscosité résistent à l'écoulement mais, les solutions de faible viscosité
s'écoulent facilement.
Or, la viscosité des solutions protéiques peuvent être transformé par des
changements de pH, de température et de force ionique. Néanmoins, elle croit en
milieu alcalin car les charges électriques négatives entraînent un déplissement et
une élongation maximale de la protéine, [25].
7.6. Propriétés optiques, [27] :
Les propriétés optiques sont importantes pour l’étude et le dosage des
protéines elles sont en relation avec :
ü la concentration de la solution (absorption, diffusion, indice de réfaction).
ü la forme et la taille la molécule (diffusion).
ü la structure (absorption à 280 nm à présence de monomère d’acides aminés
aromatiques, pouvoir rotatoire).
7.7. Propriétés de la liaison peptidique, [27] :
Dans l’Hydrolyse de la liaison peptidique on a deux types :
ü Hydrolyse chimique totale ou partielle
ü Hydrolyse enzymatique
Réaction du biuret : solution de protéines en milieu alcalin + CuSO 4
coloration violette, ainsi que des interactions des protéines avec d’autres
substances . Or, il ya des
Interactions caractéristiques avec des
macromolécules glucidiques ou poly-osidiques, et entre des enzymessubstrat, antigène-anticorps, hormone-récepteur, et d’une façon générale,
protéine-ligand.
Par contre, il y a des interactions non caractéristiques tel que la fixation sur
des substances minérales telles que phosphate tricalcique et hydrox apatite,
et aussi adsorption de plusieurs colorants tel que le bleu de bromophénol et
bleu de coomassi c.
7.8. Propriétés des chaines lat érales, [27] :
Absorption des chai nes latérales aromatiques à 280nm.
7.9. Propriétés biologiques,
[27]
:
Les propriétés biologique des protéines inclus dans leurs fonctionnement, auquel
Les protéines ce sont des Enzymes, anticorps, antigènes, hormones, protéines de
structures, etc…
8. Relation structure –fonction dans les protéines :
Quand on établir des arbres évolutifs pour les protéines, on distingue qu’il
n’y a pratiquement pas de sélection naturelle, [31]; on voit simplement la
« mémorisation » d’un processus de hasard. Le rôle de la taille de la chaine
peptidique par comparaison avec celle du site actif, c’est particulièrement de
« protéger »ce site des fluctuations thermiques. En effet, le site actif
conserve une géométrie rigoureuse nécessaire à son fonctionnement, une
fois introduit dans une structure, que ne peut être changé qu’au prix d’une
variation importante d’énergie libre, on va traite ça dans le chapitre qui suit.
Autrement, celui-ci ne nécessite pas une particulière de structure
tridimensionnelle mais simplement une structure tridimensionnelle.
Probablement Celle-ci n’est pas résolue par la fonction. Donc, un tel notion
ouvre la voie à la formation de protéines tout a fait nouvelle et admet au
même temps de mieux comprendre l’origine de la vie, [16].
En réalité, La variété des fonctions des protéines provient de la complexité
de la structure
protéique. Or, La structure tridimensionnelle des protéines
est le produit direct d’interactions avec son environnement interne. En effet,
on connes comment sont structurées nous informe énormément sur les
fonctions qu’elles garantissent dans la cellule. Aussi, dans un environnement
aqueux, les chaînes –R hydrophobes s’installent vers l’intérieur de la
protéine. Donc, Des modifications de température ou pH peuvent interagir
avec les liaisons non covalentes, incitant la rupture de la structure
tridimensionnelle et une perte d’activité.
Cette évolution est nommée “dénaturation”, on va traiter ça avec plus de
détail dans le chapitre qui suit. En conséquence, Les protéines dénaturées
peuvent aussi se rassembler ensemble pour qu’elles soient insolubles au
cours d’une évolution (coagulation), [12].
Alors, La fonction particulière d’une protéine est extrêmement liée à une
structure moléculaire bien caractéristique, déterminée par l’installation des
éléments de base (les acides aminés) qui entrent dans la constitution des
protéines, [28].
9. Conclusion :
Les protéines peuvent avoir distinctes structures, qui sont très liées aux
tâches qu’elles assurent dans la cellule, donc elles sont les véritables
macromolécules de la vie.
D’ailleurs Ce sont elles qui vont assur er la grande différence des fonctions
allant de la catalyse des réact ions à la str ucturation de la matière vivante. Or,
La structure des protéines à haute résolution montre les détails à l’échelle
atomique des si tes actifs, [29].
Alors, Les protéines jouent un rôle de premier plan dans la structure et la
fonction de la cellule. Quelques unes des protéines synthétisées par la
cellule définissent sa forme et sa structure. Par contre, d’autres permettent
de reconnaître certaines molécules ou encore sont utilisées comme
catalyseurs pour des réactions chimiques. Par exe mple, les cellules des yeux
et de la langue ne se ressemblent pas et assument des fonctions bien
différentes. Les protéines se constituent d’acides aminés, de nombre 20 et
chacun est doté de propriétés chimiques et physiques spécifiques. Pour
obtenir une protéine fonctionnelle et stable, il faut impérativement disposer
de la bonne séquen ce d’acides aminés, [30].
.
Références :
[1] F.Chapeville & al: « Biochimie », Editions, (1974).
[2] J.H.Weil :« Biochimie générale », Dunod, juin (2005).
[3] G.Champetier, J .Neel & al : « chimie macromoléculaire II », (1972).
[4]. I.Quinkal & I.RhonesApes : « quelques termes clef de biologie moléculaire
et leur définition », septembre(2003).
[5]. Graphics courtesy of the National Human Genome Research Institute, support1notion_biochimie, « rappelles sur le génome ».
[6]. M. Morage : « acide désoxyribonucléique », pour la science, p.96-97,
septembre (2006), & « arrêté de terminologie du 14 septembre », (1990).
[7]. X.Bataille, j anvier(2000).
[8] « Cour ADN Introduction à la biologie moléculaire », www.med.univangers.fr/discipline/bio_cel/Maitrise/Bioinfo/COURS_ADN.ppt
[9]. N.Caram ;« cour de biologie moléculaire », 1er année poste de graduation
spécialité biophysique &t mathé matique, (2007).
[10] M. Herzberg & M. Revel : « Atlas de biologie moléculaire », Herman- Paris,
(1972).
[11] « Synthèse des protéines - Du génotype au phénotype »,
www.bacdefr ancais.net/SVT/biologie_4.php - 14k.
[12] Copyright: IPGRI and Cornell University, (2003), Protéine basics« Les
technologies basées sur les Protéines Notions de base sur les protéines »,
Traduction françai se: Cirad & Sup Agro, (2006).
[13]
www.humans.be /bioch%20acides%20amines.ht,l-127K,[email protected].
[14] Pierre &M. Curie, « modélisation et analyse des protéines », Thèse de
doctorat de l’université Paris 6, Soutenue le 5 mars (2004).
[15] M.Elatyqy,Daffyduke.lautre.net/docs/bi ochimie/biochimie_1.html-13K.
[16].M.Daune : « biophysique moléculaire », inter Editions paris, février (1993).
[17].Danielle et Khanh Lê-Quôc :« Biochimie structurale et Analytique », (19992000).
[18]. Prof : S.Lehmann : « cour. Biochimie : Protides », (2007 /2008).
[19] K.Johnsson :« Cours Chimie Biologique 1 », [email protected],
Semestre d’été(2007).
[20]J.Pelletier :«Le repliement des peptides et des protéines », CHM3331,
AUT(2005).
[21].c .Brnden & J.Tooze : « ed.De Boek Université »,1996.C.B,et
al , « anfensen » ,Pr Proc. Natl. Acad. Sci. USA 47, 1309 – 1314,
1996.Ramachandran, G.N. & Sassi ekharan,V , « "Conformation of polypeptides and
proteins" Adv. Prot.Chem. 28, p 283 – 437,1961, Base de données de st ructures
cristallographiques "Protein Data Bank".
[22] « Structure des protéines », www.lbpa.ens-cachan.fr/bent ley/structure.htm 37k [23].J.Kruh ; « biochimie, études médicales et biologiques », Hermann,
(1987).P95
[24]J.Yion ; « structure et dynamique conformation elle des protéines », Hermann,
(1969).
[25] « Protéines : Acides aminés et peptides »,
www.azaquar .com/iaa/index.php?cible=ca_proteines - 75k –
[26] « Propriétés des protéines et méthode d’analyse »,
www.acreunion.fr/./documentspreparationconcours/biochimie/
[27] « Structure Dimensionnelle des Protéines », PRO
daffyduke.lautre.net/docs/biochimie/biochimie_3.html - 13k [28] V.N’Sondé ; «À la poursuite de la structure moléculaire », transversal,
Avril(2006).
[29] É.Pebay-Peyroula, « Les protéines de transport, garde-barrière des
membranes », institut de France académi e des sciences, juin (2005).
[30]Génome canada : « la génétique et la diversité », nature.ca/genome, IRSC,
CIHR.
[31] Ptitsyn and Volkenstein, (1986).
Chapitre II
Stabilité des Protéines
(Repliement et Dépliement)
1. Introduction :
Les protéines, ce sont des molécules essentielles à la vie des organismes
vivants, et des polymères synthétisés à partir de l’ADN des cellules. Ainsi que, Leur
fonction dépend de leur composition mais aussi de leur structure.
Ces molécules sont formées de longues chaînes linéaires d'acides aminés
(précisément une centaine) ; c’est ce qu’on appelle la structure primaire des
protéines. Si l’on accomplit que 20 types différents d’acides aminés présentent dans
le vivant et que chacun d ’eux peut pr ésenter plusieurs structures différentes, on sai sit
que cette stratégie ait donné lieu à une très grande variété de structures et de
fonctions.
Donc, L’un des points clés contrôlant la structure des protéines est le
processus de repliement menant le polymère linéaire à opter une structure
tridimensionnelle.
ADNTranscription ARN Traduction chaîne polypeptidiqueRepliement Protéine
Alors, La première phase du repliement conduit à la formation de structurestype, nommées structures secondaires, relatif a un nombre restreint d’acides aminés
de 2 à quelques dizaines, duquel les plus connues sont les feuillets b, ou les hélices
a d’ailleurs on a vue ca en détaille dans le chapitre précédent.
Le repliement se poursuit ensuite par l’agencement relatif des structures
secondaires entre elles, [1].
Le repliement des protéines peut être effectué de deux façons différentes
(Freedman, 1992) : l’une informative, comprise dans le code de la séquence et
l’autre mécanique, avec la description de la cinétique et de la thermodynamique des
processus qui exposent l’évolution de la protéine au cour s du repliement.
Or, de plusieurs informations ont pu être déduites des expériences menées in
vitro sur les protéines. Elles sont d ’une importance consi dérable pour comprendre les
règles principales du repliement.
D’après Anfinsen (1973) “toute l’information nécessaire pour obtenir la
conformation native d’une Protéine dans un environnement donné est contenue dans
l’enchaînement des aci des aminés”.
Ceci inspire que le repliement soit sous contrôle thermodynamique (Anfinsen,
Scheraga, 1975).par qu’antre, Tanford (1970) a analysé les constantes apparentes
de vitesse et montre que le repliement des petites protéines constituées de mono
domaine est sous contr ôle thermodynamique, [2].
En effet, on va étudier dans ce chapitre, le processus de repliement et le
repliement inverse de protéines, ainsi que la stabilité, le mécanisme et la
dénaturation des protéines.
2 .Stabilité des protéines et cinétique de repliement :
Une protéine est un hétér o polymère d'acides aminés; les acides ami nés sont
Sélectionnés parmi une petite « chimio thèque » Naturelle de vi ngt composés.
En effet, Le repliement produit une ségrégation de groupes alkanes au cœur
de la protéine et une exposition au solvant des chaines latérales les plus polaires.
Alors, cette ségrégation réduite les zones de contact alkane-eau, qui sont
pénalisants du poi nt de vue
Thermodynamique. On parle de la structure repliée qui est stabilisée par .l'effet
hydrophobe. (Des groupes alkanes).
Par qu’antre, L'état déplié, quant à lui, est stabilisé par le nombre énorme de
conformations dépliées possibles. Ce grand nombre de conformations se interprété,
dans le langage de la thermodynamique, par une grande entropie, préfère l'état
déplié.
Or, en pratique, cela indique que quand la protéine s'écarte fortement de sa
structure native, par exemple à la suite d'un choc avec une autre molécule, elle erre
parmi les états non-natifs pendant un temps élevé, à l'échelle atomique, avant de
retrouver la structure native, [3].
En générale, Il existe un équilibre entre l’état dénaturé D et l’état natif N, et la
stabilité est la différence d’énergie libre ( G) entre ces deux états. En effet,
l’enregistrement d’un paramètre physique de la protéine en fonction de la
température ou de la concentration d’un dénaturant chimique permet d’avoir la
différence des énergies libres de la molécule de la protéine entre les états natifs et
dénatures:
=
-T
= RTln
.
La, H et S correspondent aux changements d’enthalpie et d’entropie
pendant la réaction D↔N, et pour
c’est la constante de l’´equilibre entre les
deux états. Or, pour les petites protéines la stabilité est de l’ordre 5-10 kcal/mol ce
qui est faible par rapport à la stabilité d’une liaison covalente qui est de 50-300
kcal/mol, [4].
Anfinsen a proposé l’hypothèse « thermodynamique » du repliement qui postulait
que la conformation native d’une protéine correspondait à l’´etat dans lequel
l’´energie libre était la plus basse et que, par conséquent, cette conformation ne
d´épandait que de l’ordre des acides amines dans la chaîne (structure primaire), [5].
Et au milieu des années 60, Cyrus Levinthal a pose le problème primordial du
repliement des protéines. Il a démontre que si une protéine devait essayer chacune
des conformations géométriquement tolérables, cela prendrait un temps beaucoup
plus grand par rapport aux temps de repliement observes. Le nombre de
conformations qu’une chaîne polypeptidique peut adopter devrait être égal à
,
avec n le nombre d’acides aminés contenus dans la séquence et m le nombre de
structures possibles pour chaque acide aminé (13 structures secondaires différentes
au minimum), [2].
En effet, si nous admettons que chaque acide amine ne peut opter que deux
conformations (ce qui est bien inferieur à la réalité), donc le nombre de
conformations que peut opter une protéine de 100 acides amines devrait être égal
à
. Le temps minimum pour passer d’une conformation à l’autre étant
s, il
faudrait un temps égal à
secondes ou
années pour essayer toutes ces
conformations.
Alors, ce temps de repliement incertain coïncide à un temps du même ordre
de grandeur que l’âge de l’Univers. On sait bien, que qu’in vitro même in vivo une
protéine se replie en quelques secondes, voire même quelques millisecondes pour
quelque protéines à température ambiante, [6]. Cette énigme se renomme «
Paradoxe de Levi nthal » (Levinthal 1968).
Et pour résoudre le paradoxe, Levinthal a injecté l’idée du chemin de
repliement, il a suppose que la protéine ne cherche pas sa st ructure native au hasard
mais uniquement parmi les structures qui mènent vers un minimum local d’´energie
le plus rapidement possi ble.
Alors, selon Levinthal la structure native de la protéine est définie par la
cinétique et non par la thermodynamique. En plusse, Savoir si le repliement est
déterminé par la cinétique ou par la thermodynamique n’a rien d’´evident. En trouve
Cette quest ion se souvent pour la prédiction des structures tridimensionnelles à partir
de la séquence en acides amines ou pour la création de protéines qui n’existent pas
dans la nature.
Donc la question qui se pose est Quelle structure faut il choisir: la plus stable
ou celle qui est accessible le plus rapidement? Alors, il a été toléré que le repliement
des protéines soit contrôle par les paramètres cinétiques et thermodynamiques.
C’est à di re qu’une protéine recherche sa structur e native qui est la plus stable
au niveau thermodynamique en sui vant un chemin spécifique de repliement, [7].
2.1. Une st abilité marginale :
Généralement, la stabilité des protéines est très liée à leur repliement. Donc,
Les protéines ont besoin d’être dans leur état natif pour être stables. En effet, La
variation d’enthalpie libre de repliement d’un état dénaturé à l’état natif s’écrit comme
la participation de l’enthalpie et de l’entropie.
U
N ou U : état déplié, N : état natif
ΔG = ΔH – T ΔS
Tandis que, les variations d’enthalpie et d’entropie soient grandes, la variation
d’enthalpie libre de l’état dénatur é à l’état natif est la plus part du temps fai ble (-5 à –
15 kcal.mol-1).
Fig. 1 : Les protéines sont marginalement stables « Effets compensatoires ».
Or, Cette énergie est comparable à celle de quelques liaisons hydrogène.
Ainsi que, La diminution d’enthalpie favorable lors du repliement est compensée par
une perte d ’entropie due au passage de la chaîne étendue à une st ructure compacte.
Le terme enthalpique stabilisant la structure comprend les effets
hydrophobes, les interactions de van der Waals et électrostatiques (surtout les
liaisons hydrogène et les ponts salins) et aussi la formation de liaisons covalentes
(les liaisons disulfure). Il est diminué par la perte des interactions qui se trouvent
entre la structure dénaturée et le solvant (effet de dé sol vatation), [8].
2.2. Les effets différents qui influençant la stabilité de la structure native :
En effet, la stabilité des protéines est influencée par un certain nombre de
forces déjà énoncées dans le chapi tre précédent.
Or, les interactions qui stabilisent la structure tridimensionnelle des protéines
sont particulièrement des interactions faibles, non covalentes : interactions
électrostatiques et de van der Waals et effets hydrophobes. Ainsi que, Des
liaisons covalentes sont également mises en jeu par l’intermédiaire des ponts
disulfure, [8].
Fig. 2: Représentes les différents effets qui influence la stabilité d’une protéine.
2 .2.1. Interactions électrostatiques, [8] :
Pendant le repliement, les interactions électrostatiques attractives entre
charges opposées où entre dipôles sont formées et cassées. Leur participation
enthalpique au repliement dépend de la balance entre les interactions crées et celles
qui ont été détruites.
ü Interactions de van der Waals :
Les interactions entre les nuages électroniques de deux atomes adjacents
mènent à la présence d’une force attractive pour des distances de 3-4 A. Ainsi que,
l’énergie de liaison est d’environ 1 kcal.mol-1, ce qui est à peine supérieur à l’énergie
thermique moyenne des molécules à Température ambiante (0,6 kcal.mol-1).
Néanmoins, de par leur grand nombre, ces interactions Jouent un rôle principal dans
la stabilisation de la str ucture des protéines et préfèrent le compactage.
ü Ponts salins :
Quand on regarde ces interactions dans le cas d’acide amine chargés
(négativement pour Les Aspartates, glutamates et l’extrémité C-terminale, et
positivement pour les lysines, arginines, Certaines histidines et l’extrémité Nterminale) on parle de ponts sali ns.
En effet, Le fait que la construction de ponts salins soit un effet stabilisateur
n’est pas évident. Cependant, Phelan et al. Ont étudié par RMN et par des
expériences de thermodynamique le cas d’une protéine en fermeture éclair de 31
résidus et ont montré que la formation de ponts salins a un effet déstabilisateur. Or,
la dé solvatation des chaînes latérales chargées est en effet très défavorable du
point de vue énergétique et n’est pas compensée par le gain des attractions
coulombiennes, [9].
ü Liaisons hydrogène :
Pour les liaisons hydrogène, ce sont le résultat des interactions électrostatiques
(70%) et de van der Waals (30%), elle est entre un atome électronégatif
(généralement un atome d’oxygène ou d’azote) et un atome d’hydrogène, soutenu
par un atome électronégatif.et les deux atomes électronégatifs sont distants
d’environ 3 Å. pour l’énergie des liaisons hydrogène est de l’ordre de 3 kcal.mol-1.
Les acides aminés polaires peuvent aussi composer des liaisons hydrogène
entre eux ou avec des molécules d’eau. Ils se dissolvent alors facilement dans l’eau :
ils sont hydrophiles. Notamment on trouve ces liaisons dans les hélices et les
feuillets, stabilisant ces structures secondaires. Elles permettent aussi de lier les
sous-unités d’une oligomère. Les liaisons hydrogène participent peu directement à
l’énergie de stabilité mais permettent des contraintes favorisant l’état replié des
chaînes pol ypeptidiques, [10].
2.2.2. Effets hydrophobes et solvatation, [8] :
Puisque les composés hydrophobes (c’est-à-dire apolaires) sont peu solubles
dans l’eau aboutissement un effet dit hydrophobe. Or, L’optimisation des liaisons
hydrogène au voisinage des groupements apolaires mène à la formation d’une
enveloppe de molécules d’eau ordonnées autour de ceux-ci.
Donc, cette organisation est défavorable du point de vue entropique parce
qu’elle diminue le nombre de configurations abordables ; les groupements apolaires
ont alors aptitude à se rapprocher les uns des autres afin de limiter la surface de
contact avec l’eau.
Alors, ce fait entropique décrit pourquoi les résidus hydrophobes des
protéines solubles sont regroupés au « coeur » de celles-ci par qu’autre la « surface
» est au contraire essentiellement composée d’acides aminés hydrophiles. Donc Il
n’existe pas à distinctement parler de “liaison hydrophobe”. Et pour quantifier cet
effet, on l’explique comme l’énergie associée au transfert d’une surface hydrophobe
de l’intérieur de la protéine vers un mi lieu aqueux, [11].
Donc, cela inclut les variations d’énergie due aux modifications des
interactions de van der Waals supportées par les groupements hydrophobes ainsi
que les variations d’enthalpie libre (variations d’enthapie et surtout d’entropie)
associées à la réorientation de l’eau.
En effet, les effets hydrophobes et les liaisons de van der Waals sont
responsables de l’agencement (compactage) très dense des atomes au milieu des
protéines. Aussi le repliement est dirigé par les effets hydrophobes et la stabilisation
enthalpique par le compactage.
Pour l’enthalpie libre de désolvatation, l’énergie de transfert pour un résidu
apolaire pour passer du milieu aqueux au sein de la protéine, est de l’ordre de -25
cal.mol-1.Å-2.Or, La distinction d'enthalpie libre de solvatation entre protéine
dénaturée et protéine repliée produit une évaluation empirique de l'effet hydrophobe,
considéré comme la force principale responsable du repliement des pr otéines.
Tendis que, l’enthalpie libre de solvatation peut être calculée
approximativement à partir des surfaces atomiques accostables au solvant et des
paramètres de solvatations atomistiques résolus à partir des énergies libres de
transfert, [12].
2.2.3. Ponts disulfure, [8] :
La formation d’une liaison covalente S-S nommée pont disulfure, due aux
rapprochements des chaînes latérales de deux cystéi nes et leur oxydation.
La plupart des protéines ayant des ponts disulfures ce sont des protéines
extracellulaires, se repliant dans le réticulum endoplasmique (qui est un milieu
oxydant) avant d’être secrétées dans le milieu extracellulaire plus oxydant que le
cytoplasme et ou l e pH et la température sont moins bien surveiller.
En effet, l’énergie de liaison convenant étant d’environ 60 kcal.mol-1, un pont
disulfure suggère une forte contrainte topologique à la chaîne polypeptidique.
Néanmoins, cette énergie ne coïncide pas à l’énergie de formation d’une liaison
disulfure à partir de deux cystéines protéinées.et cette dernière dépend de
l’environnement des deux cystéines touchées. Pareillement, le rôle stabilisateur des
ponts disulfure est discuté. Par qu’autre, si certaines études sur le rôle des liaisons
hydrogène et des liaisons disulfure dans la stabilité thermique, [13], présentent que
celle-ci est favorisée par une plus grande rigidité, il ya d’autres études parviennent à
une concl usion opposée, [14].
3. Cœur hydrophobe, [8] :
Les facteurs les plus importants dans le repliement et la stabilité des
structures protéiques, ce sont Les interactions hydrophobes.
Or, les biologistes réalisent souvent référence à l’appartenance de tel ou tel
acide aminé au cœur hydrophobe d’une protéine pour définit les propriétés de ce
résidu, il n’ya pas de définition ou détermination commun du c œur hydrophobe.
Quelques définitions saisissent en compte la conservation au cours de
l’évolution des monomères hydrophobes « cachés » par qu’autre d’autres ne
s’oppose pas sur une analyse séquentielle, [15].
Et certains algorithmes ont aussi été mis en place pour expliquer le cœur
hydrophobe des Protéines de façon méthodique. Entre eux, un algorithme donné
par Swindells décrit le Cœur hydrophobe comme la collection des monomères ou
résidus ont une accessibilité faible au solvant, appartenant à des régions de
structures secondaires régulières et ou l es chaînes Latér ales non polai res interfèrent
en partie entre elles, [16].
En globale, ces trois propriétés sont en effet servies par les expérimentateurs
pour expliquer le cœur hydrophobe de façon expérimental. En effet, Les monomère
ou résidus appartenant au cœur hydrophobe d’une protéine sont des résidus gardés
dans les familles structurales et jouant un rôle important et considérable pour la
stabilité de la protéine tant au moment de son repliement que dans sa structure
native.
4. Dénaturation des protéines:
Une protéine dans un état non natif est dite dénaturée, donc La conformation
tridimensionnelle (structure primaire, secondaire, tertiaire et le cas échéant,
quaternaire) est le propre d’une protéine native. Cette conformation peut être
troublée, désorganisée sans que soit rompue la moindre liaison peptidique, par
rupture seulement des liaisons qui permettaient à l’édifice de soutenir sa
conformation dans l’espace ; c’est ce qu’on nomme la dénaturation ; elle peut être
incitée par toute une diversité d’agents physique ou chi miques :
ü la chaleur (la coagulation de l’ovalbumine du blanc d’œuf est un exemple bien connu
de dénaturation)
ü les radiations ultraviolettes et ionisantes ;
ü les variations de pH :
Certains acides (nitrique, trichloracétique, perchlorique, etc.)Et certains
solutions acides de métaux lourds (Hg, Pb) sont utilisés en analyse biologique
pour rejeter des protéines du milieu (sang, par exemple) ; ce sont des
déprotéinisants ou défécants .
En effet, le dépliement des protéines peut se faire en augmentant ou diminuant le
pH du milieu. Or, le pH influence la protonation et les charges des groupements
chimiques. Généralement, le changement de pH augmente les forces
électrostatiques répulsives, [8].
ü Les détergents :
Les détergents ce sont des molécules amphiphiles duquel la tête polaire reste
en contact avec l’eau et la queue apolaire interfère avec les chaînes protéiques.
L’ajout de déter gents dans le milieu dénature l es protéines en effaçant la stabili sation
due aux effets hydrophobes au sein de la protéine. Or, les solvants organiques
solubles dans l’eau telle que l’éthanol ou l’acétone font en général précipiter les
protéines de par les effets hydrophobes, [8].
ü les solvants organiques (sauf à une température inférieure à 0°C) ;
ü les solutions d’urée ou de guanidine :
La dénaturation avec l’urée ou l’hydrochloride de guanidine ,se fait par la
création de liaisons hydrogène entre le dénaturant et la protéine. Alors, ces liaisons
pouvant être plus abondantes dans l’état dénaturé, celui-ci est stabilisé par rapport à
l’état natif. En général, la protéine reste soluble mai s dépliée.
ü La température :
En général, il suffit d’un petit écart de température pour dénaturer les protéines
car la
Différence d’enthalpie libre entre la structure native et les structures dénaturées est
facilement abordable.
La formule de l’enthalpie libre de dépli ement (N <=> U) en fonction de la température
est la suivante : ΔG= ΔHref −TΔSref + ΔCp ( (T –Tref ) −−T ln ln(
))
Dont Δ Href et Δ Sref les valeurs respectives de l’enthalpie et de l’entropie du
dépliement à la Température de référence Tref. Où Δ Cp est la variation de la
capacité cal orifique entre l’état natif et l’état dénaturé.
En générale, les protéines se déplient si on augmente la température et que
certaines protéines se dénaturent ainsi à basse température. Aussi, les protéines ne
sont stables et fonctionnelles que dans une petite fourchette de température
(habituellement de quel ques dizaines de degrés d ’amplitude), [8].
ü La pression, [8]:
Le dépliement sous pression hydrostatique est une méthode réversible de
dénaturation qui peut être combinée avec l’ajout d’un dénaturant, [17].alors, une
pression haute about isse le dépliement des pr otéines car le système pr otéine-solvant
de l’état dénaturé occupe un
Plus petit volume que celui de la forme native. Or, Cette approche autorise une
compréhension sur l’origine de la modification de volume observé lors de la
dénaturation (qui est de l’ordre de 1%). Aussi l’étude des cavités de la nucléase du
staphylocoque montre que les effets de Volumes évincés dans les protéines sont la
raison capitale du changement de vol ume lors du dépliement, [18].
ü Nano manipulations (exerçant une force externe sur la protéine), [8].
ü la simple dilution ou la simple agitation peuvent aussi provoquer la dénaturation des
protéines, ce qui est fort gênant lorsqu’on veut purifier une protéine.
En effet, la dénaturation est parfois irréversible (par exemple dans le cas de la
coagulation de l’ovalbumine), parfois réversible, et il convient de voir ce qui se passe
lors de ce processus. Or, il ya passage d’un état hautement ordonné à un état moins
ordonné ; il ya un accroissement de l’entropie (l’entropie est une mesure de la
probabilité d’existence d’un état, or sont les états les moins ordonnés qui sont les
plus stables).
A l’état natif, du point de vue énergétique la protéine a la conformation la plus
stable dans les conditions intracellulaires ;si on modifions ces conditions , la
conformation de la protéine va être altérée ;il y aura rupture des liaison hydrogène et
des autres liaison secondaires que nous avons étudiées , désorganisation des
structures secondaire et tertiaire avec , par effets, une sensibilité accrue aux
enzymes protéolytiques, une augmentati on de la réactivité de certains groupements,
qui étaient soit engagés dans des liaisons secondaires, soit inabordables, et surtout
une perte des propriétés biologiques (spécifiquement dans le cas des enzymes) , [19].
En générale, toute conformation de protéine est associée un niveau d’énergie
libre, or L'état natif d'une protéine est l'état dans lequel cette énergie est minimale,
[20]
.
Fig. 3 : Une protéine mal repliée peut
Encore retrouver sa conformation correcte.
Fig.4 : Dénaturation et renaturation
spontanée d’une petite protéine.
5. Repliement des protéines :
Le repliement est le passage d’une chaîne d’acides amines vers une structure
tridimensionnelle native bien déterminée et permettant à la protéine d’appliquer sa
fonction biologique. C’est la dernière étape de l’emploi de l’information contenue
dans l’ADN. Or, La structure native est totalement prédéfinie par l’ordre des acides
amines dans la chaîne polypeptidique, [7].
En effet, Le passage de la structure primaire à la structure tertiaire se fait par
un processus physique appelé repliement, donc, Le r epliement des protéines est un
processus purement physique, [20], bien que Le mécanisme exact qui conduit le
repliement des pr otéines soit toujours une énigme.
Repliement
Fig. 5 : Représentation explicite et implicite de l’eau et simulation du repliement.
Une conformation dénaturée (à gauche) et repliée (à droite) de la petite protéine Trpcage.
La question –comment une chaîne d’acides amines opte-t-elle une structure
fonctionnelle? - reste un des problèmes capitaux de la biologie structurale et
cellulaire. Le séquençage des génomes fait des dizaines de milliers de séquences
d’acides amines correspondant à des différentes protéines. La cristallisation de
toutes ces protéines est impossible, de ce fait, la connaissance du code de
repliement pourrait être très nécessaire pour la prédiction de structures
tridimensionnelles des protéines à partir de leur séquence en acides amines. La
solution à ce problème se retrouve à la frontière de la biologie avec la physique et l a
chimie, et concer ne les expérimentateurs autant que les théoriciens, [7].
Alors, La conformation la plus énergétiquement stable (la plus probable) d’une
protéine est celle avec l’énergie libre la plus basse. Or, La distinction d’énergie libre
provient de l’équilibre entre les interactions qu’une protéine place avec elle-même
dans sa conformation native (repliée) et celles qu’elle établit avec le solvant dans sa
forme dénaturée (dépliée). Donc, Si les interactions qu’une protéine établit avec ellemême dans sa conformation native sont plus propices, cette forme sera la plus
vraisemblable.
ü L’entropie : La perte d’entropie conformationnelle (perte du désordre) est la force la
plus défavorable qu’une protéine doit vaincre lors de son repliement et pour rester
sous sa conformation repliée.
ü L’enthalpie : généralement le repliement donne lieu à une enthalpie favorable (baisse
d’enthalpie) grâce à la composition d’interactions stables de type électrostatique,
composition de ponts d’hydrogène et d’effets hydrophobes, [21].
Par qu’autre des nombreux structures secondaires classiques des protéines ont
pu être isolées dans la relâchement présentant bien le caractère essentiel de leur
repliement, y compris en dehors de tout environnement biologique. Ce pendant, ces
structures ont été déf inies avec une pr écision bien meilleure qu’en phase condensée,
acceptant de mettre à jour les interactions subies par chaque groupement NH dans
chacun des accorderais observés: une échelle de force des distinctes interactions
existent dans ces systèmes a pu êtr e établie.
ü Les coudes b, responsables du repli des chaînes des protéines sur elles-mêmes,
sont déjà observés dans les petites chaînes à deux acides aminés malgré la rivalité
avec les formes dépliées. Or, Ils sont définis par une liaison H relativement faible et
doivent leur stabilité relative à un faible niveau de contrainte du squelette.
ü Les hélices 310 se forment viscéralement dans les petites chaînes comprenant trois
acides aminés : cependant, elles sont très souples et sont en compétition avec des
formes voisines. Cette compétition peut être étonnamment influencée par des
interactions mineures entre les chaînes latérales et le squelette, comme les
interactions NH-aromatique.
Une telle approche est complémentaire de la simulation par dynamique moléculaire,
[1] se qui en vas traites dans les modèles du processus de repliement.
Fig.6 :(repliement) La protéine assemblée se replie pour former une structure tridimensionnelle
précise.
En générale, lorsque Une protéine commence à se replier alors qu’elle est
encore en train d’être synthéti sée. Et les informations essentiel les à toutes les étapes
de la maturation des protéines sont possédées dans la séquence d’enchaînement
des acides aminés.et quand une protéine se replie en une structure compacte, elle
enterre la plupart de ses résidus hydrophobes dans son centre.et durant le
repliement Il se forme de plus un grand nombre d’interactions non covalentes entre
différentes parties de la molécule.
En effet, Le type de repliement final opté par la protéine correspond à la forme
de plus faible énergie libre.et Les molécules chaperons facilitent le repliement de
nombreuses protéines, [22].
6. L’Aspect cinétique et thermodynamique du repliement :
Il apparaitre que l’on puisse poser l’hypothèse que les mécanismes qui
orientent le repliement des protéines globulaires sont sous contrôle mixte : cinétique
et thermodynamique.
Ce pendant, le postulat de Levinthal peut aussi être revu en termes de
paysages énergétiques (Energy Landscape ) par l’idée de repliement en entonnoir
(Folding b F u n n e l) présenté par le groupe de Wolynes et repris plus récemment
par Chan et Dill (1998). Dans cette idée, les auteurs décrivent la attitude
thermodynamique et cinétique de la transformation d’un ensemble de structures
correspondant à l’état dénaturé d’une protéine vers son unique état natif (Figure 7).
Fig. 7 : diagramme représente le Repliement en entonnoir schématique d’une protéine. La largeur de
l’entonnoir représente l’entropie, la profondeur, l’énergie—“Folding funnel” of a pro tein. WIdth and
depth respectively represent entropy and energy.
Bien que, le repliement de la structure améliore vers l’état natif, le nombre de
conformations à parcourir diminue. Or, Le processus qui mène la structure de l’état
initial (structure aléatoire) vers l’état final de la protéine (état natif) est exergonique.
De fait, Une variété très élevé de comportements de repliement apparaîtrait de ce
paysage énergétique (Figure 7), elle dépend des paramètres énergétiques et des
conditions expérimentales. Wolynes et al(1995) ont inspiré que la vitesse du
repliement est diminuée par la présence de puits intermédiaires sur la surface
énergétique.
Donc, Chaque puits coïncide à un minimum énergétique local peuplé par une
population d’intermédiaires “stables”. Ainsi que, Les auteurs décrivent que la
descente vers le fond de l’entonnoir s’accompagne d ’une diminution de l’entropie de
la chaîne polypeptidique. Alors, Plus la pente est raide, plus le repliement sera rapide.
On permet à l’heure actuelle que le repliement de la Structure 3-D de la plupart des
protéines est sous contrôle thermodynamique et que l’état natif est atteint grâce à la
constitution d’intermédiaires partiellement structurés dont la formation est sous
contrôle cinétique, [23-2].
Fig. 8 : a) Paysage énergétique plat de type trou d’un terrain de golf correspondant au Paradoxe de
Levinthal b) paysage énergétique présentant un chemin de repliement de A vers l’état natif N. c)
paysage énergétique idéal qui guide les conformations vers la conformation native N d) paysage
énergétique pour lequel il existe un repliement rapide de A vers N et un processus lent de B vers N
avec un état intermédiaire transitoire.
En générale, Pour résoudre ce paradoxe dit de Levinthal on pouvait penser
que durant son repliement la protéine opte une suite de conformations ou d’états
intermédiaires formons le chemin de repliement (Figure 8b).Or, Ces intermédiaires
pouvant être ainsi bien des intermédiaires productifs, le long du chemin, que non
productifs, des impasses. A partir des années 95, cette représentation du chemin de
repliement a été favorite à un autre vue dite « new view ». Sont alors inclus les
notions de paysage énergétique ou d’entonnoir de repliement (Figure 8).alors, L’axe
vertical représente l’énergie interne de la chaîne polypeptidique.et Les axes
horizontaux représentent les conformations de la chaîne. L’extension le long de ses
axes montre le nombre de conformations abordables. Pour l’état natif ce nombre est
réduit (le bas de l’entonnoir) et plus les états sont dépliées plus le nombre d’états
conformationell accessibles est grand et l’entropie conformationnelle élevée.
Cependant le paradoxe de Levi nthal apparaît alors comme une questi on mal posée.
Bien que, Le paradoxe de Levinthal comprend le repliement comme une
recherche conformationnelle dans un paysage énergétique plat (Figure 8a). Le
paysage énergétique peut être plus ou moins complexe. Donc, un paysage
énergétique complexe mènera à la présence de chemins de repliement multiples et à
une cinétique de repliement complexe (Figure 8d), [24].
7. Approche théorique pour l’étude de repliement des protéines :
Pour étudier théoriquement le repliement des protéines, il existe plusieurs
approches.
Une première approche pour l’étude théorique des protéines est d’apercevoir cellesci comme des hétéros polymères, c’est à dire des polymères, duquel les acides
amines sont tirés dans un assortiment de nombreux types de résidus nommés «
lettres ».
La représentation des protéines en tant qu’hétéro polymères fait suite à l’approche
développée dans les années 1960, qui était surtout biochimique. Or, Les
scientifiques désiraient savoir la structure détaillée de chaque protéine.
Donc, Quelle est la différence essentielle entre un homopolymère et un hétéro
polymère ?
Alors, L’énergie d’une conformation compacte d’un homopolymère dépend
surtout du nombre de contacts de la chaîne avec elle-même, et est donc semblable
pour des chaînes avec même nombre de contacts. Donc, Les minima d’énergie libre
possédant complètement la même valeur. Par qu’autre, pour les hétéro polymères,
la situation est distincte, suite de la diversité des interactions entre les résidus.
En effet, un petit décalage de la moitié des résidus, par exemple, va inférer
une redéfinition des interactions et conduit à une énergie distincte. Donc, Les
minima d’énergie libre obtiendront des val eurs très diverses.
Alors, Une approche théorique intéressante est d’exploiter cette diversité des
interactions pour relier le repliement des protéines à la physique des systèmes
désordonnés. On va prendre deux exemples de modèles décrivant les hétéros
polymères comme des systè mes désordonnés.
7.1. « Rando m Energy Model » et Protéines,
[25]
:
7.1. 1. Le Random Energy Model (REM):
Le modèle de Random Energy Model (REM) est introduit par Derrida en 1980.
Donc, Le REM peut être aperçu comme la limite du modèle d’interactions à p spins
pour p
Tendant vers l’infini. En effet, C’est un modèle très simple, qui a le privilège de
pouvoir être résolu analytiquement. Al ors, Les hypothèses sont les suivantes :
On considère un système de N spins à 2N états, dont les énergies sont d’une
part indépendantes les une des autres, et d ’autre part tirées avec une loi gaussienne.
Le nombre d’états d’énergie comprise entre E et E+dE est en moyenne sur le
désordre :
[
]µ
exp(-
) =exp( NLn g -
)
(1)
Si on prend la limite thermodynamique N tend vers l’infini, on constate que le nombre
D’états termes d’énergie supérieure en valeur absolue à une énergie critique
=
est nul .
Comme les flottements autour s de n(E) sont d’ordre
, qui est grand pour les
Énergies plus petites que E0, donc, on peut approximer l’entropie moyennée sur le
désordre par
[ S(E) ]=
[ln n(E) ] _
ln[ n(E)] .
Donc L’entropie a la forme donnée en figure 9. Ensuite On utilise la relation
=
pour trouver la température, qui s’interprète donc comme L’inverse de la
pente de la courbe de la figure 9.alors, à température infinie, le système a une
énergie nulle, l’entropie est maximale. Et quand T décroît, l’énergie décroît. Et
Lorsque T abouti la valeur T0 correspondant à l’énergie –E0, l’entropie devient nulle,
le système choisit un état de basse énergie et y reste bloqué ainsi pour les
températures inférieures à T0.
Fig.9 : Entropie pour le Random Energy Model .
7.1.2. Application naïve au cas d es hétéros polymères aléato ires :
A fin d’adapter ce modèle aux hétéro polymères, nous prenons à la place
des N spins N Acides aminés qui peuvent avoir conformations. Et Chaque acide
aminé a z voisins.
Donc, On suppose que les énergies d’interaction ont une moyenne <U> et un écart
type . En réalisant ces hypothèses, on oublie la connectivité de la chaîne (ceci ne
donne pas forcément des mauvais résultats, aussi les exposants de Flory sont une
excellent estimation des exposants des polymères).d’ailleurs, On a de plus supposé
qu’il y a suffisamment de « lettres » (types d’acides aminés) pour que distincts états
soient d’énergie indépendantes les uns des autres. En exécutant le même
raisonnement qu’avant, on trouve la présence d’une énergie critique
= - Z<
>+
, et donc une t empérature critique
=
.
En dessous de cette température, le polymère est dans une conformation
d’entropie nulle, et choisit un des états de plus basse énergie (pas forcément l’état
natif).
Donc, la pr otéine est gelée et mal repliée pour T<T0.
À présent Supposons qu’il existe un état natif en plus des états du spectre continu.
Alors, Cet état devrait posséder une énergie basse –EN, et une entropie nulle. Alors
il devient
Thermodynamiquement favorable quand l’énergie libre correspondant à la phase
désordonnée Devient plus haute que –EN, ce qui se produit à une température Tr
que l’on peut lire et voir Graphiquement sur la figure 3. (r signifie repliement dans Tr)
Fig. 10 : Détermination graphique de la température de repliement.
Donc, dans ce modèle, la protéine se replie pour des températures T vérifiant
T0<T<Tr. Et La gamme de température pour laquelle le repliement est favorable est
donc [T0, Tr]. Cette gamme est d’autant plus grande que le gap d’énergie E est
grand, ce qui se voit assez intuitivement sur la figure 3 ( E est la différence entre le
plus bas niveau du spectr e continu et l’énergie de l’état natif, (figure 3).
L’importance de la taille du gap apparaît avec ce modèle simple, Marquons
que le
Gap est ici introduit artificiellement. Dans le cas d’un hétéropolymère aléatoire, EN
est de l’ordre de E0, donc Tf est proche de T0 et le polymère ne trouve son état
fondamental que pour une petite gamme de température : un hétéropolymère
aléatoire ne se replie pas.
C’est un résultat que l’on pouvait attendre : en effet, on peut supposer que l’évolution
trie des séquences qui se replient bien, cela signifie qui ont un état fondamental
d’énergie bien plus basse que la plus basse éner gie du spectre continu.
En effet,Le fait d’inclure artificiellement un état natif de basse énergie est fait
un peu plus clairement dans l’analyse de Bryngelson et Wolynes (1994), où ils
considèrent des acides aminés possédant un état natif de basse énergie et m autres
états non natifs. Ainsi que, Leur Hamiltonien comprend les énergies des structures
primaires, secondaires (inbteractions de proches voisins sur la chaîne) et tertiaire
(interactions à longue portée). Ils citent un principe de frustration minimale, selon
lequel l’énergie de toutes les structures (primaires, secondaires, tertiaire) est
minimisée pour l’état natif.
Or, Le nombre d’acides aminés dans l’état natif est noté N0. L’hypothèse
réductrice est encore du type REM : à N0 fixé, les énergies des états sont
indépendantes. Et il existe Un point important est que l’énergie de ces états nat ifs est
pris en compte pour expliquer une statistique effective (gaussienne) pour E(N0).
Alors, L’énergie libre est calculable, et l’on différencie les phases bien pliées
(N0=N) des phases non pliées ; ainsi que les phases vitreuses d’entropie nulle. Dans
celles-ci, la protéine est gelée dans les états de basse énergie, mais non forcément
dans l’état natif.
7.1.3. Le p aramètre d’ordre pertinent :
Contemplons le modèle suivant, qui compte un coût ou gain d’énergie pour
chaque
contact:
H=
(2)
Alors, On suppose que les =
, )sont tirés suivant une loi gaussienne,
et on veut Cal culer l’énergie libre moyennée sur la confusion (parce qu’elle est « sel faveraging », à la différence de Z ).
En effet, l’emploi de la méthode des répliques fait apparaître des puissances
de la fonction de partition Z. donc, l’intérêt de la méthode des répliques ici est de
faire apparaître un paramètre d’ordre pertinent. On écri t :
(3)
Et on acqui ert après avoi r effectué des intégrales gaussiennes :
=
(4)
Alors, Ceci fait apparaître un Hamiltonien effectif pour les répliques, qui
contient le paramètre d’ordre :
(5)
Ce paramètre d’ordre calcul le nombre de contacts communs aux chaînes alpha et
beta.
S’il est nul, alors c’est que la phase est désordonnée. Nous ne nous étalerons pas
plus sur le
Traitement de ce pr oblème compliqué.
7.2. Cinétiques de repliement des protéines,
[26]
:
7.2.1 Repliement : cinétique de 1er ordre réarrangement intramoléculaire :
À l’équilibre les passages conformation elles, sous l’effet de distincts
dénaturants, pour des domai nes simples sont généralement du type tr ansition à deux
états :
En prend, Modèle mis en évidence pour 20 p. protéines, pas d’état intermédiaire
stable ;
A l’équilibre est :
;
;
8. Modèles pour l’effet de repliement, [7] :
L’effet de repliement de plusieurs protéines a été étudié à ce jour et il paraître
que d’un côte le processus de repliement pour une protéine peut être différent d’une
autre, mais dans le même temps quelques particuliers communs peuvent être
reconnus. Alors, Trouver un mécanisme du repliement sa veut dire répondre aux
questions suivantes: quelle force conduit le repliement, et quel est l’ordre d’apparition
des différentes structures au cour s de l’effet?
8.1. L’effondrement hydrophobe :
Certains modèles théoriques de repliement des protéines ont été proposes.
Quelque d’eux ont été affirmes par l’expérience. Donc, Ces modèles avouent plus ou
moins bien pour expliquer le repliement d’une protéine ou l’autre, [27].cependant, Le
modèle d’effondrement (collapse) hydrophobe suppose que le premier événement du
repliement est la formation d’un cœur hydrophobe, ayant lieu avant la formation des
structures secondaires (Dill 1990)on a parler de ça dans le paragraphe 3 . Il a été
prédit par Kauzmann des 1959, qui a postule que le “ collapse hydrophobe » est la
force conduisant le repliement des protéines (Kauzmann 1959). Alors, les
interactions hydrophobes sont parmi les indispensables facteurs de la stabilité d’une
protéine. Elles apparaissent car les groupes non polaires de la protéine ont une
aptitude à éviter les contacts avec les molécules d’eau, en constituons un noyau
hydrophobe. Cela conduit à une diminution de l’´energie libre du système protéinesolvant grâce à l’accroissement de l ’entropie du solvant (Fersht 1999).
8.2. Le modèle de nucléation-propagation :
Ce modèle de nucléation- propagation à été propose pour expliquer les
premiers résultats sur la cinétique du repliement de la ribonucléase A. Il sollicite que
le repliement enferme une étape de nucléation suivie par une propagation rapide de
la structure. Or, L’´etape limitant est le processus de nucléation. En effet, après des
études cinétiques plus récentes, il à été remplace par le modèle de nucléationcondensation propose par Fersht. Ce modèle propose la composition de noyaux
locaux stabili ses par des interactions éloignées , [28].
8.3. Le modèle de diffusion-collision :
Le modèle de diffusion-collision a été développe par Karplus et Weaver en
1976 et a été reconsidère en 1994 à la lumière de données plus récentes (Karplus &
Weaver 1976 & 1994). D’après ce modèle, le repliement débute par la nucléation
simultanée en nombreux endroits de la chaîne polypeptidique. En effet, cela conduit
à l’organisation de microstructures qui diffusent et s’associent dans la molécule pour
constitues des sous-structures avec la conformation native. Ces microstructures
possèdent une durée de vie contrôlée par la diffusion, alors, le repliement d’un
polypeptide de 100-200 acides amines peut se passer en un temps très court, moins
d’une seconde. D’après ce modèle le repliement se passe à travers quelques étapes
de diffusion-collision.
8.4. Le modèle « Framework » :
Ptitsyn a propose un modèle tout à fait différent qui porte le nom de «
framework », signifie, modèle de charpente. Il suggère que la protéine se replie à
travers quelques intermédiaires, chacun ayant un nombre plus grand de structures
natives (Ptitsyn & Rashin 1973; Ptitsyn et al. 1990). Donc, ce modèle présume
l’existence d’au moins deux intermédiaires: un avec une structure secondaire
flottante autour des hélices et feuillets déjà formes et l’autre plus stable avec la
structure secondaire et la forme native (charpente) mais sans interactions tertiaires
caractéristiques. Alors, quand les structures tertiaires natives sont formées la «
construction » de la protéine est finie.
8.5. Le modèle hiérarchiq ue :
Le repliement séquentiel et hiérarchique a été ainsi propose par Baldwin et il
a été admet pendant des années (Baldwin 1975; Kim & Baldwin 1982). D’après ce
modèle de nombreux segments de structures sont conformations et assembles à
différents niveaux suivant un chemin seul de repliement. Alors, dans ce modèle la
nucléation est suivie par la formation des structures secondaires, puis tertiaire et
enfin quaternaire.
8.6. Le modèle « Jigsaw Puzzle » :
Le modèle du “Jigzaw Puzzle”, [29] considère le repliement comme un
assemblage en puzzle avec l’existence de nombreux chemins conduisant à une
seule solution. C’est une nouvelle approche par ce qu’on à longtemps postule que le
repliement suit un unique chemin.
8.7. Le modèle de « l’entonnoir énergétique de repliement » :
On a vus ce modèl e dans le paragraphe 6.
8.8. Les modèles expérimentaux de repliement :
Le schéma global de la réaction de repliement est le suivant: D→I1→. . . .
→In→N, ou D est l ’´etat entièrement dénatur e, I1, . . . In sont les états intermédiaires,
n peut être égal à zéro, N est l’´etat natif. Aussi, le repliement d’une protéine peut se
passer en une seule étape, ou en nombreux étapes avec l’accumulation
d’intermédiaires stables.
8.8 .1. Le repliement à deux états :
Longtemps, Les expérimentateurs ont pense que le repliement des protéines
se passait d’après le principe du « tout ou rien », sans formation d’intermédiaire
stable. Mais, après il a été découvert que sur le chemin de repliement il peut
subsister des intermédiaires stables qui diminuent le nombre de conformations
abordables et ainsi accélèrent le repliement. Alors, Les chercheurs ont essaye de
trouver de tels états dans le repliement de toutes les protéines. En fin, il à été admet
que le repliement des petites protéines de moins de 100 acides amines se passe
sans l’accumulation d’intermédiaire et qu’il soit dans la plupart des cas beaucoup
plus rapide que celui des plus grosses protéines. Dans ce cas seuls l’´etat initial
(natif) et l’´etat final (dénature) sont observes.
En si concerne les petites protéines, les structures tertiaires et secondaires se
forment concurremment, et le modèle de nucléation-propagation expose bien leur
repliement. Or, la cinétique du repliement à deux états peut être décrite avec la
théorie de l’´etat de transition utilisée en chimie-physique. D’après cette théorie la
vitesse du repliement est limitée par l’´etat de transition qui est le moins stable de
tous les états et pour cela ne peut pas être observe. Donc la vitesse de repliement
dépend de la barrière énergétique qui existe entre l’´etat dénature et l’´etat de
transition. Cependant, récemment il a été prouve que la vitesse de repliement des
petites protéines est reliée avec leur topologie, spécialement avec la distance
moyenne entr e les résidus en interaction, [30].
D’après les études expérimentales il est incontestabl e que les interactions
locales se forment plus vite que les interactions non locales. Or, le rôle important de
la topologie de l’´etat natif s’explique facilement si on prend en compte le grand cout
entropique de la formation des interactions à plus longue distance. Alors, l’explication
thermodynamique suivante a été proposée: « Quand les résidus qui interagissent
sont proches dans une séquence, le cout entropique de l’organisation de la chaîne
est partiellement compensée par la formation du contact plus tôt dans le repliement,
ce qui mène à une barrière d’´energie plus petite”, [31].
8.8.2. Le repliement à plusieurs états :
Le repliement de protéines qui tiennent plus de 100 acides amines passe
généralement par l’accumulation d’intermédiaires visibles. Or, ces intermédiaires
peuvent apparaitre quand la phase prématuré du repliement en quelques
millisecondes. Donc, à cause de cette rapidité il est très difficile de suivre leur
formation. De ce fait, les techniques classiques de mélange rapide (“stoppedflow”,“continuous flow” et “quenched flow”) permettent d’enregistrer les événements
de l’ordre de quelques Dizaines de millisecondes. Cependant, Les événements ultrarapides sur des temps inferieurs à la milliseconde peuvent être suivis par des
techniques récentes de sauts en température classiques ou associes à un laser
infrarouge, de transfert optique d’´electron ou encore de flux continus, [32].
Malheureusement ces nouvelles techniques ne sont pas encore faciles
d’accès et possédant beaucoup de limitations. Par conséquence, elles ne sont pas
encore largement utili sées.
En effet, le modèle du collapse hydrophobe et les modèles de repliement
hiérarchique montrent bien le repliement de ces protéines. Or, le premier état
intermédiaire qui est accumule après les premières Millisecondes de repliement, à
une compacité proche de celle de l’´etat natif et les résidus hydrophobes sont alors
partiellement protèges du solvant. Une autre particulier de cet état est la présence
d’une quantité de structure secondaire comparable à celle observée dans l’´etat natif,
et l’absence de la structure tertiaire. Donc, ces particuliers expliquent l’´etat molten
globule (globule fondu) détecte dans les premiers étapes de toutes les protéines de
plus de 100 acides amines.
Ainsi que, D’autres intermédiaires peuvent être détectes au cours du
repliement de ces protéines. Ces Intermédiaires peuvent se trouver sur le chemin
conduisant de l ’´etat dénaturé vers l’´etat natif ou être en dehors de ce chemin. Or, si
un intermédiaire se trouve sur le chemin principal du repliement, il peut tenir des
structures natives partiellement formées, le taux de structures natives dépendant de
la localisation de ces intermédiaires sur le chemin du repliement, [33] .Plus
l’intermédiaire est proche de l’´etat natif, plus il contient des structures natives. Si
l’intermédiaire se trouve en dehors du chemin de repliement, il peut alors tenir des
structures non nat ives qui devront être défaites avant de for mer les structures natives
et aboutir l’´etat natif. Ces intermédiaires qui se trouvent en dehors du chemin de
repliement sont souvent propices à l’agrégation de la protéine. Donc, Il peut exister
une compéti tion cinétique entre un repliement correct et une agr égation, [34].
La dernière étape du repliement de ces protéines consiste en la formation et
l’organisation finale des structures tertiaires à partir des structures possédées dans
les intermédiaires. Or, cette étape peut être lente et limitant pour la vitesse de toute
la réaction. Cette phase tient aussi l’isomérisation des prolines, l’assemblage des
domaines dans les protéines multi-domaines et des sous-unités dans les protéines
multimarques. Il a et prouve que le repliement des protéines multimarques se passe
selon des différents schémas qui dépendent de la protéine, [35]. Pour certaines
protéines, les sous-unités se replient de manière autonome et coopérative, puis
s’associent [30] (Vita et al. 1989).Et pour d’autres protéines, les domaines se
replient concurremment puis s’associent, [36].
Généralement, les domaines isoles se replient plus vite que lorsqu’ils sont
intègres dans l’ensemble de la protéine, [37].
9. Caractérisation des différents états impliqué dans l’effet de
repliement, [7] :
9.1. L’´etat natif :
L’´etat natif de la protéine est sa forme fonctionnelle ou opérationnelle, en
biochimie. Il peut être obtenu Par la formation de la structure tertiaire (dans le cas
des protéines monomériques) ou de la structure Quaternaire de la protéine. De
plusieurs enzymes et autres protéines non structurales possédant plus d’un état natif
et elles peuvent passer d’un état à l’autre. Mais couramment, le terme « état natif »
est Utilise seulement pour différencier les protéines correctement repliées des
protéines dénaturées ou Partiellement repliées.
En effet, dans d’autres concordances la forme repliée d’une protéine est
souvent appelée « Conformation » ou « structure » native. Or, les forces qui
stabilisent l’´etat natif de la protéine sont des interactions hydrophobes, des liaisons
Hydrogène intramoléculaires, des interactions de Van der Waals, l’entropie de des
hydratations, des ponts salins et des interactions dipolaires. Par contre les liaisons
hydrogènes avec l’eau aussi la perte d’entropie conformation elles déstabilisent la
structure native. Ce pendant, il est possible de différencier les interactions locales
(entre les résidus proches de la chaîne) et non locales (entre les résidus éloignes
dans la séquence). Dans le cas des protéines solubles, la structure tertiaire de la
protéine s’organise autour d’un ou plusieurs cœur(s) hydrophobe( s) laissant les
résidus polaires exposent au solvant. On peut déterminer La structure des protéines
par la cristallographie des rayons X, et par la résonance magnétique nucléaire ou
par la diffraction des neutrons.
9.2. L’´etat dénature – La pelote statistique :
Historiquement, l’´etat dénature (l’´etat initial de la réaction de repliement) est
considère comme l’´etat de la protéine dans lequel il n’y pas d’´elements de structure
secondaire ni tertiaire. Alors, dans cet état les angles de torsion des liaisons de
chaque acide amine dans la chaîne principale peuvent opter un nombre de
possibilités important. Donc, le nombre conformations que peut échantillonner une
protéine est de ce fait grand. Alors, La protéine est décrite sous forme de pelote
statistique. C’est l’´etat initial de la plupart des expériences de repliement, or la
protéine peut être dénaturée par l’urée ou la guanidine à hautes concentrations, ou
dans cer tains cas à pH extrêmes, par des hautes tempér atures ou par la pression. La
spécification des propriétés conformation elles des états dénatures de la protéine est
la première étape importante pour la compréhension du repliement. En effet,
Pendant longtemps ces états dénatures ont été négliges, l’attention plutôt se portait
sur les états natifs.
En effet, les états dénatures sont des assortiments dynamiques de
conformations en inter conversion rapide mais d’´energie semblable, avec quelques
interactions non locales le long de la chaîne, [38].L’information de basse
détermination sur les propriétés conformationelles des distincts états dénatures peut
être acquise par des mesures du volume hydrodynamique et du rayon de giration,
par des méthodes spectroscopiques telles que le dichroïsme circulaire et la
spectroscopie infrarouge. Or, Ces études ont montre que dans l’´etat dénature il peut
rester des structures existantes dont la nature dépend du dénatur ant utilise, [39]. Mais
ces techniques permettent d’avoir une information moyennée sur tout l’ensemble des
conformations que la protéine peut opter. Donc, pour acquérir une information plus
détaillée (au niveau atomique), il faut utiliser la spectroscopie RMN. C’est sans doute
la meilleure technique pour étudier les états dénatur es, [40].
Les récentes études faites par spectroscopi e RMN ont porte un nouveau vue
sur les propriétés de l’´etat dénature. Il ne paraître plus être si désordonne et
stochastique. Cependant, Henning et ses collègues ont calcule les angles de torsion
des chaînes latérales du lysozyme du blanc d’œuf dénature par l’urée en utilisant la
spectroscopie RMN avec marquage
et
. Ils ont découver t que les résidus de la
protéine dénaturée ont des préférences pour certains rots amers, [41]. En plus, les
résidus aromatiques construits des clusters hydrophobes même en présence du
dénaturant à haute concentration. Alors, toutes ces données affirment la persistance
de quelques interactions locales et non locales dans certaines protéines dénaturées.
Dans cet état, la protéine opte un assortiment de conformations avec une distribution
limitée et une topologie entière qui présente quelques similarités avec celle de
l’´etatnatif. Récemment il a été prouvé que l’´etat dénature peut même avoir un rôle
biologique, [42].
9.3. Les états intermédiaires du repliement – Le « molten globule » :
Alan Fersht et ses collaborateur s ont propose une méthode basée sur
l’ingénierie des protéines pour l’´etude des structures des intermédiaires dans le
repliement des protéines, [43]. Cette approche est importante pour la spécification de
l’´etat de transition qui correspond à la barrière d’´energie potentielle entre l’´etat
dénature et l’´etat natif. Alors, ils ont appose au repliement des protéines la théorie
qui a été développée auparavant pour étudier le rôle des énergies d’interactions
entre des substrats et des enzymes durant la catalyse enzymatique, [44]. Pour vérifier
si une interaction, qui est présente dans l’´etat natif de la protéine et connue grâce à
la Structure déterminée par la cristallographie, est déjà présente dans l’´etat de
transition, il faut ôter cette interaction par mutagenèse dirigée et observer comment
cela influence les énergies libres de l’´etat de transition et de l’´etat natif.
En effet, L’influence relative de ces mutations sur l’´etat de transition est
définie par le paramètre :  =
-D/
-Dest la variation due à
N-D, Où
la mutation de la distinction d’´energie libre entre l’´etat de transition et l’´etat
dénature, et GN-D pour l’´etat natif. Alors, ces énergies libres peuvent être résolues
par des méthodes biophysiques traditionnelles en prend par exemple, des mesures à
l’´equilibre et des cinétiques par fluorescence i ntrinsèque en servant d’un appareil de
mélange rapide.
Cependant, normalement le calcul des distinctions d’´energies libres se fait à
partir des vitesses de repliement et de dénaturation pour
G‡-D et
GN-D,
respectivement.
Alors, quand la valeur de est zéro, cela désigne que la mutation ne change pas la
stabilité de l’´etat De transition, contrairement à la protéine sauvage, et une valeur de
égale à 1 indique que la mutation déstabilise (ou stabilise) l’´etat de transition
exactement comme l’´etat natif.
Donc, indique à quel point l’´etat de transition ressemble à l’´etat natif dans
le voisinage du résidu mute. Lorsque est égale à 1, la structure autour du résidu
mute est ainsi stable dans l’´etat de transition que dans l’´etat natif. Alors, quand
est égale à 0 la protéine dans l’´etat de transition n’est pas organisée autour du
résidu déplace. Or, L’explication des qui se trouvent entre 0 et 1 est plus difficile.
Donc, Ces valeurs peuvent être interprétées soit par des interactions affaiblies dans
l’´etat de transition soit par l’existence d’un mélange d’´etats de transition avec des
interactions entièrement formées ou cassées. Ce mélange peut coïncider à
l’´equilibre entre distinctes conformations d’un intermédiaire ou à des voies parallèles
de repliement condui sant à un mélange d’´etats de transition, [45].
Or, Les premières preuves de l’existence d’´etats partiellement replies ont été
acquises en 1967 par Les groupes de Tanford et Brandts qui ont prouve que la
dénaturation de certaines protéines peut Être non coopérative, [46]. En suite, l’´etude
mène par Kuwajima et ses collègues sur la dénaturation des structures secondaires
et tertiaires de l’a-lactalbumine à été spécialement importante. En effet les
dénaturations des deux niveaux de structure ne sont pas simultanées, [47]. Alors, La
dénaturation de cette protéine passe par un intermédiaire partiellement dénature
avec des éléments de structures secondaires mais pas de structure tertiaire. Et, le
même intermédiaire a été découvert pour cette protéine à pH acide. Cet
intermédiaire a été déterminé comme un état partiellement replie stable et compact
avec des structures secondai res natives, mais avec une structure tertiaire flottante.
Il a été nommé « molten globule » (ou globule fondu) par Ohgushi et Wada, [48].
Aussi, dans les années 80, le modèle de « framework » propose par Ptitsyn a été
réaffirme par les expériences. Le deuxième intermédiaire prédit par le modèle
coïncidait bien à l’´etat « molten globule ». Il a été étudie en détail dans le laboratoire
de Ptitsyn qui a découvert que cet état est semblable à l’intermédiaire cinétique qui
apparaît durant le repliement des pr otéines in vitro, [49].
Apres, l’´etat « molten globule » a été retrouve au cours de repliement de
nombreux protéines, comme’-lactalbumine (Kuwajima 1996), l’anhydrase
carbonique (Jagannadham & Balasubramanian 1985), l’actine (Kuznetsova et al.
1988;Turoverov et al. 1999), l’apomyoglobine (Vidugiris&Royer 1998). Suite à ces
découver tes il a été propose comme un intermédiaire général du chemin de
repliement des pr otéines, [50].
L’´etat « molten globule » est un état prématuré du repliement dans les
conditions physi ologiques. Donc, cet état apparaît durant les premières millisecondes
de la réaction du repliement tandis que la reconstitution totale des interactions
natives d’une protéine de 100 à 300 acides amines demande divers secondes (pour
certaines protéines) jusqu’`a des dizaines de minutes (pour d’autres).alors, Il est
essentiel de souligner que pour la plupart des protéines l’´etape la plus lente du
repliement n’est pas la formation du « molten globule » mais sa réorganisation dans
l’´etat natif. En effet, a l’´equilibre l’´etat « molten globule » peut être accumule à pH
extrême, en existence de concentration modérée de dénaturant, à température
élevée ou encore âpres chélation de ligands de protéines, [51]. Alors, L’´etat de
molten globule est définit par la présence de structures secondaires natives, mais
l’absence de compactage nat if des structures tertiaires.
Or, les chaînes latérales restent mobiles, [52] .Pour Le rayon de giration de la
molécule dans l’´etat molten globule est légèrement plus grand que celui de l’´etat
natif, [53] .Les résidus hydrophobes fabrique des clusters dans cet état qui sont
abordables au solvant, et peuvent lier très fortement des sondes hydrophobes, [54].
Cette sonde se lie très peu sur les protéines natives ainsi que sur les protéines
dénaturées, mais a une très grande attirance pour les surfaces hydrophobes
présentes dans les états intermédiaires.
10. Forces de repliement :
Quatre types de forces sont particulièrement à l’origine du phénomène de
repliement : les liaisons covalentes, les propriétés d’hydrophile/hydrophobie, [55], les
attraction/répulsions électrostatiques, et les forces de Van der Waals qui interdisent aux
atomes de s’interpénétrer à courte distance, et tendent à les tenir faiblement au delà d’une
distance optimale.
11. Chaperons et repliement des protéines in vivo, [2] :
Certaines protéines, même celles dont les ponts disulfures ont été rompues
par des agents dénaturants, sont capables de se replier spontanément. Il a
longtemps été sollicité que le repliement d’une chaîne se réalisait in vivo par les
mêmes mécanismes que ceux prouvés in vitro. Alors, cette vue a été changée par la
découver te des chaperons mol éculaires, [56].
En effet, les chaperons, par leur association transitoire avec des protéines
naissantes ou déstabilisées par un stress, sont capables d’empêcher un mauvais
repliement ou une agrégation (association au chaperon par des interactions
hydrophobes). Or, elles ne paraître pas pouvoir interférer avec les protéines natives
ou se lier à une chaîne complètement dépliée. Elles régulent la vitesse de repliement
en agissant comme des catalyseurs mais ne paraissent pas mettre en question le
postulat d’Anfinsen selon lequel l’information essentiel au repliement est renfermée
dans la séquence primaire. Donc, il paraître qu’in vivo peu de protéines nécessitent
l’existence de chaperons pour se replier correctement, [57].
D’ailleurs, d’autres molécules accessoires peuvent jouer un rôle dans le repliement,
comme la protéine disulfideisomérase, la peptidyl proline cis-trans isomérase. Ces
enzymes précipitent ledit processus, [58], (qui peut aussi avoir lieu en leur absence i n
v i t ro sous des conditions précises). Or, d’autres modifications, tel que les
glycosylations, ne paraître pas modifier le chemin de repliement, ni in vivo, ni in vitro,
par contre elles augmentent la stabilité de la protéine, [59], et changent son
adressage.
Finalement, inscrivons que l’étude du comportement singulier des protéines
thermophiles pourrait porter beaucoup à la compréhension des mécanismes de
repliement et de stabilisation des protéines, [60]. Or, les informations tant
expérimentales que théoriques sur le mécanisme de repliement des protéines sont
nombreuses dans la littérature. Pourtant aucun schéma consensus et prédictif
n’existe en cette fin du 20e siècle. Donc, la compréhension de ce mécanisme
essentiel sera assurément l e centre d’évolution de la biotechnologie des protéines au
21e siècle.
12. Modèles théoriques pour étudier le repliement, [8]:
L’étude et la compréhension théorique du repliement des protéines est
reposée sur trois types différents d’approche : les modèles de réseaux simples, les
modèles discrets hors réseau et les dynamiques moléculaires tenant compte de la
description de tous les atomes, [61]. En effet, les modèles de simples chaînes
soumises à des potentiels très simplifiés dans un réseau montrent les propriétés
physiques générales du problème mais ne donnent pas d’information au niveau
atomique. Aussi, on peut acquérir tous les états énergétiques et décrire toute la
surface énergétique. Or, Les réseaux cubiques, dans lesquels les protéines sont
indiquées par des chaînes dont seules les interactions entre paires en contact sur le
réseau sont pr isent en compte, permettent de donner des indices sur la sélection des
minima globaux.Par qu’antre Les modèles atomistiques traitent plus souvent la
dénaturation que le repliement des pr otéines, [62].
Les temps de repliement protéique de l’ordre de la milliseconde sont opposés
avec les simulations de dynamique moléculaire, restreintes à l’échelle de la
microseconde , [63], alors que la dénaturation des protéines à hautes températures (à
225°C) peut avoir lieu en moins d’une nanoseconde.mi s à part pour les protéines qui
se replient très vite comme la protéine En-HD étudiée par Mayor et al. (2000-2003).
D’ ailleurs, la structure initiale lors des études de dépliement est la structure
native qui est la structure très bien définie, contrairement à une st ructure dépliée.
Ces deux évolution (dépliement et repliement) réversibles se complètent mais
il vaut mieux de rester prudent quant à l’interprétation du dépliement sous de fortes
contraintes, comme une température élevée, qui ne correspondent pas aux
conditions de repliement physiologique, [64]. Néanmoins, la dynamique moléculaire
où une contr ainte impose le
Dépliement de la chaîne protéique, couplée avec les données expérimentales de
RMN, per met de définir les états partiellement dépliés, [65], comme par exemple, celui
de l’ubiquitine dans 60% de méthanol, [66] ou celui de la barnase thermiquement
dépliée, [67].
L’étude du r epliement par dynamique moléculaire se développe.
Les exemples du repliement d’un peptide de 36 résidus, [68], et celui d’une petite
protéine de 61 résidus ou monomère, [69], présentent que la dynamique moléculaire
permet d’acquérir des informations au niveau atomique non abordables
expérimentalement. Pourtant, le coût en temps de calcul reste grand et seuls des
petits systèmes peuvent être abor dés.
13. Une description théorique simple, [3] :
En générale, les modèles théoriques les plus importants aujourd'hui s'appuient
sur une mécanique moléculaire. Ils représentent la protéine comme un gr oupe de
Particules sphériques, incompressibles (ou à peu près: les atomes), assemblés par
des
Ressorts, tenant chacun une charge électrique. Or, Ces charges permettent de
représenter la caractéri stique électropositive ou électronégative des distincts groupes
chimiques.
En effet, Les ressorts soutiennent la stéréochimie et la rigidité usuelles des distincts
groupes: carbones tétraédriques ou plans, liaisons covalentes simples ou doubles.
Ainsi que, Les molécules du solvant peuvent être exposées de la même manière. La
paramétrisation d'un tel modèle à l'aide de données expérimentales demande
certaines dizaines d'années au chercheur. Pare qu’entre, Une fois en place, et
nonobstant sa simplicité, alors, un modèle de mécani que moléculaire bien paramétré
est un outil fort pour
Étudier le repliement et la stabilité des biomolécules.
14. Dépliement des protéines :
Le repliement inverse de protéines c’est le dépliement, donc en générale le
dépliement c’est l’approche inverse de repliement. En effet, L’étude du Mécanisme
de dénaturation des protéines peut octroyer des informations sur le mécanisme de
repliement, ses dernières étapes et ses états intermédiaires. En plus, le début du
dépliement est particulier de la structure tridimensionnelle des états natifs des
protéines, de leur stabilité et de leur dynamique. Il donne ainsi des informations sur
les dernières étapes du repliement et même les états intermédiaires, [8].
15. Etude du repliement des protéines par des simulations de
dépliement, [24] :
15.1. Mécanismes d e repliement simple :
Il vaut mieux donc d’étudier aussi bien des systèmes simples que des
protéines duquel le repliement est plus complexe afin comprendre les différents
mécanismes de repliement au niveau atomique. On a vue plusieurs modèles au par
avant. Selon le premier modèle, le « framework model » ou le model « diffusioncollision » les structure secondaires se constitue en premier avant de s’assembler
pour former la structure native (Figure 7). Au contraire, le modèle du « collapse
hydrophobe », avantage l’assemblage des résidus hydrophobes pour former le cœur
de la protéine suivi de la structuration des éléments de structures secondaires.
Fig. 11 : Représentation schématique des deux modèles de repliements d’âpres, [70].
L’approche expérimentale (on a vue dans le paragraphe7.2) suivie par A.
Fersht comporte à mesurer les grandeurs thermodyna miques et cinét iques
définissant le repliement d’une protéine pour la protéine native et pour nombreux
mutants ponctuel s. Donc, Ces mesur es permettent de déter miner l’énergie libre de
l’état natif, GN-D et celle de l’état de transition, DGTS-D et de cal culer la quantité F =
( DGTS-D - DG’TS-D) / (DGN-D - DG’N-D).
Alors, Si F est proche de 0 la structure de l’état de transition pour cette
situation mutée est proche de celle de l’état déplié. Si F est proche de 1 la structure
de l’état de transition à cette position et proche de celle de la protéine repliée. Aussi
la mesure expérimentale de F permet de définir structuralement l’état de transition.
En parallèle V. Daggettt a réalisé des simulations du dépliement de ces
protéines par dynamique moléculaire à température haute (225°C). Or, Les
trajectoires sont
Analysées pour reconnaître le passage par l’état de transition. Celui-ci coïncide à
une portion
De la trajectoire après l’échappement à l ’état natif. A par tir de cette ensembl e de
Conformations correspondant à l’état de transition, un paramètre S équivalent au
paramètre
Expérimental F est calculé. Une bonne relation entre les paramètres S et F est
trouvée.
L’ensemble des ces travaux a autorisé à ces auteurs de proposer un nouveau
modèle du Repliement : le modèle « nucléation-condensation ». Ce modèle unit les
modèles
« framework » et « collapse hydrophobe » : ou le repliement commence autour d’un
noyau de repliement (folding nucleus) et à partir de ce germe de repliement présent
dans l’état de
Transition, la structure secondaire et la structure tertiaire se forment en parallèle. Si
le
Accouplement entre la construction de la structure secondaire et la structure tertiaire
est faible on se rapproche du « framework » modèle.
15.2. Mécanismes d e repliement complexe :
Néanmoins l’étude du repliement de protéines de plus grande taille a montré
que leur mécanisme de repliement peut êt re plus complexe.
En effet, quand la taille des protéines accroître les barrières dans le paysage
énergétique seront possiblement plus grandes et le processus de repliement plus
complexe.
Donc, des multiples processus différents de repliement seront possibles. En
prend comme exemple une des protéines qui présente un processus de repliement
complexe et qui a été consi dérablement étudiée est le l ysozyme de poul e. C. Dobson,
[71]
, a présenté par divers type d’expériences, surtout des expériences RMN
d’échange, que le repliement de cette molécule est complexe : une partie des
molécules (environ 20%) se replie sans apparition d’intermédiaire de repliement
selon une échell e de temps de l’ordre de 100ms.
Alentour 10% des molécules se replient très lentement selon un processus qui
est
Limité par l’isomérie des prolines. Ainsi que, Pour la maturité des molécules (70%)
apparaît un intermédiaire transitoire de repliement. Alors, l’échelle de temps est de
l’ordre de 400ms. Cet intermédiaire a pu être défini. Comme exemple, La protéine
lysozyme comprend deux domaines : un domaine a forme de 4 hélices alpha et
d’une hélice 310, et un domaine b formé d’un feuillet b à trois brins et d’une hélice 310
(Figure 10). Il a été présenté qu’au sein de l’intermédiaire transitoire de repliement,
seul le domaine a est partiellement structuré.
Fig. 12 : Représentation schématique de la structure cristalline du lysozyme. Sur la droite, le domaine
a est constitué de cinq hélices (en rouge et jaune). Sur la gauche, le domaine b est constitué de trois
brins b (en bleu) et d’une hélice.
Or, afin d’appréhender au niveau atomique le processus de repliement du
lysozyme nous avons accompli des simulations de dynamique moléculaire de
dépliement.
Un des problèmes majeurs dans la réalisation de simulations de dépliement, est
l’échelle de temps des pr ocessus de repli ement ou dépli ement qui est de l’ordre de la
milliseconde à la seconde, signifie d’environ 11 ordres de grandeur plus grand que
les temps de simulation possible présentement par dynamique moléculaire. C’est de
ce fait les simulations doivent être accomplies à des températures supérieures à la
température ambiante ou utiliser une force complémentaire qui préfère le dépli ement.
La première solution favorise les participations entropiques et peut donc introduire
des artefacts et altérer le mécanisme de dépliement ( et donc de repli ement).
Fig.13: Représentation schématique du dépliement (a -> f) ou du repliement (f -> a) du
Lysozyme à six étapes différentes d’une trajectoire de dépliements obtenus par simulation de
dynamique moléculaire. Les hélices a sont représentées par des serpentins en bleu et les feuillets
b par des flèches rouges.
Pour la deuxième solution doit être appliquée avec précaution en introduisant
une force faible. Alors, B. GILQUIN et all ont choisi d’appliquer un potentiel qui
dépend de l’écart de tous les atomes de la protéine par rapport à la structure native.
Donc, ce type de contrainte ne suppose à priori aucun changement de volume ou de
rayon de giration.de ce fait, Les mouvements aboutisses sont ceux qui demandent l e
plus faible changement éner gétique.
16. Rigidité et souplesse des protéines, [8]:
La souplesse des protéines et leur stabilité peuvent être i nfluencées par des
conditions envir onnementales ( température, pH, sali nité…).
Par qu’autre, une rigidité structurelle suffisante préserve la seul et spécifique
forme native de la protéine. Pour la souplesse interne, elle permet son bon
fonctionnement (comme l’activité enzymatique des enzymes).donc, Il est très
important que les protéines conservent une certaine souplesse pour garder leur
activité biologique. Alors, une protéine est stable si les conditions extérieures lui
acceptent de ne pas se dépli er mais aussi d’être toujours active.
16.1. Dynamiq ue des protéines :
L’étude par diffraction des rayons X ne procure que des structures statiques
des protéines. Néanmoins les protéines sont souples et leur activité biologique
dépend de cette soupl esse.
Donc, la dynamique a lieu sur un large domaine temporel dont les multiples
mouvements sont vi lles dans le tableau ci-dessous.
Mouvements
Amplitude (Å)
Vibrations atomiques
Vibrations élastiques de
régions globulaires
Rotations des chaînes
latérales exposées
Rotations des chaînes
latérales enfouies
0,01 à 1
0,05 à 0,5
Log10 du temps
caractéristique (s)
-14 à –13
-12 à –11
5 à 10
-11 à –10
5
-4 à 0
Transitions allostériques
Dénaturation locale
1à5
5 à 10
-5 à 0
-5 à 1
Tableaux 1 : représentes des différents mouvements des protéines.
En effet, Les mouvements qui participent à la dynamique des protéines sont
dus à varié mécanismes : mouvements d’ensemble de domaines, mouvements de
type vibratoire, mouvements de diffusion. Or, Les vibrations atomiques sont des
mouvements très rapides de l’ordre de la picoseconde ou moins. Les mouvements
entre domaines sont attendus dans les protéines dans lesquelles des parties de la
structure peuvent bouger les unes par rapport aux autres sur plusieurs angströms.
Alors, Les régions entre les domaines forment des charnières en référence aux
charnières des por tes liant deux par ties bougeant l’une par rapport à l’autre.
16.2. Facteurs de température :
Une façon de mesurer la souplesse des domaines d’une protéine est
d’examiner les facteurs de température. Alors, si la détermination de structure de la
protéine acquise par rayons X est suffisamment bonne, les facteurs de température
de chacun de ses atomes sont disponibles dans les fichiers dispensés sur la banque
de données Pr otein Data Bank , [72]. En effet, Le facteur de température est un facteur
correctif qui rend compte du fait que les noyaux des atomes n’ont un endroit fixe que
s’ils sont à la température du zéro absolu. À la température de l’expérience, les
noyaux oscill ent autour de leur position d’équilibre.
Or, la relation mathématique entre le facteur de température Bj et la valeur
moyenne du déplacement de l ’atome j
est la suivante, [73] :
Bj =
Montre cette équation que les facteurs de température sont positifs et leur
dimension est celle d’une surface. Ainsi que plus le facteur de température d’un
atome n’est grand, plus son noyau balance autour de sa position d’équilibre, plus cet
atome change.
Les facteurs de température sont des grandeurs expérimentales qui peuvent être
calculées de Façon théorique avec la donnée des flottements moyennes des atomes.
17. La prédiction de structure, [74] :
Nous pourrons apprendre beaucoup sur la fonction des protéines si nous
arrivons à soustraire ou à prédire leur structure.
En effet, Il ya deux grandes approches de pr édiction de structure :
§
ü Modélisation basée sur des structures connues et une similarité détectable
entre la plupart de la séquence à modéliser et la séquence d’une (au moins)
structure connue.
ü Les méthodes ab initio : Elles prédisent la structure à partir de la séquence
seule, sans recourir à des similarités avec des repliements connus.
Modélisation par Homologie :
La modélisation par homologie comporte en 4 étapes
1. Trouver des structures connues qui ont un rappor t avec la séquence .
2. Aligner la séquence à modéliser sur la séquence ou les séquences connues .
3. Construire le modèle.
4. Evaluer le modèle.
§
Prédiction de Structure Ab initio :
La prédiction de structure Ab initio est Basée sur l’idée que la structure native
correspond à un minimum globale énergétique. Or, L’hypothèse d’Anfinson Ces
méthodes accomplit une recherche à grande échelle dans l’espace conformation el,
et Le but des recherches est de trouver des conformations tertiaires qui ont une
énergie spécialement basse pour une séquence donnée.
En effet, Les deux particuliers les plus importantes de ces méthodes sont la
procédure de recherche doit être rapide et efficace et La fonction d’énergie libre doit
être la plus juste possible, ainsi pour la recherche on utilise une partie des atomes,
alors les
Potentiel s doivent enfermer des méthodes pour moyenner les effets des autr es.
En revanche, Rosetta (Baker et al) combine les deux approches. Des fractions
oscillent entre des structures en accord avec la séquence du segment et des
structures connues. Or, La forme native est celle où les segments locaux sont
orientés de telle sorte que les interactions de basse énergie libre se font à travers
toute la structure.
Or, il ya D’autres approches ab initio utilisent des potentiels d’interactions
entre 2,3, ou 4 types de résidus (au lieu de 20).alors, elles sont basées sur les
statistiques de ces interactions dans des structures connues (Knowledge based
potentials).
L’authenticité des modèles issus des approches ab initio est << que les modèles par
homologie lorsque l’identité de séquence est > 30%.
Par contre, la topologie entière du repliement n’est pas si mauvaise.
Cependant, Dans des cas favorables des méthodes de novo accordent des indices
importants sur la fonction de protéines inconnues.
18. Conclusion :
Le repliement des protéines est un domaine de recherche en pleine
évolution. Après une longue période de dormance, or, les applications potentielles
des connai ssances sur le repliement dans le domaine médical, en biotechnologie et
en génomique ont dirigé le projecteur sur ce processus complexe, adroitement ciselé
par l’évolution pour permettre à une chaîne polypeptidique non seulement de
procurer sa structure biologiquement active (sur laquelle s’exerce la pression
évolutive), mais également de l’acquérir en un temps étonnamment court, avec une
grande efficacité, là où il le faut et quand il le faut, [75].
En effet, la compréhension des mécanismes de repliement des protéines
représente l’un des primordiaux enjeux de la biologie. Donc, Il s’agit d’un problème
indispensable pour l’analyse des plusieurs événements compromis dans la régulation
cellulaire, et pour l’utilisation de l’information renfermée dans le nombre augmentant
de gènes séquencés.
L’éclaircissement de ces mécanismes devrait permettre le développement de
nouvelles stratégies thérapeutiques pour la précaution et le traitement des maladies
associées à des repliements incorrects, [76].
Ainsi que, L’augmentati on des connaissances aussi bien sur les principes
dirigeant le repliement correct et incorrect des protéines que sur la croissance d ’outils
sophistiqués pour changer le patrimoine génétique des cellules ou la mécanisation
des méthodes d’évolution moléculaire sont tant de voies suivies ouvrant les vues les
plus encourageantes dans ce domaine, [77]. Pour mieux comprendre certaines
maladies dues à des anomalies de repliement, comme la maladie d’Alzheimer ou la
maladie de Creutzfeldt-Jakob c’est le sujet à qui on va traites dans le chapitre
quatre.
Référence :
[1] W. Chin and al : « Repliement de chaînes peptides en détente
supersonique », SPAM / Lab . Francis Perrin (URA CEA-CNRS 2453) CEA Saclay,
91191 Gi f-sur-Yvette Cedex, F rance(2005).
[2] N .Benhabilése, A.Thomas and al : « Les mécanismes de repliement des
protéines solubles », (2000).
[3] T. Simonson : « Le problème du repliement: peut-on prédire la structure des
protéines? », Laboratoire de Biochimie (CNRS, UMR7654) France.
[4] Fersht, p. 509, (1999).
[5] Anfinsen& Sc heraga (1973; 1975).
[6] B.Nolting, p. 1, (1999).
[7]J. Phys, N.A.B ushmarina and al : « Repliement des protéines : exemple de
l´ -lactalbumine », IV France 130, 209–228, (2005).
[8] I. SOURY and L. NAVIZET : « modélisation et analyse des pr otéines », Thèse de
doctorat de l’université Paris 6, Soutenue le 5 mars (2004).
[9] Phelan, and al. (2002).
[10] Honig; (1999).
[11] Murphy; (2001).
[12] Chothia; (1976), Eisenberg & McLachlan; (1986).
[13] Chakravarty & Varadarajan; (2002).
[14] Grottesi, and al, (2002).
[15] Hirakawa, and al. (1999).
[16] Swindells;( 1995).
[17] Perrett & Zhou; (2002).
[18] Frye & Royer; (1998).
[19] J.Henry Weil and al :« biochimie générale », p-37, DUNOD, JUIN(2005).
[20] M. Lindström : « protéines, modélisation, prédiction, conception »,
Université Libre de Bruxel les, Printemps des Sci ences, 19-25 mars (2007).
[21] J. Pelletier : « Le repliement des peptides et des protéines », CHM 3331,
AUT (2005).
[22]PDF, Cours n°15 :« Modification post-traductionnelles », L3-BH01, (20072008).
[23] Sali et al. (1994a) ; Ballew et al. (1996).
[24] B. GILQUIN :« Exploration des mécanismes de repliement des protéines
par dynamique moléculaire », DSV/DIEP/LSPCEN Sacl ay 91191 GI F sur YVETTE.
J. Phys. IV France 130, p 193–200, (2005).
[25] T. Guérin : « Protéines, hétéro polymères et systèmes désordonnés »,
Master M2 SDSMC Systè mes Dynamiques et statistiques de la matière complexe
Parcours PTSC Physique théorique des systèmes co mplexes, Cours : Physique des
systèmes désor donnés (L. Cugliandolo).
[26] « Repliement et assemblage des protéines »,
Format de fichier: PDF/Adobe Acrobat - Version HTML www.biochimie.univparis7.fr/master/pdf/folding_%5Bmode_de_compati bilite%5D.pdf [27] Baldwin (1996); Benhabiles and al. (2000).
[28] Wetlaufer (1973); Fersht (1995a).
[29] Harrison & Durbin (1985).
[30] Plaxco and al. (1998); Baker (2000); Grantcharova and al. (2001).
[31] Grantcharova and al. (2001).
[32] Nolting and al. (1995); Roder (1995); Plaxco & Dobson (1996).
[33] Ptitsyn, (1995).
[34]Yon 1996; Dobson & Ellis (1998).
[35] Creighton (1997); Baldwin (1996b).
[36]Oas & Kim (1988).
[37] Missiakas and al. (1992).
[38] Brockwell and al. (2000).
[39] Shortle (1996).
[40] Dyson & Wright (1998).
[41] Henning and al, (1999).
[42] Plaxco& Gross (1997).
[43] Matouschek and al. (1992); Matouschek& Fersht (1993).
[44] Fersht and al. (1992); Fersht (1993); Fersht (1995b); Fersht (1999).
[45] Fersht (1999).
[46] Aune and al. (1967); Brandts & Hunt (1967).
[47] Kuwajima and al.(1976); Nozaka and al, (1978).
[48] Ohgushi & Wada (1983).
[49] Dolgikh and al. (1984); Semisotnov and al, (1987).
[50] Ptitsyn and al. (1991).
[51] Ptitsyn (1995); Arai & Kuwajima (2000).
[52] Chaffotte and al, (1992).
[53] Arai and al, (2002).
[54] Semisotnov and al. (1987&1991a).
[55] Dill and al, (1995) .Levitt et Gerstein (1998).
[56] Ellis, (1992) ; Jaenicke, (1993) ; Buchner, (1996) ; Clarke, (1996) ; Ellis, (1996).
[57] Yon, (1997).
[58] Schmid, (1990) ; Lorimer, (1992).
[59] DeKoster, Robertson, (1997).
[60] Petukhov et al , (1997); Vogt, Argos, (1997).
[61] la revue de Pande, and al. (1998).
[62] Fersht & Daggett;( 2002).
[63](Daggett; 2000)
[64] Finkelstein; (1997).
[65] Daggett & Fersht; (2003a)
[66] Alonso & Daggett; (1995).
[67] Bond, and al. (1997).
[68](Duan & Kollman; (1998)
[69] Mayor, et al. (2003)
[70]Daggett V., Fersht A.R., 28, 18-25: « Is there a unifying mechanism for
protein folding ? », TIBS (2003).
[71] S.E.Radford and al : « The folding of hen lysozyme involves partially structured
intermediates and multiple pathways », Nature 358,302-358, (1992).
[72] Berman, and al. (2000).
[73] van Meerssche & Feneau-Dupont; (1984).
[74] « LE REPLIEMENT DES PROTEINES », Format de fichier: PDF/Adobe Acrobat - Version HTML
www.biochimie.univ-montp2.fr/maitrise/repliement/repliement1.pdf
[75] Michel E. Goldberg :« Le repliement des protéines : seconde traduction du
message Génétique », Éditorial, juin-juillet (2005).
[76] J. Yon-Kahn : « Repliement des protéines : études in vitro »,
MEDECINE/SCIENCES, 21 : 601-7, (2005).
[77] J.Michel Betton et A. Chaffotte :« Repliement et production de protéines recombinantes »,
MEDECINE/SCIENCES ; 21 : 613-7, (2005).
Chapitre III
Etude Théorique du Repliement
et Simulation Numérique
1 .Introduction :
Nous allons exposer dans cette partie l’approche numérique et de simulation
de la dynamique moléculaire utilisée pour étudier les propriétés mécaniques des
protéines. Suivant la taille des protéines et les informations que l’on veut avoir, on
choisit une description plus ou moins fine du système (la protéine étudiée et son
environnement). En particulier, on présente les modèles moléculaires confondant
atomes et ressorts permettant d’accomplir des simulations sur ordinateur par la
méthode de dynami que moléculaire (DM), [4].
En effet, les simulations sont un outil puissant pour modéliser et étudier à
l'échelle atomique des systèmes complexes. Dans cette étude, généralement on fait
trois approximations importantes :
1) les vitesses des particules sont faibles par rapport à la vitesse de la lumière,
2) le mouvement des électrons est beaucoup plus rapide que celui des noyaux
(approximation de BORN-OPPENHEIMER),
3) le mouvement des atomes peut êtr e écrit par la mécanique classique.
Donc, à partir de principes simples de la Physique, spécialement les lois de
NEWTON, on simule ainsi sur ordinateur le comportement des molécules au niveau
atomique. On à choisir un modèle utilise une représentation de la molécule en
boules-et-bâtonnets, où les atomes sont représentés par les boules, ayant un rayon,
une masse et une charge atomique, et les liaisons par les bâtonnets qui sont des
ressorts amenant les liaisons à leur longer la plus stable après une déformation.
Cependant, Le jeu de boules et de bâtonnets qu'on utilise est caractérisé par un
champ de for ces.
En effet, Les interactions physiques entre les atomes (boules) – telles que la
répulsion stérique, les liaisons hydrogène, etc. – sont prises en compte et introduites
dans l'équation de l'énergie potentielle. Or, du point de vue thermodynamique cette
énergie est une fonction d'état.
Nous avons utilisé les lois de NEWTON à partir du modèle physique
déterminé par les paramètres du champ de forces et la représentation de l'énergie
potentielle choisie, pour propager les molécules dans l'espace des phases, défini par
les vecteurs associés aux quantités de mouvement et les vecteurs de position des
atomes.
Cependant, La dynamique moléculaire nous permet aussi de générer des
ensembles statistiques des formes d'atomes et molécules en phase cristalline, en
solution ou en phase gazeuse , [1].
Pour accomplir ces simulations, nous avons utilisé le logiciel
TINKER « étameur ambulant », version 4.2 juin 2004 développé par Jay William. Ce
logiciel permet l’exécution de calculs et de simulations en Dynamique Moléculaire, [2],
[3]
.
Toutefois, Les détails concernant les champs de forces, la représentation de
l'énergie potentielle et les paramètres de simulation sont propres aux logiciels utilisés.
Généralement on retrouve ces caractéristiques ou des paramètres similaires
dans d'autres programmes de simulations moléculaires, étant donné que les lois
physiques utilisées sont identiques dans tous les cas.
Dans ce chapitre, on s’intéresse en particulier à l’étude de la protéine
d’Ubiquitine dont l’importance en Biologie Moléculaire et en Médecine est très
relevée.
2. L'espace Cartésien et déterminations des symboles, notations,
[1]
:
Les vecteurs et les matrices sont écrits en gras par exemple R pour les
positions ou encore F pour les forces.
En effet, Nous utilisons un système de coordonnées Cartésiennes avec les
trois vecteurs de base orthonormés suivants:
…………..(1)
Or, le vecteur de position d'un atome i dans cet espace 3D peut être
représenté par ses 3 composantes (
…………………… (2)
On utilisera dans la suite la notation simplifiée suivante :
)…………………………(3)
Donc, Le pr oduit scalaire entre les deux vecteur s (
est décrit par
…………………. (4)
et la longueur d'un vecteur
………………..(5)
Ainsi, la distance entre les atomes i et j est déterminée par
…………………………(6)
Notons que toutes ces définitions peuvent être généralisées à 4D. Cette
technique de simulations de DM dans l'espace Cartésien en quatre dimensions
permet de surmonter des barrières énergétiques dans l'hyper-surface de l'énergie
potentielle. Dans notre étude nous nous limitons aux si mulations à 3D.
3. Degrés de liberté, fonction d'interaction et équations de
mouvement :
À partir de toute modélisation d'un système, trois choix fondamentaux doivent
être faits. D’abord, quels degrés de liberté seront explicitement traités ou simulés ?
Ensuite, lesquels seront seulement traités implicitement et introduits dans la fonction
qui décrit l'interaction entre les degrés de libertés traités explicitement ?
En effet, les degrés de liberté explicites peuvent être traités de manière
classique ou par la mécanique quantique. Ensuite, il faut choisir une fonction
d'interaction pour décrire l'énergie d'interaction du système moléculaire en fonction
des degrés de liberté explicites du modèle. A la fin, il faut adopter une méthode pour
échantillonner les formes ou simuler le mouvement selon les degrés de libertés
explicites, ou pour rechercher les parties de l'espace de configuration dont le
système moléculaire possède une énergie minimale.
Dans notre étude, nous nous intéressons seulement aux degrés de libertés de
position, c'est-à-dire les coordonnées Cartésiennes des atomes. Dans ce cas,
l'HAMILTONIEN du syst ème moléculaire prend la forme suivante
………………..(7)
Le premier terme est le terme d'énergie cinétique
…………………(8)
qui dépend seulement des masses atomiques mi, et est indépendant des
coordonnées R de la particule. Le deuxième terme représente l'énergie potentielle (la
fonction d'interaction), qui s’exprime en fonction des coor données R des particules :
………………………..(9)
Généralement
dépend de L paramètres nommés aussi paramètres du
champ de for ce, indiqués par
.
En général, la fonction d'interaction est une somme de termes qui
représentent des types différents d'interactions.
Or, la force qui agit sur une particule i est donnée par l'équation
……………………………. (10)
dérivant d’un potentiel
.
Cependant, la trajectoire acquise lors des simulations de DM dépend
seulement des forces qui agissent sur les atomes, pas explicitement des énergies.
Pour cela, on utilise les équations de mouvement classique pour décrire l’évolution
des atomes dans l' espace des phases.
Alors, Les équations de NEW TON sont:
…………………… (11)
…………………………………… . (12)
…………………(13)
Dans les simulations de dynamique moléculaire, les équations (11-13) sont
"intégrées" numériquement dans le temps. D’autre part, le système moléculaire peut
être couplé à des gr andeurs externes au système de façon di fférente.
Par exemple, on peut introduire un terme perturbatif supplémentai re
,
une fonction de perturbation, dans la fonction d'interaction du système qui limite le
mouvement des particules de manière à ce que la valeur simulée de la quantité
externe se rapproche de la valeur choisie. Or, cette valeur peut également être
exigée comme contrainte au système de manière à être vérifiée pour chaque forme
ou pour un ensembl e de conformations.
Donc, une équation au premier ordre peut être additionnée aux équations de
mouvement des par ticules pour faire changer la valeur simulée de la quant ité externe
vers une valeur donnée, il s'agit de la méthode de fai ble couplage.
Alors, les deux dernières méthodes contraintes et faible couplage entraînent
un changement des équations de mouvement classiques du système moléculaire. Si
l'énergie potentielle
ne dépend que de la conformation instantanée, l'énergie
totale sera seulement conservée lors d'une simulation de DM. Quand on met une
contrainte ou la méthode de faible couplage avec des paramètres moyennés dans le
temps cette condi tion n'est pas véri fiée, [1].
4. Hamiltonien, fonction d'interaction et champs de forces utilisés:
L'Hamiltonien du système moléculaire, présenté dans l'équation (7), comporte
deux termes. Le premier représentant l'énergie cinétique est donné par l'équation (8).
Le deuxième correspond à l’énergie potentielle qui caractérise un certain champ de
force.
Cependant , les macromolécules sont représentées comme un ensemble
d’atomes ponctuel s dont les interactions sont décrites par un potentiel semiempirique ou champ de force. On nomme champ de force le modèle mathématique
représentant l'énergie potentielle d'une molécule en mécanique moléculaire, [4].
En fait, sous ce terme sont rassemblés deux éléments : d'une part l'expression
des différentes fonctions participant au calcul énergétique et d'autre part les valeurs
des constantes di fférentes paramétrant ces fonctions, [4].
En général, l'énergie potentielle dans les champs de force prend la forme
suivante, [1] :
………………. (14)
: L’énergie potentielle d’interactions entre atomes liés par des liaisons
covalentes.
: L’énergie potentielle d’interactions "non-liées" (Van Der Waals et
électrostatique).
: L’énergie potentielle des termes spéciaux, par exemple des contraintes de
position.
4.1. Interactions entre atomes liés,
Dans l'expression de
[1]
:
, quatre termes interviennent
…………(15)
Ils montrent l'élongation des liaisons, la déformation des angles et les torsions
pour les angles dièdres périodiques et "impropres".
4.1.1. Elongation des liaisons covalentes entre atomes,
[5]
:
Parmi les champs appliqués dans le logiciel TINKER, il y a le champ de forces
d'AMBER qui s’exprime par un terme quadratique pour les Interactions d'élongation
des
liaisons,
avec
une
sommation
sur
toutes
les
liaisons
covalentes
.
Ici,
représenter la longueur instantanée de la liaison n,
sa valeur à
l'équilibre et enfin
la constante de force associée. Généralement, les unités
qui sont utilisées pour
,
sont en Å et pour
en
.
4.1.2. Déformation des angles entre atomes liés, [1]:
Le terme de déformation des angles entre atomes liés par une liaison
covalente dans le cas d’AMBER est donné par l’équation :
Généralement, les angles sont donnés en radians,
4.1.3. Termes de torsion, angles dièdres et impropres,
[5]
en kcal
:
La partie de la fonction d'interaction qui représente les termes d'interactions
harmoniques impropres de déformation des angles dièdres (hors du plan, hors de la
configuration tétraédrique) est décrite par une série de FOURIER de la manière
suivante :
.
Dans AMBER, tiennent cette équation s’écrit avec une mul tiplicité
=2 pour
°
un plan ou
=3 pour un tétraèdre,
étant égal à 180 dans les deux cas.
Dans le cas général, la série ne conçoit qu'un seul terme, mais quelques cas
sont connus où il en faut plus (par exemple butane, OS-CH-CH-OS ou H-N-C-O).
4.2. Interactions non-liées, [5]:
Les interactions entre atomes non-liés sont décrites par deux termes,
pour les interactions électrostatiques et
pour les Interactions de type LENNARDJONES.
La somme s'étend en pri ncipe à toutes les paires d'atomes (i, j), mais en
général un certain nombre d’interactions est exclu.
4.2.1. Interactions de Lennard-Jones, [5]:
Plusieurs ensembles de paramètres sont utilisés pour décrire les interactions
de type Lennard-Jones, aussi nommées interactions de Van Der Waals.
En effet, dans AMBER nous avons utilisé les paramètres
en kcal
et
R*(la valeur de la distance pour laquelle l’énergie est minimale) (en Å) pour ce même
potentiel avec
en Å pareillement.
correspond à la répulsion entre deux atomes due à l'exclusion de PAULI, et le
terme
indique la dispersion attractive de LONDON.
Alors, dans AMBER nous utili sons les règles de LORENT Z-BERTHELOT.
………………..(21)
Fig.1 : Energie d'interaction (Van der Waals) en fonction de la distance de séparation
entre les deux atomes d’une molécule diatomique de type X-X.
4. 2.2. Interactions électrostatiques,
[5]
:
Le premier terme concerne dans l’équation (23) reflète les interactions
Coulombiennes et les deux autres termes le champ de réaction :
Or, la correction du champ de réaction de type Poisson-Boltzmann est une
généralisation du modèle d'ONSAGER qui prend en compte les effets de force
ionique.
Ici, on considère un modèle où l'extérieur d'une sphère de rayon
autour du
soluté est modélisé par un milieu homogène polarisable (Figure 2). En fait, le
deuxième terme représente la force agissant sur l'atome i due au champ de réaction
induit par l'atome j. Donc, on part de l'hypothèse d'un continuum électrostatique
caractérisé par une permittivité diélectrique relative et une longueur d'écrantage
de DEBYE inverse K à l'extérieur de la distance de troncature du champ de
réaction
. On introduit pour chaque atome j, une charge image hors de la
sphère
à une distance moyenne
qui participe au potentiel électrostatique
à l'intérieur de la sphère. Alors, le coefficient
sera déterminé par la relation:
…………. (24)
où
=1. Le dernier terme dans l’équation 23 est constant et sert à rendre
l'interaction nulle à
. Or, Pour =1 et K = 0, la correction du champ de
réaction est nulle.
Fig.2 : Représentation de la méthode du champ de réaction.
L'atome i au centre de la sphère de rayon
est entouré de charges
situées
A la distance
. Le champ de réaction est créé par les charges images à .
4.3. Forces spéciales dues aux contraintes, [5] :
Notons que la fonction d'interaction donnée dans l'équation (14) peut contenir
des termes qui ne sont utilisés que dans des cas particuliers. Dans cette étude, nous
avons fait appel aux contraintes harmoniques sur la position des atomes, sur les
distances de liaison, les angles et les torsions et aux contraintes de position (option
BELLY dans AMB ER) et enfin de distances de liaison (Algorithme SHAKE).
4.4. Inclusion de la polarisabilité,
[5]
:
En effet, dans les termes additifs par paires de l'équation (23) on néglige la
contribution de la polarisation, qui par sa nature est non-additive. Donc, pour l'inclure
dans la fonction d'interaction, on se sert de l'approche des polarisabilités atomiques,
où on attribue une polarisabilité
à chaque atome i. L'énergie de polarisation
dépend du champ électrique permanent
qui agit sur l'atome i et du moment
dipolaire induit :
……………(25)
Alors, pour rendre compte de la polarisation, il faut déterminer
par une
procédure itérative. En effet, à partir d'un champ initial
=
, on se sert du
tenseur dipolaire
et de ce champ pour calculer le champ électrique du pas
suivant
:
…………………… ..(26)
La procédure itérative mène à un champ auto-cohérent qui obéit à un critère
de tolérance bien défini. Ensuite, on calcule une contribution de ce champ à la force
d'interaction entre les atomes i et j :
……………..(27)
Ce terme sera donc ajouté comme force spécial e à la fonction d' interaction.
5. Mécanique et dynamique moléculaire :
5.1. Minimisation de l'énergie :
Le rôle de la minimisation dans les pr ogrammes de dynami que moléculaire est
surtout de relaxer la structure initiale et d’éliminer les mauvais contacts
Interatomiques. Ceci permet notamment d’éviter les changements de conformation
trop brusques dès le début d’une dynamique.
Généralement les structures « minimisées » correspondent au minimum local
le plus proche de la structure de départ plutôt qu’au minimum global d’énergie. Donc,
la minimisation correspond à la première étape d’un protocole de dynamique
moléculaire, elle peut êtr e aussi utilisée autour des phases d’équilibration (phases de
dynamique sous contrainte) de façon à relaxer le solvant et à accélérer son
équilibration autour du soluté.
De même, la minimisation dans les programmes de mécanique moléculaire
comme LIGAND et GNMlig permet de trouver le minimum d’énergie potentielle dans
le champ de force étudié et sous les contraintes imposées. Généralement, ces
méthodes autorisent des changements de forme plus importants grâce à la réduction
du nombre et de la nature des variables ou la simplification du champ de for ce.
Alors, les méthodes de minimisation sont basées sur le calcul des dérivées de
la fonction d’énergie et utilisent des processus itératifs : à partir de l’énergie
potentielle et du gradient, calculés pour un jeu de coordonnées, ces algorithmes
génèrent un nouveau jeu de coordonnées correspondant à une énergie potentielle
plus basse, [4].
Donc, la mécanique moléculaire nous per met de minimiser l'énergie calculée à
partir de l’équation 14 afin d'avoir des conformations à basse énergie de notre
système moléculaire et de réduire des forces initiales trop grandes qui finiront à
générer une trajectoire aberrante.
En effet, on peut utiliser deux méthodes de gradient faisant appel à l'énergie
potentielle V(r; s) et à sa dérivée suivant r. Cependant, l'inconvénient de ces
méthodes est qu'on suit à peu de choses près le gradient de l'énergie potentielle en
se déplaçant de
dans l'espace de con figuration :
………(28)
De cette manière on se déplace presque seulement vers le bas sur l'hypersurface énergétique, et le minimum atteint est en général le minimum local le plus
proche de la configuration initiale (Figure3). Alors, Il n'est pas possible de surmonter
des barrières énergétiques.
Donc, dans ce cas la dynamique moléculaire est un moyen plus efficace de
recherche de conformations de basses énergies, elle permet de surmonter des
barrières de l'ordre de kBT, [5].
Fig.3 : Inconvénient des méthodes de gradient : le minimum local atteint par les deux
boules a et b est différent et dépend de la position (configuration) initiale.
5.2 .Dynamiq ue moléculaire :
Les simulations de dynamique moléculaire donnent la possibilité d’observer le
comportement d’un système en fonction du temps. Aussi, elles permettent
d’échantillonner un espace de conformation important, inabordable aux expériences
de minimisation d’énergie.
Cependant , l’énergie totale du système se décompose en énergie potentielle
décrite par le champ de force et en énergie cinétique liée à la température du
système. Ainsi, L’apport d’énergie cinétique sous forme de température permet
d’exciter le système et de lui faire quitter le minimum local atteint au cours de la
minimisation. Alors, le système ayant accumulé suffisamment d’énergie peut
explorer l’espace de conformation et accomplir des transitions de conformations par
sauts de barrières énergétiques successives. D’où, nous avons utilisé les
expériences de dynamique moléculaire afin d’obtenir des structures stables et de
basses énergies, [4]. Nous avons pour cela utilisé la version 4 du programme de
dynamique moléculaire TINKER.
5.2.1. Principe :
À partir d'une fonction d'énergie empirique comme celle donnée dans
l'équation (14), Les simulations de dynamique moléculaire sont largement utilisées
pour étudier la structure, la dynamique et certains aspects thermodynamiques des
systèmes moléculaires à l'équilibre et hors équilibre. En effet, les équations de
mouvement des atomes issues de la mécanique classique sont intégrées dans le
temps. Donc, dans un système de coordonnées cartésiennes, ces équations sont
celles de NEWTON (11-13), avec les forces
égales au gradient de l'énergie
potentielle mais de signe opposé.
Alors, dans une simulation de DM standard, l'énergie totale E du système
moléculaire est une constante. Généralement, on garde également le nombre
d'atomes N et le volume de la boîte de simulation fixe. Or, ces simulations se
déroulent dans l'ensemble micro-canonique (NVE).
Souvent il est préférable de maintenir la température constante plutôt que
l'énergie, il s'agit alors de simulations (NVT).
Dans d'autres cas, il peut être avantageux de simuler à pression constante
plutôt qu'à volume constant, ce so nt des simulations (NPT).
Pour les simulations (NVT) ou (NPT) il est nécessaire de coupler le système
moléculaire à un bain thermique ou un bai n de pression, respectivement, [1].
5.2.2. Résolution de l’équation du mouvement, [4]:
Comme on a dit au paragraphe précédent, en dynamique moléculaire, les
formes successi ves du système étudié sont générées grâce à la résolution des
équations du mouvement de Newton. Donc, Il en résulte la trajectoire qui indique les
positions (coordonnées cartésiennes) et les vitesses des atomes qui décrivent le
système au cour s du temps.
Alors, la force
s’appliquant sur l’atome i est calculée en dérivant la fonction
d’énergie potentielle
par rapport aux coordonnées car tésiennes de cet atome :
………. (29)
Donc, pour chaque atome i de masse
la force
exercée par l’ensemble
du système sur cet atome vérifie l’équation du mouvement de Newton :
……………… ..(30)
En effet, l’équation ci-dessus est un système d’équations différentielles du
deuxième ordre pour laquelle une solution discrétisée peut être obtenue à l’aide d’un
développement de T aylor.
A partir de la connaissance des positions et de toutes leurs dérivées à l’instant
t, les positions à l’instant (t±Δt), où Δt représente le pas d’intégration, sont données
par :
…………… (31)
6. Systèmes dans le vide, [1] :
Notons que la simulation d'un système in vacuo (ou dans le vide) correspond
à la phase gazeuse à pression zér o.
Lorsque ce protocole est utilisé pour une molécule "en solution", les propriétés
des atomes proches de la surface du système sont altérées, et l'effet d'écrantage du
solvant sur les interactions électriques entre charges et dipôles de la molécule ne
peut être négligé en général. La molécule elle-même peut également être déformée
à cause de sa tendance à mi nimiser son aire de surface.
Alors, les quantités de mouvements associés à la translation et à la rotation
sont conservées, et il est d'usage de supprimer le mouvement de translation du
centre de masse et la r otation autour de ce centre au début d' une telle simulation. Or,
la température d'un système in vacuo peut être calculée par l'équation de
CLAUSIUS :
……………… ..(32)
avec la constante de BOLTZMANN
=8.31441·10-3 kJ
et
est le
nombre de degr és de liberté du syst ème donné par :
………………………… (33)
où
: Nombre d'atomes,
le nombre de contraintes et
une variable qui
dépend des condi tions de simulation.
En effet, pour un système dans le vide avec suppression du mouvement de
translation et de la rotation du centre de masse,
=6.
7. Système dans un milieu solvate (non vide), [4] :
On a vu dans le dernier paragraphe que les calculs de modélisation et de
dynamique moléculaire peuvent se réaliser pour des molécules placées dans le vide.
C’est le cas de notre présente étude. Néanmoins, il est très intéressant de tenir
compte des effets du solvant lors de l’étude des molécules biologiques (surtout des
protéines), ceux-ci jouant un rôle essentiel dans la structuration de ces dernières
(voir Chapitre 1).
Dans ce cas, Il existe aussi deux façons de tenir compte de ces effets, à
savoir l’approche explicite consistant en l’utilisation de molécules d’eau explicitement
ou l’approche implicite consistant en l’utilisation des fonctions énergétiques
représentant les interactions avec le solvant.
7.1. Approche explicite, [4] :
On peut utiliser le solvant (ici l’eau) de façon explicite. Dans ce cas, chaque
molécule d’eau est modéli sée.
·
Modèles :
On prend par exemple le modèle en 3 points TIP3P ("Transferable
Intermolecular Potential 3 Points") développé par JORGENSEN et al. Pour le liquide
pur, [4], [1].
En effet, ce modèle conçoit trois atomes (un oxygène et deux hydr ogènes) liés
par trois liaisons (deux liaisons O-H de 0,957 Å et une liaison H-H de 1,514 Å) de
constante de force de 553 kcal.mol-1. L’oxygène est chargé négativement de –0,834
e (e est la charge élémentaire égale à 1,6.10-19 C) et les charges des hydrogènes
sont de +0,417 e. L’atténuation des interactions électrostatiques par le solvant est
intrinsèque au modèl e (ε = 1) ainsi que la polarisation.
D’autres modèles existent dans la littérature. On citera par exemple celui
nommé SPC ("Simple Point Charge") qui diffère du modèle TIP3P dans la prise en
charge des charges atomiques utilisées, des paramètres de Van Der Waals et de la
géométrie. On peut aussi citer les modèles SPC/E, TIP4P ainsi que le tout récent
modèle TIP5P qui incorpore une représentation explicite des deux paires libres sur
l'oxygène de l'eau a été mise au point tout récemment.
·
Limite :
Notons que le nombre de molécule d’eau à ajouter pour simuler un
environnement aqueux est important et augmente avec la taille de la protéine. Donc,
il en résulte un accroissement consi dérable du nombre de vari ables du système et du
temps de cal cul, [4].
7.2. Approche implicite (modèle de Born généralisé) , [4]:
Pour étudier les systèmes de grande taille, il est souvent très utile d’utiliser un
solvant implicite. Cependant, ce traitement du solvant est plus rapide que les
représentations explicites du solvant.
Ainsi, le modèle de Born généralisé (« Generalized Born », GB) traite le
solvant comme un continuum diélectrique. Donc, la contribution électrostatique à
l’énergie de solvatation est donnée par l’équation suivante :
……..(34)
Avec
où :
-
-
……. (35)
est la constante diélectrique du solvant (la constante diélectrique de l’eau étant
égale à 78,5) ;
Κ est une constante calculée d’après le modèle de Debye-Hückel permettant de
représenter l’effet d’un sel. En effet, elle est égale à la constante de Debye-Hückel
multipliée par 0,73 pour prendre en compte la surestimation de l’effet du sel due au
fait que rien n’empêche les contres-ions d’avancer très près du soluté ;
sont les charges partielles des atomes i et j respectivement ;
est une fonction telle que fGB→Ri quand
→0. Or, cette fonction minimise le
calcul de l’énergie de deux charges en interactions coulombiennes écrantées par
Debye-Hückel quand les deux charges sont éloignées,
étant la distance entre
-
les deux atomes i et j ;
sont les rayons effectifs de Born des atomes i et j respectivement. En fait,
ces rayons dépendent non seulement des rayons atomiques intrinsèques
des deux atomes considérés mais aussi des rayons
ou
et des positions relatives
des autres atomes par le biais d’une fonction positive notée g. Ils sont calculés
avec la méthode de Hawkins, Cramer et Truhlar, [28], qui donne un rayon de Born plus
grand que le rayon atomique :
……..(36)
Remarquant que les paramètres utilisés sont ceux de Tsui et Case, [29], qui
ont montré que l’ADN restait stable sur 12 ns de dynamique moléculaire avec
l’utilisation de ces paramètres. Ils ont montré aussi que, pour les protéines, cette
modélisation du solvant permettait un gain important de temps par rapport à
l’utilisation d’un solvant explicite tout en représentant raisonnablement des effets de
solvant, [30].
Cependant, l’avantage de ce modèle continu est de pouvoir limiter le nombre
d’atomes du système par rapport à l’utilisation d’un solvant explicite tout en tenant
compte des effets él ectrostatiques du solvant.
En effet, pour une protéine d’environ 2000 atomes, le remplacement du
solvant explicite par l’approche de Born généralisée représente un gain d’environ
30% de temps de cal cul (sans autres simplifications).
8. Modélisation de la dynamique de la chaîne peptidique des protéines en
solution par RMN à travers les couplages dipolaires, [15] :
Observer la structure tridimensionnelle d’une protéine à l’échelle atomique est
très important pour comprendre sa fonction et son mécanisme. Or, cela n’est pas
suffisant pour une compréhension totale de son fonctionnement. Donc, pour que
l’étude soit complète, il est indispensable de s’intéresser à sa dynami que.
De ce fait, comme hétéro-polymères comprenant un grand nombre de degrés
de liberté, les protéines présentent une dynamique interne riche et complexe
étroitement associée à leur réactivité à travers différentes catégories de mouvements.
On prend comme exemple, les fluctuations conformationnelles de surface permettant
la reconnaissance, les interactions entre partenaires, l’entrée et la sortie de ligands
ou de substrats, les fluctuations structurales du site actif engendrant une distribution
des vitesses de r éaction et la relaxation conformationnelle successi ve à la réaction.
En effet, la Résonance Magnétique Nucléaire (RMN) occupe une position
particulière parmi les méthodes biophysiques de part sa grande sensibilité aux
mouvements intramoléculaires des protéines. Cependant, les mouvements rapides,
avec un temps spécifique allant jusqu’au temps de corrélation de la réorientation de
la molécule, autour de 10 ns pour les protéines de taille moyenne en solution
aqueuse à température ambiante, peuvent être étudiés directement par les mesures
de relaxation de spin, une technique bien établie maintenant.
Ces méthodes expérimentales, combinées avec une analyse intuitivement
simple en termes d’amplitude dynamique et de fréquences du mouve ment, font par tie
du parcours classique des expériences généralement réalisées dans une étude de
protéine par RMN. Or, dans des échelles de temps plus importantes, l’échange
conformationel entre des sites ayant des comportements chimiques différents peut
participer significativement au ter me de relaxation transverse.
En effet, Il est habituellement observé lors de l’expérience de relaxation, une
dispersion qui met en évidence l’équilibre conformationnel sur une échelle de temps
de l’ordre de la microseconde. Ces échelles de temps sont notamment très
intéressantes dans ce cas car un grand nombre de processus biologiques
fonctionnellement importants sont supposés s’y produire.
Récemment, l’utilisation de cristaux liquides dilués permettant un léger
alignement des protéines par rapport au champ magnétique et introduisant, aussi,
une faible anisotropie dans l’espace d’orientation de la molécule étudiée a suscité un
vif intérêt. Ainsi, les couplages dipolaires résiduels mesurés donnent une
information très précise de l’orientation des liaisons internucléaires relativement à un
repère attaché à la molécule. Ceci rend ces couplages très puissants permettant
ainsi de déterminer la structure des biomolécules. Puisque ces mesures proviennent
de moyennes faites sur des échelles temps relativement longues (jusqu’à la
milliseconde) et sur l’ensemble de la population, l’information dynamique qu’elles
détiennent est complémentaire à celle acquise par l’étude de la relaxation de spin et
de ce fait potentiellement très intéressante pour reconnaître des modèles spécifiques
de mouvements.
Notons, que de récentes contributions, [31], employant des couplages
dipolaires résiduels pour étudier les moyennes conformationnelles ont utilisé des
approches sans contrainte géométrique (model free) pour définir les propriétés de
réorientation des vecteur s N-NH.
La direction et l’amplitude de l’échantillonnage angulaire du vecteur
internucléaire sont décrits : soit uniquement à partir d’harmoniques sphériques
moyennées de deuxi ème ordre <Y 2M>, qui sont ensui te résolues explicitement ; soit à
partir de matrices décrivant aussi bien l’information structurale que dynamique à
déterminer.
Ainsi, les deux méthodes ont été appliquées à partir des données
expérimentales des couplages dipolaires résiduels N-NH, mesurées dans 11 milieux
d’alignement distincts, de la protéine d’Ubiquitine. Toutefois, la première méthode
permet d’apercevoir un degré de mobilité qui n’est pas visible à partir des études de
relaxation, possiblement dans la gamme de la nano à la milliseconde. Dans ce
dernier cas, les auteurs n’exposent pas l’amplitude absolue des mouvements, mais
uniquement les paramètres d’ordre qui y sont relatifs.
Abordant le problème différemment, une étude récente, [32], a prouvé en
considérant dans chaque peptide plusieurs couplages dipolaires résiduels mesurés
dans 5 milieux orientant, qu’une seule forme, en accord avec tous les couplages,
peut être déterminée. En effet, une analyse de cette structure a conclu que
l’amplitude des mouvements des vecteurs N-NH était moindre que celle déduite par
l’approche décrite plus haut, l’origine de cette distinction reste inconnue.
De ce fait, un des avantages des approches citées ci-dessus est de montrer
l’utilité, expérimentalement délicate, de trouver un grand nombre (>5) de milieux
d’alignement distincts. Pour arriver à ce but, chaque milieu doit déduire une
orientation résiduelle de la molécule par rapport au champ magnétique
significativement distincte (voir section §.8.3), qui, en pratique, suppose que
l’interaction entre le soluté et le milieu soit différente dans chacun des cas. Donc, Il
est intéressant de développer des méthodes alternatives, peut-être plus générales,
pour détecter la moyenne conformationelle à partir des couplages dipolaires
résiduels.
Alors, dans cette étude une autre approche différente a été développée, qui au lieu d’essayer de
déterminer explicitement les composantes des harmoniques sphériques, et la moyenne du couplage
dipolaire, des modèles géométriques simples ont été testés pour décrire les mouvements locaux. Ainsi,
ils ont pu réduire le nombre de paramètres indépendants essentiels à caractériser les mouvements, tels
que ceux de la chaîne peptidique qui sont des processus complexes. Trois modèles intuitifs ont été
proposés : le modèle à symétrie axiale, les fluctuations du plan peptidique autour d’un axe défini par
les carbones alpha et un modèle de saut entre deux conformations autour de ce même axe et un modèle
de réorientation à symétrie cylindrique du vecteur N-NH.
8.1.1. L’interaction Dipôle-Dipôle Directe :
Notons que chaque spin nucléaire est associé à un moment magnétique de spin et
engendre un champ magnétique dans l’espace environnant. Donc, deux spins nucléaires se
trouvant dans un même voisinage interagiront chacun avec l’autre, le premier « voyant » le
champ magnétique créé par le second et inversement. L’interaction est mutuelle.
Toutefois, inversement aux couplages scalaires, l’interaction dipolaire ne nécessite
pas de liaison électronique entre les deux atomes mis en jeu pour exister. Alors, elle
s’effectue sans intermédiaire entre les deux noyaux. C’est pur cela qu’elle est nommée
« interaction dipôle-dipôle directe ». De plus, les couplages dipolaires peuvent être aussi
bien intramoléculaires qu’intermoléculaires.
L’expression complète de l’Hamiltonien d’interaction dipôle-dipôle entre les spins
Ij et Ik est donnée par :
où ejk est le vecteur unitaire colinéaire à la droite joignant le noyau j au noyau k,
sont
respectivement les moments linéaires des sites j et k, et enfin l’amplitude de l’interaction
dipolaire est donnée par la constante de couplage dipolaire :
où
et
sont les rapports gyromagnétiques des deux spins (en rad.s-1), m0 la permittivité du
avec h la constante de Planck et rjk la distance entre les deux spins (en m). Par
vide,
exemple, pour la paire de spin 15N-1H, en considérant la distance rjk = 1.02 Å, l’amplitude de
l’interaction est égale à bjk/2π = 23 KHz.
Quand les spins sont placés dans un champ B0 intense, seule la composante des
spins selon la direction du champ est significative dans l’Hamiltonien de l’interaction dipôledipôle direct. Ainsi, dans l’approximation des hauts champs, seule cette composante est
prise en compte, les autres sont négligées. Alors, si l’on suppose que le champ B0 est
colinéaire à l’axe z alors l’Hamiltonien se réécrit de la manière suivante :
où d jk vaut :
et qjk est l’angle que fait le vecteur internucléaire avec la direction du champ magnétique
(Figure 4),
B0
q
Fig. 4 : Schéma représente les deux spins, de l’orientation du champ magnétique B0 et de l’angle q.
Remarquant que le cas particulier des liquides isotropes est important parce qu’en
général les mesures en RMN des biomolécules se réalisent dans ce type de milieu. Or, dans
un liquide isotrope, les molécules se réorientent uniformément et avec une vitesse
suffisamment grande pour que seule la moyenne des couplages dipolaires intramoléculaires
soit mesurable. L’isotropie de la réorientation rend cette moyenne nulle. Donc, aucun
couplage dipolaire intramoléculaire n’est mesurable dans ces milieux.
De ce fait, la probabilité p(W)dW que la molécule s’oriente selon l’angle solide
unitaire dW = sinqjkdqjkdjjk (qjk et jjk étant les angles polaires du vecteur internucléaire par
rapport au champ B0) est donnée par :
p(q jk ,j jk )dW =
Donc :
1
sinq jk dq jk dj jk ………… (42)
4p
3cos2 q jk - 1 =
1
4p
ò
2p
0
p
(
)
dj jk ò dq jk 3cos2 q jk - 1 sinq jk = 0
0
………
(43)
D’où :
HjkDD (q jk ) = 0 ……………………… ... (44)
De manière analogue, les interactions dipôle-dipôle intermoléculaires à courte
distance sont moyennées à zéro du fait du mouvement de translation des molécules. Les
interactions dipôle-dipôle à plus grande distance ne sont pas moyennées, mais sont trop
faibles pour être mesurées.
De ce fait, dans un liquide isotrope, en solution aqueuse par exemple, les couplages
dipolaires ne sont pas mesurables. Donc, cela à l’avantage de rendre les raies de résonance
d’un spectre de RMN en solution plus fines et plus lisibles. Néanmoins, il n’est aussi pas
possible d’avoir accès aux précieuses informations de l’interaction dipôle-dipôle direct.
A l’opposé, en RMN du solide, les couplages sont si importants qu’ils rendent
rapidement illisible le spectre d’une protéine.
Or, entre ces deux extrêmes, un compromis a été trouvé dans les liquides
anisotropes. En effet, ceux-ci grâce à leurs caractéristiques singulières permettent
l’exploitation des couplages dipolaires directs en RMN en solution.
8.1.2. Couplages Dipolaires Résiduels (CDR) en milieux orientant :
Une des avancées les plus récentes dans le monde de la RMN haute résolution est
venue de l’introduction des milieux orientant pour le calcul de structure et de dynamique.
Or, Dans de tels milieux, les protéines sont partiellement orientées. Alors, leur espace
d’orientation devient suffisamment anisotrope pour permettre la mesure précise de
couplages dipolaires résiduels (CDR). L’anisotropie induite par ces milieux reste
suffisamment faible pour ne pas perturber le comportement des protéines et préserver au
spectre RMN sa lisibilité.
Donc, nous supposerons, dans un premier temps, la molécule comme une entité
rigide. De même, les distances et les orientations en son sein seront supposées constantes
et seule son orientation par rapport au champ magnétique B0 varie.
Alors, la valeur du couplage dipolaire entre deux spins Ij et Ik de la molécule s’écrit:
Djk = bjk
3cos2 q jk -1
2
………………… (45)
où les crochets représentent la moyenne temporelle ou d’ensemble (le phénomène est
ergodique) de la réorientation de la molécule.
Notons que, l’orientation de chaque vecteur internucléaire ejk, dans n’importe quel
repère lié à la molécule, peut être défini par les angles ax, ay et az que fait le vecteur avec les
axes du système de coordonnées. De la même façon, les angles bx, by et bz définissent
l’orientation instantanée du champ B0 dans le repère lié à la molécule (Figure 5).
B
0
z
b
z
a
b
B
z
b
x
a
z
a
x
y
y
y
A
x
Fig.5 : Représentation des orientations du champ B0 et du vecteur internucléaire
dans le repère lié à la molécule.
Alors, d’après l’équation (41), cosq peut être réécrite sous la forme suivante :
æ cosax ö æ cosbx ö
ç
֍
÷
cosq = ç cosay ÷ .ç cosby ÷ = cosax cosbx +cosay cosby +cosaz cosbz ……..(46)
ç cosa ÷ ç cosb ÷
è
zø è
zø
D’où :
3cos 2 q jk - 1
2
=
3
2
(cosa
x
cos b x + cosa y cos b y + cosa z cos b z
)
2
-
1
…………..(47)
2
En prenant ci = cosa i et Ci = cos b i , on obtient :
3cos2 q jk -1
2
3
1
= é Cx2 cx2 + Cy2 c2y + Cz2 cz2 + 2 CxCy cxcy + 2 CxCz cxcz + 2 CyCz cycz ù û 2
2ë
………(48)
3
1
Soit S la matrice définie par : S ij = Ci C j - d ij où d ij est la fonction de
2
2
Kronecker. Alors, l’équation (48) s’écrit aussi :
3cos2 q jk - 1
= å Sij cosa i cosa j ……..(49)
2
i, j = {x, y, z}
La matrice 3´3 S est couramment nommée la matrice de Saupe ou simplement la
matrice d’ordre. Comme <Cx2> + <C y2> + <C z2> = 1, la matrice S est de trace nulle et, comme
<CxCy> = <CyCx>, S est aussi symétrique. Donc, elle ne contient que cinq termes indépendants.
Si la structure de la molécule est connue, c’est-à-dire que les cosai sont connus, la
valeur des cinq termes indépendants de la matrice en général peut être déterminée à partir
des valeurs du couplage dipolaire d’au moins cinq vecteurs internucléaires distincts.
Généralement, dans l’étude d’une macromolécule biologique, beaucoup plus de
couplages sont mesurés et S est surdéterminé.
La matrice S est réelle et symétrique, donc il est toujours possible de trouver un
repère lié à la molécule dans lequel S est diagonale. Dorénavant, on travaillera toujours dans
ce repère dont on caractérisera la position dans le repère de la molécule par les angles
d’Euler (x1,x2,x3). Alors l’équation (48) devient :
où <Ci2> correspond à la probabilité de trouver l’axe i colinéaire au champ magnétique.
Seule la différence relative entre les valeurs <Ci2> participe au couplage dipolaire résiduel.
1
+ Aii , où A est le tenseur d’alignement, et en
3
utilisant les coordonnées polaires q = a z ; cz = cosq cx = sinq cosf ; c y = sinq sinf ;
Alors, en écrivant Ci2 =
l’équation (50) peut être réécrite sous la forme :
3
b é A cos 2 q + Axx sin 2 q cos 2 f + Ayy sin 2 q sin 2 f ùû ……. (51)
2 ij ë zz
On suppose que |Axx| < |Ayy| < |Azz|. Il est d’ailleurs toujours possible de s’amener à ce
D jk (q ,f ) =
cas.
En utilisant le fait que : Axx + Ayy = -Azz ; 2cos2f = 1 + cos2f ; 2sin2f = 1 - cos2f ; la
formule précédente se réécrit :
ù
3 é æ 3cos 2 q - 1ö
1 2
D jk (q,f) = bij ê Azz ç
+
A
A
sin
q
cos
2f
ú ………. (52)
÷
xx
yy
2 êë è
2
2
ø
úû
(
)
Si on définit la composante axiale Aa et rhombique Ar du tenseur d’alignement A
comme :
Aa =
3
A
2 zz
et
Ar = Axx - Ayy
alors, l’équation précédente devient :
é æ 3cos 2 q - 1ö 3
ù
D jk (q,f) = bij ê Aa ç
+ Ar sin 2 q cos 2f ú ……………. (53)
÷
2
ø 4
êë è
úû
Une des particularités propres aux couplages dipolaires résiduels est leur
dégénérescence (voir Figure 6). Ceci veut dire qu’une valeur donnée ne correspond pas à
une seule orientation du vecteur internucléaire étudié. Alors, on lève ces dégénérescences
en introduisant une cohérence entre les distinctes données en considérant des motifs
structuraux spécifiques ou en utilisant des mesures relativement à deux tenseurs dont les
orientations et les valeurs propres diffèrent.
Fig.6 : A gauche : Coordonnées d’un vecteur internucléaire dans le repère principal du tenseur
d’alignement. A droite : Iso-contours des CDR par rapport à un tenseur d’alignement ; la
valeur des CDR va croissant du gris au noir en passant par le blanc.
Il existe maintenant beaucoup de milieux orientant qu’on à coutume de classer selon
leur conformation, leur mode d’interaction et leur comportement physique, (voir figure7).
Donc, pour qu’il soit possible d’étudier une macromolécule dans ces milieux, l’ordre imposé à
la molécule doit être très petit, précisément moins de 0,002. En effet, l’ordre des particules
du cristal liquide est, quant à lui, grand ; il se situe entre 0,5 et 0,85. D’où, il est clair que les
interactions des macromolécules avec le cristal liquide doivent être faibles. Ainsi, les milieux
doivent être aqueux pour que les protéines soient dans un environnement proche de leur
milieu naturel. Ces conditions sont satisfaites en utilisant des solutions aqueuses de cristaux
liquides fortement diluées ou les milieux avec les cavités anisotropes.
Fig.7 : Milieu orientant.
8.2. Utilisation des CDR dans l ’étude dynamique :
Pour l’instant, on suppose que les macromolécules étudiées sont rigides. Toutefois,
comme on l’a précisé précédemment, il est maintenant bien établi que les macromolécules
en solution possèdent une dynamique interne qui est sans doute très importante sur le plan
biologique.
En effet, les CDR forment une autre voie d’étude de la dynamique alternative à la
relaxation. Bien que les phénomènes physiques mesurés dans les deux cas soient distincts,
l’objet d’étude, lui, est semblable et concerne la réorientation des mêmes vecteurs. Or, les
spécificités de chacune des méthodes sont autant de visions distinctes d’un même
mouvement, les deux méthodes sont donc complémentaires. Alors, l’utilisation des CDR
permet d’étudier les mouvements qui s’échelonnent sur une gamme de temps plus
importante jusqu’à la milliseconde. Remarquant que malgré ce potentiel important pour
étudier les mouvements plus lents, très peu d’études utilisant des modèles géométriques de
mobilité locale dans les protéines ont été décrits dans la littérature. C’est à ce dernier point
que s’intéressera la présente partie, où trois modèles de dynamique moléculaire seront
présentés ainsi que la formulation analytique du CDR qui leur est associé.
8.2.1. Traitement théorique :
Les couplages dipolaires mesurés en présence de dynamique intramoléculaire,
correspondent à une moyenne conformationnelle. Donc, la valeur des couplages dipolaires
mesurée est donnée par :
é
ù
3cos 2 q - 1
3
D jk (q,f) = bij ê Aa
+ Ar sin 2 q cos 2f ú ………(54)
2
4
êë
úû
où les crochets représentent la moyenne angulaire.
Donc, l’équation (54) suppose que les mouvements intramoléculaires n’interfèrent
pas avec le processus d’alignement, ceci veut dire que le processus d’alignement n’est pas
étudié de manière significative par les mouvements internes.
On peut également l’exprimer à l’aide d’harmoniques sphériques moyennées :
D jk (q,f) =
ù
16p é
3
bij ê Aa Y20 (q,f) +
Ar Y22 (q,f) + Y2- 2 (q,f) ú ………. (55)
5
8
êë
úû
(
)
Cette expression a l’avantage d’être facilement convertible d’un repère à un autre en
usant des propriétés relatives aux rotations d’Euler des harmoniques sphériques. En effet,
pour une rotation de repère d’angle (a,b,g), notée R(a,b,g), on a :
R(a,b,g )Y2, M (q,f) =
+2
åe
-ia M ' (2)
M' M
d
(b)e-ig MY2, M ' (q,f) ………. (56)
M '=-2
où d
(2)
M'M
est la matrice de Wigner d’ordre 2.
En suivant la logique précédente, on écrit d’abord, la moyenne des harmoniques
sphériques dans un repère lié au plan peptidique pour qu’ensuite on la transpose dans le
repère lié au tenseur d’alignement en employant la rotation d’Euler appropriée au plan
peptidique considéré (voir Figure 8).
Fig. 8 : Illustration du mouvement FAG et du passage du repère peptidique au repère principal de la
molécule par la rotation d’angle (a,b,g). Le vecteur N-NH est en jaune.
Il s’ensuit que :
é æ +2 - ia M ' ( 2)
ö
d M ' 0 (b) Y2, M ' ÷ +
ê Aa ç å e
ø
ê è M '= -2
16p ê
æ +2 - ia M ' ( 2)
D jk (q,f) =
bjk ê
å e d M ' 2 (b)e- i2g Y2, M '
5
ê 3 ç M '= -2
ê 8 Ar ç +2
ç
ê
e- ia M ' d M( 2)'- 2 (b)e+ i 2g Y2, M '
å
ç
êë
è M '= -2
ù
ú
ú
öú
+ ÷ ú …….(57)
ú
÷ú
÷ú
÷ø ú
û
Dans ce cas, la rotation (a,b,g) décrit le passage du repère principal du tenseur
d’alignement au repère local lié au plan peptidique considéré. En général, on a 16
conventions différentes pour définir les angles d’Euler. On utilisera toujours la convention ZY-Z. Ceci permet de traiter la dynamique de toute la molécule de manière analytiquement
identique.
Notons que, l’équation (57) est linéaire par rapport à la moyenne dynamique des cinq
harmoniques. Si les couplages <Djk> d’une même paire de spin étaient mesurés dans cinq
(ou plus) tenseurs d’alignement connus {Aa, Ar, x1, x 2, x3}, les cinq valeurs <Y2,M’> pourraient
être déterminées en résolvant le système linéaire constitué à partir de l’équation (57), sans
recours aux modèles géométriques. Pourtant, il est difficile d’obtenir la mesure d’un couplage
dans plus de 5 milieux distincts et le cas de l’ubiquitine reste rare.
Un des buts des chercheurs dans ce domaine est de diminuer le nombre de
paramètres nécessaires à la description du mouvement grâce à des modèles géométriques
caractéristiques. Il est aujourd’hui peu probable qu’un seul modèle de dynamique puisse
suffire à la description du mouvement de la chaîne polypeptidique d’une protéine. Dans ce
qui suit, trois modèles distincts seront développés qui représentent les modes du
mouvement les plus inspirés.
Ainsi, dans le développement des trois modèles de dynamique moléculaire suivants,
seule la paire nucléaire N-NH de chaque peptide sera traitée, d’où l’intérêt particulier que
suscite ce couplage se justifie par sa facilité de mesure et sa grande dynamique, la plus
importante de tous les couplages du plan peptidique.
8.2.2. Modèle à symétrie axiale :
Ce modèle à symétrie axiale a été introduit, d’abord, pour son côté intuitif et sa
grande simplicité. Il est censé représenter le mouvement d’une paire atomique en l’absence
d’anisotropie.
En effet, Il se caractérise par une distribution à symétrie axiale du vecteur
internucléaire autour d’une position moyenne. De ce fait, les angles d’Euler (a,b,g) seront
choisis de telle sorte que l’axe z du repère lié au plan peptidique soit le long de la position
moyenne du vecteur internucléaire considéré. Analytiquement, cela se traduit par :
e ± if = e ±2if = 0 …………… ..(58)
D’où :
Y2,±2 (q,f) = Y2,±1 (q,f) = 0 ……………… (59)
Ainsi, l’équation (57) se simplifie en :
é
ù
16p
3
(2)
+i2g
bij Y2,0 (q,f) ê Aa d00(2) (b) +
Ar d02(2) (b)e-i2g + d0(b)e
ú ……..(60)
2
5
8
êë
úû
En explicitant les termes de la matrice de Wigner, nous obtenons :
(
D jk (q,f) =
D jk (q,f) = bij
)
é æ 3cos 2 b - 1ö 3
ù
+ Ar sin 2 b cos 2g ú ………..(61)
ê Aa ç
÷
2
ø 4
êë è
úû
avec (qstatique, f statique) l’orientation de l’axe de symétrie du
3cos 2 q - 1
2
où b = -qstatique et g = -fstatique
mouvement.
L’équation (61) peut aussi être réécrite sous la forme :
D jk (q,f) = S.D jk,statique (qstatique ,fstatique ) …………… ..(62)
où S est le paramètre qui définit le mouvement et Djk,statique le couplage qui serait mesuré en
l’absence de dynamique.
Donc, l’effet de la dynamique dû aux mouvements de symétrie axiale ne dépend pas
de l’orientation du vecteur internucléaire, mais seulement de l’amplitude du mouvement. Le
paramètre, noté S, est à rapprocher du paramètre d’ordre issu des études de relaxation.
Donc, ce dernier s’écrit de manière générale :
S2 =
4p
5
+2
å
M = -2
Y2, M (q,f) Y2,* M (q,f) ……………… ..(63)
qui se simplifie, dans notre cas tel que :
4p
S =
Y (q,f)
5 2,0
2
2
3cos 2 q - 1
=
2
2
……………………… (64)
8.2.3. Modèle des Fluctuations Axiales Gaussiennes (FAG) :
Bien que la dynamique de la chaîne principale d’une protéine soit compliquée, des
simulations de dynamique moléculaire, à partir des peptides et de l’ubiquitine, ont montré
que des mouvements anisotropes de la forme de Fluctuations Axiales Gaussiennes (FAG)
autour d’une position moyenne, étaient particulièrement aptes à représenter le mouvement
fondamental de la chaîne polypeptidique.
En effet, Brüschweiler et son équipe, [31], ont montré que le mouvement d’un peptide
(supposé plan et rigide) pouvait être décrit par un mouvement FAG tridimensionnel défini par
trois rotations aléatoires et indépendantes autour de trois axes orthogonaux, l’axe principal
étant le long de l’axe Cai-1-Cai.
Une simplification du modèle FAG-3D peut être raisonnablement faite en ne prenant
en compte que cette composante et en négligeant les autres. En effet, il a été montré que la
convolution d’un mouvement FAG-1D avec un mouvement à symétrie axiale équivalait, de
façon presque parfaite, à un mouvement FAG-3D.
Alors, pour décrire l’effet de moyennement de ce mouvement sur les CDR du couple
N
N- H, nous supposerons, pour la suite, que le vecteur N-NH est perpendiculaire au vecteur
déterminé par le couple Cai-1-Cai. Il a été montré que cette approximation reproduit de façon
acceptable les amplitudes simulées à partir du modèle FAG-1D. On le nommera le modèle
ortho-FAG.
En fait, les angles d’Euler utilisés dans l’équation (57) nous place dans la
configuration suivante : l’axe z est le long de N-NH et l’axe y est dans le plan peptidique,
approximativement le long de Cai-1-Cai (Figure 8).
Notons que l’équation (61), devient :
DNH
é Aa
ù
s1 3cos 2 b - 1 + 3s2 sin 2 b cos2a +
ê
ú
4
ê
ú ………………… . (65)
= bij
ê 3 ìï
æ 4b
ö üï ú
2
4 b
ê Ar ís1 sin b cos 2g + 2s2 ç cos cos 2d1 + sin cos 2d 2 ÷ ý ú
2
2
è
ø ïþ úû
êë 8 ïî
{(
}
)
en présence de fluctuations axiales gaussiennes par rapport à l’axe y du repère peptidique (f
= 0), et en utilisant :
cos(mq ) =
ò
+¥
-¥
æ -m2s 2 ö
p(q)cos(mq)dq = exp ç
÷ ………. (66)
è 2 ø
p(q) =
où :
æ -q 2 ö
exp ç 2 ÷ ………………… . (67)
è 2s ø
2ps 2
1
et avec :
d1 = a + g
;
d2 = a - g
; s1 = 1+ 3e
-2s 2
;
s2 = 1- e-2s
2
…………… . (68)
L’expression analytique du paramètre d’ordre S relatif à un mouvement ortho-FAG
d’amplitude s est la suivante :
S 2 = 1-
(
2
3
1 - e-4s
4
) ……………… (69)
8.2.4. Mo dèle du saut à deux sites :
Le modèle du saut à deux sites décrit les sauts de formes entre deux sites, chacune
des formes étant équiprobable. De la même façon que pour le modèle FAG-3D, il est
raisonnable de considérer le saut à deux sites d’un peptide comme étant une rotation par
rapport à l’axe Cai-1-Cai d’angle 2q centrée sur la position d’équilibre de N-NH. On supposera,
comme pour le FAG, que le vecteur N-NH est perpendiculaire à l’axe Cai-1-Cai.
Donc, dans le repère lié au peptide i considéré, la loi de probabilité angulaire s’écrit :
p(x) =
(
)
Y2- 2 =
1 15
sin 2 qe -2ij
4 2p
1
d (x + q) + d (x - q) ……………………… ..(70)
2
Alors, Les harmoniques sphéri ques sont moyennées de la mani ère suivante :
Y20 =
Y21 = 0
Y2-1 = 0
,
(
)
1 5
3cos 2 q - 1
4 p
,
Y22 = -
,
,
1 15
sin 2 qe+2ij
4 2p
…………………… ..(71)
où q représente la demi-amplitude du saut.
L’expression du couplage dipolaire dans le repère principal du tenseur d’alignement A
s’obtient en réécrivant l’équation (57) et en explicitant les harmoniques sphériques
moyennées :
DNH
é Aa ,
ù
s1 3cos 2 b - 1 + 3s2, sin 2 b cos2a +
ê
ú
4
ê
ú ………(72)
= bij
ü
ê 3 ïì , 2
ú
æ
ö
b
b
ï
,
4
4
ê Ar ís1 sin b cos 2g + 2s2 ç cos cos 2d1 + sin cos 2d 2 ÷ ý ú
2
2
è
ø þï úû
êë 8 îï
{(
)
}
avec :
d1 = a + g ; d 2 = a - g
;
s1, = 2(3cos 2 q - 1) ; s2, = 2 sin 2 q ………. (73)
Donc, l’expression analytique du paramètre d’ordre S relatif à un saut à deux sites
d’amplitude 2q est la suivante :
3cos 2 2q + 1
S =
………(74)
4
2
Notons que la formule liée au saut à deux sites est remarquablement proche de celle
du modèle de l’ortho-FAG. Une étude plus poussée montre qu’elle se comporte aussi de
façon très analogue. Aussi, jusqu’à une amplitude 2q de 43.5° (0,76 radians), il est
impossible de différencier le modèle du saut à deux sites du modèle FAG, parce que, jusqu’à
cet angle, les deux modèles balayent les mêmes valeurs de CDR, (Voir Figure 9).
Fig.9: Comparaison entre le modèle FAG (trait plein) et saut à deux sites (pointillés), D étant la valeur
du couplage (pas à l’échelle) (a = b = g = 60°, Aa = 20.10 , Ar = 13.10 ).
-4
-4
8.3. Méthodes numériques :
8.3.1. Le Tenseur d’Alignement A:
On a vu précédemment que le tenseur d’alignement caractérise l’orientation des
macromolécules en solution. C’est une matrice réelle d’ordre 3, de rang 2, symétrique et de
trace nulle. Donc, elle ne possède que cinq paramètres indépendants et est toujours
diagonalisable dans une base orthonormée. Or, on a l’habitude de l’expliquer à l’aide des
trois angles d’Euler (x1, x2, x3) définissant son repère principal (dans lequel il est diagonal)
par rapport au repère absolu (dans lequel sont données les coordonnées des atomes de la
protéine), et de même à l’aide de sa composante axiale Aa et rhombique Ar (Voir la section
§8.1.2).
En fait, le calcul du tenseur d’alignement peut être réalisé à partir de la structure de la
protéine et des couplages dipolaires disponibles grâce au logiciel MODULE. La structure
permet de préciser les coordonnées des vecteurs internucléaires associés aux valeurs des
CDR.
Donc, le tenseur possédant cinq paramètres indépendants, cinq couplages au moins,
et leur vecteur internucléaire associé doivent être connus pour déterminer complètement le
tenseur.
En pratique, un maximum de couplages est utilisé. Cela permet de minimiser les
erreurs dues au bruit contenu dans la valeur des couplages mesurés et dans la structure
utilisée.
Or, l’algorithme de détermination réalise une régression par la méthode des moindres
carrés. Spécialement, il minimise, en jouant sur les paramètres de la matrice, la fonction c2
suivante :
2
æ D exp - Dicalc ö
c x1 ,x2 ,x3 , Aa , Ar = å ç i
÷ ………(75)
si
ø
i è
2
(
)
où Diexp est la valeur expérimentale du couplage dipolaire i, Dicalc est la valeur du couplage
dipolaire i calculée via l’équation (53) et s i représente l’erreur sur la mesure du couplage
dipolaire i. Par conséquent, plus l’erreur sur un couplage sera grande moins celui-ci aura de
poids dans le c2. Donc, la méthode de minimisation s’appuie sur deux algorithmes : un
algorithme de recuit simulé et l’algorithme de Levenberg-Marquardt. En effet, les deux
algorithmes travaillent de façon complémentaire, celui de Levenberg-Marquardt étant
particulièrement bien adapté à la recherche d’un minimum de l’espace paramétrique, par
contre celui de recuit simulé permet d’identifier les distincts minima de ce même espace.
Donc, L’association des deux est spécialement efficace pour déterminer le
minimum de l’espace paramétrique défini par le c2. Pour cela, on peut choisir d’utiliser le
couplage dipolaire statique du résidu « i ».
Ce choix se justifie par le fait qu’on ne connait pas, à priori, la dynamique liée à ce
résidu. Néanmoins, un des points indispensables de cette étude est de montrer que la
dynamique influe de manière non négligeable sur la valeur des CDR. Donc, Il est important
de mentionner que les paramètres du tenseur d’alignement résolus par la méthode
« classique », sans prendre en compte les effets de la dynamique locale, seront influencés
par un effet de moyennement complexe de tous ces mouvements et que les amplitudes
locales extraites grâce à ce tenseur seront aussi affectées. Il existe deux approches pour
résoudre ce problème. La première consiste à employer les couplages N-NH et de remplacer
l’expression du couplage statique par la formule (65) du FAG-1D en optimisant un paramètre
supplémentaire, <s> représentant une amplitude moyenne des mouvements ortho-FAF de
tous les sites considérés. Il a été montré que cela progresse significativement la justesse des
calculs. D’ailleurs, cette amélioration constitue une preuve supplémentaire que le
mouvement FAG est bien une composante de la dynamique de la protéine. La seconde,
valable si l’on considère un mouvement FAG, consiste à prendre pour calculer le c2
seulement les couplages des paires nucléaires qui subissent le moins de dynamique, c’est à
dire les couples Cai-1-Cai de chaque peptide.
8.3.2. Calcul du paramètre de dynamique :
Notons que, une fois acquise l’expression des tenseurs d’alignement et les angles
d’Euler (a,b,g), tous les paramètres des différents modèles de dynamique sont connus sauf
le paramètre de dynamique. Alors, il est relativement facile de le déterminer en l’ajustant
par rapport aux données expérimentales. Pourtant, ce paramètre peut être mal défini s’il est
calculé à partir d’un seul tenseur d’alignement. De ce fait, on peut prouver que certaines
orientations du plan peptidique rendent l’effet d’un mouvement FAG presque ou
complètement inobservable (par exemple, si le vecteur est placé sur un iso-contour, (voir
Figure 6), c’est à dire qu’avec ou sans FAG, dans ces directions, la valeur du CDR calculé
est identique. Donc, il est nécessaire, pour une analyse consistante de la dynamique,
d’ajuster le paramètre de dynamique à partir de données issues de plusieurs milieux
orientant dont les tenseurs d’alignement sont suffisamment distincts les uns des autres.
De la sorte que nous combinerons les données découlant de m milieux d’alignement
distincts, pour extraire le paramètre de dynamique (S, s ou q) du résidu r. Dans ce dessein,
ils ont utilisé la méthode des moindres carrés qui consiste à minimiser la fonction :
2
æ Dexp - D calc ö
r ,m
r ,m
2
c r S,s ,q = å ç
÷ ……………… . (76)
s
÷ø
m ç
r ,m
è
où Dr,mexp est le couplage dipolaire expérimental du résidu r dans le milieu m, Dr,mcalc est le
couplage dipolaire du même résidu calculé par la formule du modèle qui nous intéresse et
sr,m l’erreur relative à la mesure du couplage de ce résidu.
({
})
Il faut bien marquer la distinction majeure entre les deux fonctions c 2 (75, 76)
définies ci-dessus. En fait, l’équation (75) se calcule avec tous les couplages d’un même
milieu, alors que l’équation (76), elle, ne prend en compte que les couplages relatifs à un
seul résidu résultant des distincts milieux d’alignement.
Le calcul de l’incertitude est réalisé à l’aide de simulations Monte-Carlo basées sur
l’estimation de l’erreur des mesures expérimentales des CDR (la fonction erreur associée
aux mesures de CDR est supposée être de type gaussien, la valeur communément appelé
« erreur » étant l’écart type de la gaussienne associée).
9. Logiciel TINKER :
TINKER ou « L'ÉTAMEUR AMBULANT », est une collection de programmes
particulièrement adaptée à la construction et à la manipulation des peptides et des
oligonucléotides.
Ainsi, le logiciel TINKER est un programme de modélisation moléculaire avec
un package général et complet de la mécanique et la dynamique moléculaire,
particulièrement les bio-macromolécules.
TINKER peut fonctionner sous WINDOWS, MAC, UNIX ou LINUX, son code
de source écrit en Fortran77 est disponible pour tous les chercheurs.
Ce logiciel a la capacité d'employer n'importe lequel des ensembles de
paramètre commun ou des variétés de champ de force, tels qu’AMBER (ff94, ff96,
ff98, ff99), de CHARMM (19 et 27), Allinger le millimètre (MM2-1991 et MM3-2000),
OPLS (Opls-uA, Opls-AA et Opls-AA/l), water, aussi bien que le champ multipolaire
atomique polarisable de force d'AMIBE, [7], [9].
Le logiciel que nous avons utilisé permet la visualisation en 3D moléculaire de
base (wireframe, spacefilling, boule et bâton, etc..) avec usages spéciaux pour des
paramètres spécifiques de champ de force tels que des rayons de Lennard-Jones et
des grandeurs partielles de charge.
10. Description des algorithmes :
On va donner une courte description des composants principaux de chaque
algorithme, y compris quelques algorithmes qui sont appliqués dans le programme
TINKER, [8].
Pour une molécule n des atomes nous empl oyons les notations sui vantes :
est la fonction d'énergie potentielle
, où
est le vecteur à
coordonnées cartésiennes à la
itération,
est le
vecteur gradient de taille
, et
est la matrice
symétrique formée
des deuxi èmes dérivées partielles de par rapport aux différentes coordonnées.
Donc, dans tous les algorithmes les itérations se font comme sui t :
……. (77)
où
est le vecteur de di rection de descente, et
est la longueur de l’étape.
Alors, les itérations seront terminées quand :
,……. (78)
où || || indique la norme Euclidienne.
Les changements nécessair es des programmes ont été réalisés afin de
s'assurer que chacun des algorithmes emploie le même critère d'arrêt. En outre, ils
employent la même ligne de recherche qui est basée sur l'interpolation cubique, et
est sujet à ce qui est appelé Conditions de strong Wolf :
……..(79)
où
, et l'indice supérieur T indique la transposée.
· Algorithme conjugué non-linéaire de gradient :
Le CG emploie les dérivées analytiques de f, définies par . Une mesure le long
du vecteur négatif courant de gradient est prise lors de la première itération. Des
directions successives sont construites de sorte qu'elles forment un ensemble de
vecteurs mutuellement conjugués. A chaque étape, les nouveaux réitèrent sont
calculés à partir de l'équation (77) et des directions de recherche sont exprimées
périodiquement comme :
……(80)
Le calcul de  avec l'algorithme incorporé dans CONMIN est décrit par
Shanno. La remise en marche automatique est employée pour préserver un taux de
convergence
recherche
linéaire. Pour des itérations de relance ment,
. D'autre part, pour des itérations de non restart,
direction
de
……..(81)
· L'algorithme tronqué de Newton, [8]:
Dans l’algorithme Tronqué de Newton (TN) en trouvant une solution
approximative aux équations de newton
…………(82)
L'utilisation d'une approximative est justifiée car une solution exacte de
L'équation de newton à un point loin du minimum est inutile et informatiquement
inutile dans le cadre d'une méthode de base de descente.
Ainsi, pour chaque itération externe
équation (82), il y a une boucle
d'itération intérieur se servant de la méthode conjuguée de gradient cela calcule
cette direction approximative
.
Le produit de vecteur de toile de jute
pour donné
requis par le conjugué
intérieur l'algorithme de gradient est obtenu par une approximation de différence finie,
……………..(83)
Une issue importante est comment choi sir en juste proportion .
L'algorithme intérieur est terminé en utilisant l'équation quadratique essai de
troncation, qui surveille une diminution suffisante du modèl e quadratique
:
Où est le compteur pour l'itération intérieure et
est une constante,
.
L’algorithme de l'intérieur est également terminé si une limite supérieure imposée
sur le nombre d'itérations intérieures, M est atteint, ou quand une perte de positifdéfinit est détectée dans la toile de jute (par exemple quand
).
Des méthodes de T N peuvent êtr e prolongées à des pr oblèmes plus génér aux,
qui ne sont pas corps convexe plus ou moins de la même façon comme méthode de
newton.
Comprenons la méthode libre de newton de toile de jute (HFN), considèrent
un inexact Newton-type itération pour résoudre le problème,
où est une
longueur d'étape et direction de recherche, est un minimiser approximatif du
modèle quadratique,
.
Ici indique le gradient de la fonction objective
, et
est définie une
matrice symétrique et positive. La minimisation approximative du l'équation
quadratique
est exécutée par la méthode de CG.
On le suppose que, si la courbure négative est rencontrée, l'itération de CG
Se termine immédiatement sans explorer cette direction de courbure négative. Une
méthode inexacte de Toile de jute-libre de newton est un exemple particulier de ceci,
méthode dans laquelle B est prévue pour être la toile de jute,
,mais n'est pas
calculé explicitement.
Tous les produits de la forme
sont l'un ou l'autre rapprochée par des
différences finies,
, où h est un petit paramètre, ou est
calculé par des techniques automatiques de différentiation. Il n'y a aucun consensus
sur le meilleur essai d'arrêt pour l'itération de CG., et les diverses règles sont utilisé
dans la pratique.
· NEWTON.EXE, [12]:
La routine de newton.exe est un algorithme de solution qui peut de manière
adaptative incorporer plusieurs différentes méthodes de minimisation (NewtonRhapson, courbure négative, etc.).La routine de newton.exe exige de la matrice de
toile de jute (deuxièmes dérivés) de fonctionner qui peut deviennent un problème
pour les systèmes très grands. Pour beaucoup de simulations c'est une routine plus
rapide parce qu'il n'oscille pas bien aut our de l'énergie minimum.
· Algorithme de VERLET:
Parmi les algorithme qui sont utiliser par TINKER, algorithme gaussien, Jorj
Nocedal, algorithme de minimisation de Monte Carlo, algorithme de William Davidon,
BEEMAN,
STOCHASTIC ,RIGIDBO ,BERENDEN ,
ANDERSEN ,NOSE
HOOVER ,algorithme d’Elber, et Dans ce qui suit nous décrivons l'algorithme Verlet,
qui est simple et le plus utiliser dans les différent logiciel ,La particularité de cet
algorithme est que la vitesse des atomes n' apparaît pas expli citement dans l'équation,
et ainsi un couplage avec un bain thermique par ajustement des vitesses deviennent
impossibles, [1].
…………… . (85)
Or, Le temps de calcul nécessaire est directement proportionnel au pas
d'intégration Dt.
Ainsi que, Le pas Dt doit rester petit devant la période de vibration la plus courte
dans le système afin de pouvoir montrer ce mouvement. Généralement, ce sont les
vibrations X-H qui limitent t à
s=1 fs ,[1].
11. Analyse des repliements,
[14]
:
Une étude des repliements est menée par Gerstein et al, [33], sur le génome
du ver C.elegans, en utilisant des méthodes de comparaison de séquence 2 à 2 et
multiples (FASTA (Families of Structurally Similar Proteins) et PSIBLAST). Ils trouvent
alors qu’environ 250 repliements présentent des similarités avec environ 8000
domaines dans environ 4500 ORFs (Open Reading Frame) c’est une séquence
contenant une série de triplets codant pour les acides aminés, non interrompue par
un codon de terminaison, ainsi Cette séquence est potentiellement traduisible en
protéines, [40]. Environ 32 similarités locales ("matches") par repliement impliquant un
quart du total des ORF. De ce fait, Ils ont confrontés les repliements dans le génome
de ce ver à ceux d’autres organismes modèles (en particulier E.coli) et trouvèrent
que le ver C.elegans partage plus de repliements avec la levure
(phylogénétiquement plus proche) qu’avec E.coli. Donc, Il y a environ 36 repliements
uniques au ver comparé aux 2 autres organismes modèles. Énormément de ceux ci
sont impliqués dans des aspects de la vie multicellulaire. En effet, le plus commun
est le repliement immunoglobuline, et beaucoup des repliements communs sont
répétés en combinaisons et permutations dans les protéines multi-domaines.
Cependant, les auteurs constatent également une prévalence des protéines avec 7
segments transmembranaires (en comparaison à d’autres génomes de nonmétazoaires).
D’autre part, David Lee et al, [34], ont pu reconnaître et analyser les familles de
protéines sur 120 génomes. Ces familles de protéines ont été constituées d’abord
grâce à un algorithme de classification Markovien, suivi d’un regroupement sur la
base de l’identité de séquence. Les domaines sont reconnus pour chaque famille de
séquences, en utilisant une librairie de HMM contenant des domaines CATH et
PFAM. Ensuite les domaines ont été caractérisés par Domain Finder. Ce dernier se
base sur un calcul simplifié des modes normaux pour déterminer les domaines
dynamiques des protéines, [35]. Lee et ses collègues, comme les autres auteurs,
trouvèrent que la distribution des familles suit une loi de puissance. De ce fait, les
2000 familles de domaines les plus larges peuvent être attribuées à environ 70% des
séquences génomiques non singleton (non unique). Le reste est attribué à de bien
plus petites familles. Cependant, 50% des annotations en domaines d’un génome
sont attribuées à 219 familles universelles de domaines, uniquement 10% des
protéines le sont à une famille universelle de protéines. Donc, Ceci affirme l’idée que
l’évolution se ferait par duplication et mélange des domaines ("domain shuffling")
pour donner de nouvelles architectures qui étendrait le répertoire fonctionnel d’un
organisme.
Pour étudier l’évolution des structures, Abeln et Dean, [36], ont aussi examiné
l’usage des repliements sur des génomes complets. En effet, la présence ou
l’absence de repliements sur les génomes donnent une idée des relations entre
repliements, de leur âge et de leur évolution. Ainsi, 157 génomes complets ont été
analysés. Cependant, l es auteurs ont recherché le nombre de copies d’un repliement
par génome, le nombre de famille par repliement, et le nombre de génome dans
lesquels existe un repliement donné. La recherche a été faite en se basant sur la
classification SCOP((Structural Classification Of Proteins) et PSIBLAST. Les cas des
domaines structuraux de SCOP ont été cherchés sur les génomes grâce à
PSIBLAST. En se servant de PSIBLAST, les auteurs découvrent un (ou plus)
domaine de SCOP pour 37.4% des gènes dans l’ensemble des génomes (cela va de
66% dans des symbiontes comme Buchnerasp à 22.7% dans Plasmodium
falciparum. En revanche, environ 10% des familles, superfamilles et repliements de
SCOP n’ont pas été trouvé sur aucun des 157 génomes (principalement des
structures de protéines appartenant à des virus). Par contre, les bactéries possèdent
relativement plus de repliements différents que les archaebactéries. D’autre part, les
eucaryotes ont eux plus de copies d’un repliement sur leurs génomes. Lorsqu’on
prend en compte les classes de repliements, la classe a/b a moins de repliements
distincts sur les grands génomes, plus de copies sur les génomes bactériens, et plus
de repliements dans les trois règnes. D’où la supposition faite par les auteurs que la
plupart des repliements a/b sont parvenus plus tôt que les autres repliements. En
effet, une loi de puissance (attendue) est observée pour les copies d’un repliement
par génome, et une loi de puissance est également observée pour le nombre de
familles peuplant un repliement. Néanmoins, une distribution moins claire est
observée pour les occurr ences d’un repliement parmi les génomes.
Donc, Il n’y a pas non plus de relation claire entre les 3 mesures d’usage des
repliements : un repliement qui existe dans beaucoup de génome n’a pas
nécessairement beaucoup de copies sur un génome, et vice-versa.
Enfin, la loi de puissance est du type
où
et sont des
constantes. Vu que les données sont lacunaires, la loi de puissance a été montrée
grâce au fait que les rangs provenant d’une loi de puissance suivent aussi une loi de
puissance. Les auteurs calculent le rang descendant de x,
, en sommant sur
tous les éléments x. Cette somme peut être approximée (pour
) par une
intégrale, par exemple le nombre d’observations (N) multiplié par la surface sous la
distribution de probabilité de
représente le nombre d’observations
supérieures à :
……. (86)
12. Banques de structures et Classifications:
Notons qu’il ya deux techniques physiques majeures permettant la
détermination expérimentale de la structure des protéines : la diffraction des rayons
X sur des cristaux de protéines et la Résonance Magnétique Nucléaire (RMN) sur
des protéines en sol ution.
En effet, le but final de ces techniques est la reconnaissance de l’ensemble
des coordonnées dans l’espace de tous les atomes de la protéine étudiée, c’est à
dire sa structure tridimensionnelle (tertiaire ou 3D), [13].
La banque principale de structures est la PDB (Protein Data Bank). C’est une
banque de données concernant les structur es protéiques ou nucl éiques (ou les deux)
obtenues par cristallographie aux rayons X ou par RMN. Elle contenait environ 6000
structures en 2000, 13000 en 2006. Actuellement, environ 16000 structures ont été
résolues et rendues accessibles publiquement, elles sont répertoriées et stockées
dans la PDB. Toutefois, elle est très redondante (par exemple, il y a plus de 100
lysozymes, dont beaucoup de mutants ponctuels dont la structure 3D ne change
pas). Néanmoins, pour rechercher les structures il est souvent pl us agréable d’utiliser
le site PDB-Sum qui contient plus d’informations sur les structures et leurs
séquences ainsi que des liens avec d’autres banques. Il existe beaucoup d’autres
banques contenant des informations sur les structures, [14].
Alors, parmi les 16000 structures actuellement connues, nombreuses sont celles qui
se ressemblent. Cette observation a motivé le développement de méthodes
permettant de les confronter automatiquement par superposition de leurs structures
3D. Parmi ces méthodes, on tr ouve les pr ogrammes VAST, Dali, CE et Pro Sup, [39].
Ainsi, après comparaison de toutes ces structures entre elles, il est possible de
regrouper celles qui se ressemblent et ainsi constituer une base de données de
repliements. Cela peut être fait manuellement comme pour SCOP [39], semiautomatiquement comme pour CATH ((Class Architecture Topology Homology), [39]
ou bien automatiquement comme pour DDD [39] et MMDB ((Molecular Modeling
Data Base), [39].
D’après ces bases de données, le nombre de repliements différents connus
semble se placer entre 600 (selon SCOP) et 1200 (selon CATH). En effet, en se
servant de VAST pour comparer toutes les structures présentes dans la PDB, nous
avons trouvé environ 700 groupes ayant des structures globales différentes.
Cependant, une question importante relative à la diversité des protéines est
de savoir combien il existe de repliements différents dans la nature. Ceci est une
question difficile, pour preuve, nous venons de voir qu’en connaissant les structures
des Protéines, les appréciations du nombre de repliements connus varient du simple
au double. Puisque ces structures sont inconnues, l’estimation est encore plus floue.
Cependant, plusieurs études ont essayé de répondre à cette question, portant sur
une fourchette variant de 700 à 10 000 repliements, [13].
13. Réalisation d’une dynamique moléculaire
Plusieurs étapes sont nécessaires avant de réaliser une simulation de
dynamique moléculaire.
13.1. Structure initiale de la molécule :
En premier lieu, il faut construire la molécule, ce qui consiste à établir les
positions des atomes du système dans un espace tridimensionnel. La construction
de cette structure initiale se fait soit en dessinant à l’écran de façon interactive, soit
par assemblage de fragments moléculaires contenus dans une base de données, où
les positions des atomes en 3D sont obtenues à partir des données expérimentales
dérivées de la RMN, Rayon X ou autre. En effet, ces données expérimentales nous
renseignent par exemple sur les valeurs des longueurs de liaison, des angles de
liaison et des angles dièdres. On aboutit ainsi à une conformation générale de la
molécule.
Dans notre travail, on extrait la structure de notre protéine à partir du fichier
1o06(PDB) contenu dans la PDB, qu’on injectera par la suite dans le logiciel TINKER
afin de l’étudier.
13.2. Paramétrisation :
Les structures simulées et les propriétés calculées dépendent particulièrement
de la fonction énergie potentielle et des autres paramètres utilisés. La fiabilité du
champ de forces de dynamique moléculaire est reliée à sa capacité à reproduire le
maximum de grandeurs expérimentales.
Il faut également que l e champ de for ce soit transférable d’une molécule à une
autre et soit aussi utilisable dans un grand nombre de domaines. La paramétrisation
est donc une étape essentiel le pour le développement du champ de for ces, [27].
Divers procédés sont employés pour la paramétrisation de la fonction énergie
potentielle empirique. Les paramètres (X, Y, Z,…) doivent être déterminés pour
chaque atome ou groupe d’atomes. Si on veut développer un potentiel assez
complet distinguant les différents types de carbone, d’oxygène ou autre, le nombre
de paramètres devient rapidement impressionnant et n’est pas toujours justifié pour
le système étudié. La détermination de ces paramètres peut se faire par ajustement
d’une autre valeur de références, celle-ci étant calculée empiriquement. L’observable
de référence peut être de nature géométrique (liaison, angle, paramètre du réseau
cristallin), énergétique, thermodynamique (chaleur de formation ou sublimation),
électronique (moment dipolaire) ou de toute autr e nature.
Elle peut être aussi une valeur calculée théoriquement par mécanique
quantique (différence d’énergie ∆E, moment d’inertie µ). Les spectres de vibration
sont également utilisées mais simplement pour vérifier le champ de force avec des
écarts typiques entre fréquences vibrationnelles observées et calculés de l’ordre de
30 à 100cm-1.
Dans notre cas on n’a pas besoin de paramétrisation car tous ces
renseignement sont contenues dans le fichier PDB.
13.3. Minimisat ion de la structure :
Apres la construction de la molécule, le système obtenu est minimisé par les
procédures de minimisation, qui seront décrites par la suite, afin d’enlever les
mauvais contacts ou les contraintes locales qui pourraient gêner la dynamique
moléculaire très sensible à la configuration initiale.
Donc, la minimisation permet d’obtenir la conformation de départ pour la
dynamique moléculaire ou Monte-Carlo. Il s’agit de la conformation la plus stable,
c’est à dire celle qui possède l’énergie la plus basse.
En général, la fonction d’énergie potentielle présente un minimum absolu ou
global et un grand nombre de minima locaux. Toutes les méthodes de minimisation
permettent de se déplacer sur la surface de l’énergie potentielle afin de trouver un
minimum. Donc, il faut commencer par un point donné de cette surface et choisir la
direction et la longueur de pas, l’espace des coordonnées pour laquelle l’énergie
potentielle est minimale.
Ce choix se fait en fonction des informations locales au point de départ
(gradient de l’énergie, matrice de dérivées secondes) et aussi en fonction de pas
précédents.
Il existe de multiples méthodes pour la minimisation de la structure d’une
molécule. Les critères d’efficacité de ces méthodes sont la capacité de faire diminuer
rapidement en peu de pas l’énergie, un rayon de convergence ( qui permet d’éviter
de retourner à un même minimum), une bonne convergence (faculté à toujours
s’approcher du minimum), la rapidité d’exécution (temps de calcul) et la place
mémoire occupée par le calcul, [27].
14. Ensembles appliqués à la dynamique moléculaire :
Les propriétés du système modélisé sont reliées aux positions et impulsions
des particules par la mécanique statique. Celle-ci permet le calcul des moyennes
prises sur l’ensemble de tous les états possibles du système en respectant la
conservation du nombre de par ticules N, du vol ume V (ou parfois de la pression P) et
soit de l’énergie total E, soit de la température T pour les principaux ensembles
utilisées en si mulation. Les ensembl es appliqués à la dynamique moléculaire opèrent
le plus souvent dans l’ensemble NVE, dit micro-canonique, qui correspond à un
système isolé ou l’énergie est fixée au départ, la température fluctuant pendant le
calcul jusqu’à atteindre une valeur d’équilibre.
Depuis une dizaine d’années, de nouveaux algorithmes ont permis d’étendre
cette méthode à des ensemble différents, tels que NVT (l’ensemble iso-thermique,
iso-chorique), NPT (l’ensemble isobarique, iso-thermique) et enfin µPH (l’ensemble
grand-canonique), [25]. Ainsi, en plus de l’ensemble NONE (aucun paramètre fixé),
les différents ensembl es qui peuvent êtr e adaptés sont :
ü L’ensemble micro-canonique NVE : le nombre de particule N, le volume V et
l’énergie sont fixes.
ü L’ensemble canonique NVT : le nombre de particule N, le volume V et la
température T sont fixes.
ü L’ensemble iso-thermique, isobarique ou l’ensemble NPT : le nombre de
particules N, la température T et la pression P sont fixes. Cet ensemble est
devenu le plus commun pour les dynamiques moléculaires des systèmes
protéiques et nécessaire pour les simulations de lipides et de protéines
membranaires, [26].
ü L’ensemble iso-enthalpique, isobarique NPH ou NPE : le nombre de particules
N, la pression P, et l’enthalpie H sont fixes.
ü L’ensemble grand-canonique ou l’ensemble µPH : le potentiel chimique µ, la
pression P et l’enthalpie H sont fixes.
15. Topologie du système :
Pour que les programmes de simulation reconnaissent les molécules en tant
que telles, il faut leur fournir des informations sur les liaisons entre atomes, la
constitution de chaque molécule, les masses et charges à utiliser, etc. Il s'agit de la
topologie moléculaire. Le logiciel TINKER possède des modules qui permettent de
générer cette topologie, soit à partir d'une bibliothèque de fragments déjà existants,
soit à partir des coordonnées dont on dispose, ou en créant une nouvelle structure.
Une fois établie, cette information est une caractéristique du système et ne change
pas pendant la simulation, [5].
Pour faciliter la mise en œuvre de l’étude nous avons choisi le cas de
protéine dans le vide.
16. Protéine d’Ubiquitine :
16.1. Protéine d’ubiquitine, [6]:
L'ubiquitine est une protéine employée, elle-même, comme marqueur de
protéines à éliminer. Elle est ainsi nommée car elle est localisée dans tous les
compartiments subcellulaires de toutes les cellules des organismes, elle est dite
ubiquitaire.
Alors, l’ubiquité est la capacité d'être présent en plusieurs lieux simultanément.
Le terme est dérivé du latin « ubique » qui signifie « partout ».
Donc, l’ubiquitination indique la fixation spécifique et régulée d'ubiquitine sur une
protéine cible. Ceci a pour conséquence la reconnaissance puis la destruction de la
protéine marquée par le complexe protéolytique du protéasome.
16.2. Structure de l’ubiquitine, [6] :
L'ubiquitine comprend 73 acides aminés et a une masse moléculaire d'environ 8500
Da. Sa structure est très conservée parmi les distinctes espèces d'eucaryotes : l'ubiquitine
humaine et celle d'une levure partagent 96 % d'identité pour leur séquence protéique. En
effet, l'ubiquitine est une petite protéine présente dans toutes les cellules des eucaryotes.
Fig.10 : Représentation de
La structure de l'ubiquitine.
Fig.11: surface moléculaire de l'ubiquitine
16.3. Mécanisme d 'action, [6] :
Il existe trois systèmes de protéolyse ou destruction des protéines :
ü une destruction par des enzymes (protéases) digestives non spécifiques :
trypsine, pepsine, chymotrypsine des protides alimentaires ;
ü le système lysosomial, non spécifique, permettant la dégradation et le
recyclage des protéines cellulaires par des protéases intra-cellulaires ;
ü le système ubiquitine-protéasome, toujours intra-cellulaire, mais cette fois
hautement spécifique par un système de marquage des protéines à dégrader.
La fonction principale de l’Ubiquitine est de marquer d'autres protéines en vue
de leur destruction, que l'on appelle la protéolyse. De multiples molécules
d'ubiquitine sont liées de manière covalente à la protéine cible (polyubiquitination),
grâce à l'action de trois enzymes, E1, E2 et E3-ligases. Ce pendant, la protéine ainsi
changée est ensuite dirigé vers un protéasome, une structure en forme de baril dont
l'activité est régulée par l'ubiquitine, et dans laquelle la protéolyse se déroule. Alors,
L'ubiquitine est libérée de son substrat et peut être réutilisée, (Pour plus de détails,
voir Chapitre 4).
Il existe des actions séquentielles des enzymes permettant la fixation à
d'autres protéines :
ü Activation : carboxylation terminale de l'ubiquitine par l'enzyme activatrice E1
ü Conjugaison : transfert de la molécule activée d'ubiquitine sur un groupe
sulfure de l'enzyme conjugante E2.
ü Transfert : transfert de la molécule d'ubiquitine via une ubiquitine-ligase E3 à
un groupe amyle d'une lysine acceptative de la protéine à dégrader. Cette
protéine s'étant auparavant liée à la ligase.
Ce processus peut se répéter plusieurs fois jusqu'à former un polymère. Donc,
Il faut au moins quatre molécules d'ubiquitine fixées à la protéine pour que celle-ci
soit adressée au protéasome et dégradée.
Alors, E1 fixe l'ubiquitine; E1-Ubiquitine se fixe sur E2 puis transfert
l'ubiquitine sur E2; E2-Ubiquitine se fixe sur E3. Le complexe E3-E2-Ubiquitine est
actif.
E1 (enzyme d'activation de l'ubiquitine) serait unique. Cependant, Il existerait
près d'une centaine de types d'E2 (enzyme de conjugaison d'ubiquitine) et plus de
1000 types d'E3 (ligase ubiquitine-protéine), cette dernière expliquant la spécificité
de la réaction. E2 et E3 sont souvent associées l' une à l'autre dans le cytoplasme.
L'ubiquitine également peut marquer des protéines transmembranaires
comme exemple des récepteurs pour les retirer de la membrane.
17. Théorie et méthodes, [8] :
Les interactions interatomiques des biomolécules, tels que les protéines et les
acides nucléiques sont habituellement décrits par une fonction empirique ou
énergie potentielle (champ de force). Ceci dépend de la structure (la géométrie) de
la molécule et mène typiquement à une surface d'énergie, comportant un nombre
énorme de minima locaux.
En effet, l’identification de la plus basse énergie (les minima), en particulier le
minimum global, est le but des études de repliement de protéine. Un critère plus
rigoureux est de considérer l’énergie libre harmonique minimale, Fhar, obtenue à
partir du minimum de l'entropie harmonique, Shar.
· Modèles de protéine et fonctions d’énergie, [8]:
Dans ce travail, on a considéré l’exemple de la protéine d’Ubiquitine qui
comprend 73 résidus. Pour l’étudier, on a puisé nos informations à partir du fichier
pdb 1o06 de PDB (Banque de Données de Protéines). Les simulations ont été
effectuées avec le programme de dynamique moléculaire TINKER, ce programme
qui fournit des champs de forces et ainsi des énergies potentielles définis par
AMBER, ainsi que des énergies potentielles de torsion qui dépendent des angles
dièdres , et celle des interactions électrostatiques et des interaction de LennardJones :
……. (87)
où r, sont les valeurs des longueurs et des angles, ainsi que
leurs valeurs
d'équilibre, respectivement.
étant la distance entre l’atome i et l’atome j. Enfin,
, , , n, ,
,
sont des constants.
Notons que l’énergie totale dans le cas où il existe un solvant est donnée par :
………(88)
où
est l’énergie de solvatation,
est la superficie accessible du dissolvant de
l’atome i, est le paramètre atomique de la correspondance de solvatation dérivé
par Das et Mei rovitch pour les boucles de protéines.
18. Modèle de protéine à simuler, [37-38] :
Comme précisé précédemment, on s’intéresse dans notre étude à la protéine
d’Ubiquitine. Dans la PDB (Protein Data Bank), on retrouve actuellement jusqu’en
Février 2009, 735 structures d’Ubiquitine et parmi ces structures, on a choisit la
structure 1o06, car c’est la petite molécule qui contient le moins d’atomes par rapport
aux autres, et afin de faciliter l’étude de dynamique moléculaire avec le logiciel
TINKER, sachant que ce logiciel peut effectuer des calculs de simulation de
molécules contenant jusqu’à 10000 atomes, [17], [16].
18.1. Protéine d’Ubiquitine choisie (VPS27)1o06 :
La structure cristalline de l’ubiquitine, répertoriée dans Protein DataBank sous
le code de base de données 1o06, a été découverte expérimentalement par Ficher
et al le 20 Février 2003 en utilisant la méthode de diffraction des rayons X en
résolution de 1,45 Å.
La protéine est une macromolécule polymérique portant le nom de protéine
vacuolaire assortissant la protéine associée (VPS27 : Vacuolar protein sortingassociated protein n°=27), composée de 622 résidus. Il existe dans cette
macromolécule plusieurs régions. Notre protéine d’Ubiquitine se localise
précisément dans le fragment de résidus 301-320.
Notre protéine d’Ubiquitine, qui est une pr otéine de tr ansport, est structurée en
une seule chaine nommée chaine A. Elle comporte un nombre de non-atomes
d'hydrogène de 172, 33 hétéro-atomes, 20 à 29 groupes et 179 liaisons.
Notons que cette structure existe naturellement dans les saccharomyces
cerevisiae vps27p et a été synthétisée par des méthodes standard de synthèse de
peptide, et le poids de structur e étant égal à 2441,52Da .
Fig.12 : la structure de l’ubiquitine (VPS27)1o06.
· Cellule en crist al :
Longueur a : 34.967
(Å.)
Angle
90.00°
b : 34.967
C : 64.243
90.00°
120.00°
· La séquence de la protéine 1O06 :
a.a
Glu(E) Asp(D) Pro(P) Leu(L) Lys(k)
6
2
1
2
1
9
8
7
8
9
Ala(A) Ile(I)
4
1
5
8
Ser(S)
1
6
Arg(R) Gln(Q)
1
1
11
9
N : nombre d’atomes total :
N=
=6.9+2.8+1.7+2.8+1.9+4. 5+1.8+1.6+1.11+1.9=156 at oms
: Nombre d’acide amine
: Nombre d’atome par acide amine
· Chaine A :
Chaine A est de type polypeptide L, sa longueur est de 20 résidus, sa structure
secondaire est de 75% Hélicoïdal (1 hélice; 15 résidus).
Fig.13 : Séquence de la chaine A d’après les clase de scop,DSSP ,PDB.
Fig.14 : structure secondaire de la chaine A.
18.2. Régions de 1o06, [19], [20]:
Feature
key
Position(s)
Length
Description
1 – 622
622
Vacuolar
protein
sortingassociated
protein 27
Domain
18 – 149
132
VHS
Repeat
258 – 277
20
UIM 1
Repeat
301 – 320
20
UIM 2
Graphical
view
Feature identifier
Molecule processing
Chain
Regions
PRO_0000065893
Zinc finger
170 – 230
61
FYVE-type
L’UIM ((Ubiquitin Interaction Motif) se trouve dans un nombre de protéines
différentes qui fonctionnent dans une variété de la diversité biologique. Ces
séquences analysées ont également fourni une définition plus précise de l'UIM en
tant qu’une séquence de 20 résidus :
X-AC-AC-AC-AC-? -- X-X-Ala-X-X-X-Ser-X-X-Ac-X-X-X-X,
Et où ? représente un grand résidu hydrophobe (généralement Leu), Ac représente
un
résidu acide (Glu, ASP), et X représente des résidus qui sont moins bien conservés,
[18].
P40343 [ 301-320], Vacuolar protein sorting-associated protein 27,
Saccharomyces cerevisiae
10
20
30
40
50
60
MSVSTPSELD ALIEQATSES IPNGDLDLPI ALEISDVLRS RRVNPKDSMR CIKKRILNTA
70
80
90
100
110
120
DNPNTQLSSW KLTNICVKNG GTPFIKEICS REFMDTMEHV ILREDSNEEL SELVKTILYE
130
140
150
160
170
180
LYVAFKNDSQ LNYVAKVYDK LISRGIKFPE KLTLSNSPTA MFDSKTPADW IDSDACMICS
190
200
210
220
230
240
KKFSLLNRKH HCRSCGGVFC QEHSSNSIPL PDLGIYEPVR VCDSCFEDYD LKRHDDSKKS
250
260
270
280
290
300
KKHRHKRKKD RDYSTPEDEE ELIRKAIELS LKESRNSASS EPIVPVVESK NEVKRQEIEE
310
320
330
340
350
360
EEDPDLKAAI QESLREAEEA NVRSERQKAS RQMQPQQPSP QPQPIHSVDL SDEEKDSIYM
370
380
390
400
410
420
FASLVEKMKS RPLNEILEDS KLQNLAQRVF ASKARLNYAL NDKAQKYNTL IEMNGKISEI
430
440
450
460
470
480
MNIYDRLLEQ QLQSINLSQQ YTLPQVPSDP YNYLTENVQN PAESYQTPPL QQLSSHQYKP
490
500
510
520
530
540
QQDVSRQQSV KANSSPTTNI DHLKTIDVTP HAQQKPQSHV ELAPSDPPYP KEEAEDEGTQ
550
560
570
580
590
600
AVQDEESSTQ ESRERPYPVE TENGETSINK RPQGITRYDF PTVPARKFVQ PESTVPLPAS
610
620
SSEIPIKEER PPSPQEELLI
EL
19. Résultats et discussion :
Comme on l’a déjà signalé, les informations concernant la structure 3D native
de notre protéine d’Ubiquitine 1o06 utilisée pour notre étude de simulation de
dynamique moléculaire ont été puisées de la banque de données de pr otéine (PDB).
Notons que notre modèle de protéine 1O06 contient 156 atomes. Elle est liée
à 29 résidus dont 3 atomes de Zi nc (Zn) et 26 molécules d’eau.
Fig. 15: Interface TINKER (Keywords set (Édition des paramètres) à gauche, visualisation graphique à
droite
de la protéine 1o06.
Fig.16 : Structure native de l’Ubiquitine (1o06), prise par TINKER.
La structure native est ensuite analysée par TINKER (voir Fig. 16). La
structure obtenue est ensuite utilisée pour la simulation de dynamique moléculaire
dans les différents ensembles.
Fig.17 : Structure de l’ubiquitine (1o06) analysée par PDB XYZ.
v Simulation dans l’ensemble NONE :
Ø Dynamique moléculaire p our un temps de simulation de 50
picoseconde :
Fig.18 : Evolution dynamique de la structure de l’ubiquitine (1o06)
sous le champ de force AMBER99, TINKER. Photos prises toutes les trois mn.
On obtient les résultats suivants concernant l’évolution de l’énergie potentielle
en fonction du temps et en fonction de la température :
DM Protéine 1o06 (pour 50 picosecond)
300
Energie potentiel V (Kcal/mole)
250
200
150
100
50
0
0
10
20
30
40
50
temps t (pico second)
Fig.19 : Graphe représentant la variation de l’énergie potentielle V en fonction du temps t.
D M P ro t é in e 1 o 0 6 (p o u r 5 0 p ic o s e c o n d )
Energie potentiel V (Kcal/mole)
2 50
2 00
1 50
1 00
50
0
300
31 0
320
33 0
34 0
350
T e m p é ra tu r e T (K e lv in )
Fig.20 : Graphe représentant la variation de l’énergie potentielle V en fonction de la température T.
Ø Dynamique moléculaire p our un temps de simulation de 100
picoseconde :
Fig.20 : les phases de la dynamique de l’ubiquitine (1o06), champ de force AMBER99, TINKER.
Dans ce cas, on obtient les résultats suivants concernant l’évolution de
l’énergie potentielle en fonction du temps et en fonct ion de la température :
D M P ro té ine 1o06 p our 100 pic osecon de
Energie potentiel v (Kcal/Mole)
300
250
200
150
100
50
0
0
20
40
60
80
1 00
T em ps t (picos econde)
Fig.21 : Graphe représentant la variation de l’énergie potentielle V en fonction du temps t.
DM Protéine 1o06 pour 100 picoseconde
Energie potentiel V (Kcal/mole)
250
200
150
100
50
0
280
290
300
310
320
330
340
350
Température T (Kelvin)
Fig.22 : Graphe représentant la variation de l’énergie potentielle V en fonction de la température T.
D M P r o té in e 1 o 0 6 e n s e m b le N O N E
360
Température T(kelvin)
340
320
300
280
260
0
20
40
60
80
100
te m p s t ( p i c o s e c o n d e )
Fig.23 : Graphe représentant la variation de la température T en fonction du temps t,
Dans cette simulation, on a pensé à ajouter un graphe concernant l’évolution
de la tempér ature en fonction du temps (voir Figure 23).
v Simulation ensemble NPE :
Fig.24 : L’évolution de la DM de la protéine 1o06 sous l’ensemble NPE chaque 100picosecande.
D M P r o té in e 1 o 0 6 e n s e m b l e N P E ,V (t )
Energie potentiel V (kcal/mole)
150
100
50
0
-5 0
-100
-150
-200
0
20
40
60
80
100
te m p s t ( p ic o s e c o n d e )
Fig.25 : Graphe représentant la variation de l’énergie potentielle V en fonction du temps t.
D M P r o té in e 1 o 0 6 e n s e m b le N P E ,V ( T ) ,
Energie potentiel V (kcal/mole)
150
100
50
0
-5 0
-1 0 0
-1 5 0
-2 0 0
2
4
6
8
10
12
T e m p é ra tu r e T (k e lv in )
Fig.26 : Graphe représentant la variation de l’énergie potentielle V en fonction de la température T.
DM Protéine 1o06 ensemble NPE, T(t)
12
Température T KELVIN
10
8
6
4
2
0
20
40
60
80
100
temps t (picoseconde)
Fig.27 : Graphe représentant la variation de la température T en fonction du temps t,
v Simulation ensemble NPT:
Fig. 28 : L’évolution de la DM de la protéine 1o06 sous l’ensemble NPT chaque 100picosecande.
D M P r o té in e 1 o 0 6 e n s e m b le N
150
Energie potentiel V (Kcal/mole)
100
50
0
-5 0
-1 0 0
-1 5 0
-2 0 0
-2 5 0
0
20
40
60
80
100
te m p s t ( p ic o s e c o n d e )
Fig.29 : Graphe représentant la variation de l’énergie potentielle V en fonction du temps t.
D M P r o té in e 1 o 0 6 e n s e m
150
Energie potentiel V (kcal/mole)
100
50
0
-5 0
-1 0 0
-1 5 0
-2 0 0
-2 5 0
0
20
40
60
80
100
T e m p é ra tu re T ( k e lv in )
Fig.30: Graphe représentant la variation de l’énergie potentielle V en fonction de la température T.
D M P ro té in e 1 o 0 6 e n s e m b le N P T , T (t)
Température T (kelvin)
100
80
60
40
20
0
0
20
40
60
80
100
te m p s t (p ic o s e c o n d e )
Fig.31 : Graphe représentant la variation de la température T en fonction du temps t,
v Simulation ensemble NVE:
Fig.32: L’évolution de la DM de la protéine 1o06 sous l’ensemble NVE chaque 100picosecande.
D M P ro té in e 1 O 0 6 ,N V E ,V (t)
Enérgie potentiel V(kcal/mole)
1 50
1 00
50
0
-50
-1 0 0
-1 5 0
-2 0 0
0
20
40
60
80
10 0
te m p s t (p ic o s e c o n d e )
Fig.33 : Graphe représentant la variation de l’énergie potentielle V en fonction du temps t.
D M P ro te in e 1 o 0 6 e n s e m b le N V E ,V (T ),
Energie potenteil V (kcal/mole)
15 0
100
50
0
-5 0
-1 0 0
-1 5 0
-2 0 0
0
1
2
3
4
5
6
7
8
9
T e m p é r a tu r e T (k e lv in )
Fig.34 : Graphe représentant la variation de l’énergie potentielle V en fonction de la température.
DM Protéine 1O06,NVE,T(t)
9
Température T(kelvin)
8
7
6
5
4
3
2
1
0
0
5
10
15
20
25
30
35
temps t (picoseconde)
Fig.35: Graphe représentant la variation de la température T en fonction du temps t.
v Simulation ensemble NVT:
Fig.36 : L’évolution de la DM de la protéine 1o06 sous l’ensemble NVT chaque 100picosecande.
D M P ro té in e 1 o 0 6 e n s e m b le N V T , V (t ) ,
Energie potenteil V (kcal/mole)
15 0
10 0
50
0
-5 0
-10 0
-15 0
-20 0
0
20
40
60
80
10 0
t e m p s t (p ic o s e c o n d e )
Fig.37 : Graphe représentant la variation de l’énergie potentielle V en fonction du temps t.
D M P roté in e 1o 06 en se m b le N V T ,V (T )
Energie potentiel V (kcal/mole)
150
100
50
0
-50
-100
-150
-200
1
2
3
4
5
6
7
8
9
10
T e m p érature T (k elv in )
Fig.38: Graphe représentant la variation de l’énergie potentielle V en fonction de la température.
D M Protéine 1o06 e nsem ble N VT ,T (t),
10
Température T (kelvin)
9
8
7
6
5
4
3
2
1
0
20
40
60
80
10 0
te m ps t (picosec onde)
Fig.39: Graphe représentant la variation de la température T en fonction du temps t.
Ø Interprétation :
Notre simulation de dynamique moléculaire (DM) a été réalisée pour deux
pas temporels différents : celui de 50 picoseconde et celui de 100 picoseconde pour
l’ensemble NONE. Pour les autres ensembles (NPE, NPT, NVE et NVT) le pas
temporel a été choisi comme étant égal à 100ps.
Au cours de la première simulation avec un pas de 50ps et qui a été réalisée
durant vingt quatre minute, on a pris une photo de la protéine toutes les trois
minutes pour suivre l’évolution de la structure de la protéine (Voir Figure17). Les
résultats obtenus ont été traités par Origin pour traiter les variations des différents
paramètres (Voir 18-19).
Concernant le graphe 18, on remarque que l’énergie potentielle diminue au
cours du temps jusqu’à se stabiliser à la valeur de 26Kcal/mole. Par contre, la
Figure19, on remarque que la température fluctue autour de la valeur ambiante 300
kelvin (27c°).
La deuxième simulation de pas temporel de 100ps, a duré 30mn, où à chaque
six minutes on a pris une photo pour suivre l’évolution dynamique de la structure de
la protéine étudiée (Voir Figure 20).
Les résultats obtenus ont été aussi traités en utilisant le logiciel Origin. Ils ont
été représentés par les Fi gures 21-23.
Concernant la Figure 21, on remarque que l’énergie potentielle diminue au
cours du temps jusqu’à se stabiliser autour de la valeur de 25kcal /mole. Par contre,
la Figure 22 représente la variation de l’énergie en fonction de la température. Dans
ce cas, on remarque que l’énergie fluctue autour de la température 300kelvin (27c°).
Enfin, la Figure 23 représente la variation de la température en fonction du temps. Ici ,
on remarque que la température se stabilise rapidement autour de la valeur de
300kelvin (27c°).
La simulation de dynamique moléculaire sous les autres ensembles a été
réalisée et les résultats obtenus ont été traités de la même manière que pour
l’ensemble NONE et représentés dans les Figures 24-39.
Grossièrement, les mêmes conclusions peuvent être déduites à partir de ces
ensembles concer nant l’étude de la dynamique moléculaire de notre protéine.
Essentiellement, on en déduit que notre protéine d’Ubiquitine est une
macromolécule biologique assez stable sur le plan énergétique. Ce qui justifie son
utilisation à des fins médicales.
20. Conclusion :
Le repliement des protéines est un domaine d’un intérêt capital. Il concerne
les mécanismes moléculaires par lesquels une chaîne polypeptidique naissante,
résultant de l’information génétique, acquiert sa structure tridimensionnelle, condition
essentielle à l’expression de sa fonction, [22].
En effet, contrairement aux polymères artificiels, les protéines optent pour une
conformation tridimensionnelle bien caractéristique, associée à une fonction
biologique déter minée.
Alors, à chaque protéine correspond une structure donnée, une stabilité et
une dynamique propre, déterminées par la séquence primaire en acides aminés,
laquelle est le résultat de l’évolution.
Or, pourquoi et comment se plient les protéines, et pourquoi certaines
séquences ont été sélectionnées et pas d’autres restent des problèmes principaux
en biophysique, [23]. Quoique, les simulations de dynamique moléculaire tentent de
comprendre ce processus de repliement au niveau atomi que, [24].
Ainsi, la dynamique moléculaire permet de décoder ces informations à travers
un modèle facilitant l'interprétation des résultats, [21].
Le repliement des protéines possède aussi des applications pratiques en
médecine, en particulier, dans la compréhension des différentes maladies associées
aux repliements incorrects à l’agrégation subséquente , [22]. Les mécanismes
moléculaires impliqués dans ce processus complexe ont fait l’objet de nombreuses
études.
Le chapitre 4 est consacré justement à l’aspect usage médical de la protéine
d’ubiquitine dans le traitement des protéines malades sous le phénomène de
mauvais repliement.
Référence :
[1] M. BAADEN : THÈSE « Etudes de molécules extra tantes en solution et aux
interfaces liquide-liquide : aspects structuraux et mécanistiques des effets de
synergie, TOME II», U. F. R. D E S C I E N C E S C H I M I Q U E S, 23 .11. (2000).
[2] F. Manuel, Ruiz-Lopez and all : Rapport scientifique «Simulation informatique
des systèmes enzymatiques : de la structure à la fonction (SIRE) »,
IMPbio, Septembre(2007).
[3] «GUIDE (TINKER) Software Tools for Molecular Design Version 4.2 », juin
(2004).
[4] I. SOURY&L. NAVIZET: «thèse, MODÉLISATION ET ANALYSE DES
PROPRIÉTÉS MÉCANIQUES DES PROTÉINES », l’UNIVERSITÉ PARIS 6, 5 mars
(2004).
[5] M. BAADEN :«Complément de cours ,Outils pour etudier le structure et la
dynamique des peptides et des protéines », E C O L E T H E M AT I Q U E D U
CNRS A R C A CH ON, 1 8 - 2 4 MAI (2 0 0 3).
[6] « Ubiquitine - Wikipédia », fr.wikipedia.org/wiki/Ubiquitine - 35k.
[7] “Files and Subprograms used by Tinker”, 18 November (2005)
[8] B. Dasa and al: “Performance of Enriched Methods for Large Scale
Unconstrained Optimization as applied to Models of Proteins», Florida State
University, Tallahassee, Florida 32306.
[9] J. Ponder Lab:”Software Distributed by the Lab”,[email protected],
28.08. (2008).
[10] Nash, S.G. SIAM J Sci Statist Comput, 6, 599- 616, (1985),
[11]Nash, S.G. SIAM J Numer Anal, 21(4), 770- 778, (1984)
[12] A. Sears: “APPENDIX – TINKER users guide for VEM tests of CNTs”, 1150
Bozeman Trail Bozeman MT, 59715, [email protected] .
[13] A. Marin : « thèse, Développement d’une méthode bioinformatique de
reconnaissance de repliements des protéines et application aux séquences
(orphelines) issues du séquençage de Bacillus subtilis », l’université Paris7,
29.1. (2002).
[14] « Evolution des structures »,28 novembre (2006).
[15]G. Bouvignies and all : « Modélisation de la dynamique de la chaîne
peptidique des protéines en solution par RMN à travers les couplages
dipolaires », 41 rue Jules Horowitz, 38027 Gr enoble Cedex, Fr ance.
[16] J.Prilusky :“OCA Atlas for 1O06”, Bioinformatics and Biological Computing
Weizmann Institute of Science,( 1996-2007).
[17] Protein data bank : “protein ubiquitine”, page 19 (11.11.2008).
[18] Robert D. Fisher and al: “Structure and Ubiquitin Binding of the Ubiqu itininteracting Motif”, Laboratory, Upton, New Yor k 11973-5000,Published, JBC Paper s
in Press, May 14, (2003).
[19] Piper R.C. and al:"VPS27 contr ols vacuolar and endocyti c traffic through a
prevacuolar compartment in Sacchar omyces cerevisiae », 131:603-617(1995).
[20] Verhasselt P and al:"Twelve open r eading frames revealed in the 23.6 kb
segment fl anking the cent romere on the Sacchar omyces cer evisiae chromosome XIV
right arm.", Yeast 10:1355 -1361(1994).
[21] S. Crouzy, « Dynamique moléculaire de canaux ioniques », école (2004).
[22] J. Yon-Kahn : « Repliement des protéines : études in vitro »,
MEDECINE/SCIENCES, 21 : 601 -7 (2005).
[23]C. Royer : « Le rôle de l´eau dans la dynamique conformation elle des
protéines », Centre de Biologie Structurale Montpellier, (2006).
[24] B. GILQUIN, « Exploration des mécani smes de repliement des pr otéines par
dynamique moléculaire », DSV/DIEP/LSP CE N Saclay 91191 GIF sur YVETTE.
(2004)
[25]B.J.Alder & T.E Wainwrig ht: “chem. Phys”, (1957).
[26]P. Fuchs : « Modélisation Moléculaire, Cours3: Méthodes d’exploration de
la surface d’énergie potentielle Dynamique Moléculaire et Analyse de
trajectoire », (2007).
[27] z.cherrak :”utilisation du champ de forces SPASIBA pour des calculs de
dynamique moléculaire de polymères. Application à la polyaniline”, thèse de
doctorat, (2005).
[28]Hawkins & al. Hawkins, et al. (1995-1996).
[29] Tsui & Case;( 2000).
[30] Xia, et al. (2002).
[31] Brüschweile r & Griesinger
[32] T.S. Ulmer and al. Chem. Soc. 125 (2003) 9179-9191.
[33] Gerstein and al. (2000).
[34] D. Lee, A. Grant et Orengo, 2005
[35] Hinsen et al. (1999)
[36] Abeln et Deane,( 2005)
[37] S. Nair and A.E.F .DJAMAI :"Dynamical study of the Ubiquitine Protein",
paper presented at the 16th Congr es "Peptides and protei ns, which takes place from
10 to 15 May ( 2009 )Belambra club" Albéville ", Alsace, France.
[38] S. Nair and A.E.F .DJAMAI:“Simulation of the Dynamical Evolution of the
Ubiquitine”, paper for presentation to Congress of pr otein Society, which takes place
from 14-18 June (2009), Zurich, Switzerland.
[39] CATH :Pearl et al., 2005, 2000 ; Orengo et al., (1997), VAST, Dali : Holm et
Sander, (1993),
CE : Shindyalov et Bourne, (1998), Pro Sup, SCOP: (Murzin et al.,(1995), CATH:
Orengo et al., (1997),DDD,MMDB: Gibrat et al., 1996 ; Madej et al., (1995)
[40]science.ca View question #2327 ,
www.science.ca/askasci entist/viewquestion.php?qID=2327& -table=activities&action=list... - 17k -
Chapitre IV
Conséquences Médicales
1. Introduction :
Une bonne structure protéique assure un bon fonctionnement des protéines.
En effet, le repliement des protéines est un processus qui leur fait prendre une forme
tridimensionnelle précise, laquelle est nécessaire à l’expression de leur fonction dans
l’organisme, [1]. Alors, avant de pouvoir être fonctionnelles dans l'organisme, les
protéines doivent opter pour une structure particulière nommée pliage, et c’est cet
auto-assemblage des protéines qui est nommé repliement. Donc, Un repliement
anormal de certaines protéines peut être à l'origine de beaucoup de maladies dont
celles d'Alzheimer
Parkinson ou de Creutzfeldt-Jakob (ou encéphalopathie
spongiforme bovine - ESB). Or, dans ce dernier cas, c'est un prion qui serait
responsable du repliement défectueux , [2].
Dans ce chapitre, on présente les différentes maladies résultant du mauvais
repliement des protéines et l’importance du choix opéré et concernant l’étude de la
protéine d’Ubiquitine.
2. la protéine prion et prion pathogène :
Le terme prion est un mot, venant de l'anglais « PRoteinaceous Infectious particle
ONly » (particule infectieuse protéinique) à partir de leur description par Stanley Prusiner
dans les années 80. Toutefois, Les prions jouent un rôle utile dans le bon (ou le mauvais)
repliement des protéines, qui permettra de les rendre fonctionnelles ou non.
En effet, La protéine prion Prp-c est présente à l’état naturel et est impliquée dans le
fonctionnement normal de la cellule, au sein de laquelle, ses fonctions, ne sont pas encore
parfaitement connues mais on les soupçonne indispensables. En effet, la protéine Prp-c est
présente avant la spéciation, ce qui explique que tous les mammifères (y compris l'homme)
sont susceptibles de développer des maladies à prions. Cependant, la protéine Prp-c est
impliquée dans le développement du système nerveux chez l'embryon. Chez l'adulte, elle est
présente essentiellement dans le cerveau et la moelle épinière (neurones et glie). De plus,
elle est impliquée dans les processus de distinction et d’adhésion des cellules. Elle aurait
pareillement un rôle protecteur antioxydant ainsi que vis-à-vis de la mort cellulaire
programmée (apoptose). Enfin, cette protéine aurait également un rôle dans le repliement
d’autres protéines, [3].
Fig.1 : Modèle de la protéine prion PrP2.
Le prion pathogène est une protéine prion Prp-c mutée. Toutefois, on ignore la
cause réelle de cette mutation qui incite des maladies à prions (telles que la maladie de la
vache folle, ou encéphalopathie spongiforme bovine, maladie de Creutzfeldt-Jakob,
Chronical Wasting Disease ou maladie du dépérissement chronique des cervidés). Or, lors
de l'infection, l'agent prion, agent pathogène responsable de l'infection, pénètre le neurone,
où pour des raisons particulières et par un mécanisme encore mal compris, il se "multiplie"
de façon exponentielle, en déformant les protéines prion saines en protéines prion mutées
allant jusqu'à provoquer littéralement l'explosion de la cellule nerveuse, [3].
En effet, la maladie de la vache folle, la forme de maladie de Creutzfeldt -Jakob qui
lui est associée chez l'homme et la tremblante du mouton sont provoquées par le repliement
anormal d'une protéine présente à la surface des neurones, c’est la protéine prion. Ainsi,
sans que l'on sache comment, la présence de cette protéine prion dénatur ée change
le cerveau en éponge, d’où l’appellation « encéphalopat hies spongiformes ». L'étude
et la compréhension de ces encéphalopathies spongiformes transmissibles, qui sont
des maladies incurables, se heurtaient jusqu'ici à un obstacle. Les scientifiques
n'avaient aucune idée précise sur la fonction du prion et aucune piste pour la
découvrir. De ce fait, l'étude de la protéine prion normale est indispensable si l'on
veut saisir comment les prions pathogènes modi fient les fonctions neuronales, [4].
3. L’ubiquitine et la protéine chaperonne:
Une protéine chaperonne est une protéine dont la fonction est de par ticiper à la
maturation d’autres protéines en leur assurant un repliement tridimensionnel
approprié. La plupart des protéines chaperonnes sont des protéines de choc thermique
(Heat Shock Proteins: Hsp), c’est à dire des protéines s’exprimant en réponse à des
changements de température, ou d'autres types de stress cellulaire. En effet, la
structure des protéines est sensibles à la chaleur, elles se dénaturent et perdent leur
action biologique. Alors, le rôle des protéines chaperonnes est de prévenir les
dommages potentiellement provoqués par une perte de fonction protéique causée
par un mauvais repliement tridimensionnel. Or, d'autres protéines chaperonnes sont
impliquées dans le repliement de protéines néo-synthétisées alors qu'elles sont
extraites du ribosome. Quoi que la plupart d'entre elles aient la capacité de se replier
correctement sans intervention des protéines chaper onnes, certaines d’entre elles en
sont incapables. Enfin, notons que les pr otéines chaper onnes ont ét é co-découvertes
récemment par A. Horwich et U. Hartl , [5].
En général, les molécules chaperonnes sont des protéines qui se lient aux
protéines naissantes à la sortie des ribosomes pour leur permettre de prendre une
configuration spatiale caractéristique. De la même manière, elles défendent certaines
liaisons protéine-protéine indésirables pour la fonction. Ainsi que, elles permettent de
transconformer certaines protéines pour assurer le passage au travers des
membranes comme la membrane interne des mitochondri es.
En général, les protéines chaperonnes aident à l'acquisition et au maintien de
la structure tertiaire des protéines cellulaires. Dans des conditions normales, elles
favorisent le repliement des protéines néo-synthétisées. En fait, la cellule synthétise
des protéines chaperonnes appelées "Heat Shock Protein" ou Hsp, lorsqu’’elle est
soumise à un stress. Ainsi, le complexe formé par la protéine Hsp70 (Heat Shock
Protein 70) et la protéine CHIP (Carboxy Terminus of Hsp70 binding Protein)
reconnaît les protéines transformées ou endommagées et choisit de les restructurer
si cela est possible ou bien s'en débarrasse dans le cas contr aire.
Quoique, la protéine CHIP est une co-chaperonne, c'est-à-dire qu'elle est
associée à Hsp70 et qu'elle régule son activité, néanmoins, la protéine CHIP a une
autre fonction. Elle joue le rôle de l’Ubiquitine-Ligase, qui reconnaît et marque les
protéines anormales par un signal protéique : l'ubiquitine.
En effet, L'ubiquitine est une petite protéine qui, fixée en grand nombre sur la
protéine-cible, peut la diriger vers le complexe poly-protéique "protéasome", afin
qu'elle soit dégradée.
Notons que l'équipe de Cam Patterson de l'Université de Caroline du Nord à
Chapel Hill., avait déjà cloné le gène codant pour la protéine CHIP en 1999. Or,
l'étude publiée le 23 mars 2006 dans Nature décrit comment la cellule détermine le
devenir de ces protéines mal repliées et des protéines Hsp afin de reprendre une
activité physiologique classique.
Cependant, il a été vérifié que des souris mutées au niveau du gène CHIP
sont plus sensibles aux conditions de stress comme la fièvre ou les infarctus. Par
contre au niveau cellulaire, ils ont prouvé que, lorsque la restructuration des
protéines n'est pas suffisante voire infructueuse, la protéine CHIP marque les
protéines à dégrader. Alors, une fois que toutes les protéines-cibles sont éliminées,
CHIP marque par l’Ubiquitine les Hsp pour les protéolyses. Ainsi, la cellule n'a plus
de "symptômes" de stress et peut revenir à un état physiologique compatible avec
son activité.
Donc, ces résultats représentent un espoir pour les maladies à stress ou
impliquant des protéines mal-repliées telles que la maladie d'Alzheimer, la maladie
de Parkinson et la Chorée de Huntington. Alors, Selon Patterson, CHIP joue un rôle
très important dans l'adaptation cellulaire et accroître son activité pourrait être une
approche pour traiter de telles maladies, [2].
Fig.2 : Structure cristalline de l'ubiquitine.
Enfin, l’ubiquitine (figure2) est une petite protéine comporte 76 acides aminés
dont la séquence est hautement conservée chez les eucaryotes.Comme on a dit
précédemment, l'ubiquitine est une petite protéine de structure simple qu'on trouve
dans toutes les cellules eucaryotes, ces cellules qui ont une membrane nucléaire
séparant le noyau du cytoplasme. D’ailleurs Comme son nom le montre, il s'agit
d'une protéine très commune, présente chez la plupart des êtres vivants, des
organismes les plus simples aux formes de vie l es plus complexes.
En fait, l'ubiquitine a tout d'abord été connue pour son rôle de vidangeuse
dans le processus de dégradation des protéines. Notons qu’au sein des cellules, les
protéines possèdent un cycle de vie en fonction de leur utilité, elles sont synthétisées,
employées à différentes fins, ensuite elles se dégradent. Donc, l'ubiquitine a pour
fonction de repérer les protéines inutiles ou désuètes et de s'y attacher par un lien
chimique, servant alors de marqueur qui entraîne la dégradation de la protéine ainsi
«ubiquitinée».
De plus, l'ubiquitine participe au système de contrôle de qualité des protéines
produites à l'intérieur de la cellule. Ainsi, au cours de la synthèse de ces protéines, il
faut être sûr que celles-ci sont formées convenabl ement. Or, le système de contrôle
de qualité qui implique de multiples processus dont celui de l'ubiquitination, s'assure
que la protéine est bien formée et bien repliée, et qu'elle va pouvoir jouer le rôle qui
est le sien dans la cellule. En effet, lorsque des protéines n'arrivent pas à se replier
correctement, elles sont ciblées par l'ubiquitine, qui vient s'y fixer, montrant au
système qu'il faut s’en débarrasser, [6].
4. Le système d’ubiquitination :
L’Ubiquitine se fixe de manière covalente aux protéines cibles par une liaison
iso-peptidique entre le groupement COOH de sa glycine C-terminale, et le
groupement εNH2 d’un résidu lysine du substrat. En effet, L’ubiquitination des
substrats est effectuée par une série de réactions mettant en jeu plusieurs familles
d’enzymes, [7].
En schématisant alors, l’ubiquitine est d’abord activée par l’enzyme E1, puis
transférée sur l’une des enzymes de conjugaison de l’ubiquitine, E2s. Ces derniers
catalysent la liaison de l’ubiquitine aux substrats protéiques soit directement soit en
présence d’une des protéines ubiquitine-Ligases, E3s, qui reconnaissent les
protéines cibles. Toutes les réactions résultant des E3s mènent à la formation de
conjugués poly-ubiquitinés. En général l’ubiquitine se fixe sur le résidu lysine 48 de
l’ubiquitine précédemment l iée au substr at, [8].
4.1. Enzyme act ivant l’ubiquitine, E1 :
Alors, deux iso-formes de E1 (110 et 117 kDa) dérivant d’un seul gène
trouvent dans le cytoplasme et le noyau des cellules eucaryotes. Chez la levure, la
délétion de E1 est létale malgré l’existence de protéines « E1-like », [9]. Donc, E1
active l’ubiquitine en présence d’ATP en formant une liaison thiol ester entre un
résidu cystéi ne de son site catalytique et l’ubiquitine puis transfère l’ubiquitine activée
sur l’une des E2s, [8] .
4.2. Enzymes co njuguant l’ubiquitine, E2S :
Généralement, ces enzymes assemblent une superfamille de protéines
apparentées ayant un poids moléculaire compris entre 14 et 35 kDa. Alors, Il existe
quatre classes d’E2s qui ont un domaine catalytique central enfermant également un
résidu Cystéine critique pour la constitution d’une liaison thiol ester avec l’ubiquitine,
et des extensions N et/ou C-terminales variables, [10]. Or, onze enzymes E2s
existent chez la levure, et les mammifères auraient au moins 25 iso-formes
différentes, [11], parmi lesquels un nombre limité d’enzymes E2s participe directement
dans la formation des signaux de poly-ubiquitination et donc dans la protéolyse (trois
sur onze chez la levure). De ce fait, il est très important de noter que l’ubiquitination
des substrats n’est pas seulement un signal de dégradation. Il s’agit d’un
changement post-traductionnelle dirigeant les protéines vers d’autres fonctions. Les
protéines mono-, di- ou tri-ubiquitinées sont généralement des protéines stables qui
ne sont pas dégradées, [8]. En effet, le marquage de ces protéines par l’ubiquitine
semble servir essentiellement à leur adressage et à la régulation de leur localisation,
on prend comme exemple l’internalisation de certains récepteur s hormonaux, [8].
Par ailleurs, seules les protéines conjuguées à au moins 4 molécules
d’ubiquitine sont reconnues par le protéasome 26S et dégradées. La formation de
ces protéines poly-ubiquitinées peut être exécutée seulement en présence de
l’enzyme E1 et de l’une des enzymes E2s, [8].
4.3. Les ubiquitines-Ligases E3S et leur classif ication, [12] :
La dégradation des protéines par la voie ubiquitine-protéasome est effectuée en
deux étapes consécutives. Dans un premier temps, les protéines devant être dégradées sont
sélectionnées par des enzymes particuliers, les ubiquitines-Ligases, qui les marquent en leur
ajoutant une "étiquette" caractéristique, formée d’une chaîne de poly-ubiquitines. Dans un
deuxième temps, les protéines ainsi étiquetées sont identifiées et dégradées par le
protéasome 26S. Le protéasome est un vaste complexe rassemblant de multiples activités
protéases qui écartent les protéines ubiquitinées en les transformant en petits peptides
inactifs.
Donc, les ubiquitines-Ligases sont de véritables arbitres de la survie des protéines en
assurant la sélectivité et l’efficacité de leur dégradation par la voie ubiquitine-protéasome.
Les analyses récentes de séquence montrent que le génome humain code pour plus de 150
ubiquitines- Ligases, qui se distribuent en plusieurs classes structurales.
En effet, dans leur grande majorité, les protéines poly-ubiquitinées sont formées en présence
d’une E1, une E2 et une E3, [7]. Or, Certaines E2s interagissent avec de multiples E3s, et inversement.
Ainsi, un substrat donné peut aussi être poly-ubiquitiné par plusieurs combinaisons d’enzymes E2 et
E3 distinctes. Il demeure que l’intérêt probable de ces combinaisons multiples est de générer diverses
voies de poly-ubiquitination d’un substrat spécifique susceptible d’être différentiellement régulé en
réponse à des stimuli donnés, [13]. En plus, comme les enzymes E3s tiennent des sites de
reconnaissance des substrats, [7], l’abondance de ces combinaisons permet de cibler spécifiquement
vers la dégradation un nombre très élevé de différentes protéines.
Néanmoins, ce phénomène est encore augmenté par le fait qu’une enzyme E3 donnée peut
reconnaître des protéines différentes, [14]. Les enzymes E3s montrent une très grande hétérogénéité de
structure, mais appartiennent à deux classes différentes [7].
L’ubiquitine-Ligase (ou l’enzyme E3s) appartient, selon la composition du
complexe enzymatique, à l'un des trois groupes sui vants :
ü une seule unité possédant un motif RING-finger,
ü plusieurs sous-unités dont l'une a un motif RING-finger,
ü protéine possédant un domaine HECT.
5. protéasome-ubiquitine, [15] :
Les protéasomes sont des complexes enzymatiques multi-protéiques que l'on
retrouve chez les eucaryotes, les archées et chez quelques bactéries de l'ordre
Actinomycetales.
Dans les cellules eucaryotes, ils se situent dans le noyau, le cytosol et associés au
réticulum endoplasmique. La fonction principale du protéasome est de dégrader les
protéines mal repliées, dénaturées ou obsolètes de façon ciblée. Donc, cette dégradation se
fait par protéolyse, une réaction chimique qui coupe les liaisons peptiques et qui est
effectuée par des enzymes nommées protéases. Ainsi, la protéine est découpée en
peptides long de 7 à 9 acides aminés qui seront ensuite hydrolysés hors du protéasome et
recyclés. Notons que les protéines sont marquées pour la dégradation par une protéine
nommée ubiquitine. Cependant, ce marquage est fait par l'action coordonnée de trois
types d'enzymes. Alors, une fois le marquage par une première molécule d'ubiquitine réalisé,
d'autres ubiquitines vont être rajoutées à sa suite. Donc, Il faudra une chaîne d'au moins
quatre ubiquitines pour que le protéasome 26S reconnaisse la protéine à dégrader.
En effet, Le protéasome a une forme de baril et a une cavité en son centre cernée
par quatre anneaux, fournissant ainsi un espace clos pour la digestion des protéines. Or,
Chaque anneau est composé de sept protéines où les deux anneaux intérieurs sont formés
de sept sous unités β qui contiennent le site actif de la protéase. Par contre les deux
anneaux extérieurs contiennent sept sous-unités α dont le rôle consiste à maintenir
l'ouverture par laquelle les protéines à dégrader pénètrent dans le baril où ces sous-unités α
sont capables d’identifier les marqueurs de poly-ubiquitine qui régulent le processus de
dégradation. L'ensemble est connu sous le terme de complexe protéasome-ubiquitine.
Fig.3 : Représentation du protéasome obtenue par Diffractométrie de rayons X après cristallisation.
Le cœur catalytique 20S est en bleu. Les deux complexes régulateurs 11S sont en rouge.
Donc, La dégradation protéasomal e est un élément indispensable d’abondant
processus cellulaires, surtout le cycle cellulaire, l'expression génétique et la réponse au
stress oxydatif. Notons que l'importance de la dégradation protéolytique et du rôle de
l'ubiquitine lors de celle-ci a été officialisée par la remise du Prix Nobel de chimie 2004 à
Aaron Ciechanover, Avram Hershko et Irwin Rose . Ainsi que, La régulation du
protéasome fai t encore de nos j ours l'objet de recherches intensives.
6. La voie ubiquitine–protéasome:
En général, La vie cellulaire repose sur l’activité des protéines. Donc dans
toute cellule, l’abondance et l’activité de chaque protéine dépend de l’équilibre de
deux processus : sa synthèse à partir du génome, et sa dégradation par protéolyse.
Lorsqu’on dit Protéolyse, on entend la fragmentation d’une protéine en plusieurs
morceaux sous l ’action d’une enzyme.
Fig.4 : Interaction entre la voie « loi N-terminale » et le système ubiquitine protéasome.
Une protéine en voie de dégradation est associée avec l’enzyme E3α qui
reconnaît ses motifs NH2-terminaux spécifiques. En association avec l’enzyme
E214k, l’ubiquitine activée est transférée vers un résidu lysine. Lorsqu’une chaîne
d’au moins 4 molécules d’ubiquitine est formée sur le substrat protéique, la
reconnaissance par le protéasome 26S est possible, et aboutit au clivage en petits
peptides, qui ser ont par la suite dégradés en acide aminés par des peptidases.
La voie ubiquitine-protéasome est le mécanisme primordial de dégradation
des protéines de toutes les cellules humaines. Donc, Il s’agit d’un mécanisme très
caractéristique, étroitement régulé et contrôlé dans le temps, qui joue un rôle
essentiel dans tous les aspects les plus fondamentaux de la vie cellulaire. Il est
aujourd’hui bien établi que la dégradation des protéines par la voie ubiquitineprotéasome joue un rôle majeur dans la réparation de l’ADN, le contrôle de
l’expression des gènes, la régulation de la progression du cycle cellulaire, l’apoptose
ou la réponse immunitaire, [12].
Fig.5 : Représentation de la dégradation des protéines par l’ubiquitine-protéasome.
En effet, la voie ubiquitine-protéasome (ubiquitination) régule un grand
nombre de fonctions cellulaires critiques, le plus fréquemment en déterminant la
dégradation sélective de certaines protéines clés par le protéasome. Or,
l’amélioration du cycle cellulaire, [16], l'induction de la réponse inflammatoire, [17], et la
présentation antigénique [18] particulièrement sont quelques uns des processus
régulés par la voie ubiquitine-protéasome. Donc, Il n'est pas étonnant de constater
qu'une dérégulation de la protéolyse dépendante de l'ubiquitine a été reconnue
comme étant une cause du cancer, [19] et de plusieurs maladies héréditaires, [20] .
Toutefois, la dégradation n'est pas la seule issue possible pour des protéines liées à
l'ubiquitine. L'ubiquitination régule également certains processus par des
mécanismes qui ne paraîssent pas nécessiter de protéolyse. Cependant, ces
processus incluent notamment l'initiation de la réponse inflammatoire, [21] et le
fonctionnement de certains facteurs de transcription [22]. Ainsi, parmi les protéines
concernées par l'ubiquitination, on trouve notamment p27, p53, p300, les cyclines,
E2F, STAT-1, c-Myc, c-Jun, IKB, NFKB et la p-caténine, [23].
7. Maladies pathologiques impliquant l'ubiquitine:
L’ubiquitine est récemment apparue comme un important régulateur de la fonction et
de la stabilité des protéines, aussi bien chez la levure que chez les mammifères. Or, elle
reconnaît et se lie spécialement aux protéines mal repliées ou incomplètes, constituant aussi
un signal de dégradation qui envoie les protéines anormales dans la poubelle de la cellule, le
protéasome, [24].
En effet, parmi les maladies impliquant l’ubiquitine, on cite le syndrome de Liddle
qui est une maladie rare découverte pour la première fois en 1960 par Grant Liddle et
caractérisée par une hypertension artérielle grave. Une des causes de la maladie parmi
d'autres et une mutation d'un gène codant une des sous-unités du canal sodique ENaC, qui
empêche la fixation de l'enzyme E3 spécifique nommée NEDD4 et aussi la dégradation
d'ENaC .
Ainsi que, la maladie de Parkinson pourrait être également causée par
l'accumulation de certaines substances secondaires à un déficit en certains enzymes E3.
Certains cancers pourraient être provoqués par une dégradation excessive de
protéines inhibitrices, ou par une accumulation d'autres protides en raison de changement de
l'enzyme E3.
Bien que, Le système ubiquitine-protéasome aurait identiquement un rôle lors
de certaines infections virales, [25].
Vu la différence des processus cellulaires contrôlés via la dégradation des
protéines, il n’est pas surprenant de constater que des altérations de la voie
ubiquitine-protéasome soient à l’origine, ou profondément liées à certains maladies
génétiques et à d’abondantes pathologies humaines, comme :
ü les cancers (colorectal, lymphomes…)
ü les syndromes inflammatoires
ü les maladies neuro-dégénératives (maladies de Parkinson, Alzheimer,
Huntington).
En plus, le détournement de la voie ubiquitine-protéasome par des virus et
microorganismes pathogènes de l’homme (induisant la dégradation anormale de protéines
humaines) est à la base de certaines maladies infectieuses, [12].
On distingue plusieurs maladies associées à des dérèglements du processus
d’ubiquitination, telles que des cancers et des maladies génétiques comme le syndrome de
Down.
Or, ces maladies, dites «conformationnelles», découlent du mauvais
repliement des protéines lors de leur formation dans la cellule. Par contre, la liste de
ces maladies croît continuellement et inclut entre autres des affections comme la
rétinite pigmentaire, le diabète néphrogénique congénital, la fibrose kystique et des
multiples maladies neuro-dégénératives.
En effet, deux types de dérèglements de l'ubiquitination liés aux maladies
conformationnelles peuvent être observés. Dans un premier cas, le système de
contrôle, censé écarter les protéines faussement formées, finit par être dépassé par
l'ampleur de la tâche. Alors il apparaît dans les cellules une agrégation de protéines
mal formées dont l’accumulation toxique cause la maladie. Le deuxième cas repose
sur l'activité inverse, c’est le contrôle de qualité, au lieu d'être dépassé, fonctionne
alors «trop bien». Alors, des protéines, dont le code génétique a subi une mutation
mineure, sont reconnues par le système co mme étant incorrectement repliées et sont
donc dégradées par ubiquitination. Donc, on a une perte de fonction de cette
protéine qui, malgré sa mutation, aurait été fonctionnelle si elle n'avait pas été jugée
inadaptée et dégradée.
En saisissant mieux les mécanismes d'action de l'ubiquitine, il sera possible
de les réguler et de favoriser ou d'éviter la dégradation de certaines protéines. Selon
cet objectif, les travaux des lauréats du prix Nobel de chimie 2004 ont mené a la
fabrication du premier médicament dont l 'action consiste à intervenir sur le processus
d'ubiquitination, c’est le Velcade, destiné à traiter certains cancers, [6].
Notons que, si elle a d'abord été connue pour sa fonction de vidangeuse,
l'ubiquitine énonce depuis peu aux chercheurs la diversité de ces rôles dans le bon
fonctionnement des cell ules.
Les chercheurs ont récemment observé que l'ubiquitination, en tant que
changement «post-traductionnelle» de la protéine, est employée pour réguler,
moduler et contrôler la fonction de certaines protéines. Donc, L'ubiquitine est utilisé
pour réguler les interactions protéines-protéines, faisant en sorte que deux protéines
qui doivent interagir le font dans une plus grande ou une moindre mesure. Elle
participe également lors du déplacement des protéines, qui modifient parfois de
«compartiment» à l'intérieur de la cellule, selon leur activité.
Toutefois, ces fonctions de l'ubiquitine restent encore méconnues, elles
devraient cependant ouvrir de nouvelles perspectives de recherche très promettantes ,
[6]
.
La question qui se pose, c’est quels sont les stimuli résultant à la perte des
protéines musculaires au cours des maladies rénales? Il est peu probable que
l’insuffisance rénale en soi puisse accélérer la perte des protéines musculaires, car
les mécanismes compensateurs favorisant le renouvellement des protéines sont
intacts chez les suffisants rénaux tant qu’il n’y a pas de complications surajoutées,
[26-27]
.
En effet,
dans le cas de syndrome néphrotique, les mécanismes
nutritionnels sont préservés et les patients sont capables de supporter un régime
limité en protéi nes sans per dre de masse musculaire, tant qu’il n’y a pas de difficultés
cliniques surajoutées [28]. Néanmoins, certaines complications de l’insuffisance
rénale peuvent inhiber ces mécanismes compensateurs. Or, L’acidose métabolique,
par exemple, stimule la dégradation des acides aminés essentiels et des protéines
dans le muscle de rat [29-30-31] ; des effets semblables ont été observés chez les
adultes sains et des insuffisants rénaux en hémodialyse ou en dialyse péritonéale
(Tableau1). Nouvellement, il A été montré que le système ubiquitine-protéasome
était activé chez les insuffisants rénaux. Quoique, des biopsies musculaires ont été
effectuées à cet effet chez des patients en dialyse péritonéale continue ambulatoire,
avant et apr ès traitement d’une acidose
Métabolique modérée. L’accroissement des bicarbonates était associé à une
diminution significative de la transcription de l’ubiquitine [32], rappelant les résultats
acquis en expérimentation animale [29].
L’insulino-résistance associée à l’insuffisance rénale pourrait pousser le
système musculaire ubiquitine-protéasome [33, 34]. Ce pendant, chez le rat, l’induction
d’un diabète aigu précipite la dégradation protéique musculaire [35,36], et accroître la
Transcription de l’ubiquitine et de la sous-unité E2 14k du protéasome. En effet, ces
anomalies sont indépendantes de l’acidose associée au diabète aigu [36]. Par ailleurs
Il existe une augmentation de la liaison de l’ubiquitine aux protéines musculaires du
rat diabétique in vitro, qui dépend de la présence des enzymes E2 14k et E3α,
suggérant une activité de la loi N-terminale au cours du diabète [37].
Donc il est possible que l’insulino-résistance associée à l’insuffisance rénale
soit un stimulus pour une dégradation précipitée des produits musculaires, via une
anomalie dans la voie de signalisation stimulée par l’insuline, [38].
En général, les virus ont obtenu des stratégies efficaces pour mettre à profit la
machinerie cellulaire d’ubiquitination qui permet d'étiqueter les protéines destinées à
être dégradées par le protéasome. Martin Scheffner, par ses études défricheuses, a
mis en lumière un mécanisme par lequel une protéine virale assure le ciblage
caractéristique d’une protéine cellulaire vers la dégradation par le protéasome, pour
le bénéfice du virus. Or des études antérieures de d’autre chercheures ont identifié
un mécanisme analogue pour la protéine Vpu du virus VIH1. Alors, Vpu recrute
betaTrCP, la protéine à boîte F du complexe ubiquitine ligase SCF betaTrCP et se lie
concurremment à la protéine CD4, le récepteur cellulaire au virus synthétisé par la
cellule au niveau du réticulum endoplasmique (ER). Or, la protéine CD4
intracellulaire est-elle ciblée, de façon anormale, vers la dégradation par le
protéasome, [39].
Fig.6 :Modèle de dégradation de CD4 en présence de Vpu ,
[63]
.
De ce fait, les protéines virales d'enveloppe destinées à la fabrication des nouvelles
particules virales fuient à une rétention dans le compartiment ER, [40].
À parti des exemples de ce type de stratégie virale de piratage des ubiquitines
ligases cellulaires se sont accroîtrais. Donc, on peut citer la protéine V des paramyxovirus
qui induit la dégradation de la protéine STAT1 pour échapper à la réponse interféron, les
protéines E7 du papillome, pp71 du virus CMV et EBNA3C du virus Epstein-Barr qui ciblent
les protéines de type Rb pour l’altération du cycle cellulaire, et la protéine Vif du virus VIH qui
cible la protéine APOBEC3G pour fuir à un "éditing" létal du génome viral. Alors, le
mécanisme général qui se dégage de ces distincts exemples est le recrutement par la
protéine virale d’une E3 ubiquitine ligase et de la protéine cellulaire cible qui devient un
substrat de la machinerie d’ubiquitination, aboutissant à sa dégradation par le protéasome.
Comme on a dit précédemment, Vpu forme un complexe avec la betaTrCP pour
induire la dégradation de CD4. Cependant, la betaTrCP participe dans la progression du
cycle cellulaire. De ce fait, elle assure la destruction au moment opportun, des régulateurs
du cycle cellulaire, tels que Cdc25, Wee1 ou encore, Emi1. Donc, les chercheures
demandent si la protéine Vpu pourrait modifier le déroulement du cycle cellulaire en
empêchant la reconnaissance par la protéine betaTrCP de ses cibles naturelles qui régulent
le cycle cellulaire.
Au cours de ces études, ils ont mis en lumière un mécanisme de dégradation de la
protéine Vpu elle-même. Où, Vpu est dégradé de manière principale dans les cellules
arrêtées en mitose. En effet, ils ont identifié le déterminant de Vpu responsable de son
ciblage vers la dégradation et montré que la mutation de ce déterminant entraîne une
accumulation plus forte de Vpu dans la cellule. Ainsi Vpu stimule le relâchement des virions
dans le milieu extracellulaire, une activité indépendante de sa fonction de dégradation de
CD4. Quoique, Les résultats en cours inspirent que le mécanisme de dégradation opérant
sur Vpu serait désavantageux pour le virus. Malgré cela, une étude comparative exhaustive
des isolats viraux VIH1 montre un taux de conservation très élevé du déterminant de
dégradation de Vpu. Or Ceci suggère une pression sélective en faveur du maintien du
mécanisme de dégradation. Les chercheures évaluent actuellement l'hypothèse qu'une
efficacité optimale de production virale à l'échelle de la cellule infectée aurait pour revers un
effet pathogène exagéré, dommageable à long terme à la persistance et à la transmission du
virus à l'échelle des organismes.
Fig.7 : figure représente une cellule en début de mitose, et une cellule en interphase, et la protéine
Vpu, visualisée grâce a un anticorps couplé à un fluorochome vert, est présente dans des
compartiments péri-nucléaires (Golgi, réticulum).
8. Maladies neuro-dégénératives,
[41]
:
Une maladie neurodégénérative est une maladie qui affecte le fonctionnement du
cerveau ou plus généralement le système nerveux de manière graduelle au cours de son
évolution. Celle-ci peut être plus ou moins longue, de quelques semaines à quelques
années. Généralement, Le processus en cause consiste en une détérioration du
fonctionnement des cellules nerveuses, surtout les neurones, voire à leur mort cellulaire.
Donc, la conséquence pour le malade est une altération progressive souvent irréversible des
fonctions nerveuses qui peut mener à son décès.
Cependant , en fonction des régions du système nerveux atteintes par la maladie, les
troubles pourront concerner la motricité, le langage, la mémoire, la perception, la cognition...
De ce fait, on distingue les maladies atteignant le système nerveux central de celles touchant
le système nerveux périphérique. Une autre différenciation porte sur l'étiologie suivant que la
pathologie soit génétique ou non. Toutefois, dans d’abondant cas, les causes exactes du
déclenchement de la maladie restent inconnues.
Parmi ce type de maladies neuro-dégénératives, on cite la maladie d’Alzheimer,
celle de Parkinson, celle de Creutzfeldt-Jakob (ETB).
8.1. Maladie d'Alzheimer :
La maladie d'Alzheimer, autrefois nommée gâtisme, est la démence sénile la plus
fréquente dans les pays développés, [42]. En effet, La maladie d'Alzheimer c’est une maladie
neuro-dégénérative du tissu cérébral qui entraîne la perte graduelle et irréversible des
fonctions mentales. D’ailleurs, c'est la cause principale de démence chez les personnes
âgées, touchant environ 24 millions de personnes à travers le monde, [43].
Où, Le premier cas de la maladie d’Alzheimer a été découvert par Alois Alzheimer en
1906. Alors, La maladie d’Alzheimer est une démence neurodégénérative à dominante
corticale qui touche en premier lieu les fonctions cognitives et se reflète sur le comportement
et l’adaptation sociale des patients. Donc, elle se détermine par la mort des neurones
cholinergiques du système limbique spécialement ceux de l’hippocampe c’est la zone
mémoire du cerveau, [44].
La maladie d’Alzheimer présente trois types capitaux de lésions que sont l’atrophie
corticale (le cerveau peut perdre de 8 à 10% de son poids tous les 10 ans), les
dégénérescences neurofibrillaires (écheveaux de filaments anormaux à l’intérieur des
neurones) et les plaques séniles (dépôts extracellulaires de substances amyloïde), [44].
L’ubiquitine joue un rôle important dans le turn-over des protéines au niveau du
protéasome 26S mais elle participe aussi au niveau du contrôle du cycle cellulaire, de la
régulation de la transcription, dans la réponse au stress, [45.46] .
La fonction de l’ubiquitine dans la dégradation par le protéasome, se fait au travers
d’une liaison entre le C-terminal de l’ubiquitine et le C-terminal d’une lysine de la protéine de
fusion. Cependant, en plus de cette liaison iso-peptidique, le C-terminal de l’ubiquitine
peut former des liaisons peptidiques sur les groupements amines des carbones α
(figure 12) [47]. Or, le clivage naturel de la fusion est accompli par des protéases déubiquitinylantes. Les fusions à l’ubiquitine, réalisées dans différentes autres
expériences, ont montré une expression allant de 20 à 50% des protéines totales
d’Escherichia coli, [45].
Fig.8 : Schéma de la structure cristalline de l’ubiquitine avec la
Représentation des feuillets β (4) et de la longue hélice α (résidus 23 à 34).
Fig.9 : Représentation schématique de la famille De gènes ayant une fusion naturelle à l’ubiquitine
UBI1, 2,3 sont constitués de la séquence de l’ubiquitine en fusion avec une queue de 52 acides
Aminés pour UBI1 et 2 et de 76AA pour UBI3, cette Fusion contient un site de liaison à un ion
Métallique et un site de liaison à l’ADN. UBI4 est une répétition de 5 séquences d’ubiquitine, [47].
Le diagnostic de la maladie d’Alzheimer pour le moment ne peut être posé qu’a
l’examen du cerveau, à partir de l’autopsie. Alors cet organe présente des modifications
structuraux importants (atrophie de l’écorce cérébrale localisée surtout dans les régions
pariéto- temporo-occipitales, lésions de l’hippocampe, dilatation des ventricules cérébraux,
présence d’abondante plaques séniles dont des dépôts extracellulaires et de l’angiopathie
cérébrovasculaire). En fait, les plaques séniles sont des dépôts extracellulaires compacts et
assez bien délimités des substances amyloïdes retrouvés aussi dans l’angiopathie cérébrale.
Où, cette béta-amyloïde existe aussi dans le plasma et le liquide cérébro-spinal. En
revanche, les embrouillements neurofibrillaires apparaissent plutôt a l’intérieure de la cellule
nerveuse.ils sont majoritairement composés de protéine tau qu’une phosphorylation
insuffisante rendrait inactive de même que l’ubiquitine .donc, ces protéines qui s’accumulent
particulièrement dans le cytoplasme, serait liées a la morts des neurones .le degrés de la
dégradation des fonctions intellectuelles est en étroite relation avec leur densité.
Alors, Les troubles fonctionnels et comportementaux examinés chez la personne
seraient liés aux sites des atteintes cérébrales. Ainsi, les atteintes du lobe frontal seraient
responsables de trouble de la parole, de l’écriture, du contrôle de soi, de la gestion des
émotions et des difficultés relationnelles.
Fig.10: Aspect des lésions observées dans la maladie d’Alzheimer à l’examen microscopique.
Toutes les photographies ont été prises avec un objectif x100 ; le trait de l’image A
représente 20 μm. A. Plaque sénile ; immunohistochimie du peptide Aβ. Un dépôt dense de
peptide Aβ (grande flèche) occupe le centre de la plaque sénile. Elle est entourée d’une
couronne claire (correspondant aux prolongements nerveux de l’image C), puis d’un halo de
dépôt diffus (petites flèches). Un noyau de macrophage est marqué par une tête de flèche.
B. Plaque sénile colorée par le rouge Congo, colorant qui se fixe sélectivement sur les
substances amyloïdes. La partie amyloïde de la plaque sénile (correspondant au centre
dense de la photo A) est indiquée par une flèche. La tête de flèche marque le noyau d’un
macrophage. C. Plaque sénile ; immunohistochimie de la protéine tau. Le centre de la
plaque (grande flèche) est à peine visible. Il est entouré de prolongements nerveux
dégénérés, marqués par l’anticorps anti-tau (petites flèches). Le noyau de deux
macrophages est indiqué par des têtes de flèches. D. Dégénérescence neurofibrillaire ;
immunohistochimie de la protéine tau. Deux neurones sont visibles (marqués a et b). Le
noyau est indiqué par une grosse tête de flèche, le nucléole par une petite tête de flèche. La
dégénérescence neurofibrillaire est constituée par des fibrilles de protéine tau dans le corps
cellulaire du neurone à (flèches), [48].
Or,
Les dommages causes aux lobes pariétaux léseraient à l’interprétation
sensorielle de la douleur, du toucher, de la température et des mots écrits de même qu’a la
mémorisation.
Finalement, les dommages occasionnés au lobe occipital seraient dommageables au
centre de la vision et a la compréhension de l’écriture, [49]. De manière générale, il ya une
destruction massive de certaines neurones menant a la démence et a la mort. Quand la mort
survient, le cerveau a perdu environ le tiers de sa masse. Quoique, les chercheurs n’arrivent
pas a déterminer avec conviction si ces lésions ont une influence étiologique ou si elles sont
le résultat de la maladie, d’ailleurs, c’est là le véritable talon d’Achille dans la recherche sur
la maladie d’Alzheimer.
8.2. La maladie de Parkinson :
La maladie de Parkinson c’est une maladie neurologique chronique atteignant le
système nerveux central responsable de troubles surtout moteurs d'évolution graduelle.
Cependant, ses causes sont mal connues. Habituellement la maladie débute entre 45 et 70
ans. Donc, elle est la deuxième maladie neuro-dégénérative, après la maladie d'Alzheimer.
La maladie de Parkinson se différencie des syndromes parkinsoniens qui sont couramment
d'origines différentes, plus sévères et répondent peu au traitement, [50]. Décrite de façon
scientifique et précise pour la première fois en 1817 par Sir James Parkinson sous le nom de
«paralysie agitante», découverte de 2 des principaux symptômes : l’akinésie et le
tremblement. Alors, jusqu'au l’année 1861-1862 Charcot décrit le 3ème symptôme important
c’est la rigidité et appelle la maladie en exprimant son respect à Sir Parkinson pour son
travail, [51].
En effet, La maladie de Parkinson est définie par la mort graduelle et élective des neurones
dopaminergiques de la substantia nigra et la présence d'inclusions protéiques ubiquitinylées, les corps
de Lewy. Cependant, durant ces six dernières années, quatre gènes impliqués dans de rares formes
familiales de maladie de Parkinson ont été identifiés: des mutations des gènes de l'α-synucléine et de
l'ubiquitine hydrolase UCH-L1 (ubiquitin carboxyterminal hydrolase L1) sont associées à des formes
autosomiques dominantes, tandis que des mutations des gènes de la parkine et de DJ-1 sont
responsables de formes autosomiques récessives. Quoique, Un gain de fonction toxique, associé à
l'assemblage de l'α-synucléine en fibrilles insolubles de type amyloïde, pourrait rendre compte de la
mort neuronale dans les syndromes parkinsoniens dus à des mutations du gène de l'α-synucléine. En
revanche, une perte de fonction serait à l'origine de la maladie de Parkinson incitée par des mutations
des gènes de la parkine et d'UCH-Ll, deux enzymes clés de la voie protéolytique ubiquitineprotéasome. Où, La présence d'α-synucléine, de parkine et d'UCH-Ll dans les corps de Lewy suggère
qu'un dysfonctionnement des voies de repliement et de dégradation des protéines pourrait jouer un rôle
non uniquement dans les formes familiales de maladie de Parkinson, mais aussi dans la forme
sporadique, plus habituelle, [52].
Notons que les causes de la maladie de Parkinson ne sont pas exactement
connues, mai s trois principaux facteur s sont mis en jeu, [51] :
ü Le vieillissement cérébral : n’est qu’un facteur facilitant,
ü Les facteurs génétiques : neuf gènes dont la mutation est responsable de maladies
de Parkinson familiales ont été identifiés.
Or, trois protéines connues sont présentes dans l es corps de Lewy :
·
l’ -synucléine,
·
l’ubiquitine C-terminale hydrolase (gènes sur le chromosome 4) transmission
autosomale dominante,
la parkine (gène sur le chromosome 6) transmission autosomale récessive.
·
Dans de plusieurs cas, le facteur génétique serait particulièrement une
prédisposition à la maladie.
ü Les facteurs environnementaux :
o le MPTP
o Neurotoxines MPTP-like (b-carbolines, tétrahydroisoquinolines)
o Neuroleptiques
o Pesticides (roténone, paraquat, carbamates, organochlorés)
o Métaux (Fer, Manganèse)
Fig.11 : schéma représente le Mécanismes mis en jeu dans la mort des neurones dopaminergiques.
Précisément en 1997, le gène de l’α-synucléine fut le premier à être reconnu
responsable d’un aspect rare de maladie de Parkinson, transmise selon le mode
autosomique dominant, quand’ il porte l’une des deux mutations faux-sens, [53]. En
fait, Les patients porteurs de ces mutations présentent une maladie de Parkinson
sévère, dont le début se pl ace entre la 4e et la 6e décenni e.
Alors, L’α-synucléine est une protéine neuronale de 140 acides aminés, très
conservée chez les vertébrés. Elle est enrichie dans plusieurs régions cérébrales
(néocortex, hippocampe, gyrus denté, bulbe Olfactif, striatum, thalamus, cervelet)
dans lesquelles elle se concentre au niveau des terminaisons synaptiques. Sa
fonction est loin d’être éclaircie, [54]. In vivo, l’α-synucléine est étroitement associée
aux vésicules synaptiques. Or, in vitro, elle s’associe avec des vésicules de
phospholipides synthétiques ou purifiées à partir de cerveau.
Une apparition importante a été franchie au Japon, en 1998, avec la
découver te de l’implication du gène de la parkine dans un syndrome Parkinsonien
familial à début précoce, transmis suivant le mode autosomique récessif, [53].
Aujourd’hui, le gène de la parkine paraît intervenir dans près de 50 % des cas
familiaux transmis suivant le mode autosomique récessif, avec un début avant 45
ans, mais aussi dans plus de 15 % des cas isolés de maladie de Parkinson à début
précoce, dans des populations de différentes origines ethniques. Plusieurs
combinaisons de mutations ponctuelles, délétions ou reproductions d’exons dans le
gène de la parkine rendent compte d’un tableau clinique changeant, parfois
semblable à celui de la maladie de Parkinson idiopathique, [55].
En effet, La parkine est une protéine ubiquitaire de 465 acides aminés, définie
par la présence d’un domaine homologue de l’ubiquitine à son extrémité aminoterminale et de deux domaines riches en cystéines de type RINGfinger dans la
région carboxy-terminale. Alors, comme d’autres protéines de type RING finger, la
parkine participe dans l’une des voies majeures de dégradation des protéines
cellulaires, la voie ubiquitine-protéasome (Figure 16). Donc, grâce à son activité E3
ubiquitine-ligase, elle reconnaît des protéines substrats caractéristiques et induit leur
poly-ubiquitinylation, signal de ciblage vers la voie de dégradation par le protéasome,
[56]
.
Cependant, La perte de cette fonction entraînerait une accumulation
irrespirable de substrats non ubiquitinylés qui serait à l’origine de la dégénérescence
neuronale chez les patients porteurs de mutations du gène de la parkine. Par cantre,
l’absence de corps de Lewy chez la plupart de ces patients insinue que la parkine
joue un rôle central dans la formation de ces inclusions ubiquitinylées. Quoique, La
présence fréquente de la parkine dans les corps de Lewy de patients atteints de
maladie de Parkinson idiopathique, ou due à une mutation du gène de l’α-synucléine,
est en faveur de cette hypothèse, [57]. L’existence d’une neuro-dégénérescence en
l’absence de corps de Lewy en cas de mutations du gène de la parkine suggère
aussi que l’existence de corps de Lewy dans la maladie de Parkinson idiopathique
pourrait n’être qu’un simple marqueur phénotypique d’un dysfonctionnement, et non
la cause de la mort neuronale, [55].
Notons que, Une isoforme minoritaire O-glycosylée d’α-synucléine (αSp22) a
été reconnaîtrai, dont le taux est accroître dans le cerveau de patients porteurs de
mutations du gène de la parkine, [57]. Normalement L’αSp22 est associ ée à la parkine
dans le cerveau humain, est ubiquitinylée in vitro par la parkine normale, tandis que
des formes mutantes de celle-ci sont incapables d’inciter cette réaction. Par cantre,
la synphiline, une protéine partenaire de l’α-synucléine dont on ignore la fonction, est
aussi ubiquitinylée par la parkine, [58]. Toutefois, le rôle délétère d’une éventuelle
accumulation de l’αSp22 et de la synphiline reste à prouver. Néanmoins, l’interaction
fonctionnelle entre la parkine et l’α-synucléine - directe via l’αSp22 ou indirecte via le
partenaire synphiline de l’α-synucléine - est en faveur d’un rôle biologique des deux
protéines dans une même voie moléculaire impliquée dans la pathogénie de la
maladie de Parkinson (figure 15), [55].
Fig.12: Voies moléculaires impliquées dans la pathogénie de la maladie de Parkinson.
Notons qu’un second gène témoigne du rôle clé d’un défaut de la voie
d’ubiquitinylation dans la dégénérescence neuronale observée au cours de la
maladie de Parkinson. Précisément en 1998, une substitution Ile93Met fut identifiée
dans le gène codant pour UCHL-1 chez deux membres d’une famille allemande
atteints d’un syndrome parkinsonien transmis suivant le mode autosomi que dominant,
[53]
. Alors, UCH-L1, l’une des protéines les plus nombreuses dans l e cerveau, est une
ubiquitine hydrolase qui permet de recycler des monomères d’ubiquitine
indispensables à l’adressage de protéines cellulaires vers la voie de dégradation par
le protéasome (Figure 16), [55]. Cependant , le rôle pathogène d’UCHL-1 reste à
prouver, puisqu’à ce jour aucune autre mutation dans son gène n’a été retrouvée
dans la maladie de Parkinson. Tandis, l’activité hydrolase du variant Ile93Met paraît
diminué de 50 % .
Fig.13 : Maladie de Parkinson et voie protéolytique ubiquitine-protéasome. L’ubiquitinylation est
un signal de dégradation permettant de cibler les protéines cellulaires vers leur dégradation par le
protéasome. Ce processus dépendant de l’ATP requiert l’action séquentielle de trois enzymes,
nommées respectivement E1, E2 et E3, qui conduisent à l’addition covalente de molécules
d’ubiquitine sur des protéines spécifiques de substrats. Dans cette voie interviennent également des
enzymes de désubiquitinylation (ubiquitine hydrolases) qui permettent de recycler des monomères
d’ubiquitine indispensables à l’adressage de protéines cellulaires vers la dégradation par le
protéasome. Une altération de la voie ubiquitine-protéasome peut conduire à une dégénérescence de
la voie dopaminergique nigro-striatale. Ainsi, la mutation Ile93Met du gène codant pour l’ubiquitine
hydrolase UCH-L1 rend compte d’un syndrome parkinsonien transmis selon le mode autosomique
dominant dans une famille allemande. De plus, une grande variété de réarrangements d’exons et de
mutations ponctuelles du gène codant pour l’E3 ubiquitine ligase parkine est associée à une maladie
de Parkinson autosomique récessive dans des populations de diverses origines ethniques, [55].
Dans un test in vitro, laissant apercevoir la possibilité que cette mutation
pourrait compromettre la dégradation de protéines cellulaires par le protéasome en
diminuant la quantité de mono mères d’ubiquitine disponibles. Quoique, à côté de son
activité ubiquitine hydrolase, la protéine UCH-L1 a in vitro une activité ubiquitine
ligase non classique qui mene à la formation de chaînes de poly-ubiquitine non
canoniques, résistantes à la dégradation par le protéasome, [56].
Récemment, une délétion génomique et une mutation ponctuelle (L166P) du
gène DJ-1 ont été reconnaître comme responsables d’une maladie de Parkinson
transmise suivant le mode autosomique récessif, dans une famille hollandaise et une
famille italienne, respectivement, [59].
Où, DJ-1, une protéine ubiquitaire de 189 acides aminées, est un protagoniste
de variés interactions protéine-protéine par lesquelles elle semble intervenir dans
d’abondantes voies moléculaires. Cependant, seule la détermination précise de sa
fonction, notamment à travers l’étude des résultats de l’inactivation du gène DJ-1
chez l’animal, permettra de relier cette protéine à la pathogénie de la maladie de
Parkinson, [55].
8.3. Maladie de Creutzfeldt-Jakob :
La maladie de Creutzfeldt-Jakob (MCJ) c’est une dégénérescence du système
nerveux central définie par l'accumulation d'un prion c’est la forme anormale d'une protéine
qui peut transmettre la maladie. Cependant, La période d'incubation se compte en années,
voire en décennies avant qu'apparaissent des troubles de l'équilibre et de la sensibilité, puis
une démence. L'issue est systématiquement fatale à échéance d'approximativement un an,
[60]
.
En revanche, La maladie du Kuru a été montrée dans le peuple des Fores de
Nouvelle-Guinée par D.C. Gajdusek (Prix Nobel de médecine 1976). Bien que différent de la
maladie de Creutzfeldt-Jakob, le kuru est aussi
une encéphalopathie spongiforme
transmissible. Ainsi, son mode de transmission a pu être associé une habitude funéraire
anthropophage. L'insomnie fatale familiale est aussi une EST, [60].
En effet, la maladie Creutzfeldt-Jakob elle touche 1 personne sur 1 million par ans
et jamais avant 60 ans. Quoique, une nouvelle forme a pu apparaitre, [61].
Une nouvelle forme de la maladie est apparue en 1996 en Angleterre, éventuellement
provoquée par l'ingestion de produits bovins infectés par l'encéphalopathie spongiforme
bovine (ESB : vache folle) ; parfois elle est notée vMCJ, pour « variante de la maladie de
Creutzfeldt-Jakob ». Alors, elle apparue en 1985, l'épidémie d'ESB, d'abord britannique puis
continentale, est la conséquence d'une augmentation de la transmission d'un agent
pathogène avec le recyclage des déchets d'abattoir au sein de l'alimentation animale
(ruminants et autres mammifères).
L'ESB s'attaque aux cerveaux de certains primates, et donc a fortiori des hommes. La
maladie peut être transmise à l'homme s'il consomme de la viande ou des tissus issus
d'animaux contaminés. Alors, l’ESB transmise à l'être humain est nommée variant(e) de la
maladie de Creutzfeldt-Jakob et, comme chez les bovins, s'attaque de même au système
nerveux central (cerveau et moelle épinière).Bien que, personne n'a aujourd'hui d'idée
précise quant à la durée d'incubation de la maladie.
Notons que le profil génétique des individus joue un rôle essentiel dans l'infection par
voie alimentaire. Or, La nature du codon 129 de la protéine prion normale (PRNP)
(chromosome 20, locus 13) est au centre de plusieurs recherches parce que tous les cas de
vMCJ par voie alimentaire sont 129Met/Met alors que seul 40% de la population générale
présente ce profil génétique. Par ailleurs, On ne sait pas si le fait d'avoir le codon 129PRNP
autre que Met/Met (càd Val/Met ou Val/Val) permet d'être protégé contre l'infection ou si
cette particulier prolongerait la durée d'incubation (tel que la maladie de Kuru par exemple),
dans ce dernier cas, on aurait de nouveau une épidémie de vMCJ dans les années à venir.
Jusqu’à présent on connait des multiples causes la maladie de Creutzfeldt-Jakob, or
la plupart des cas sont dits sporadiques, parce que l'origine est inconnue. ainsi que , Il
existe une transmission héréditaire (10 % des cas) et des contaminations iatrogéniques (sa
veut dire dues à un processus opératoire) reliées à l'emploi d'hormone ou de greffes de
tissus cérébraux (dure mère) issus de cadavres de malades, ou également par l'utilisation
d'instruments de chirurgie mal décontaminés (électrodes).
Ainsi que, la maladie est causées par une protéine anormalement repliée : PrP
(infectius protein) : Prion protéine. Notons que son rôle en tant que forme normale n’est pas
établi. Alors, La PrP normale a un repliement en hélice α ; la PrP anormale a un repliement
en feuillet β, elle impossible à dégrader. Ainsi, La PrP patho va imprimer sa conformation à
d’autres protéines c’st la Formation d’agrégats, [61].
9. Conclusion :
L’ubiquitine est une petite molécule récemment apparue l’un des régulateurs
de la fonction et la de la stabilité des protéines.
En effet, des travaux récents ont montres l’importance de cette petite mol écule,
où leurs résultats ouvrent la voie vers une meilleure compréhension des différents
rôles joués par cette petite molécule qu’est l’ubiquitine. Alors que le prix Nobel de
chimie a justement été décerné en 2004 à Aaron Ciechanover, Avram Hershko et
Irwin Rose pour leurs travaux sur le rôle de l'ubiquitine dans les systèmes de
dégradation des protéines, [6], dont l’importance de notre choix du modèle de
l’ubiquitine dans notre étude.
De plus, ces dernières années, beaucoup de chercheurs s’intéressent à ce
sujet portant sur l’instabilité des protéines et leurs conséquences médi cales.
Donc, l’objectif est double : D’abord mettre au point une grille d’analyse
descriptive des protéines avec des mutations connues, et ensuite élaborer un outil
prédictif pour faciliter la compréhension de ces mutations dans les maladies
humaines. Or, ce projet s’inscrit dans le contexte fondamental de la compréhension
des mécanismes qui contrôlent la fonction des protéines. La manière dont une
protéine se replie dans l’espace détermine ses interactions avec l’environnement
cellulaire, y compris la façon dont ell e va interagir avec les molécules thérapeut iques,
[62]
.
Référence :
[1] S.Mitchell : “ La simulation par ordinateur perce le secret de la maladie “, UPI à
Washington, (2002).
[2] « Comment calmer une cellule ? - Actualité médicale - Alzheimer »,
www.informationhospitaliere.com/actuali te-7219-calmer-cellule.html - 48k - , 06.04.
(2006)
[3] Prion (protéine ) - Wikipédia fr.wikipedia.org/wiki/Prion_(protéine) - 47k -, 21.11.
(2008).
[4] « Signal Transduction through Prion Protéine ", Science, 15 septembr e
(2000).
[5] Protéine chaper onne - Wikipédia, fr.wikipedia.org/wiki/Protéine_chaperonne - 34k -,
25.10. (2008).
[6]B.Forum & al :“Deux chercheuses démontrent l’importance de l’ubiquitine »,
Université de Montréal, 22.11. (2004).
[7] CM. PICKART : “Mechanisms underlying ubiquitination. Annu Rev
Biochem”, 70 : 503–533. (2001).
[8] D. ATTAIX & al : « Régulation de la protéolyse musculaire UbiquitineProttéasome-dépendante par les hormones et les nutriments », Flammarion
médecine –sciences-journées de diabétol ogie, (2002).
[9] AL .HAAS, TJ .SIEPMANN: “Pathways of ubiquitin conjugation”; FASEB J,
11: 1257-1268, (1997).
[10] M .SCHEFFNER, S. SMITH & al:“The ubiquitin-conjugation system. In : JM
Peters, JR Harris, D Finley”, Ubiquitin and the Biology of the Cell , New York,
Plenum Press, (1998 ).
[11] AM .WEISSMAN: “Themes and variations on ubiquitylation”, Nat Rev Mol
Cell Biol, (2001).
[12] « Cytomics Systems »,www.cytomics.fr/html/m2_1.html - 20k [13] D .ATTAIX, L.COMBARET& al: « Regulation of proteolysis. Curr Opin Clin
Nutr Metab Care », (2001).
[14] A. MARTI & al: « Interaction between ubiquitin-protein ligase SCFSKP2 and
E2F-1 underlies the regulation of E2F-1 degradation”. Nat Cell Biol, (1999).
[15] Protéasome - Wikipédia, fr.wikipedia.org/wiki/Protéasome - 69k - , 27 .11. (2008).
[16] DM. Koepp & al, (1999).
[17] S. Ghoshet & al, (1998).
[18] KL .Rock & AL. Goldberg, (1999).
[19] Joazeiro CAP & al; GR .Bignell &al, (1999-2000).
[20] T. Matsuura & al; H .Shimura & al, (1997-2000).
[21] L .Deng & al, (2000).
[22] P .Kaiser & al, (2000).
[23]Catherine, Alain: «Nucleic acids coding for novel hect domain proteins,
their diagnostic and therapeutic USE », (Cabinet Harle et Phelip, 7 rue de Madrid,
Paris, F-75008, FR), 02.13. (2003).
[24] FIB : « L’ubiquitination en temps réel »,
http://www.sciencedaily.com/releases/2004/11/041123213700.htm , FLASH INFO
BIOTECH le 10 Décembre 2004, l’Université de Montréal ,06.12. (2004).
[25] « Ubiquitine - Wikipédia », fr.wikipedia.org/wiki/Ubiquitine - 35k
[26] TH.GOODSHIP & al:“Adaptation to low-protein diets in renal failure:
Leucine turnover and nitrogen balance”, J Am Soc Nephrol, 1, 66-75, (1990).
[27] K. TOM & al: “Long-term adaptive responses to dietary protein restriction
in chronic renal failure”, Am J Physiol, (1995).
[28] BJ .MARONI & al:” Mechanisms permitting nephrotic patients to achieve
nitrogen equilibrium with a protein-restricted diet”, J Clin Invest, 99, 2479-2487,
(1997).
[29] JL .BAILEY & al: “The acidosis of chronic renal failure activates muscle
proteolysis in rats by augmenting transcription of genes encoding proteins of
the ATP-dependent, ubiquitin-proteasome pathway.” J Clin Invest, 97, 1447-1453.
(1996).
[30] RC .MAY, Y. H ARA, RA. KELLY & al:“Branched-chain amino acid
metabolism in rat muscle: Abnormal regulation in acidosis” Am J Physiol,
(1987).
[31] WE. MITCH & al:“Metabolic acidosis stimulates muscle protein
degradation by activating the ATP-dependent pathway involving ubiquitin and
proteasomes”,J Clin Invest, (1994).
[32] WP. PICKERING & al: “Nutrition in CAPD: serum bicabonate and the
ubiquitinproteasome system in muscle”,Kidney Int, (in press). (2002).
[33] RA. DEFRONZO & al: “ Insulin resistance in uremia”, J Clin Invest, (1981).
[34] RA. DEFRONZO, AD .BECKL ES: “Glucose intolerance following chronic
metabolic acidosis in man”, Am J Physiol, (1979).
[35] SR. PRICE & al : “ Muscle wasting in insulinopenic rats results from
activation of the ATP-dependent, ubiquitin-proteasome pathway by a
mechanism including gene transcription”,J Clin Invest, (1996).
[36] WE. MITCH & al:“ Evaluation of signals activating ubiquitin-proteasome
proteolysis in a model of muscle wasting”,Am J Physiol, (1999).
[37] SH .LECKER & al : “Ubiquitin conjugation by the N-end rule pathway and
mRNAs for its components increase in muscles of diabetic rats”, J Clin Invest,
(1999).
[38] W. E. MITCH : «Mécanismes de l’atrophie musculaire induite par le
complexe protéolytique Ubiquitine-Protéaasome au cours des maladies
rénales », FLAMMARION MÉDECIN E-SCIENCES—ACTUALITÉS
NÉPHROLOGIQUES , (2002).
[39] institut.cochin.inserm.fr/la_recherche/départements/maladies...43.../étude -durôle-des-ubiquitine-ligases-dans - 37k - .
[40] Margottin & al, (1998).
[41]Maladie neurodégénérative Wikipédia ,fr.wikipedia.org/wiki/Maladie_neurodégénérative - 22k - , 22.11.(2008).
r
[42] R. Dehin &J.Aubry :« Révision médicale : D Paul Lépine, M.D., D.O », 19 .09.
(2005).
[43] Maladie d'Alzheimer - Wikipédia ,fr.wikipedia.org/wiki/Maladie_d'Alzheimer-121k .
[44] N. GALOPHE : « Expression génique et protéines recombiantes »
Biotechnologies et peptides amyloides β, Mémoire bibliographique de Master 2,
(2005-2006).
[45] TR .Butt & al: “Ubiquitin fusion augments the yield of cloned gene
products in Escherichia coli. Proc Natl Acad Sci U S A”, 1989 Apr (1989).
[46].] A. Pilon & al: “ Ubiquitin fusion technology: bioprocessing of
peptides”,Biotechnol Pr og. Jul-Aug (1997).
[47] E. Ozkaynak & al: “The yeast ubiquitin genes: a family of natural gene
fusions”,EMBO J. May (1987).
[48] M. Dhenain & al : « Le diagnostic : de la neuropathologie à l’imagerie
cérébrale », MEDECINE/SCIENC ES,(2002).
[49] Aupetit, p.82. (1991).
[50] Maladie de Parkinson - Wikipédia , fr.wikipedia.org/wiki/Parkinsonisme - 56k - .
[51] « La motricité somatique et son contrôle La maladie de Parkinson »,
www.med.univangers.fr/discipline/labo_neuro/cours/hg/cmmotriciteparkinson2007 .pd
f -, (2007).
[52] C.Olga, B.Alexis :« La maladie de Parkinson : que nous apprennent les
gènes responsables des formes familiales? = Parkinson's disease: what do the
genes involved in familial forms tell us?” ,CopyrightINIST-CNRS. All rights
reserved (2008).
[53]PT. Lansbury, A .Brice: “Genetics of Parkinson’s disease and biochemical
studies of implicated gene products”, Curr Opin Genet Dev, (2002).
[54] J. Lotharius, P. Bru ndin :“Pathogenesis of Parkinson’s disease: dopamine,
vesicles and alphasynuclein”, Nat Rev Neur osci,(2002).
[55] O. Corti, A. Brice : « La maladie de Parkinson: que nous apprennent les
gènes Responsables des formes familiales? », MEDECINE/SCIE NCES, (2003).
[56] Y. Liu, L. Fallon & al: « The UCH-L1 gene encodes two opposing enzymatic
Activities that affect alpha-synuclein degradation and Parkinson’s
diseasesusceptibility”. Cell, (2002).
[57]. H. Shimura, MG .Schlo ssmacher & al:« Ubiquitination of a newform of
alpha-synuclein by parkin from human brain: implications for Parkinson’s
disease », Science (2001).
[58] BI. Giasson, VM. Lee: “Parkin and the molecular pathways of Parkinson’s
disease», Neuron; (2001).
[59] V. Bonifati, P .Rizzu & al: “Mutations in the DJ-1 gene associated with
autosomal recessive early-onset Parkinsonism”, Science, (2003).
[60] Maladie de Creutzfeldt-Jakob - Wikipédia , fr.wikipedia.org/wiki/NvMCJ - 33k - .
[61] A.Leblanc :« Chapitre 6 – Les ribosomes, cours de biologie cellulaire »,
12.10. (2008).
[62] « Les projets scientifiques en cours », Dossier de presse IBM : L ’innovation
technologique : de la r echerche à l’usage, Janvier (2006).
[63] Margottin & al.,(1998).
Conclusion général
Conclusion général
Les protéines sont des chaines de quelques centaines d’acides aminés. Dans
les conditions physi ologiques, elles parviennent presque toujours à se replier jusqu’ à
l’état natif où elles sont fonctionnelles, et ce malgré le nombre astronomique de
configurations accessi bles.
En fait, les protéines jouent un rôle de premier plan dans la structure et la
fonction. Certaines protéines produites par la cellule déterminent sa forme et sa
structure.
Alors, la fonction particulière d’une protéine est intimement liée à une str ucture
moléculaire bien spécifique, définie par l’agencement des éléments de base qui la
composent. Donc, on compte 20 acides aminés dotés de propriétés chimiques
propres. Or, la combinaison de ces 20 unités fournit une incroyable diversité de
protéines. Quoique, pour former une protéine fonctionnelle et stable, il faut avoir la
séquence exacte d’acides aminés. Notons que puisque les acides aminés sont
susceptibles de s’attirer ou de se repousser de façon prévisible, il résulte de leur
assemblage une structure tridimensionnelle stable.
Or, Les protéines peuvent avoir différentes structures (primaire, secondaire,
tertiaire et quaternaire), qui sont très liées aux tâches qu’elles assurent dans la
cellule, donc elles sont les véritables macromolécules de la vie.
En effet, Le passage de la structure primaire à la structure tertiaire se fait par
un processus physique appelé repliement. Cependant le repliement des protéines
est un domaine d’un intérêt fondamental . Il concerne les mécanismes moléculaires
par lesquels une chaine polypeptidique naissante, résultant de l’information
génétique, acquiert sa structure tridimensionnelle, condition nécessaire à
l’expression de sa fonction.
Alors, le repliement est le passage d’une chaîne d’acides aminés vers une
structure tridimensionnelle native bien déterminée et permettant à la protéine
d’appliquer sa fonction biologique. C’est la dernière étape de l’emploi de l’information
contenue dans l’ADN. Or, La structure native est totalement prédéfinie par l’ordre des
acides aminés dans la chaîne polypeptidique.
En effet, la simulation ou « l’expérimentation par ordinateur » représente
aujourd’hui un aspect supplémentaire à considérer parallèlement au coté théorique
et expérimental des disciplines scientifiques.
De ce fait, Les simulations de dynamique moléculaire ont permis d’aborder
la compréhension du processus de repliement au niveau atomique. Cependant
l’échelle de temps des processus de repliement (de l’ordre de la milliseconde) n’est
pas accessible aux simulations numériques (de l’ordre de la nanoseconde) .quoique
la dynamique moléculaire est une méthode d ’étude des mouve ments et l’évolution de
la configuration spatiale des systèmes moléculaires. En pratique, on opère par
résolution des équations classique du mouvement de Newton étant donnés une
fonction énergie potentiel et son champ de force associ é.
Pour effectuer ces simulations, nous avons utili sé les logiciels TINKER version
4.2 /2004, qui est un programme de modélisation moléculaire avec un package
général et complet de la mécanique moléculaire et la dynamique moléculaire. Cette
simulation de DM a été faite pour la protéine « Ubiquitine », ces base de donner et
emportes de site Protein Data Bank, sous forme fichier de (PDB).Ceci nous permet
d’étudier l’énergie potentiel en fonction du temps et minimiser ses énergies en
utilisons son comportement thermodynamique et cinétique, avec des différents
ensemble essentielle pour la DM tel que NVE, NVT , NPT.
Alors, la compréhension des mécanismes de repliement des protéines
représente l’un des principaux enjeux de la biologie. Il s’agit en effet d’un problème
essentiel pour l’analyse des divers événements impliqués dans la régulation
cellulaire, ainsi que pour l’utilisation de l’information contenue dans le nombre
croissant de gènes séquencés .L ’élucidation de ces mécanismes devrait permettre le
développement de nouvelles stratégies thérapeutiques pour la prévention et le
traitement des mal adies associées à des repliements i ncorrects.
Nous présenterons un exemple de ce qui a été réalisé dans le cas de l’étude
de protéines de petite taille (Ubiquitine) suivant un repliement simple. L’ubiquitine
est récemment apparue comme un important régulateur de la fonction et de la
stabilité protéines, aussi bien chez la levure que chez les mammifères. Elle reconnaît
et se lie notamment protéines mal repliées ou incomplètes, constituant ainsi un signal
de dégradation qui envoie protéines anormales dans la poubelle de la cellule, le
protéasome. Où la protéine male replier provoque des maladies D’où l’importance
de du modèle de protéine choisie à simuler, et sa relation avec différentes maladies
tel que celle d’Alzheimer, de Parkinson, de Jacobi …..ect.
Alors ce travail, reste à compléter et a pour suivre dans le cadre de la
recherche interdisciplinaire actuelle.

Documents pareils