Modélisation et prédiction de structure de protéines

Transcription

Modélisation et prédiction de structure de protéines
Modélisation et prédiction
de structure de protéines:
une introduction
Mastères Ingénierie des BioMolécules et Bioinformatique et Biostatistiques
Module Bioinformatique Structurale.
octobre 2013
T. Simonson, Ecole Polytechnique.
Importance de la modélisation
A
U
G
C
G
C
U
U
A
U
A
G
C
C
A
A
G
G
:
Pour l'immense majorité des protéines connues,
il n'y a pas de structure 3D expérimentale.
Pour ~1/3, la fonction n'est pas connue.
50% de notre poids sec...
Séquence
Structure
Fonction
Le problème du repliement
K
L
H
G
G
P
M
L
D
S
D
Q
K
F
W
R
T
P
A
A
L
H
Q
N
E
G
F
T
Nétats ~ 10n
n = 100-300
googols of googols....
Paradoxe de Levinthal
●
Organisation structurale et stabilité des protéines
●
Modélisation moléculaire, dynamique moléculaire
●
Prédiction de structure secondaire
●
Prédiction de structure 3D: modélisation par homologie
Structure des protéines
Une protéine est un polymère d'acides aminés
i
i-1
i+1
Ri
CαH
N
H
φ
O δ−
H δ+
ψ
N
C
δ−
C
CαH
O
Ri+1
δ+
Les degrés de liberté
importants du backbone
sont phi, psi
Les valeurs stériquement permises sont celles du
diagramme de Ramachandran
Ri
CαH
N
φ ψ
H
C
O
H
O
N
C
CαH
Ri+1
Les valeurs stériquement permises de phi, psi
sont celles du diagramme de Ramachandran
CαH
O
Cβ
H
C
CαH
N
N
H
φ
ψ
C
O
CαH
Lovell et al, 2003,
Proteins, 50:437
CαH
O
C
Cβ
N
H
φ
CαH
ψ
H
N
C
O
CαH
La nature a sélectionné les acides aminés L
L
D
Ne pas confondre “L” avec “lévogyre”: subtile différence
Dans les hélices et feuillets, les groupements polaires
sont engagés dans des liaisons hydrogènes
Hélice α
Feuillet β (antiparallèle)
3.6 résidus
par tour
Pseudo-périodicité de 2
Les hélices et feuillets sont des structures étendues
qui peuvent traverser le coeur hydrophobe d'une protéine
tout en formant toutes les liaisons hydrogènes possibles
Hélices +
feuillets =
plus de 60% des
acides aminés
Prédites par Corey et Pauling avant la détermination de structures expérimentales
Les boucles sont flexibles et moins conservées,
donc difficiles à prédire
Boucles
coude
~ 1/3 des acides aminés
Les vingt acides aminés possèdent une gamme de
caractéristiques physico-chimiques et structurales
+NH
3
NH
Trp
Ile CH3
CH3 CH2
OH
CH
Tyr
CH3
CH2
S
Thr
CH3
Ala
NH
Cys SH
CH3 OH
NH
CH2
CH
H
N
CH
Pro
NH2
O
C
OH
Gly
CH2
CH2
CH2
CH2 Ser
-
O
CH2
Glu
CH2
CH2
Met
CH
O
C
CH2
CH2
CH2
Val
CH2
C
CH3 CH3
CH3 CH3
NH2
O
Arg
(CH2)3
CH2
Gln
Phe
Leu
NH
CH2
CH2
CH
NH2+ NH2
Lys CH
2
Asn
His
CH2
O
-
O
C
CH2
Asp
Les chaines latérales ont des angles de torsion flexibles
+
Lysine
φ
N
H
NH3
CH2
CH2
χ3
CH2
χ2
CH2
χ1
CαH
ψ
C
O
53 conformations de Lys
vue dans des structures
cristallographiques de protéines.
Les chaines latérales ont des conformations
préférées, appelées “rotamères”
énergie(chi1,chi2)
χ2
chi1
χ1
-2.5
Cβ
Cγ
Nδ
Oδ
-4.5
-4.3
-3.3
1 kcal/mol entre contours
N
Cα
C
Exemple de l'asparagine
chi2
conformations typiques vues dans les protéines
conformations vues par simulation
D'où une caricature discrète de
l'espace des conformations
χ2 = +60°
δ
χ1 = -60°
Hα
γ
O
γ
Ci-1
C
N
H
γ
χ2 = 180°
δ
β
O
χ1 = +60°
χ1 = 180°
χ2 = -60°
phenylalanine
La structure tertiaire est globulaire, avec une surface
polaire et un intérieur plutôt apolaire
Cytochrome c
Hémoglobine
Thioredoxine:
les sphères rouges
sont les atomes des
chaines latérales
hydrophobes.
eau
Les protéines membranaires sont un cas à part
Cytochrome oxidase
~ 30% du génome humain, ~ 50% des médicaments sur le marché
Nombre limité de structures connues (~100).
Nombre limité d'architectures possibles.
La structure quaternaire est un
agencement de domaines structuraux
100-300 acides aminés
Un même domaine peut être utilisé par de
nombreuses protéines différentes
Domaine “SH3”: trouvé
dans des contextes variés
dans >150 protéines de
structures 3D connues.
Tyrosine kinase c-Src
23 chez la levure;
pas de réactivité croisée
Structures de domaines: classement hiérarchique
par similarité
3 classes
α
α/β
β
40 architectures
Classifying a Protein in
the CATH Database
of Domain Structures
Acta Cryst (1998) D54:1155
Orengo, Martin, Hutchinson,
Jones, Jones, Michie,
Swindells, Thornton
~ 1100 “topologies”
ou “repliements”
~ 2200 superfamilles
Les similarités reflètent l'histoire évolutive
Protéines orthologues
Protéines paralogues
Gène X
Gène X
Duplication
du gène
spéciation
Gène X
Gène X
Gène X
Gène X
Divergence
Gène A
Gène B
Classement structural des domaines
Classe α
Classe α/β
Classe β
114000 structures
●2200 superfamilles
●100 contiennent 60%
des domaines
●
www.cathdb.info
Stabilité des protéines
Les protéines sont marginalement stables
∆G = 5-15 kcal/mol = 10-30 kT
~ 0.1 kT par acide aminé
Forte entropie configurationnelle
Nombreuses interactions protéine-eau
−∆G
Effets compensatoires
Faible entropie configurationnelle
Interactions protéine-eau
Interactions protéine-protéine
Le repliement est gouverné par l'effet hydrophobe
Ségrégation alkane/eau
Kauzmann, 1959
Partition phase vapeur/eau
octane
Tension de
surface
70 cal/mol/A2
1 nm
propane
méthane
éthane
Les alkanes saturés
n'aiment pas l'eau.
Les protéines tendent à enfouir leurs groupes apolaires
avec un empilement très compact
thioredoxine
Les sphères rouges sont les atomes
des chaines latérales hydrophobes.
Fraction de volume occupée élevée: ~ 0.74 (moyenne sur les structures connues)
Les interactions électrostatiques gouvernent
la reconnaissance moléculaire
25% des acides aminés sont chargés
90% des ponts salins sont en surface
+
+ NH3
Lys
NH2 NH2
CH2
NH
CH2
Fe
2+
(CH2)3
CH2
CH2
O
-O
C
NH
Cu2+
+ NH
CH2
His
Acetylcholine estérase
Régions rouges = potentiel électrostatique négatif
Son substrat, l'acétylcholine, est positif
Arg
Glu
CH2
O
CH2
-O
C
2+
Zn
CH2
Asp
Les interactions électrostatiques gouvernent
la reconnaissance moléculaire
Bleu: potentiel positif
Cytochrome c
Rouge: potentiel négatif
hème
Vue de devant
Vue de derrière
Le cytochrome c interagit avec la membrane mitochondriale, chargée
négativement, et avec des régions négatives sur le cytochrome bc1 et
le cytochrome oxidase.
Les interactions électrostatiques gouvernent
la reconnaissance moléculaire
Flipping Loop
Asp233Lys198
Glu235-
Glu171
-O
O
NH3
+
N
N
Arg489
O
+
-
N
O
+
NH3
Asp
N
N
O
+
O-
N
Arg217
HN
+
HN
His448
Pα
Rib
Ade
2+
Pβ
ATP
Pγ
Site actif de l'aspartyl-ARNt synthétase
Motif 2
Les interactions électrostatiques gouvernent
la reconnaissance moléculaire
NAG
E
E
D
O HO
Glu35
C H
+ C1
O
O
Carbonium
ion
D
O
O
- C
O
NAG3
Site actif du lysozyme
Asp52
Certains acides aminés sont ionisées aux pH ordinaires
Notion d'équilibre acide/base:
AH → A- + H+
pKa
[A-]/([AH]+[A-])
AH
A[AH]/([AH]+[A-])
Protons
abondants
Protons
rares
Propriétés acide/base des acides aminés
Lys
Glu
OH
O
O
C
-
O
C
CH2
NH
CH2
CH2
CH2
Cys
His
N
+
SH
NH
CH2
NH
CH2
-
CH2
CH2
4
pH
OH O
O
-
O
C
C
CH2
CH2
Asp
Protons
abondants
6
7
pKa en rouge
S
8
positive
+NH
3
NH2
CH2
CH2
CH2
CH2
CH2
CH2
CH2
CH2
OH
10 O
CH2 Tyr
CH2
Protons
rares
Arg
NH2+ NH2
NH
(CH2)3
>12
Les interactions électrostatiques gouvernent
la reconnaissance moléculaire
25% des acides aminés sont chargés
90% des ponts salins sont en surface
+
+ NH3
Lys
NH2 NH2
CH2
NH
CH2
Fe
2+
(CH2)3
CH2
CH2
O
-O
C
NH
Cu2+
+ NH
CH2
His
Acetylcholine estérase
Régions rouges = potentiel électrostatique négatif
Son substrat, l'acétylcholine, est positif
Arg
Glu
CH2
O
CH2
-O
C
2+
Zn
CH2
Asp
Structure 3D:
mécanique moléculaire
et dynamique moléculaire
U
T1
T2
T3
{r}
On observe expérimentalement que les macromolécules
biologiques ont des structures relativement désordonnées
Lysine
Tige-boucle d'ARN
(vue stéréo)
On peut les caractériser par une surface d'énergie
Cα
χ1 Cβ
χ2
Nδ
N
chi1
C
Cγ
Oδ
chi2
Prédiction de structure = recherche de structures de basse énergie
On peut construire une fonction d'énergie empirique
pour la modélisation biomoléculaire
Modèle “boules + ressorts”
U = Σliaisons kb (b-b0)2 + Σangles ka (a-a0)2 + Σtorsions kt [1 + cos(nt-τ)]
On peut construire une fonction d'énergie empirique
pour la modélisation biomoléculaire
q
-2q
q'
−q'
−q'
q
q'
U = Σij [ Aij/rij12 - Bij/rij6 ] + Σij qiqj/rij
Coulomb
kcal/mol
Lennard-Jones ou
van der Waals
Angstroms
Rôle des interactions de van der Waals: mutations Leu → Val
Fonction d'énergie: Mécanique Moléculaire
U = Σliaisons kb (b-b0)2 + Σangles ka (a-a0)2 + Σtorsions kt [1 + cos(nt-τ)]
+ Σij [ Aij/rij12 - Bij/rij6 + qiqj/rij ]
.35
H H H
N -.30
.3
eau
H
CH2
.3
CH2
-.55
-.6
-.8
O
O
H N
.4
C
CH2
.55
-.55
CH2
O
CH2
O
CH
C
CH3
-.35
N
CH
C
N
N
.55
H
H.25
H
CH
H
H
.4
Fonction d'énergie: Mécanique Moléculaire
U = Σliaisons kb (b-b0)2 + Σangles ka (a-a0)2 + Σtorsions kt [1 + cos(nt-τ)]
+ Σij [ Aij/rij12 - Bij/rij6 + qiqj/rij ]
.35
H H H
N -.30
.3
H
CH2
.3
CH2
-.6
H N
eau
O
-.8
O
C
CH2
-.55
.4
.55
-.55
CH2
O
CH2
O
CH
C
CH3
-.35
N
CH
C
N
N
CH
.55
H
H.25
H
Notion de transférabilité des paramètres
H
H
.4
Fichier de “topologie”, extrait
RESIdue ALA
GROUp
ATOM N
ATOM H
ATOM CA
GROUp
ATOM CB
GROUp
ATOM C
ATOM O
BOND
BOND
BOND
BOND
BOND
N
CA
C
N
CA
IMPRoper
TYPE=NH1
TYPE=H
TYPE=CH1E
CHARge=-0.35
CHARge= 0.25
CHARge= 0.10
END
END
END
TYPE=CH3E
CHARge= 0.00
END
TYPE=C
TYPE=O
CHARge= 0.55
CHARge=-0.55
END
END
CA
C
O
H
CB
CA
N
C
CB
!tetrahedral CA
END {ALA}
{Fichier toph19.pro}
Fichier des paramètres d'énergie, extrait
bond
bond
bond
bond
bond
C
C
C
C
C
C
CH1E
CH2E
CH3E
CR1E
450.0
405.0
405.0
405.0
450.0
1.38!
1.52!
1.52!
1.52
1.38
B. R. GELIN THESIS AMIDE AND DIPEPTIDES
EXCEPT WHERE NOTED. CH1E,CH2E,CH3E, AND CT
ALL TREATED THE SAME. UREY BRADLEY TERMS ADDED
:
:
angle
angle
angle
angle
C
C
C
C
C
C
C
C
C
CH2E
CH3E
CR1E
70.0
65.0
65.0
70.0
106.5!
126.5!
126.5!
122.5!
FROM
PART
WITH
OF H
B. R. GELIN THESIS WITH HARMONIC
OF F TERMS INCORPORATED. ATOMS
EXTENDED H COMPENSATED FOR LACK
ANGLES.
:
:
NONBonded
NONBonded
H
HA
0.0498
0.0450
1.4254
2.6157
0.0498
0.0450
1.4254
2.6157
0. 1.
0. 1
NONBonded
NONBonded
NONBonded
C
CH1E
CH2E
0.1200
0.0486
0.1142
3.7418
4.2140
3.9823
0.1000
0.1000
0.1000
3.3854
3.3854
3.3854
7.116 1. ! carbonyl carbon
9.944 1. !
17.626 1. ! extended carbons
{fichier param19.inp}
! charged group.
Fonction d'énergie: Mécanique Moléculaire
●
pas d'électrons explicites
●
charges partielles sur les atomes
●
pas de réactions chimiques
●
grands systèmes: >100.000 atomes
●
énergies conformationnelles
●
représentation du solvant explicite ou implicite/simplifié
●
calcul explicite des forces
●
dynamique moléculaire
Paramétrisation: 1970-présent
CHARMM M. Karplus, A. Mackerell and coll. (Harvard)
AMBER
P. Kollman, D. Case and coll. (UCSF, Scripps)
OPLS
W. Jorgensen and coll. (Yale)
GROMOS H. Berendsen, W. van Gunsteren and coll. (Groningen, Zürich)
Plus récent: AMOEBA Jay Ponder (St Louis)
Charges atomiques : cristaux de petites molécules
propriétés de liquides simples
calculs de chimie quantique
Lennard-Jones: cristaux de petites molécules
propriétés de liquides simples
liaisons, angles, torsions: calculs de chimie quantique
spectroscopie de petites molécules
Implémentation logicielle
CHARMM19 (M Karplus et al, Harvard)
XPLOR (A Brunger, Yale)
CNS ('Crystallography and NMR System') ~220,000 lines
NIH-XPLOR
(M Clore,
C Schweiters,
J Kuszewski)
A Brunger, P Adams, G Clore, W Delano, P Gros, R Grosse-Kunstleve, J Jiang
J Kuszewski, M Nilges, N Pannu, R Read, L Rice, T Simonson, G Warren
(1998) Acta Cryst D54, 905.
HTML graphical interface
modules and procedures
written in
CNS language
interpreted by
CNS program
CNS source
Optional user control
Hierarchical
stucture:
converted to
task files
call
Recherche de structures de basse énergie:
minimisation d'énergie
Cα
χ1 Cβ
χ2
Nδ
N
chi1
C
Cγ
Oδ
chi2
Minimisation selon la ligne de plus grande pente
(1) Méthode: partant de Pi, on se déplace le long
du gradient: -grad E(Pi) jusqu'au minimum dans
cette direction, Pi+1. On recommence jusqu'au
minimum (gradient nul).
(2) Recherche de Pi+1:
par interpolations successives
Cf Numerical Recipes; Press et al.
Exploration conformationnelle
par dynamique moléculaire
N
Cα
χ1 Cβ
χ2
chi1
C
Permet
de franchir
les barrières
d'énergie
(pas trop
fortes)
Cγ
Nδ
Oδ
chi2
Résoudre numériquement les équations du mouvement:
mi γi = Fi = - grad Ui
3 équations
par atome
Algorithme de Verlet
On considère chaque coordonnée de chaque atome i comme fonction du temps t
On approxime la relation entre deux instants voisins, t et t+τ:
xi(t+ τ) = xi(t) + τ x'i(t) + (τ2/2) x''i(t) + ....
yi(t+ τ) = …
zi(t+ τ) = ...
Algorithme de Verlet
On considère chaque coordonnée de chaque atome i comme fonction du temps t
On approxime la relation entre deux instants voisins, t et t+τ:
xi(t+ τ) = xi(t) + τ x'i(t) + (τ /2) x''i(t) + ....
x(t) + τ x'(t)
2
yi(t+ τ) = …
x(t)
x(t + τ)
zi(t+ τ) = ...
t
t+τ
Algorithme de Verlet
x(t) + τ x'(t)
x(t)
x(t + τ)
On soustrait les valeurs pour t+τ et t-τ:
xi(t+ τ) = xi(t) + τ x'i(t) + (τ2/2) x''i(t) + ....
t
t+τ
xi(t - τ) = xi(t) - τ x'i(t) + (τ2/2) x''i(t) + ....
xi(t+ τ) = 2 xi(t) - xi(t - τ) + (τ2/mi) Fxi(t) + ....
Fxi(t) = m x''i(t)
τ est le pas temporel d'intégration. Il doit etre plus petit que
les temps caractéristiques les plus courts du système (vibrations
des liaisons interatomiques: ~ 10-15 secondes
●
●
A chaque pas on fait un calcul de forces et on utilise deux conformations.
Lien entre température et vitesses atomiques
p(vi) = A exp(-mi vi2/ 2kT)
T température
k constante de Boltzmann
distribution de Maxwell-Boltzmann
p(vi)
<vi>
vi/<vi>
●
Choix aléatoire des vitesses initiales
●
Mise à l'échelle de temps en temps
En résumé: pour simuler la dynamique d'une biomolécule
Une “mécanique moléculaire” ou modèle “boules et
ressorts” ou fonction d'énergie empirique
●
Des paramètres (constantes de force, charges, etc)
déduites de petites molécules et jugées “transférables”
●
●
Développement limité ou approximation “parabolique” des xi(t)
Un algorithme récursif (Verlet) pour résoudre les équations du
mouvement
●
●
Un lien (simple) entre vitesses atomiques et température
Recuit simulé:
Optimisation sur une surface d'énergie rugueuse
●
Exploration par dynamique moléculaire
●
Température élevée; décroit progressivement
●
Affinements de structures RMN ou cristallographiques
U
T1
T2
T3
{r}
Description explicite du solvant
Boite d'eau
●Conditions aux limites périodiques
●
Simulation du repliement in silico
FiP35
vilin
Domaine WW
35 acides aminés
Se replie
expérimentalement en
14 µs
Par simulation en 10 µs
4000 molécules d'eau
Bleu: cristallographie
Rouge: simulations
~5000 années de temps CPU monoprocesseur...
Shaw et al (2010) Science, 330:341
Structural Bioinformatics; editors PE Bourne, H Weissig; Wiley, 2003
Computational Biochemistry & Biophysics, editors Becker, Mackerell, Roux, Watanabe;
Marcel Dekker, 2001
Bioinformatics: from genomes to drugs; editor T Lengauer; Wiley, 2002
Molecular modelling: principles and applications; A Leach; Prentice Hall, 2001
Introduction to Genomics; A Lesk, Oxford University Press, 2007
Bioinformatique: génomique et post-génomique; Dardel & Képès, Ecole Polytechnique, 2002
X-PLOR version 3.8, A System for X-ray crystallography and NMR; Brunger, Yale University
Press, 1992
Simonson (2005) Médecine Sciences 21:609-612; Peut-on prédire la structure des protéines?
CNS; Brunger, Adams, Clore, Delano, Gros, Grosse-Kunstleve, Jiang, Kuszewski, Nilges,
Pannu, Read, Rice, Simonson, Warren (1998) Acta Cryst D54, 905.
Brunger, Adams, DeLano, Gros, Grosse-Kunstleve, Jiang, Pannu, Read, Rice, Simonson (2001)
The structure determination language of the Crystallography and NMR System.
International Tables of Crystallography, Volume F. Editors: M.G. Rossmann
and E. Arnold; Dordrecht: Kluwer Academic Publishers, the Netherlands.
Description explicite du solvant
Boite d'eau
●Conditions aux limites périodiques
●
Description implicite du solvant
Solvent “explicite”
Solvent “implicite”
Continuum diélectrique
Energie électrostatique pour une paire d'ions: U = q q' / ε r
ε = 80 = constante diélectrique de l'eau
Les interactions ion-ion sont fortement réduites dans l'eau
-
+
Vue de loin (un nanomètre), la charge de chaque ion est partiellement
compensée par celle des oxygènes ou hydrogènes de l'eau. D'où une forte
réduction des interactions ion-ion (constante diélectrique ε de l'eau = 80!):
-.8
U = q q' / ε r
O
.4
H
H
.4
Importance du solvant: association Mg2+ – HPO42Energie d'association dans le vide: -515 kcal/mol
Énergie libre d'association standard dans l'eau;
valeur expérimentale -3.7 kcal/mol
[conditions standard = solution 1 M “idéale”]
+
-
L'eau a un effet “écran”, d'où une réduction effective
des interactions par un facteur de 100 environ.
Effet de ponts salins sur la stabilité du lysozyme T4
Dao-Pin, Nicholson, Matthews (1991) Biochemistry, 30:7142
Mutation
∆∆G(kcal/mol)
K60H/L13D
-2.8
K83H/A112D
-1.5
S90H/Q122D
-2.2
T115E (...K83) +0.3
S90H
K60H
K83H
-1.1
-0.1
-0.5
Un pont salin contribue faiblement à la stabilité, en comparaison
avec l'énorme énergie d'interaction entre charges dans le vide
Pont salin
Mutant,
repliée
Native,
repliée
Mutant,
dépliée
Native,
dépliée
Interactions
avec le
solvant
Effet de compensation
Rappel: 90% des ponts
salins sont en surface
Description implicite du solvant
Solvent “explicite”
Solvent “implicite”
Continuum diélectrique
Energie électrostatique pour une paire d'ions: U = q q' / ε r
ε = 80 = constante diélectrique de l'eau
Pour traiter quelques ions dans l'eau, tout va bien...
Description implicite du solvant
Solvent “explicite”
Solvent “implicite”
Continuum diélectrique
Pour une biomolécule, c'est plus compliqué:
hétérogénéité du système
Dans un premier temps, on peut ignorer cette difficulté:
énergie électrostatique E = q q' / ε r
Dans un deuxième temps: un modèle plus sophistiqué
Description implicite du solvant: un modèle
nettement plus raffiné: Born généralisé ou GB
Solvent “explicite”
Solvent “implicite”
Continuum diélectrique
●
●
●
Charges très enfouies: E = q q' / r
Charges exposées au solvant: E = q q' / ε r
ε = 80 = constante diélectrique de l'eau
Cas intermédiaires: formule d'interpolation empirique bien calibrée
Description implicite du solvant: un modèle
nettement plus raffiné: Born généralisé ou GB
Solvent “explicite”
Solvent “implicite”
Continuum diélectrique
●
●
●
Charges très enfouies: E = q q' / r
Charges exposées au solvant: E = q q' / ε r
ε = 80 = constante diélectrique de l'eau
Cas intermédiaires: formule d'interpolation empirique bien calibrée
Exc: expliquer le dépliement des protéines à fort et faible pH
Description implicite du solvant: un modèle
nettement plus raffiné: Born généralisé ou GB
Uelec = UCoul + UGB
UCoul =
Σi,j qi qj / rij
interaction en l'absence de solvant
UGB = (-1 + 1/ε ) Σi,j qi qj FGB(i,j) terme associé au solvant
ε = 80
= constante diélectrique de l'eau
FGB(i,j) = 1/(rij2 + b2ij exp[-rij2/4b2ij])1/2
bij = ( bi bj )1/2
bi, bj = distance au solvant des atomes i, j
Description implicite du solvant: un modèle
nettement plus raffiné: Born généralisé ou GB
Uelec = UCoul + UGB
UGB = (-1 + 1/ε ) Σi,j qi qj FGB(i,j)
FGB(i,j) = 1/(rij2 + b2ij exp[-rij2/4b2ij])1/2
1/rij
bij petit: forte compensation
entre UCoul et UGB:
Uelec ressemble à UCoul/ε
FGB
bij petit = paire exposée
r
bij grand = paire enfouie
bij grand: faible compensation
entre UCoul et UGB:
Uelec ressemble à UCoul
Une charge enfouie isolée déstabilise la protéine: pourquoi?
dénaturation
Rappel: 90% des ponts
salins sont en surface
Une charge enfouie isolée déstabilise la protéine: pourquoi?
ionisation
dénaturation
-
Cys
Cys
pH physiologique
pH basique
Glu
O
Lys
O
-
His
C
NH
CH2
CH2
4
O
Asp
-
Cys
NH
CH2
O
+NH
3
6
SH
CH2
8
Arg
CH2
CH2
NH2+ NH2
CH2
NH
CH2
(CH2)3
10
>12
OH
C
CH2
pKa's en rouge
Tyr
Dans le modèle GB, quel est le terme qui reflète ce comportement?
Dans le modèle GB, UGB contient des termes “ii”
bi
Uelec = UCoulomb +
UGB
= Σi < j qiqj/rij + (1/ε - 1) Σij qiqj / (rij2 + bibj exp[-rij2/4bibj])1/2
FGB(rij)
i=j ;
r→ 0 ;
FGB → 1 / bi ; UGB → (1/ε - 1) qi2 / bi
Comme 1/ε est petit, on a pratiquement UGB → -qi qi / bi :
L'interaction qi ↔ solvant = comme si qi interagit avec une charge -qi, distante de bi
Energie “self” de la charge i; terme GBSE dans XPLOR
Polarité des chaines latérales; caractérisation par le modèle GB
Quelques ions
Énergies libres
de solvatation
(transfert
vapeur → eau)
en kcal/mol.
J Comp Chem,
1999, 20:322
Cf aussi Fersht;
Structure & mechanism in
protein science; Freeman.
Exercice:
En utilisant XPLOR et le modèle GB, estimer l'énergie (libre) d'une
charge ponctuelle placée sur un atome enfoui au centre du Trpcage,
toutes les autres charges atomiques étant mises à zéro.
Comparer à ce que vous obtenez avec une charge placée sur un acide
aminé seul (le reste de la protéine étant enlevée).
On admet que quand le Trpcage se replie, l'énergie libre varie de 0 à -5
kcal/mol. Quelle est, à l'équilibre, la fraction de protéine repliée?
Nous avons vu ci-dessus l'effet d'une “mutation” sur l'énergie de la
protéine repliée et celle de la protéine dépliée. (On utilisera le calcul fait
pour un acide aminé isolé pour représenter la protéine dépliée; est-ce que
c'est raisonnable?) Pour la protéine “mutée”, quelle est la fraction de
protéine repliée à l'équilibre?

Documents pareils