Pression de sélection sur les séquences nucléotidiques

Transcription

Pression de sélection sur les séquences nucléotidiques
Pression de sélection sur les
séquences nucléotidiques
Comment voyait-on l'évolution au niveau de la fonction d'un gène
Espace des mutations
délétères
avantageuses
‡
La plupart des mutations sont délétères, elles réduisent la fitness de
l'organisme
‡ elles sont éliminées de la population par sélection purificatrice.
‡
Quelques mutations sont avantageuses, elles augmentent la fitness de
l'organisme
‡ elles sont gardées par sélection positive darwinienne (adaptative)
La fitness est fonction du taux de survie et de la fécondité
Motoo Kimura
En 1968 Kimura analyse les changements dans l'hémoglobine, le
cytochrome c et le triosephosphate dehydrogenase.
Kimura (1968) Nature 217 624-626
Kimura propose que la plupart des substitutions sont neutres du point de
vue de la fitness et que très peu sont dues à la sélection positive
darwinienne.
Avant Kimura
délétères
avantageuses
Neutral theory
de Kimura
délétères
neutres
Une mutation neutre (ou allèle) ne change pas
la fitness du wildtype
Kimura (1968) Nature 217 624-626
Les changements synonymes peuvent être des
mutations neutres
Prédictions:
‡
Si la plupart des changements dans l'ADN étaient dus à la
sélection positive alors on déduirait que la plupart des
changements auraient lieu en 1ère ou 2ème position des codons.
‡
Si les changements dans l'ADN incluent des mutations neutres,
alors les 3ème positions devraient changer plus rapidement parce
que les mutations synonymes sont plus vraisemblablement
neutres.
King, J. L., and Jukes, T. H. 1969. Non-Darwinian evolution, Science 164, 788-798.
Taux de substitution synonyme et taux de substitution
non-synonyme.
‡
KS = nombre de substitutions Synonymes par site synonyme
‡
KA = nombre de substitutions non-synonymes (Altering) par
site non-synonyme
On pourrait estimer le Ks et le Ka de manière empirique, en examinant les
données mais des méthodes ont été développées pour le faire de manière
systématique.
Les sites nucléotidiques peuvent être classifiés en 3 types
en fonction de leur dégénérescence.
2-fold
Degenerate
deux posibilités
synomymes
4-fold
degenerate
0-fold
degenerate -
4 possibilités
synonymes
aucune
possibilité
synonyme
tout changement
modifie le aa
Synonyme
- Altère
Il y a 32 situations 4-fold degenerated en 3ème
position sur les 61 codons
Il y a 25 situations 2-fold degenerated en 3ème position
et 8 situations en 1ère position des codons.
L es situations 0-fold degenerated sont les 2ème positions (61)
et 53 des 1ère positions.
En partant d'une paire de séquences alignées, classifier chaque
site de la séquence en fonction de sa dégénérescence.
000002002002204002004204002004000002002004004004002002204002004004004
000002002002204002004204002004000002002004004002002002204002004004002
Compter le nombre de sites 4-,2-,0-fold degenerated.
Si besoin, faire la moyenne entre les deux séquences.
Exemple:
L 0 = (45+45)/2 = 45
L 2 = (13+15)/2 = 14
L 4 = (10+8)/2 = 9
Classifier les mutations en fonction de leur dégénérescence
et du type de substitution.
a. transition (S) or transversion (V)
b. dégénérescence (0,2,4)
0-fold
2-fold
4-fold
S0
S2
S4
transversion V0
V2
V4
transition
La simplification clé de cette méthode est la relation
intéressante entre les transitions - transversions et la
dégénérescence:
Mutations synonymes
0-fold
2-fold
4-fold
transitions
S0
S2
S4
transversions
V0
V2
V4
Mutations non-synonymes
(Exceptions: 1ère position de' arginine (CGA,CGG,AGA,AGG),
dernière position de l'isoleucine (AUU, AUC, AUA)).
Calculer la proportion de substitutions pour les transitions et les
transversions séparément pour pouvoir ensuite utiliser le modèle de
Kimura (K2P) pour corriger les substitutions multiples:
- proportion de transitions de type i : P i = Si/L i
- proportion de transversions de type i : Q i = Vi/L i
i = 0-fold, 2-fold, 4-fold
Le modèle de K2P est utilisé pour corriger les substitutions multiples:
A i = (1/2) ln (1/(1- 2P i ± Q i)) ± (1/4) ln (1/(1- 2Q i))
B i = (1/2) ln (1/(1- 2Q i))
Ici A i = taux corrigé de transitions de type i
Calcul du KS et du KA
KS = substitutions synonymes par site synonyme
nb.sites x taux
S2
S4
V4
exprimés en proportion + corrigé avec K2P
L2A2 + L4A4 + L4B4
KS =
L2/3+ L4
Par convention, 1/3 des sites
2-fold degenerated sont
considérés synonymes
KA = substitutions non-synonymes par site non-synonyme
V0
KA =
Ici, 2/3 des sites 2-fold
degenerated sont considérés
non-synonymous
V2
S0
L0B0 + L2B2 + L0A0
(2/3)L2 + L0
en proportion + K2P
Li, Wu and Luo, MBE 1985
un exemple
L (top): 000 004 202 004 002 002 002 004 002 002 004 004 004 204 004
L (bottom): 000 004 004 004 002 002 002 004 004 002 004 004 004 204 004
L0 = (29+30)/2 = 29.5
L2 = (7+5)/2 = 6
L4 = (9+10)/2 = 9.5
S0 = (2+1)/2=1.5
S2 = (1+0)/2=0.5
S4 = 0
Proportions (P = transitions, Q = transversions)
P0 = 1.5/29.5 Q0 = 0
P2 = 0.5/6
Q2 = 0
P4 = 0
Q4 = 4/9.5
V0 = 0
V2 = 0
V4=(4+4)/2=4
L (top): 000 004 204 004 002 002 002 004 002 002 004 004 004 204 004
L (bottom): 000 004 004 004 002 002 002 004 004 002 004 004 004 204 004
K2P corrections
Ai = ½(ln(1/(1-2Pi-Qi))) ± ¼(ln(1/1-2Qi))
Bi = ½(ln(1/(1-2Qi)))
A0 = 0.054
A2 = 0.091
A4 = -0.188
B0 = 0
B2 = 0
B4 = 0.923
KS = B4 + (A2L2 + A4L4)/(L2 + L4) = 0.843
KA = A0 + (L0B0 + L2B2)/(L0 + L2) = 0.054
les A et B sont les
fréquences des
transitions et
transversions
corrigées avec le
modèle K2P.
L es taux de substitutions synonymes sont généralement plus grands
que les taux de substitutions non-synonymes.
From Li, W-H Molecular Evolution who took it from:
2K¶8LJLQDQG/L-0(-384
The Molecular Clock of Viral Evolution
Different rates
Relationship between the number of nucleotide substitutions and the difference in the year
of isolation for the H3 hemagglutinin gene of human influenza A viruses. All sequence
comparisons were made with the strain isolated in 1968.
Gojobori et al. 1990 PNAS 87 10015-10018
L e taux K s/ K a est utilisés pour évaluer la pression de sélection
sur les régions codantes.
KA/Ks | 1
-> les séquences évoluent demanière neutre,
sans sélection.
KA/Ks > 1
-> La région codante est sous sélection positive.
KA/Ks << 1 -> La région codante est sous sélection purificatrice.