Pression de sélection sur les séquences nucléotidiques
Transcription
Pression de sélection sur les séquences nucléotidiques
Pression de sélection sur les séquences nucléotidiques Comment voyait-on l'évolution au niveau de la fonction d'un gène Espace des mutations délétères avantageuses La plupart des mutations sont délétères, elles réduisent la fitness de l'organisme elles sont éliminées de la population par sélection purificatrice. Quelques mutations sont avantageuses, elles augmentent la fitness de l'organisme elles sont gardées par sélection positive darwinienne (adaptative) La fitness est fonction du taux de survie et de la fécondité Motoo Kimura En 1968 Kimura analyse les changements dans l'hémoglobine, le cytochrome c et le triosephosphate dehydrogenase. Kimura (1968) Nature 217 624-626 Kimura propose que la plupart des substitutions sont neutres du point de vue de la fitness et que très peu sont dues à la sélection positive darwinienne. Avant Kimura délétères avantageuses Neutral theory de Kimura délétères neutres Une mutation neutre (ou allèle) ne change pas la fitness du wildtype Kimura (1968) Nature 217 624-626 Les changements synonymes peuvent être des mutations neutres Prédictions: Si la plupart des changements dans l'ADN étaient dus à la sélection positive alors on déduirait que la plupart des changements auraient lieu en 1ère ou 2ème position des codons. Si les changements dans l'ADN incluent des mutations neutres, alors les 3ème positions devraient changer plus rapidement parce que les mutations synonymes sont plus vraisemblablement neutres. King, J. L., and Jukes, T. H. 1969. Non-Darwinian evolution, Science 164, 788-798. Taux de substitution synonyme et taux de substitution non-synonyme. KS = nombre de substitutions Synonymes par site synonyme KA = nombre de substitutions non-synonymes (Altering) par site non-synonyme On pourrait estimer le Ks et le Ka de manière empirique, en examinant les données mais des méthodes ont été développées pour le faire de manière systématique. Les sites nucléotidiques peuvent être classifiés en 3 types en fonction de leur dégénérescence. 2-fold Degenerate deux posibilités synomymes 4-fold degenerate 0-fold degenerate - 4 possibilités synonymes aucune possibilité synonyme tout changement modifie le aa Synonyme - Altère Il y a 32 situations 4-fold degenerated en 3ème position sur les 61 codons Il y a 25 situations 2-fold degenerated en 3ème position et 8 situations en 1ère position des codons. L es situations 0-fold degenerated sont les 2ème positions (61) et 53 des 1ère positions. En partant d'une paire de séquences alignées, classifier chaque site de la séquence en fonction de sa dégénérescence. 000002002002204002004204002004000002002004004004002002204002004004004 000002002002204002004204002004000002002004004002002002204002004004002 Compter le nombre de sites 4-,2-,0-fold degenerated. Si besoin, faire la moyenne entre les deux séquences. Exemple: L 0 = (45+45)/2 = 45 L 2 = (13+15)/2 = 14 L 4 = (10+8)/2 = 9 Classifier les mutations en fonction de leur dégénérescence et du type de substitution. a. transition (S) or transversion (V) b. dégénérescence (0,2,4) 0-fold 2-fold 4-fold S0 S2 S4 transversion V0 V2 V4 transition La simplification clé de cette méthode est la relation intéressante entre les transitions - transversions et la dégénérescence: Mutations synonymes 0-fold 2-fold 4-fold transitions S0 S2 S4 transversions V0 V2 V4 Mutations non-synonymes (Exceptions: 1ère position de' arginine (CGA,CGG,AGA,AGG), dernière position de l'isoleucine (AUU, AUC, AUA)). Calculer la proportion de substitutions pour les transitions et les transversions séparément pour pouvoir ensuite utiliser le modèle de Kimura (K2P) pour corriger les substitutions multiples: - proportion de transitions de type i : P i = Si/L i - proportion de transversions de type i : Q i = Vi/L i i = 0-fold, 2-fold, 4-fold Le modèle de K2P est utilisé pour corriger les substitutions multiples: A i = (1/2) ln (1/(1- 2P i ± Q i)) ± (1/4) ln (1/(1- 2Q i)) B i = (1/2) ln (1/(1- 2Q i)) Ici A i = taux corrigé de transitions de type i Calcul du KS et du KA KS = substitutions synonymes par site synonyme nb.sites x taux S2 S4 V4 exprimés en proportion + corrigé avec K2P L2A2 + L4A4 + L4B4 KS = L2/3+ L4 Par convention, 1/3 des sites 2-fold degenerated sont considérés synonymes KA = substitutions non-synonymes par site non-synonyme V0 KA = Ici, 2/3 des sites 2-fold degenerated sont considérés non-synonymous V2 S0 L0B0 + L2B2 + L0A0 (2/3)L2 + L0 en proportion + K2P Li, Wu and Luo, MBE 1985 un exemple L (top): 000 004 202 004 002 002 002 004 002 002 004 004 004 204 004 L (bottom): 000 004 004 004 002 002 002 004 004 002 004 004 004 204 004 L0 = (29+30)/2 = 29.5 L2 = (7+5)/2 = 6 L4 = (9+10)/2 = 9.5 S0 = (2+1)/2=1.5 S2 = (1+0)/2=0.5 S4 = 0 Proportions (P = transitions, Q = transversions) P0 = 1.5/29.5 Q0 = 0 P2 = 0.5/6 Q2 = 0 P4 = 0 Q4 = 4/9.5 V0 = 0 V2 = 0 V4=(4+4)/2=4 L (top): 000 004 204 004 002 002 002 004 002 002 004 004 004 204 004 L (bottom): 000 004 004 004 002 002 002 004 004 002 004 004 004 204 004 K2P corrections Ai = ½(ln(1/(1-2Pi-Qi))) ± ¼(ln(1/1-2Qi)) Bi = ½(ln(1/(1-2Qi))) A0 = 0.054 A2 = 0.091 A4 = -0.188 B0 = 0 B2 = 0 B4 = 0.923 KS = B4 + (A2L2 + A4L4)/(L2 + L4) = 0.843 KA = A0 + (L0B0 + L2B2)/(L0 + L2) = 0.054 les A et B sont les fréquences des transitions et transversions corrigées avec le modèle K2P. L es taux de substitutions synonymes sont généralement plus grands que les taux de substitutions non-synonymes. From Li, W-H Molecular Evolution who took it from: 2K¶8LJLQDQG/L-0(-384 The Molecular Clock of Viral Evolution Different rates Relationship between the number of nucleotide substitutions and the difference in the year of isolation for the H3 hemagglutinin gene of human influenza A viruses. All sequence comparisons were made with the strain isolated in 1968. Gojobori et al. 1990 PNAS 87 10015-10018 L e taux K s/ K a est utilisés pour évaluer la pression de sélection sur les régions codantes. KA/Ks | 1 -> les séquences évoluent demanière neutre, sans sélection. KA/Ks > 1 -> La région codante est sous sélection positive. KA/Ks << 1 -> La région codante est sous sélection purificatrice.