Evolution Moléculaire et Phylogénie
Transcription
Evolution Moléculaire et Phylogénie
Evolution Moléculaire et Phylogénie Dominique Mouchiroud [email protected] L’Evolution Moléculaire est la discipline qui étudie l’Evolution à l’échelle de l’ADN, d’ARN et des protéines (patron, processus). Premiers travaux dans les années 1960-1970 Phylogénie Moléculaire Etude des mécanismes Évolutifs Reconstruction des parentés Orientation des évènements Inférence des caractères A Ancestraux t Biométrie et Biologie Evolutive, UMR5558, Lyon I Bioinformatique et Génomique Evolutive Cours C. Brochier Choix des marqueurs Phylogénétiques Modélisation des processus évolutifs Cours D. Mouchiroud Plan du cours I. L’évolution moléculaire I1. Le cadre théorique I2. Les données et les questionnements II. Evolution de quelques traits moléculaires II.1 Composition en Base des Génomes I. L’évolution moléculaire I1. Le cadre théorique - Théories de l’évolution - Forces évolutives qui façonnent les génomes - Test de neutralité II.2 Taux d’évolution II.3. Taille des génomes III. Conclusion 1 Les acteurs de la théorie de l’Evolution Motoo Kimura (1924-1994) Théorie neutraliste de l’évolution moléculaire (1983) Vast majority of base substitutions are neutral with respect to fitness. Genetic drift dominates evolution at the molecular level. level Rate of molecular evolution is equal to the neutral mutation rate. Ku La théorie de l’évolution par la sélection naturelle (1859) La théorie synthétique de l’évolution (1930) A l’appui de sa théorie, l’hypothèse de l’horloge moléculaire proposée en 62 par Zuckerkandl et Pauling. L théorie La thé i neutraliste t li t de d l’évolution l’é l ti moléculaire lé l i (1983) « Le taux de divergence en acides aminés est approximativement proportionnel au temps de divergence paléontologique. » Motoo Kimura (1924-1994) Théorie neutraliste de l’évolution moléculaire (1983) Vast majority of base substitutions are neutral with respect to fitness. Genetic drift dominates evolution at the molecular level. Rate of molecular evolution is equal to the neutral mutation rate. Ku A l’appui de sa théorie, l’hypothèse de l’horloge moléculaire proposée en 62 par Zuckerkandl et Pauling. Générateur du polymorphisme génétique « les mutations » - substitutions - insertions, délétions - recombinaison - duplication de gènes, translocation - éléments transposables - transgénèse (transfert horizontal de gènes) - remaniements chromosomiques (fission, fusion, inversion) - duplication génomique (aneuploïdie, euploïdie) A l’échelle macroévolutive, les génomes sont le fruit de deux forces évolutives Sélection / Dérive génétique (Hasard) 2 Processus de fixation des mutations MUTATION nouvel allèle Individu Réparation de l’ADN Cellule C ll l somatique Cellule germinale Fréquences des changements fixés (substitutions) Taux de divergence Pas de transmission à la descendance Transmission à la descendance Population (N) Taux de mutation Polymorphisme Perte d’allèle Plusieurs générations Changement des fréquences alléliques Substitutions Fixation CAG GTG CAA CAG CAG GTG CAA CAG CAG GTG CAA CAA CGG GTG GAA CAG CAG GAG CAT CAG CAG GAG TAT CAG CAG GAG CAT CAG CGG GAG CAT CAG Changements polymorphiques 2 non synonymes 1 synonyme 2 non synonymes 0 synonyme Changements fixés 2 non synonymes CAA CAG Gln CAC CAT His Taux de mutation ou polymorphisme ou diversité génétique (intra spécifique) : Nbre de changements/site/génération (SNP) Mesuré entre individu d’une même population Reflète le processus (fréquence) et patron (type) de mutation de ll’ADN ADN au sein dd’une une population Taux de divergence (inter spécifique) : Nbre de substitutions (changements fixés)/site/temps de divergence Mesuré entre individu d’espèces ou de populations différentes Reflète le processus de fixation des mutations (sélection ou dérive génétique). X Probabilité de fixation Probabilité de fixation dépend - de la taille efficace de la population (Ne) - de la valeur sélective de la mutation (s) La probabilité de fixation d’une mutation est différente si le processus de fixation est sous le modèle neutre ou sélectif Processus de fixation des mutations Les mutations délétères ne sont pas fixées dans la population en raison de leur impact sur le fonctionnement du génome. Elles sont éliminées par la sélection naturelle : sélection négative ou purificatrice purificatrice. Divergence < Diversité génétique Les mutations non (ou faiblement) délétères peuvent être transmises à la descendance. Ces mutations, dites « neutres », sont fixées aléatoirement dans la population : dérive g génétique. q Divergence = Diversité génétique Les très rares mutations avantageuses sont positivement sélectionnées : sélection adaptative. Divergence > Diversité génétique 3 Processus de fixation des mutations Résultats majeurs des modèles en évolution moléculaire Mutation => création d’un nouvel allèle => polymorphisme/diversité dans la population Si population de petite taille ou s = 0 alors s < 1/2Ne Changement des fréquences alléliques au cours des générations => fixation de la mutation i => substitution b i i => divergence di entre espèces è la sélection ne peut opérer et la dérive génétique agit Taux de divergence ~ Taux de mutations la sélection positive/négative peut opérer Taux de divergence ≠ taux de mutations Fixation des mutations avantageuses Elimination des mutations délétères Variation des fréquences alléliques par dérive génétique (1) Par dérive génétique, il y a perte ou fixation de l’allèle dans les populations de très petites tailles efficaces (Ne) Temps de fixation des allèles dans la généalogie représente le temps de coalescence. T2 ≈ 4 Ne (en moyenne) T3 T4 T5 2 Ne (en moyenne) La probabilité de fixation d’un allèle neutre est égale à sa fréquence initiale initiale. Le temps moyen de fixation d’un allèle neutre est de 4 Ne. Substitu ution Si p population p de ggrande taille alors s > 1/2Ne Generattions Fixation de mutation faiblement délétères Pas fixation de mutations avantageuses Population Dérive génétique Sélection naturelle Recombinaison … Fixation de l’allèle rouge La sélection (2) Ségrégation différentielle des alléles • Il y a sélection lorsque les différents génotypes pour un locus donné ne participent pas de façon équivalente à la constitution génotypique é t i de d la l génération é é ti suivante. i t • Un génotype donne plus de descendants fertiles et donc présente un avantage sélectif . Meilleure Fitness pour ce génotype. • La valeur sélective d’un génotype dépend : - L’aptitude des individus à atteindre l’âge de reproduction (viabilité) – La durée de la période reproductive – L L’aptitude aptitude à la reproduction – La qualité des gamètes produits • Exemple de sélection au niveau nucléotidique : le gBGC – Sélection directionnelle : biais de fixation de C/G versus A/T Tous les processus évolutifs qui conduisent à réduire la taille efficace comme l’absence de recombinaison conduisent à des phénomènes de dérive. 4 Valeurs sélectives des mutations Durée de fixation d’une mutation Les mutations délétères ne sont pas fixées dans la population en raison de leur impact sur le fonctionnement du génome. par la sélection naturelle : sélection Elles sont éliminées p négative ou purificatrice. s>0 t = (2/s) ln (2N) Les mutations non (ou faiblement) délétères peuvent être transmises à la descendance. Ces mutations, dites « neutres », sont fixées aléatoirement dans la population : dérive génétique. s≈0 t = 4Ne Les très rares mutations avantageuses sont positivement sélectionnées : sélection adaptative. t = durée de fixation moyenne en générations Darwin C. s<0 s>0 s=0 s~0 Wright et al. s < 0 s = coef. de sélection Ki Kimura T. T Otha T. 1/= temps moyen entre deux évènements de fixation =coalescence La recombinaison (3) • La recombinaison assure le brassage génétique en conduisant à l’échange de matériel génétique entre chromosome homologue ou hétérologue. • La recombinaison entre le chromosome maternel et paternel lors de la meïose s’accompagne s’il y a cassure d’une réparation par conversion génique avec ou sans crossing-over. • Un dogme en génétique des populations veut que la recombinaison améliore l’efficacité de la sélection en favorisant le tri des meilleurs allèles. • Lorsque la recombinaison est absente, la sélection ne peut agir. Bernardi G. Effets Hill-Robertson PNAS 2007 5 Effet Hill-Robertson Mutations physiquement liées effet auto-stop / effet Hitch-hiking T0 : deux génotypes dans la population a b a B T1: Apparition d ’un nouvel allèle avantageux issu d ’une mutation a en A a b Ab Par le fait du hasard A est lié à b a B Fitness = 0.90 Balayage sélectif (Maynard-Smith et Haig 1974) Fitness = 1 Fitness = 0.90 Fitness = 0.95 Fitness = 1 Mutation avantageuse Mutation neutre Sélection d d’arrière arrière garde (Charlesworth et al, al 1993) Recombinaison : Pas de recombinaison : Le génotype AB peut être crée. La combinaison des deux allèles favorables est favorisée par la sélection. La sélection contre b tend à faire disparaître A de la population et le génotype aB est favorisé. a B A B Bilan des effets « sélection/recombinaison » • Affecte la distribution des fréquences alléliques parfois rapidement rapidement, • Affecte le temps de résidence des allèles dans les populations donc la diversité génétique, • Affecte l’association dans une population des mutations physiquement liées, • Affecte le nombre d’allèles maintenus, • Affecte la proportion de changements synonymes et non synonymes, Dn/Ds. Mutation délétère Mutation neutre Goulot d’étranglement Effondrement des effectifs d’une population qui conduit à un tri au hasard des allèles pour la fondation d’une nouvelle Population » Ne faible » : dérive génétique. Le goulot d’étrangement en réduisant le polymorphisme a également les mêmes effets que le balayage sélectif. Les effets démographiques s’appliquent à l’ensemble du génome alors que les effets sélectifs sont localisés à une région génomique. 6 Questions actuelles en génomique évolutive I. L’évolution moléculaire I1. Le cadre théorique - Théories de l’évolution - Forces évolutives qui façonnent les génomes - Test de neutralité • Quelle est la part du génome qui évolue de manière iè neutre t ett la l partt sous pression i de d sélection ? • Quelle est la part de génome sous sélection qui est due à la sélection adaptative ou purificatrice? • Quels sont les facteurs de sélection impliqués ? Tests de neutralité ou comment détecter la sélection ? Importance de la théorie neutraliste de l’évolution moléculaire - Un modèle « nul » qui décrit un monde dans lequel la sélection naturelle ne joue aucun rôle, - La diversité génétique n’est affectée que par la dérive, la mutation, la recombinaison et la migration. 1. Prédire grâce au modèle neutraliste ce qu’on devrait attendre (diversité, nombre d’allèles, distribution de fréquences alléliques) et tester l’ajustement du modèle aux données, Tests de neutralité ou comment détecter la sélection ? • Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre. • Sans donnée de polymorphisme - comparaison des divergences synonymes et non synonymes Ka/Ks ou dn/ds 2. Comparer la vraisemblance d’un modèle qui ignore la sélection naturelle à la vraisemblance d’un modèle qui l’intègre : l’amélioration permet-elle d’expliquer au mieux les données ? 7 Sélection purificatrice Test de la neutralité Sélection adaptative Protéines immunitaires Protéines de résistance/virulence Protéine de reconnaissance Gamétique (Yang 2000) Divergence non synonyme versus Divergence synonyme KA vs KS Les pressions évolutives diffèrent entre les sites synonymes et non synonymes des parties codantes. 8% (1% significatif) ω= KA KS ω > 1 d’où KA > KS : sélection adaptative ω = 1 d’où d où KA = KS : évolution neutre ω < 1 d’où KA < KS : sélection purificatrice 13454 séquences codantes orthologues entre l’homme et le chimpanzé Pour ce jeu de donné, ω moyen vaut 0,23 En générale, la moyenne de ω se situe entre 0,05 et 0,3 Tests de neutralité ou comment détecter la sélection ? • Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre. • Sans donnée de polymorphisme - comparaison des divergences synonymes et non synonymes dn/ds ou Ka/Ks • Avec des données de polymorphisme, - comparaison i des d taux t de d mutation/taux t ti /t de d substitution b tit ti Test de Mc Donald -Kreitman (91) Type de changement h t Divergence K Polymorphisme P Synonymes KS PS Non synonymes KA PN H0 : évolution neutre KA/KS = PN/PS H1 : sélection purificatrice KA < PN H1 : sélection adaptative KA > PN 8 Subset of Data from McDonald & Kreitman (1991) Test de Mc Donald -Kreitman (91) Type de g changement Divergence Polymorphisme Synonymes 26 36 Non synonymes 21 2 (Eanes et al. 93) H0 : évolution neutre KA /K / S ou DN /D / S = PN /P / S Exemple : G6PD entre D. melanogaster (32 s.) et D.simulans (12 s.) 1705 bp Exemple : G6PD entre D. melanogaster (13 s.) et D.simulans (12 s.) KA/KS = 0,81 PN/PS = 0,06 2 = 16,5 p<10-4 Tests de neutralité ou comment détecter la sélection ? L=100 pb sites neutres sites sous sélection négative 0.35 0.25 0.15 0 05 0.05 10% 20% 30% 40% 50% 60% 70% 80% 90% <100% Fréquence des allèles dérivés SNP n = 10 Proportion de SN NPs • Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre. • Sans donnée de polymorphisme - comparaison des divergences synonymes et non synonymes dn/ds ou Ka/Ks • Avec des données de polymorphisme, - comparaison i des d taux t de d mutation/taux t ti /t de d substitution b tit ti - étude des distributions des fréquences alléliques Proportion of SNPs Sélection adaptative Sites neutres sites sous sélection positive 0.35 0.25 0.15 0.05 10% 20% 30% 40% 50% 60% 70% 80% 90% <100% Fréquence des allèles dérivés 9 Plan du cours I. L’évolution moléculaire I1. Le cadre théorique I2. Les données et les questionnements II. Evolution de quelques traits moléculaires II.1 Composition en Base des Génomes II.2 Taux d’évolution II.3. Taille des génomes LES DONNEES Carte physique : séquences de génomes complets au niveau des taxons et des individus Génomique évolutive, évolutive génomique populationnelle Carte génétique : RH, marqueurs, SNP moyenne ou sexe spécifique Etude de la Recombinaison p q : RNAseq, q, NGS Données transcriptomiques Génomique fonctionnelle, biodiversité III. Conclusion Données protéomiques : Spectrométrie de masse Analyse des Réseaux d’interaction, biodiversité des communautés Pourquoi étudier l’évolution des génomes ? http://www.genomesonline.org Données disponibles (3/11/2013)/(15/09/2012) 7403/3708 Génomes complets p : 2650/2224 publiés – 4753/1484 en cours d’annotation 234/159 Archés - 6858/3366 Bactéries – 311/183 Eucaryotes 409/340 projets de métagénomique : dont 37/29 (Ingénéries) – 238/197 (environnements) – 134/114 (hôte/parasite) 1. Comprendre l’évolution de la vie 1. L’origine de la vie, 2. La phylogénie des espèces, l’histoire des populations, 3. Inférence des paléoenvironnements p 2. Comprendre la structure et l’organisation des génomes 1. La mise en place des chromosomes sexuels, 2. L’impact du sexe et de la recombinaison sur l’évolution des génomes, 3. La mise en place des systèmes biologiques (voies métaboliques), 4. Le rôle des duplications dans l’adaptation des organismes à leur environnement (domestication), (domestication) 5. Le déterminisme écologique (THV) du polymorphisme et de la divergence génétique, 6. Les dialogues moléculaires entre génome (au sein d’un même organisme ou entre organismes différents Hôte/symbiotes ou pathogène) 7. …… 10 La génomique évolutive Comprendre les processus à l’origine de la dynamique des génomes - nécessaire pour reconstruire l’évolution de la vie - nécessaire pour comprendre le contenu et le fonctionnement des génomes Etude des processus évolutifs en relation avec les composantes écologiques Génome nucléaire et cytoplasmique Taille des populations mécanismes moléculaires + processus populationnels + environnement Génomique évolutive Taille des génomes Composition en base Répartition des ETs Taux d’évolution Packaging de ll’ADN ADN …… Réplication (u) Réparation Recombinaison Activité télomérase Remaniement chromosomique Taille de la population Mode d’appariement Sociabilité …….. Latitude Température Rayonnement UV …….. Traits Moléculaires Ecologie évolutive Dérive génétique Composante adaptative Durée de génération Activité métabolique Longévité Masse corporelle Mode de vie Système de reproduction Traits d’Histoire de Vie 11