Evolution Moléculaire et Phylogénie

Transcription

Evolution Moléculaire et Phylogénie
Evolution Moléculaire et
Phylogénie
Dominique Mouchiroud
[email protected]
L’Evolution Moléculaire est la discipline qui
étudie l’Evolution à l’échelle de l’ADN, d’ARN
et des protéines (patron, processus).
Premiers travaux dans les années 1960-1970
Phylogénie
Moléculaire
Etude des mécanismes
Évolutifs
Reconstruction des parentés
Orientation des évènements
Inférence des caractères
A
Ancestraux
t
Biométrie et Biologie Evolutive, UMR5558, Lyon I
Bioinformatique et Génomique Evolutive
Cours C. Brochier
Choix des marqueurs
Phylogénétiques
Modélisation des processus
évolutifs
Cours D. Mouchiroud
Plan du cours
I. L’évolution moléculaire
I1. Le cadre théorique
I2. Les données et les questionnements
II. Evolution de quelques traits moléculaires
II.1 Composition en Base des Génomes
I. L’évolution moléculaire
I1. Le cadre théorique
- Théories de l’évolution
- Forces évolutives qui façonnent les génomes
- Test de neutralité
II.2 Taux d’évolution
II.3. Taille des génomes
III. Conclusion
1
Les acteurs de la théorie de l’Evolution
Motoo Kimura (1924-1994)
Théorie neutraliste de l’évolution moléculaire (1983)
Vast majority of base substitutions are neutral with respect to fitness.
Genetic drift dominates evolution at the molecular level.
level
Rate of molecular evolution is equal to the neutral mutation rate.
Ku
La théorie de l’évolution par la sélection naturelle (1859)
La théorie synthétique de l’évolution (1930)
A l’appui de sa théorie, l’hypothèse de l’horloge moléculaire
proposée en 62 par Zuckerkandl et Pauling.
L théorie
La
thé i neutraliste
t li t de
d l’évolution
l’é l ti moléculaire
lé l i (1983)
« Le taux de divergence en acides aminés est
approximativement proportionnel au temps
de divergence paléontologique. »
Motoo Kimura (1924-1994)
Théorie neutraliste de l’évolution moléculaire (1983)
Vast majority of base substitutions are neutral with respect to fitness.
Genetic drift dominates evolution at the molecular level.
Rate of molecular evolution is equal to the neutral mutation rate.
Ku
A l’appui de sa théorie, l’hypothèse de l’horloge moléculaire
proposée en 62 par Zuckerkandl et Pauling.
Générateur du polymorphisme génétique
« les mutations »
- substitutions
- insertions, délétions
- recombinaison
- duplication de gènes, translocation
- éléments transposables
- transgénèse (transfert horizontal de gènes)
- remaniements chromosomiques (fission, fusion, inversion)
- duplication génomique (aneuploïdie, euploïdie)
A l’échelle macroévolutive, les génomes sont le fruit de deux forces évolutives
Sélection
/
Dérive génétique (Hasard)
2
Processus de fixation des mutations
MUTATION
nouvel allèle
Individu
Réparation de l’ADN
Cellule
C
ll l
somatique
Cellule germinale
Fréquences des
changements fixés (substitutions)
Taux de divergence
Pas de transmission à la
descendance
Transmission à la descendance
Population (N)
Taux de mutation
Polymorphisme
Perte d’allèle
Plusieurs générations
Changement des fréquences
alléliques
Substitutions
Fixation
CAG GTG CAA CAG
CAG GTG CAA CAG
CAG GTG CAA CAA
CGG GTG GAA CAG
CAG GAG CAT CAG
CAG GAG TAT CAG
CAG GAG CAT CAG
CGG GAG CAT CAG
Changements polymorphiques
2 non synonymes
1 synonyme
2 non synonymes
0 synonyme
Changements fixés 2 non synonymes
CAA
CAG
Gln
CAC
CAT
His
Taux de mutation ou polymorphisme ou diversité génétique
(intra spécifique) :
Nbre de changements/site/génération (SNP)
Mesuré entre individu d’une même population
Reflète le processus (fréquence) et patron (type) de mutation de ll’ADN
ADN au sein dd’une
une population
Taux de divergence (inter spécifique) :
Nbre de substitutions (changements fixés)/site/temps de divergence
Mesuré entre individu d’espèces ou de populations différentes
Reflète le processus de fixation des mutations (sélection ou dérive génétique).
X
Probabilité de fixation
Probabilité de fixation dépend
- de la taille efficace de la population (Ne)
- de la valeur sélective de la mutation (s)
La probabilité de fixation d’une mutation est différente si le processus
de fixation est sous le modèle neutre ou sélectif
Processus de fixation des mutations
Les mutations délétères ne sont pas fixées dans la population
en raison de leur impact sur le fonctionnement du génome.
Elles sont éliminées par la sélection naturelle : sélection
négative ou purificatrice
purificatrice.
Divergence < Diversité génétique
Les mutations non (ou faiblement) délétères peuvent être
transmises à la descendance. Ces mutations, dites « neutres »,
sont fixées aléatoirement dans la population : dérive
g
génétique.
q
Divergence = Diversité génétique
Les très rares mutations avantageuses sont positivement
sélectionnées : sélection adaptative.
Divergence > Diversité génétique
3
Processus de fixation des mutations
Résultats majeurs des
modèles en évolution moléculaire
Mutation => création d’un nouvel allèle => polymorphisme/diversité dans la
population
Si population de petite taille ou s = 0
alors s < 1/2Ne
Changement des fréquences alléliques au cours des générations => fixation de la
mutation
i => substitution
b i i => divergence
di
entre espèces
è
la sélection ne peut opérer et la dérive génétique agit
Taux de divergence ~ Taux de mutations
la sélection positive/négative peut opérer
Taux de divergence ≠ taux de mutations
Fixation des mutations avantageuses
Elimination des mutations délétères
Variation des fréquences alléliques par dérive
génétique (1)
Par dérive génétique, il y a perte ou
fixation de l’allèle dans les populations de
très petites tailles efficaces (Ne)
Temps de fixation des allèles dans la
généalogie représente le temps de
coalescence.
T2
≈ 4 Ne
(en moyenne)
T3
T4
T5
2 Ne
(en moyenne)
La probabilité de fixation d’un allèle neutre
est égale à sa fréquence initiale
initiale.
Le temps moyen de fixation d’un allèle neutre
est de 4 Ne.
Substitu
ution
Si p
population
p
de ggrande taille
alors s > 1/2Ne
Generattions
Fixation de mutation faiblement délétères
Pas fixation de mutations avantageuses
Population
 Dérive génétique
Sélection naturelle
 Recombinaison
…
Fixation de l’allèle rouge
La sélection (2)
Ségrégation différentielle des alléles
• Il y a sélection lorsque les différents génotypes pour un locus
donné ne participent pas de façon équivalente à la constitution
génotypique
é t i
de
d la
l génération
é é ti suivante.
i t
• Un génotype donne plus de descendants fertiles et donc présente
un avantage sélectif . Meilleure Fitness pour ce génotype.
• La valeur sélective d’un génotype dépend :
- L’aptitude des individus à atteindre l’âge de reproduction (viabilité)
– La durée de la période reproductive
– L
L’aptitude
aptitude à la reproduction
– La qualité des gamètes produits
• Exemple de sélection au niveau nucléotidique : le gBGC
– Sélection directionnelle : biais de fixation de C/G versus A/T
Tous les processus évolutifs qui conduisent à réduire la taille efficace
comme l’absence de recombinaison conduisent à des phénomènes de dérive.
4
Valeurs sélectives des mutations
Durée de fixation d’une mutation
Les mutations délétères ne sont pas fixées dans la population
en raison de leur impact sur le fonctionnement du génome.
par la sélection naturelle : sélection
Elles sont éliminées p
négative ou purificatrice.
s>0
t = (2/s) ln (2N)
Les mutations non (ou faiblement) délétères peuvent être
transmises à la descendance. Ces mutations, dites « neutres »,
sont fixées aléatoirement dans la population : dérive
génétique.
s≈0
t = 4Ne
Les très rares mutations avantageuses sont positivement
sélectionnées : sélection adaptative.
t = durée de fixation moyenne
en générations
Darwin C.
s<0
s>0
s=0
s~0
Wright et al.
s < 0
s = coef. de sélection
Ki
Kimura
T.
T
Otha T.
1/= temps moyen entre deux
évènements de fixation =coalescence
La recombinaison (3)
• La recombinaison assure le brassage génétique en conduisant
à l’échange de matériel génétique entre chromosome
homologue ou hétérologue.
• La recombinaison entre le chromosome maternel et paternel
lors de la meïose s’accompagne s’il y a cassure d’une
réparation par conversion génique avec ou sans crossing-over.
• Un dogme en génétique des populations veut que la
recombinaison améliore l’efficacité de la sélection en
favorisant le tri des meilleurs allèles.
• Lorsque la recombinaison est absente, la sélection ne peut
agir.
Bernardi G.
Effets Hill-Robertson
PNAS 2007
5
Effet Hill-Robertson
Mutations physiquement liées
effet auto-stop / effet Hitch-hiking
T0 : deux génotypes dans la
population
a b
a B
T1: Apparition d ’un nouvel
allèle avantageux issu d ’une
mutation a en A
a b
Ab
Par le fait du hasard
A est lié à b
a B
Fitness = 0.90
Balayage sélectif (Maynard-Smith et Haig 1974)
Fitness = 1
Fitness = 0.90
Fitness = 0.95
Fitness = 1
Mutation avantageuse
Mutation neutre
Sélection d
d’arrière
arrière garde (Charlesworth et al,
al 1993)
Recombinaison :
Pas de recombinaison :
Le génotype AB peut être crée.
La combinaison des deux allèles
favorables est favorisée par la
sélection.
La sélection contre b tend à faire
disparaître A de la population et le
génotype aB est favorisé.
a B
A B
Bilan des effets
« sélection/recombinaison »
• Affecte la distribution des fréquences alléliques
parfois rapidement
rapidement,
• Affecte le temps de résidence des allèles dans les
populations donc la diversité génétique,
• Affecte l’association dans une population des
mutations physiquement liées,
• Affecte le nombre d’allèles maintenus,
• Affecte la proportion de changements synonymes et
non synonymes, Dn/Ds.
Mutation délétère
Mutation neutre
Goulot d’étranglement
Effondrement des effectifs d’une population qui conduit
à un tri au hasard des allèles pour la fondation d’une nouvelle
Population » Ne faible » : dérive génétique.
Le goulot d’étrangement en réduisant le polymorphisme a
également les mêmes effets que le balayage sélectif.
Les effets démographiques s’appliquent à l’ensemble du
génome alors que les effets sélectifs sont localisés à une région
génomique.
6
Questions actuelles en génomique
évolutive
I. L’évolution moléculaire
I1. Le cadre théorique
- Théories de l’évolution
- Forces évolutives qui façonnent les génomes
- Test de neutralité
• Quelle est la part du génome qui évolue de
manière
iè neutre
t ett la
l partt sous pression
i de
d
sélection ?
• Quelle est la part de génome sous sélection qui
est due à la sélection adaptative ou purificatrice?
• Quels sont les facteurs de sélection impliqués ?
Tests de neutralité ou comment détecter
la sélection ?
Importance de la théorie neutraliste de l’évolution moléculaire
- Un modèle « nul » qui décrit un monde dans lequel la sélection naturelle ne
joue aucun rôle,
- La diversité génétique n’est affectée que par la dérive, la mutation, la
recombinaison et la migration.
1. Prédire grâce au modèle neutraliste ce qu’on devrait attendre (diversité, nombre
d’allèles, distribution de fréquences alléliques) et tester l’ajustement du modèle
aux données,
Tests de neutralité ou comment détecter
la sélection ?
• Différentes signatures moléculaires de la sélection
peuvent être utilisées pour tester le modèle neutre.
• Sans donnée de polymorphisme
- comparaison des divergences synonymes et non
synonymes Ka/Ks ou dn/ds
2. Comparer la vraisemblance d’un modèle qui ignore la sélection naturelle à
la vraisemblance d’un modèle qui l’intègre : l’amélioration permet-elle
d’expliquer au mieux les données ?
7
Sélection
purificatrice
Test de la neutralité
Sélection
adaptative
Protéines immunitaires
Protéines de résistance/virulence
Protéine de reconnaissance
Gamétique (Yang 2000)
Divergence non synonyme versus Divergence synonyme
KA vs KS
Les pressions évolutives diffèrent entre les sites
synonymes et non synonymes des parties codantes.
8% (1% significatif)
ω=
KA
KS
ω > 1 d’où KA > KS : sélection adaptative
ω = 1 d’où
d où KA = KS : évolution neutre
ω < 1 d’où KA < KS : sélection purificatrice
13454 séquences codantes orthologues entre l’homme
et le chimpanzé
Pour ce jeu de donné, ω moyen vaut 0,23
En générale, la moyenne de ω se situe entre 0,05 et 0,3
Tests de neutralité ou comment détecter
la sélection ?
• Différentes signatures moléculaires de la sélection
peuvent être utilisées pour tester le modèle neutre.
• Sans donnée de polymorphisme
- comparaison des divergences synonymes et non
synonymes dn/ds ou Ka/Ks
• Avec des données de polymorphisme,
- comparaison
i
des
d taux
t
de
d mutation/taux
t ti /t
de
d substitution
b tit ti
Test de Mc Donald -Kreitman (91)
Type de
changement
h
t
Divergence
K
Polymorphisme
P
Synonymes
KS
PS
Non synonymes
KA
PN
H0 : évolution neutre
KA/KS = PN/PS
H1 : sélection purificatrice
KA < PN
H1 : sélection adaptative
KA > PN
8
Subset of Data from McDonald &
Kreitman (1991)
Test de Mc Donald -Kreitman (91)
Type de
g
changement
Divergence
Polymorphisme
Synonymes
26
36
Non synonymes
21
2
(Eanes et al. 93)
H0 : évolution neutre
KA /K
/ S ou DN /D
/ S = PN /P
/ S
Exemple : G6PD entre D. melanogaster (32 s.) et D.simulans (12 s.)
1705 bp
Exemple : G6PD entre D. melanogaster (13 s.) et D.simulans (12 s.)
KA/KS = 0,81
PN/PS = 0,06
2 = 16,5 p<10-4
Tests de neutralité ou comment détecter
la sélection ?
L=100 pb
sites neutres
sites sous sélection négative
0.35
0.25
0.15
0 05
0.05
10% 20% 30% 40% 50% 60% 70% 80% 90% <100%
Fréquence des allèles dérivés
SNP n = 10
Proportion de SN
NPs
• Différentes signatures moléculaires de la sélection
peuvent être utilisées pour tester le modèle neutre.
• Sans donnée de polymorphisme
- comparaison des divergences synonymes et non
synonymes dn/ds ou Ka/Ks
• Avec des données de polymorphisme,
- comparaison
i
des
d taux
t
de
d mutation/taux
t ti /t
de
d substitution
b tit ti
- étude des distributions des fréquences alléliques
Proportion of SNPs
Sélection adaptative
Sites neutres
sites sous sélection positive
0.35
0.25
0.15
0.05
10% 20% 30% 40%
50% 60% 70% 80% 90% <100%
Fréquence des allèles dérivés
9
Plan du cours
I. L’évolution moléculaire
I1. Le cadre théorique
I2. Les données et les questionnements
II. Evolution de quelques traits moléculaires
II.1 Composition en Base des Génomes
II.2 Taux d’évolution
II.3. Taille des génomes
LES DONNEES
Carte physique : séquences de génomes complets
au niveau des taxons et des individus
Génomique évolutive,
évolutive génomique populationnelle
Carte génétique : RH, marqueurs, SNP
moyenne ou sexe spécifique
Etude de la Recombinaison
p
q
: RNAseq,
q, NGS
Données transcriptomiques
Génomique fonctionnelle, biodiversité
III. Conclusion
Données protéomiques : Spectrométrie de masse
Analyse des Réseaux d’interaction, biodiversité des
communautés
Pourquoi étudier l’évolution des génomes ?
http://www.genomesonline.org
Données disponibles
(3/11/2013)/(15/09/2012)
7403/3708 Génomes complets
p
:
2650/2224 publiés – 4753/1484 en cours d’annotation
234/159 Archés - 6858/3366 Bactéries – 311/183 Eucaryotes
409/340 projets de métagénomique :
dont 37/29 (Ingénéries) – 238/197 (environnements) – 134/114 (hôte/parasite)
1. Comprendre l’évolution de la vie
1. L’origine de la vie,
2. La phylogénie des espèces, l’histoire des populations,
3. Inférence des paléoenvironnements
p
2. Comprendre la structure et l’organisation des génomes
1. La mise en place des chromosomes sexuels,
2. L’impact du sexe et de la recombinaison sur l’évolution des
génomes,
3. La mise en place des systèmes biologiques (voies métaboliques),
4. Le rôle des duplications dans l’adaptation des organismes à leur
environnement (domestication),
(domestication)
5. Le déterminisme écologique (THV) du polymorphisme et de la
divergence génétique,
6. Les dialogues moléculaires entre génome (au sein d’un même
organisme ou entre organismes différents Hôte/symbiotes ou
pathogène)
7. ……
10
La génomique évolutive
Comprendre les processus à l’origine de la dynamique des génomes
- nécessaire pour reconstruire l’évolution de la vie
- nécessaire pour comprendre le contenu et le fonctionnement
des génomes
Etude des processus évolutifs en relation
avec les composantes écologiques
Génome nucléaire et cytoplasmique
Taille des populations
mécanismes moléculaires + processus populationnels + environnement
Génomique évolutive
Taille des génomes
Composition en base
Répartition des ETs
Taux d’évolution
Packaging de ll’ADN
ADN
……
Réplication (u)
Réparation
Recombinaison
Activité télomérase
Remaniement chromosomique
Taille de la population
Mode d’appariement
Sociabilité
……..
Latitude
Température
Rayonnement UV
……..
Traits Moléculaires
Ecologie évolutive
Dérive génétique
Composante adaptative
Durée de génération
Activité métabolique
Longévité
Masse corporelle
Mode de vie
Système de reproduction
Traits d’Histoire de Vie
11