BOP Génétique des populations

Transcription

BOP Génétique des populations
BOP Génétique des populations
Xavier Vekemans
Laboratoire de Génétique et Evolution des Populations Végétales
(UMR CNRS 8016), Bureau 203, Bâtiment SN2
e-mail: [email protected]
http://www.univ-lille1.fr/gepv lien "Ressources pédagogiques"
Supports de cours élaborés par Xavier Vekemans et Joël Cuguen (UMR 8016)
Ouvrages
g de référence
• Henry,
y, JP et PH Gouyon
y 1998 Précis de Génétique
q des
Populations, Masson
• Serre, JL 1997 Génétique des Populations, Nathan
• Hartl, DL 1994 Génétique des Populations, Flammarion
• Solignac
S li
ett coll.
ll , 1995 Gé
Génétique
éti
ett E
Evolution,
l ti T
Tomes I ett
II, Hermann
• Ridley, M 1997 Evolution Biologique, De Boeck
y PH et coll. 1997 Les Avatars du Gène, Belin
• Gouyon
• Provine W. 2001 The origins of theoretical population
genetics. University of Chicago Press, Chicago: un excellent
exposé de l'histoire de la génétique des populations
Elé
Eléments
t de
d génétique
é éti
des
d populations
l ti
1. Introduction
2 Organisation de la diversité génétique: Principe de Hardy2.
Hardy
Weinberg
3 Organisation
3.
O
i i de
d la
l diversité
di
i é génétique:
é éi
A li i du
Application
d
principe de Hardy-Weinberg et écarts à la panmixie
4. Mécanismes évolutifs: Les sources de la variation
5 Mécanismes évolutifs: La sélection naturelle
5.
6. Mécanismes évolutifs: La dérive génétique
1. Introduction
1.1.Qu'est-ce que la génétique des populations?
1 2 Méthodes de détection de la diversité génétique
1.2.
1.3. Polymorphisme génétique
1.1. Qu'est-ce q
que la génétique
g
q des ppopulations?
p
Définit° Génétique: discipline qui étudie la transmission de l'information
héréditaire et son utilisation dans le développement
pp
et le
fonctionnement des organismes
– Comment et pourquoi l'information génétique évolue t'elle au cours
du temps au sein des espèces et des populations?
Æ Génétique des populations
1.1. Q
Qu'est-ce q
que la génétique
g
q des ppopulations?
p
Historiquement une synthèse entre
1. Application des lois de la génétique de la
transmission
G. Mendel
Ö caractères à déterminisme simple
2. Application de la théorie de l'évolution et
d la
de
l sélection
él ti naturelle:
t ll
– Évolution biologique
– Évolution par sélection des individus les plus
adaptés
Ö caractères à distribution continue
(quantitatifs: nombre graines, vigueur mâles )
Charles Darwin
1 1 Qu
1.1.
Qu'est
est-ce
ce que la génétique des populations?
L fondements
Les
f d
t de
d la
l génétique
é éti
des
d populations:
l ti
∃ diversité
di
ité génétique
é éti
•
Information ggénétique
q → locus → p
plusieurs états alléliques
q
distincts
•
Diversité génétique s'exprime par les fréquences (proportions) relatives des différents
allèles
•
Evolution agit sur des populations d'individus (groupe d'individus susceptibles de se
reproduire entre eux à court terme)
•
Evolution se traduit par une variation des fréquences alléliques dans les populations
au cours du temps
•
Forces évolutives: pprocessus qqui agissent
g
sur les changements
g
de fréquences
q
alléliques
1.1. Q
Qu'est-ce q
que la génétique
g
q des ppopulations?
p
Forces évolutives:
•
•
•
•
mutation
migration
sélection
é
i naturelle
dérive génétique: processus évolutif de fluctuations aléatoires des fréquences
alléliques
q
résultant d'un échantillonnage
g aléatoire p
parmi les g
gamètes
– processus important dans les petites populations
– force évolutive car changement des fréquences alléliques
1.1. Qu'est-ce que la génétique des populations?
Théorie synthétique de l'évolution:1920-1930
• Ronald Fisher:
– Héritabilité des caractères quantitatifs →
compatibilité avec génétique Mendélienne
– Grande population: N inexorable de fréquence des
allèles favorisés par sélection naturelle
• J.B.S. Haldane:
– Approche récursive: variation d'une génération à
l'autre des fréquences alléliques sous l'effet de
différentes formes de sélection
• Sewall Wright:
– Effets stochastiques dans petites populations Ö
nouvelles combinaisons de gènes Öaction de
sélection naturelle
– Structuration
i de
d la
l diversité
di
i génétique
i
et
consanguinité
1.1. Qu'est-ce que la génétique des populations?
Objectifs →génétique des populations:
(1) Mesurer la diversité génétique dans populations naturelles + décrire patron
d'organisation de diversité
di ersité
(drongo,
Dicrurus paradiseus,
Mayr & Vaurie
Vaurie, 1948)
(2) Expliquer
E li
origine,
i i maintien
i i et évolution
é l i de
d la
l diversité
di
i é génétique
é éi
par l'effet
l' ff
des forces évolutives
•
J. Gillespie: "Grande Obsession des généticiens des populations:
Quelle force évolutive est responsable du patron observé?"
1.1. Qu'est-ce que la génétique des populations?
Objectif 1: Mesurer diversité génétique
exple: Estimation des fréquences alléliques
Polymorphisme floral chez les Gueules-de-loup
Gueules de loup
(Antirrhinum majus)
Corolle rouge:
ro ge: RR
Corolle blanche: rr
Corolle rose: Rr
•
•
•
Echantillon de 400 plantes dd‘une
une population:
Rouges, n=165; Roses, n=190; Blanches, n=45
P = fréquence de l'allèle R dans l’échantillon = (2x165+190)/800 = 0,65
Q = fréquence de l’allèle r dans l’échantillon = (190+2x45)/800 = 0,35
0 35
Vérification: P+Q = 0,65 + 0,35 = 1,00
1.1. Qu'est-ce que la génétique des populations?
Objectif 1: Mesurer diversité génétique
Distinction entre paramètre et estimateur
•
•
Les modèles de génétique des populations décrivent l’évolution de quantités décrivant
la population dans son entièreté
entièreté, quantités appelées paramètres
Les études empiriques mènent au calcul de quantités mesurées sur des échantillons
sensés représenter la population, quantités appelées estimateurs
Exemple des Gueules-de-loup:
p = fréquence
fé
de
d l’allèle
l’ llèl R dans
d
la
l population
l ti = paramètre
èt (valeur
( l
inconnue)
i
)
<p> = estimateur de p = fréquence de l’allèle R dans l’échantillon =P = 0,65
1.1. Qu'est-ce que la génétique des populations?
Objectif 2: Expliquer patron de diversité génétique
exple: Anémie à cellules falciformes chez l’homme (drépanocytose)
individu SS
individu AA ou AS
(tiré de Griffiths et al. 2001)
Anomalie génétique quasi-létale à l'état homozygote
Variant génétique de la chaîne β−hémoglobine à expression récessive:
– allèle
llèl normal→A;
l A
– allèle muté→S;
– individus atteints→génotype SS.
SS
Microgrraphie éle
ectroniqu
ue
de glob
bules roug
ges
•
•
1.1. Qu'est-ce que la génétique des populations?
Objectif 2: Expliquer patron de diversité génétique
exple:
p Anémie à cellules falciformes
Répartition des fréquences de l'allèle S
>0,14
(tiré de
e Ridley, 1997)
•
<0,02
Özones de forte fréquence de S correspondent avec les régions d'endémisme de la malaria
1.1. Qu'est-ce que la génétique des populations?
Objectif 2: Expliquer patron de diversité génétique
exemple: Anémie à cellules falciformes
Anopheles: vecteur du Plasmodium
•
Explication:
Les individus hétérozygotes AS résistent mieux à la malaria (parasite des globules
rouges: Plasmodium falciparum) que les homozygotes AA
Ö équilibre entre
– sélection en faveur de l'hétérozyg. AS Ö N fréq(S)
– sélection contre l'homozyg. létal SS Ö P fréq(S)
1.1. Qu'est-ce que la génétique des populations?
• Difficultés conceptuelles de la génétique des populations
– Discipline essentiellement quantitative: quantification de la
diversité génétique; modélisation de l'effet d'une force évolutive sur
les fréquences alléliques
– Changements évolutifs graduels :
• Echelle de temps évolutive: les modifications des fréquences alléliques se
marquent → échelle 10.000-106 générat°
• Avantages adaptatifs souvent très faibles: difficile à mettre en évidence
– Paradoxe:
• Evolution agit → phénotypes à déterminisme génétique complexe
• Modèles théoriques → évolution de caractères à déterminisme
simple
1.2. Méthodes de détection de la diversité génétique
• Jusque dans les années 1960: marqueurs phénotypiques (drosophile, couleur
fleurs,…) ou sérologiques (ABO, rhésus,…)
• Années 1960: découverte des allozymes
(tiré de Hartl, 1994)
– séparation électrophorétique des protéines
– coloration histochimique des enzymes
1.2. Méthodes de détection de la diversité génétique
Allozymes
Gel obtenu après coloration histochimique
(tiré de Hedrick, 2000; Lap= Leucine amino-peptidase; 2 locus distincts Lap-1 et Lap-2)
•
•
Allozymes: formes moléculaires distinctes d’un enzyme chez un même
organisme et ayant la même activité catalytique
origine des allozymes: mutations Ö changement d’acide aminé qui affecte la
charge totale de la protéine sans affecter le site catalytique (± neutre)
1.2. Méthodes de détection de la diversité génétique
Allozymes: Relation phénotype Ù génotype
codominance
+
f→"fast"
s→"slow"
f
f
x
s
−
Génotype FF x
Phé t
Phénotype
f
•
•
•
•
SS
s
Phénotype = nombre/position
Phé
b / i i relative
l i des
d bandes
b d
Isoenzymes ≡ codés par des locus différents (Lap-1 et Lap-2)
Allozymes ≡ différents allèles au même locus (F et S)
Enzyme monocaténaire: 1 bande = un allèle
s
FS
fs
1.2. Méthodes de détection de la diversité génétique
Allozymes: Calcul des fréquences alléliques
•
•
•
Echantillon de 9 individus (18 copies d'allèles)
– génotypes FF: 3
– génotypes FS: 4
– g
génotypes
yp SS: 2
Fréquence de l'allèle F: <p> = (3x2+4)/18 = 0,56
Fréquence de l'allèle S: <q> = (4+2x2)/18 = 0,44
1.2. Méthodes de détection de la diversité génétique
• Années 70: outils moléculaires → ADN
– Utilisation des enzymes de restriction
Fréq. moy. coupure
1/256 p.b. (=1/44)
1/4096 p.b. (=1/4
( 1/46)
1.2. Méthodes de détection de la diversité génétique
• Années 70: outils moléculaires → ADN
(tiré de Ha
artl, 1994)
– clivage de l'ADN par enzymes de restriction
– procédure
éd
"Southern
"S th
Bl
Blot"
t"
– hybridation avec sonde (ADN) radioactive
Ö Marqueurs RFLP (("Restriction
Restriction fragment length polymorphism
polymorphism" =
polymorphisme de longueur des fragments de restriction)
1.2. Méthodes de détection de la diversité génétique
Marqueurs RFLP
• Relation
R l i phénotype
hé
Ù génotype
é
sites de restriction
+
X
X
X
sonde-ADN
sonde
ADN
X
X
X
X
_
ce fragment
f
t ne s'hybride
'h b id
pas à sonde
– Sonde-ADN
S d ADN: fragment
f
t d'ADN marquéé ((radioactif/fluorescent)
di tif/fl
t) simple-brin
i l b i
correspondant à une séquence non répétée du génome (gène connu, ou anonyme)
– Polymorphisme de présence/absence d'un site de restriction (mutation du site de
reconnaissance) Î polymorphisme du nombre et taille des bandes observée
– Plusieurs marqueurs Ö différentes combinaisons enzyme/sonde
1.2. Méthodes de détection de la diversité génétique
Relation phénotype Ù génotype
(tiré d
de Hartl, 1994)
Marqueurs RFLP
→ marqueurs co-dominants
• Utilisés pour les 1ère cartes génétiques fines
• Utilisés pour "DNA-fingerprinting": identification de criminels,…
• Utilisés pour reconstructions phylogénétiques, estimation de diversité génétique
1.2. Méthodes de détection de la diversité génétique
• Années 80-…: amplification PCR à partir d'ADN ou
d'ARN
d
ARN (→ cDNA)
– Marqueurs microsatellites (locus dont séquence = répétition d'un
motif simple)
p )
– Marqueurs AFLP ("Amplified Fragment Length Polymorphism")
– Séquençage dd'ADN
ADN Æ SNPs ("Single
( Single Nucleotide Polymorphism
Polymorphism"))
1.3. Polymorphisme génétique
• Marqueurs génétiques (allozymes, RFLP) Ö quantification du
polymorphisme génétique (= diversité génétique)
• Déf.: un locus est dit polymorphe dans une population si fréquence
de ll'allèle
allèle le + commun < 0,95
0 95 (ou 0,99);
0 99); sinon le locus est dit
monomorphe
Ö exclusion des allèles rares ((fréq.
q < 0,005)) souvent délétères et voués à
disparaître
• Quantification du polymorphisme:
– <P> = proportion de locus polymorphes dans un échantillon
– <Ho> = hétérozygotie moyenne observée = estimation de la proportion de
locus présents à ll'état
état dd'hétérozygote
hétérozygote chez un individu moyen Æ calculé
comme moyenne sur les locus de la proportion de génotypes hétérozygotes
dans l'échantillon
1.3. Polymorphisme génétique
Polymorphisme des allozymes
Synthèse de Nevo (1978)
(tiré
é de Harttl, 1994)
sur 243 espèces
Ö important polymorphisme des allozymes
• polymorphisme neutre?
• surprise pour les "sélectionnistes" (sélect° naturelle censée éliminer variation)
1.3. Polymorphisme génétique
Polymorphisme des allozymes
• Effet de la "forme de vie" chez les pplantes: étude comparée
p
du
polymorphisme des allozymes chez 473 espèces végétales (Hamrick & Godt, 1989, in
Plant population genetics, breeding, and genetic resources, Brown et al. ed., Sinauer, Sunderland)
Forme de vie
Nombre d'espèces
P
Ho
Annuelle
187
30,2% ± 1,9%
0,105 ± 0,008
Pérenne herbacée
159
28,0% ± 1,8%
0,096 ± 0,008
Pérenne ligneuse
115
50,0% ± 2,5%
0,149 ± 0,009
Ö arbres = espèces végétales les plus variables génétiquement
1.3. Polymorphisme génétique
Polymorphisme des allozymes
• Polymorphisme
P l
hi
fréquent
fé
mais
i pas universel:
i
l exemple du guépard
Acinonynx jubatus ("cheetah") - O'Brien et al. 1987 PNAS 84:508-511
– Echantillon de 98 individus typés pour 49 allozymes
Ö <P> = 0,02 et <Ho> = 0,0004
g
historique
q ((10.000 B.P.))
Ö ggoulot d'étranglement
Ö perdu diversité génétique
Ö pperte de sa capacité
p
évolutive?
Elé
Eléments
t de
d génétique
é éti
des
d populations
l ti
1. Introduction
2 Organisation de la variation génétique: Principe de Hardy2.
Hardy
Weinberg
3 Organisation
3.
O
i i de
d la
l variation
i i génétique:
é éi
Application
A li i du
d
principe de Hardy-Weinberg et écarts à la panmixie
1.1. Qu'est-ce que la génétique des populations?
Objectifs →génétique des populations:
(1) Mesurer la variation génétique dans populations naturelles +
décrire patron d'organisation de variation
(Frêne,
Fraxinus excelsior,
Marqueurs microsatellites,
Heuertz et al. 2004)
(2) Expliquer origine, maintien et évolution de la variation
ggénétique
q ppar l'effet des forces évolutives
2 Organisation de la variation génétique:
2.
Principe
p de Hardy-Weinberg
y
g
2.1. Modèle de p
population
p
"idéalisée"
2.2. Principe de Hardy-Weinberg
2.1. Modèle de population "idéalisée"
• déf. Population : groupe d'individus de la même espèce vivant dans une aire
géographique suffisamment restreinte pour permettre potentiellement à tout membre de se
reproduire avec tout autre membre du groupe: unité de reproduction
• Exemples:
– Les éléphants dd'un
un parc national africain
– Les chênes d'un massif forestier (pollen à large dispersion anémogame)
– Les individus d'une espèce de parasite intestinal, présents chez un seul individu hôte
• Synonymes: population locale, dème, sous-population (→ "population" =
espèce)
2.1. Modèle de ppopulation
p
"idéalisée"
• Hypothèses du modèle de population de Hardy-Weinberg
– organisme diploïde
– reproduction sexuée
– générations non chevauchantes
2.1. Modèle de population "idéalisée"
• Hypothèse de générations non chevauchantes (discrètes):
(tiré dee Hartl, 19994)
– cycle
y de reproduction
p
simple:
p individus de chaque
q génération
g
meurent avant la
naissance des membres génération suivante
– exemple: plante annuelle (blé, plantes adventices, …); insectes; …
– approximation souvent satisfaisante même pour des espèces à cycle reproductif +
complexe (Homme: évitement consanguinité,
consanguinité temps de génération moyen comme unité de
temps)
2.1. Modèle de ppopulation
p
"idéalisée"
• Hypothèses du modèle de population de Hardy-Weinberg
–
–
–
–
–
–
organisme diploïde
reproduction sexuée
générations non chevauchantes
locus considéré possède 2 allèles
fréquences alléliques identiques chez les individus mâles et femelles
panmixie p/r locus considéré
2.1. Modèle de population "idéalisée"
• Hypothèse de panmixie:
– llors de
d la
l reproduction,
d i les
l croisements
i
s'effectuent
' ff
au hasard
h
d pour
les génotypes considérés
– double hypothèse:
yp
1. les couples reproducteurs s'unissent au hasard (panmixie sensu stricto)
2. les gamètes produits s'associent au hasard (pangamie)
Ö probabilité de se croiser avec un individu de génotype donné =
fréquence de ce génotype dans la population
Exemple:
l locus
l
Lap-1
1 chez
h lles Lillois:
ill i 4% FF; 32% FS;
S 64% SS
Si panmixie, en moyenne une Lilloise, indépendamment de son génotype Lap-1,
va choisir pour se reproduire (si elle choisit un partenaire Lillois):
– partenaire
i FF avec 1 chance
h
sur 25
– partenaire FS avec 8 chances sur 25
– partenaire SS avec 16 chances sur 25
2.1. Modèle de ppopulation
p
"idéalisée"
• Hypothèse
yp
de p
panmixie:
– Panmixie relative au caractère considéré: une même population peut
se reproduire de manière
• panmictique p/r à un caractère (locus Lap-1)
• non aléatoire p/r à un autre caractère (couleur peau, taille, date floraison,…)
– écart à la panmixie Ö consanguinité :
• autofécondation: 2 partenaires génétiquement identiques
• croisements entre cousins: 2 partenaires plus similaires génétiquement que 2
individus choisis au hasard
2.1. Modèle de ppopulation
p
"idéalisée"
• Hypothèses du modèle de population de Hardy-Weinberg
–
–
–
–
–
–
–
–
–
–
organisme diploïde
reproduction sexuée
générations non chevauchantes
locus considéré possède 2 allèles
fréquences alléliques identiques chez les individus mâles et femelles
panmixie p/r locus considéré
population de très grande taille (∞)
migration entre populations négligeable
mutation négligeable
sélection naturelle n'agit
g ppas au locus considéré
2.1. Modèle de population "idéalisée"
(tiré de Solignac et al. 19995)
Conceptualisation du modèle de population de Hardy-Weinberg
2.2. Principe de Hardy-Weinberg
• Formulé en 1908 indépendamment par:
– G.H. Hardy (1877-1947): mathématicien anglais
– W. Weinberg (1862-1937): physiologiste allemand
• Si les hypothèses du modèle de Hardy-Weinberg sont respectées, on
peut prédire exactement les fréquences génotypiques à partir des
fréquences alléliques de la population
– F
Fréquences
é
alléliques:
lléli
A (p);
( ) a (q
( = 1-p)
1 )
– Fréquences génotypiques: AA (P); Aa (Q); aa (R)
H-W: AA→p2
Aa→2pq
aa→q2
Clé: association des gamètes pour formation des zygotes =
événements indépendants Ö développement du binôme:
(p A + q a)2 = p2 AA + 2pq Aa + q2 aa
2.2. Principe de Hardy-Weinberg
Fréquences alléliques: A (→p); a (→q = 1-p)
Fréquences génotypiques: AA (P); Aa (Q); aa (R)
H-W: AA→p2
Aa→2pq
aa→q2
{( A + q a))2 = p2 AA + 22pq Aa
{(p
A + q2 aa}}
(tiré de Hartl, 1994)
→ événements
indépendants!
2.2. Principe de Hardy-Weinberg
• Le principe de Hardy-Weinberg découle du fait que la reproduction
aléatoire entre génotypes est équivalente à l'union au hasard des gamètes
Les valeurs de P', Q' et R' ne dépendent pas de P, Q, et R !
Ö fréquences génotypiques de H-W atteintes en 1 génération!
(tiré de Hartl, 1994)
2.2. Principe de Hardy-Weinberg
• Implications du principe de Hardy-Weinberg:
– Une seule génération de panmixie suffit pour atteindre les fréquences
génotypiques de Hardy-Weinberg (en général)
– Selon les hypothèses
yp
du modèle de Hardy-Weinberg,
y
g, les fréquences
q
alléliques restent constantes Ö absence d'évolution au locus considéré
Ö maintien du polymorphisme génétique
fréq.(A): p' = P'+Q'/2 = p2+2pq/2 = p(p+q) = p
– Base pour élaboration de modèles + complexes: séparation en 2 phases
• gamètes
g
Î zygotes
yg
(fréquences
( q
génotypiques
g
yp q
à naissance déterminées par
p H-W si
panmixie Ö inchangé)
• zygotes Î adultes (ajouter effet de sélection ou de la migration)
Ö changement des fréquences alléliques
2.1. Modèle de population "idéalisée"
(tiré de Solignac et al. 19995)
Conceptualisation du modèle de population de Hardy-Weinberg