génomes

Transcription

génomes
Génomique structurale et
fonctionnelle chez les
animaux de rente
Laurence FLORI
Génétique Animale et Biologie Intégrative
INRA, Jouy-en-Josas
10/10/2008
Plan de l’exposé
Introduction et définitions
La génomique structurale
1. La cartographie des génomes animaux
2. L’amélioration génétique
- Principes
- Exemples de détections de QTLs
- Sélection assistée par marqueurs (SAM)
La génomique fonctionnelle
1. Transcriptome et protéome
2. Etude du transcriptome
- Techniques bas et haut-débit
- Vers le séquençage du transcriptome
- Exemples d’étude du transcriptome
La génomique génétique
Conclusion
10/10/2008
Introduction et
définitions
10/10/2008
Les animaux domestiques
Une ressource pour comprendre les bases moléculaires
de la variation phénotypique
•
L’élevage des animaux domestiques a abouti à une grande diversité
intra-spécifique (races)
•
Comprendre la base génétique de la diversité phénotypique inter et
intra-spécifique est un des enjeux majeurs de la biologie moderne.
10/10/2008
Les animaux de rente
Une vingtaine d’espèces domestiquées il y a plus de 8000 ans
(pour la
plupart).
Bos taurus
Equus caballus Orytolagus cuniculus
Volailles:
Gallus gallus
Capra hircus
Mammifères:
Sus scrofa
Ovis aries
Anas platyrhyncos
Poissons:
Onchoryncus mykiss
10/10/2008
Une vision formelle de l’élevage…
• L’élevage des animaux de rente est basée sur «
maîtrise de la génération animale »
(Aristote)
• Les trois éléments de la génération animale
(Vissac, 2002)
Contexte : pratiques d’élevage (nutrition)
Contenant : techniques de reproduction (I.A.,OPU/FIV)
Contenu : la génétique (Amélioration génétique)
10/10/2008
Quelques exemples de caractères d’intérêt
zootechnique …
• Mouton
– Tremblante
– Résistance aux salmonelles
• Porc
– Composition de la carcasse
– Pathologie tumorale (Mélanome)
• Lapin
– Caractère Rex (pelage)
• Chèvre
– Débit de traite
• Bovin
– Caractères de production
– Caractères fonctionnels
• Fertilité des vaches laitières
• Résistance aux mammites
• Poulet
– Résistance aux maladies
– Modèle d’épilepsie
• Cheval
– Diverses pathologies
• Espèces aquacoles
– Caractéristique de la chair et
des carcasses
– Résistance aux maladies virales
et bactériennes
10/10/2008
L’amélioration génétique basée sur la sélection
sur indice
• L’Amélioration Génétique s’appuie sur un choix rationalisé des
candidats à la reproduction
• Très efficace durant les dernières décennies
–
Explique de 1/2 à 2/3 de l’amélioration des performances en production laitière (x4
depuis 1950)
• Les méthodes classiques sont basées sur :
–
Collecte d’informations de performances individuelles
–
Compilation des observations avec des informations généalogiques
–
Généalogie VS Performance ⇒ « Indice de sélection » pour chaque candidat à la
reproduction
–
Diffusion du progrès génétique (I.A.)
10/10/2008
Amélioration génétique et génomique
• Quelques limites de la sélection classique sur indice
– Certains caractères sont difficiles à mesurer (résistance aux maladies)
– Certains caractères ont une héritabilité faible (fertilité)
– Certains caractères sont antagonistes (QL & fert)
– Coût de l’évaluation des candidats à la reproduction (40k€/taureau d’IA)
• Apport de la dissection moléculaire des caractères d’intérêt
– Sélection directe des individus sur la base de leur génotype
– Compréhension du déterminisme moléculaire et des mécanismes physiologiques
10/10/2008
Atouts/Limites des animaux de rente
• Les Atouts :
– Très bon suivis et beaucoup d’informations sur les populations exploitées
(pour les besoins de la sélection) :
• Information généalogique (Livres généalogiques)
• Information phénotypique
• Facilités pour l’obtention d’échantillons
– Possibilité de réaliser des accouplements dirigés : croisement entre 2 races
(variabilité génétique !)
• Les Limites :
des dispositifs expérimentaux optimaux impossibles (ou
difficiles) à réaliser
– Il n’existe pas de lignées pures (=! souris, rat)
– Temps de génération souvent importants
10/10/2008
Le programme
10/10/2008
de l’INRA
Génomique structurale
Génome
nucléaire
Dégradation
Traduction
ARNm
Protéome
Transcriptome
Génomique fonctionnelle
10/10/2008
La génomique
structurale
10/10/2008
La génomique
structurale
1. La cartographie des génomes
animaux
2. Application: l’amélioration
génétique des animaux
10/10/2008
La génomique structurale
• C’est d’abord … avoir les outils pour baliser et étudier la
structure du génome
– Marqueurs génétiques (microsatellites et SNP)
• Balises du génome et traceurs de l’information génétique
– Cartes génomiques
• « Charpente » et « articulation » du génome
– Collections représentatives du génome
(Banques de grands fragments d’ADN)
• BAC (Bacterial Artificial Chromosome)
• Intérêts
– Connaissance fondamentale
– Amélioration génétique
10/10/2008
Cartographie génomique
• Cartographie génétique
– Loci polymorphes et familles de référence
• Cartographie physique chromosomique
– Hybrides somatiques
– Hybridation In Situ
– Hybrides d’irradiation
• Cartographie physique moléculaire
– Contig du génome
– Séquence complète de l ’ADN
10/10/2008
Cartographie génomique
• Cartographie génétique
– Loci polymorphes et familles de référence
• Cartographie physique chromosomique
– Hybrides somatiques
– Hybridation In Situ
– Hybrides d’irradiation
• Cartographie physique moléculaire
– Contig du génome
– Séquence complète de l ’ADN
10/10/2008
Cartographie génétique
• Objectif: mesurer la distance entre 2 marqueurs par recombinaison
méiotique et déterminer l’ordre des marqueurs le long du chromosome
• Principe:
– Etude de la co-ségrégation des marqueurs au cours de la méiose
– Estimation de leur ordre sur le chromosome
– Calculer la distance génétique:
d=F(R)
d en cM (centimorgan), R=taux de recombinaison
La mesure de la distance génétique est la fraction de recombinaison
(cM)
• Nécessite le développement de marqueurs génétiques et la
collecte de familles
• Deux approches générales
– cartographie par marqueur-caractère : localiser des gènes d ’intérêt
– cartographie par marqueur-marqueur : construire une charpente de cartes grâce
à des marqueurs
10/10/2008
Les marqueurs moléculaires
Intérêt en cartographie :
suivi de la transmission de segments chromosomiques au sein du pedigree
Les 4 qualités nécessaires des marqueurs
Polymorphisme : suivi des évènements de recombinaisons au fil des générations
Homogénéité dans la répartition génomique
Neutralité (pas de biais de ségrégation)
Tous les génotypes peuvent être identifiables (homozygotes et hétérozygotes)
Types de marqueurs :
VNTR: Mini et microsatellites
Mutations ponctuelles: SNP (Single Nucleotide Polymorphism)
10/10/2008
Les marqueurs moléculaires
Exemple de microsatellite…
CCACCTCTCCCCCTA(CA)25GGTTGAAACGCACCAG
Exemple de SNP…
Ind 1
Ind 2
10/10/2008
..GAATCTTATGCTATACATAATTATATACTAATCGGGTATTGTTCTTAT..
..CTTAGAATACGATATGTATTAATATATGATTAGCCCATAACAAGAATA..
..GAATCTTATGCTATACATAATTATATACTAATAGGGTATTGTTCTTAT..
..CTTAGAATACGATATGTATTAATATATGATTATCCCATAACAAGAATA..
SNP
Cartographie génétique
• Programmes développés par l’INRA
Programmes internationaux
PIGMAP
BOVMAP
SALMAP
10/10/2008
Cartographie génomique
• Cartographie génétique
– Loci polymorphes et familles de référence
• Cartographie physique chromosomique
– Hybridation In Situ
– Hybrides d’irradiation
– Cartographie comparée
• Cartographie physique moléculaire
– Contig du génome
– Séquence complète de l ’ADN
10/10/2008
FISH
BTA7
BTA10
BTA20
Cartographie génomique
Cartographie comparée
• Objectifs
–
Tirer profit des programmes génomes, en particulier humain et murin
–
La séquence du génome humain est disponible depuis avril 2003 (+ souris et le rat)
–
Construire des passerelles entre les génomes humain, murin et les génomes de nos
espèces domestiques permettant l’extrapolation de données
• Développement de cartes comparées haute densité
–
Facilité pour la cartographie de gènes : développement de cartes comparées
–
Ancrage des cartes génétiques sur la carte comparée
10/10/2008
15
.6
43
(13.9 Mb)
NUCB2
MYOD1
LDHA
500
BDNF
30
(19.9 Mb)
45
S4’
KCNA4
FSHB
PAX6
RCN1
CAT
CD44
750
EXT2
KAI1
F2
CHST1
AHNAK
(2.1 Mb)
75
S3
(5.6 Mb)
90
SSRP1
SERPING1
LPXN
GLYAT
CD5
FEN1
ROM1
COX8
PLCB3
SIPA1
CTSF
GSTP1
GAL
KRN1
NUMA1
PDE2A
KIAA0769
PHRET1
UCP3
UCP2
ARRB1
MYO7A
1000
3
21.
λ=
60
1250
λ=35.0
1500
TYR
S1
120
(23.7 Mb)
135
143.4
FDX1
PPP2R1B
IL18
SDHD
NCAM1
DRD2
APOA1
APOC3
PAFAH1B2
CD3D
CD3G
ORP150
SOLR1
CRTAM
HSPA8
KCNJ1
λ =2
9. 2
105
MMP1
MMP3
10/10/2008
7
38.
λ=
Human chromosome 11
S4
MGTG13B
250
1750
2000
2128
BR3510
BMS2533
DIK102
BMS1004
FDX1
T441F4 (PPP2R1B)
SP441F4
BB712 (IL18)
SDHD
NCAM1MS (ADCY2MS)
DRD2
INRA224
APOA1
APOC3
IDVGA60
PAFAH1B2
ORP150
CD3G
CD3D
EST1471
JAB8
JAB1
SORL1
HSPA8
CRTAM
BMS1782
HEL1
BB1539 (MYOD1)
NUCB2
INRA50
NOR04
EST1456
PTH
ABS011
BMS2684
ADM
SMPD1
APBB1
DIK36
HBBMS
RRM1
TRPC2
NUMA1
PDE2A
INRA46
KIAA0769
PHRET1
UCP3
UCP2
IDVGA28
IDVGA32
ARRB1
IDVGA10
MYO7A
BY1520 (BDNF)
BMS2812
FSHBMS
FSHB
X570335(KCNA4)
ILSTS61
T935F11 (PAX6)
SP935F11 (PAX6)
RCN1
CD44
T608B5 (CAT)
SP608B5 (CAT)
ILSTS27
BMS812
TGLA75
BMS540
BM4439
RM4
BMS2076
IOBT395
BL1095
IDVGA23
BM686
BM848
KAI1
BMS820
EXT2
F2
CHST1
SSRP1
SERPING1
GLYAT
LPXN
EST1093
BMS429
S1
(810 cR3000)
S2
(319 cR3000)
S3
(160 cR3000)
S4
(514 cR3000)
S4’
(98.7 cR3000)
Bovine chromosome 15
S2
Gautier & al.
2002
MMP1
MMP3
λ=
NAP1L4
RRM1
IGF2
SMPD1
APBB1
HBB
ADM
PTH
Cartographie génomique
• Cartographie génétique
– Loci polymorphes et familles de référence
• Cartographie physique chromosomique
– Hybrides somatiques
– Hybridation In Situ
– Hybrides d’irradiation
• Cartographie physique moléculaire
– Contig du génome
– Séquence complète de l ’ADN
10/10/2008
Construction de banques génomiques
Principes généraux
Digestion du génome en fragments de petite taille
Clonage des fragments (intégration dans un génome bactérien
hôte): Banques de BACs
Intérêts
Facilité de manipulation car obtention d’ADN en grande quantité
de la région clonée
Préalable à la cartographie physique d’une région : reconstituer
le puzzle en recouvrant la région avec des clones chevauchants =
CONTIG
10/10/2008
Essentiel pour les études génétiques : recherche de
polymorphismes, séquençage,
Le séquençage des génomes
Whole genome shotgun
1
2a
Fragment d'ADN à séquencer (matrice)
Copies
incomplètes
partant d'un
point fixe
Fragmentation
Sens de la copie -->
3
2b
Clonage des fragments d’ADN
(5, 50 et 150 kb)
Sens de la migration
électrophorétique
ADN purifié
4
Détection du signal de
fluorescence à la sortie
du séquenceur
Méthode
de Sanger
Séquence reconstituée
10/10/2008
D’après Dujon
Le séquençage des génomes (suite)
5
assemblage
contig 1
Type de séquence
Exploratoire
Ebauche (draft)
Finale
10/10/2008
D’après Dujon
contig 2
contig 3
Nombre de contigs (G/L)
contig
0.8
0.6
0.4
0.2
3X: exploratoire
6X: ébauche
12X: qualité
"finale"
0
0 2 4 6 8 10 12
Nombre de séquences (c = NL/G)
Caractéristiques
Utilisation
Très nombreux contigs, petite taille
Nombreux contigs, taille variable
Peu de contigs, grands
Variations polymorphiques, biodiversité
Premières analyses globales
Analyse génomique fonctionnelle
Le séquençage des génomes (fin)
6
Finition (supercontigs)
Ossature de supercontigs (scaffolds)
7
Finition (remplissage des trous et zones de basse qualité
vérification des assemblages, examen des séquences répétées, … )
Séquence finie, complète et de haute qualité
8
Annotation: ensemble de procédures informatiques qui:
1- prédisent (± efficacement) les limites des gènes, des éléments
de contrôle et de tout autre élément du génome
2- suggèrent les fonctions des gènes à partir des
comparaisons avec ce qui est déjà connu
10/10/2008
D’après Dujon
Le séquençage complet du génome bovin
•
Consortium international pour la construction d’une carte physique du génome
bovin
–
–
Production de profils de restriction
•
340 000 BAC (Genome Sequencing Center, Canada)
•
100 000 BAC (INRA, LGbC)
Séquençage d’extrémités de BAC (Nb de séquences)
•
312 000 BES (USA, Brésil, N. Zélande, Australie)
•
53 560 BES (INRA-Génoscope)
•
Séquençage du génome bovin financé (50 M $) par le NIH, l’USDA, le
Texas, le Canada, les Pays Bas
•
Whole Genome Shot Gun Sequencing
–
Couverture 7X sur un individu
–
Couverture 1X à partir de plusieurs individus de différentes races : production de
marqueurs
•
Actuellement (09/2007) un assemblage 7X est disponible
•
La séquence du génome représente l’aboutissement de tous les efforts de cartographie
10/10/2008
Le séquençage complet du génome porcin
Consortium pour le séquençage du porc
Etats-Unis, Chine, Japon, Corée, Royaume-Uni, France (INRA),
Danemark, Allemagne
•Séquençage 2-3 x de BAC (MTP)
•Séquencage « whole genome shotgun » de 3-5 x
(1 x déjà fait Chine - Danemark)
10/10/2008
Genomes animaux domestiques séquencés
(2008)
Cow
Bos taurus
Mammal
Draft Assembly
(7x)
BCMHGSC
Cat
Felis catus
Mammal
Draft Assembly
WUGSC
Completed
Chicken
Gallus gallus
Non-Mammalian
Vertebrate
Draft Assembly
(6,6x)
WUGSC
Completed
Dog
Canis familiaris
Mammal
Draft Assembly
BI/MIT
Completed
Horse
Equus caballas
Mammal
Draft Assembly
(7x)
BI/MIT
Completed
Pig
Sus scrofa
Mammal
Draft Assembly
(BAC to BAC)
Sanger
In Process
Rabbit
Oryctolagus
cuniculus
Mammal
Low Coverage WGS
(~2X)
BI/MIT
Completed
Sheep
Ovis aries
Mammal
Draft Assembly
BCMHGSC
In progress
Completed
D’après A.Eggen
- L'ensemble des données est dans le domaine public
- ”Genome Browsers” online:
ENSEMBL: http://www.ensembl.org
10/10/2008
UCSC: http://genome.ucsc.edu/
La séquence du génome : Intérêts
• Pour les efforts d’identification de gènes d’intérêt
– Un nombre quasi illimités de marqueurs (microsatellites, SNP…)
– Des passerelles immédiates avec les autres génomes séquencés
– Identification des séquences codantes, des séquences régulatrices
• De manière plus générale
– Implication pour la compréhension de la dynamique de l’évolution
chez les mammifères (ex.: mise en évidence de régions conservées)
10/10/2008
Le séquençage haut débit
2001
2008
10/10/2008
Plusieurs séquenceurs haut-débit
Illumina
Genome Analyzer
Roche NimbleGen
454 FLX system
Applied
Biosystems
SOLiD Analyzer
Amount of DNA
100 ng-1µg
?
5-10 µg
Volume of
sequence
1,5 Gb
(3 Gb)
0,1 Gb
1-1,5 Gb
(1,5-2 Gb)
Size
36 pb
(50 -70 bp)
200-300 pb
(400 pb)
35 pb
(2 x 25 pb)
de novo
Sequencing
NO
YES
NO
Resequencing
YES
YES
YES
Expression
studies
YES
YES
YES
D’après A.Eggen
Coût <1000 $ pour un génome de la taille du génome humain
10/10/2008
La détection de SNPs:
valeur ajoutée du séquençage du génome
• Séquence référence (couverture 6-12x)
• Plusieurs animaux appartenant à des races différentes
• Alignement des séquences pour identifier plusieurs millers de
SNPs
• Validation des SNPs sur un nombre restreint d‘animaux de races
différentes
• Construction d‘une puce de SNPs pan-génomique (International
Consortium)
10/10/2008
Digestion “in silico”
In silico estimates
135
92
70
10/10/2008
Van Tassel et al., 2008
Nature Methods 5, 247-252
L’identification des SNPs
GGCCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGGCC
HaeIII
Reference sequence
HaeIII
CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG
CCACGTAATCCGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG
Holstein
CCACGTAATCGGCACCTTAGGATCTGC
CCACGTAATCGGCACCTTAGGATCTGC
CCACGTAATCCGCACCTTAGGATCTGCaaacct….cactggATGAGGGCTCAATTGGCCATCATCGG
CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG
CCACGTAATCCGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG
Angus
CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG
CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAGGGCTCAATTGGCCATCATCGG
CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG
BEEF
CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG
CCACGTAATCCGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG
10/10/2008
L’identification des SNPs bovins
• Analyse de 49 millions de lectures
– 5 022 143 tags uniques
• 62 042 SNPs putatifs identifiés avec une haute stringence
• 1 SNP / 1780 bp
• 25 125 SNPs validés et intégrés à la puce bovine: «Bovine
SNP50 genotyping BeadChip» (ILLUMINA) contenant plus
de 54 000 SNPs
10/10/2008
Van Tassel et al., 2008
Nature Methods 5, 247-252
La génomique
structurale
1. La cartographie des génomes
animaux
2. Application: l’amélioration
génétique des animaux
10/10/2008
L’amélioration génétique des animaux
Etude de caractères ayant un contrôle génétique simple
déterminisme mendélien
Phénotype qualitatif
Monogénique
Etude de caractères ayant un contrôle génétique complexe
Phénotype qualitatif
Phénotype quantitatif
=>Cartographie de QTLs (Quantitative Trait Locus)
- Gènes majeurs
- Autres
=> stratégie: clonage positionnel
Sélection assistée par marqueurs (SAM)
10/10/2008
Détection de gènes majeurs
• Porcs
gène RN
• Bovins
gène sans corne,
anomalie Mulefoot
• Ovins
OAR : gène Boroola
• Caprins
CHI : gène PIS
• Lapins
10/10/2008
OCU : gène Rex
Stratégies d’identification de gènes
d’intérêt
Du caractère
à la fonction
Clonage
positionnel
Gènes/
Allèles
Phénotype
•
•
•
10/10/2008
Génomique
comparative
Carte physique
Séquençage
des génomes
Le clonage positionnel
Conditions: Disposer de marqueurs génétiques (Microsatellites, SNP)
Disposer de familles informatives
Primolocalisation
Genome Scan
Etapes
Analyses de liaison
A
*
B
C
*
D
10/10/2008
Nouveaux polymorphismes
(microsatellites, SNPs)
Identification de gènes candidats
Typages additionnels
Analyses d’association
Méthodes statistiques fines (DL)
Méthodes moléculaires (analyse
A
d’expression, transgénèse…)
B
AT
GC
AT
CG
TA
CG
Carte comparée
Carte physique
*
*
Résolution
Physique
Validation du
›
› Localisation Fine › Caractérisation
de la région
polymorphisme causal
20-50 cM
(20 - 50 Mb)
C
D
5-10 cM
(5 - 10 Mb)
BACs
150 kb
Rappels
analyses de liaison et analyses d’association
Analyses de liaison
Familles
Analyses d’association
Populations
Cas/contrôles
Caractères: Qualitatifs
Simple
Complexe
Intervalles: 10-20cM
Caractères: Qualitatifs
Quantitatif
Contrôle génétique: Simple
Complexe
Familles
Intervalles: 2-5cM
Caractères: Qualitatifs
Quantitatifs
Contrôle génétique: Simple
Complexe
10/10/2008
Courtin
et al, Infect Genet Evol. 2008 8(3):229-38.
La génomique
structurale
1. La cartographie des génomes
animaux
2. Application: l’amélioration
génétique des animaux
a)
Identification de
gènes majeurs
Exemple 1: clonage positionnel de la
mutation RN- chez le porc
10/10/2008
Clonage positionnel chez le porc
La mutation RNClonage positionnel d'un gène influençant
la qualité de la viande (rendement
technologique du jambon cuit, tendreté &
jutosité)
Identification d’un gène régulant la
quantité de glycogène musculaire, et
donc le pH post-mortem de la viande
10/10/2008
La mutation RN• Phénotype RN-: chez les porcs Hampshire
• Mutation dominante
• Effet:
• favorable: croissance
• défavorable: taux de glycogène élevé dans les muscles
squelettiques
Effet négatif sur la qualité de la viande et la
transformation (pH)
Pertes économiques importantes
10/10/2008
• Objectif:
Localisation de la mutation RN• Mutation détectée par analyse de liaison (1000 méioses informatives)
• Première analyse de liaison: localisation sur le chromosome 15 =>
région de 2,5Mb
• Construction d’un contig de BAC de 2,5Mb
– But: identifier de nouveaux marqueurs microsatellites et de
nouveaux marqueurs SNP
• Nouvelles analyses de liaison
10/10/2008
Localisation de la mutation RN-
Carte génétique
Carte RH
Contig de BAC
•Nouvelles analyses de liaison:
exclusion de la région proximale
de SLC11A1 et de la région distale SNP S1010
10/10/2008
Localisation de la mutation RN-
10/10/2008
Localisation de la mutation RN• Cartographie comparée:
homme (2q), souris (chr1) =>pas de gènes candidats évidents
• Analyse de déséquilibre de liaison:
association complète entre les allèles des marqueurs S1006,
S1007 (BAC 127G6) et RNDL sur 91 porcs Hampshire
10/10/2008
Localisation de la mutation RN-
Carte génétique
Carte RH
Contig de BAC
10/10/2008
Localisation de la mutation RN• Séquençage shotgun du BAC 127G6
(1000 individus)
3 séquences codantes
-KIAA173
-CYP27A1
-3e gènes
• KIAA173 et CYP27A1 ne sont pas des gènes candidats
• 3e gène: similarité avec la sous-unité γ de l’AMP activated protein
kinase
• Rôle des AMPK: Rôle clef dans la régulation du métabolisme
énergétique de la cellule eucaryote
Augmentation du ratio AMP/ATP => activation AMPK
=>production ATP et inhibition de la consommation d’ATP
=>inactivation de la glycogen synthase (Enzyme régulant la synthèse du
glycogène).
Bon candidat positionnel et fonctionnel
10/10/2008
Localisation de la mutation RN- dans le
gène PKARG3
• Détermination de la séquence du gène par RT-PCR et
amplification rapide des extrémités de cDNA
Chez le porc (RN+/RN+) et chez l’homme
=> gène différent des autres isoformes et orthologue du gène humain
(BLAST)
=> PRKAG3
• Expression (Northern blot)=> uniquement dans le muscle
• Comparaison de la séquence de PRKAG3 d’individus RN-/RN- et
individus RN+/RN+
=> Différence de 7 nucléotides dont 4 substitutions non synonymes
10/10/2008
Localisation de la mutation RN- dans le
gène PKARG3
Analyse d’association des mutations avec le phénotype RN•Animaux: Hampshire
+ autres PC (15 races)
•Phénotype: mesure du taux de glycogène des muscles squelettiques
•Génotype: mutation R200Q du gène PRKAG3
10/10/2008
Caractérisation fonctionnelle de la
mutation RN•Mesure de l’activité de l’AMPK dans des extraits musculaires:
l’activité est 3 fois supérieure chez les porcs RN+ que chez les porcs
RN- (en présence et en absence d’AMP)
•La mutation semble inhiber l’activation de l’AMPK et la
dégradation du glycogène
10/10/2008
La génomique
structurale
1. La cartographie des génomes
animaux
2. Application: l’amélioration
génétique des animaux
a)
Identification de
gènes majeurs
Exemple 2: chez le mouton
Les brebis callipyges
10/10/2008
La Mutation CALLIPYGE chez le mouton
•Initialement observée au
début des années 80
•Augmentation de la
proportion et du diamètre
des fibres musculaires de
type rapide
•Convoitée initialement
mais tendreté moindre de
la viande
Cockett et al. (Science, 1996)
Charlier et al. (Nature Genetics, 2001)
Freking et al. (Genome Research, 2002)
10/10/2008
Un mode de transmission original
• Observé pour la première fois: ~15% de descendants d’un bélier
(Solid Gold) atteints
• Après croisement 50% de descendants issus d’un mâle callipyge
(CLPG) atteints
• Mais…
– 0% des descendants issus d’une femelle CLPG atteints
– 25% des descendants d’un croisement Femelle CLPG x Mâle CLPG (au lieu de
50% sous l’hypothèse de l’implication d’un gène soumis à une empreinte
paternelle)
10/10/2008
La surdominance polaire…
CLPG: allèle muté
clpg: allèle non muté
clpgPAT
CLPGMAT
CLPGPAT
clpgMAT
CLPGPAT
CLPGMAT
Mode de transmission non mendélien.
Seuls les hétérozygotes ayant hérité la mutation de leur père expriment
10/10/2008
le phénotype…
Le locus impliqué…
Etudes de liaison=>400kb sur OAR18=>200Kb
(orthologue du domaine à empreinte situé sur HSA14, MMU12)
Gènes codant pour des protéines à
expression paternelle
ARN non codants à expression
maternelle
10/10/2008
Expression des gènes selon le génotype de
la mutation
DLK1:
- Gène à expression
paternelle
- Effecteur de
l’hypertrophie
musculaire
10/10/2008
Profil d’expression unique dans le génotype affecté
Pas de perturbations de l’empreinte parentale.
Mutation active la transcription des gènes en cis
Découverte de la mutation
184 kb
Substitution
A to G
10/10/2008
Recherche de la mutation causale
Solid Gold
animal fondateur
Recherche d’un fragment
IBD
10/10/2008
Effet de la mutation
GGACCACCTGTC clpg
GGGCCACCTGTC CLPG
Mutation régulatrice de 4 gènes « éparpillés » sur 200 kb
(LCR)
Facteur inhibiteur qui ne se fixe plus
10/10/2008
L’empreinte génétique : rappels
• Forme de régulation génique dépendante de l’origine parentale
=>expression monoallélique de certains gènes nucléaires
– Décrite dans plusieurs espèces de mammifères placentaires
– Soit la copie de l’allèle paternel (ex IGF2R) soit la copie de l’allèle
maternel (ex IGF2) est transcriptionnellement active
– Nb= environ 80 . Les gènes soumis à empreinte sont organisés en
grappe + ICE = élément régulateur commun
– Région contenant systématiquement des ARN non codants
– En général conservés entre espèces
• Variation des empreintes au cours du développement
10/10/2008
Effacement et établissement des empreintes
génétiques au cours du développement
Exemple souris
13e jour du devt
embryonnaire
10/10/2008
L’empreinte et la théorie du conflit…
• Paradoxe
– L’expression mono-allélique augmente la vulnérabilité aux mutations
délétères
• La théorie du conflit (Wilkins et Haig, Nature Review Genetics, 2003)
– Intérêts génétiques parfois conflictuels entre la mère et le père
chez les espèces polygames (majorité des mammifères). Pour
augmenter la propagation de ses gènes
• Le mâle transmet à sa descendance des gènes qui vont favoriser la croissance fœtale
(au détriment de l’avenir reproductif de la mère)
• La femelle transmet à sa descendance des gènes qui vont favoriser une économie de
ressources et une augmentation du nombre de portée.
– La plupart des gènes soumis à empreinte interviennent dans des
mécanismes de transfert de ressources maternelles à la descendance
(favorisés par les gènes à expression paternelle, inhibés par ceux à expression
maternelle)
10/10/2008
La génomique
structurale
1. La cartographie des génomes
animaux
2. Application: l’amélioration
génétique des animaux
a)
Identification de
gènes majeurs
b) Cartographie de
QTLs
Exemple 1: chez les bovins
10/10/2008
La primolocalisation :
Dispositif animal (exemple français chez les bovins laitiers)
Prim'Holstein
Primolocalisation
Etapes
Normande
Montbéliarde
Genome Scan
A
*
*
*
*
Résolution
Utilisation
en sélection
10/10/2008
B
….
….
C
….
….
….
….
D
20-50 cM
(20 - 50 Mb)
26 familles de demi-frères Prim’Holstein: 2138 fils
9 familles Normandes: 548 fils
6 familles Montbéliardes: 370 fils
Pourquoi un tel dispositif « petite-fille » ?
Le
dispositif existe déjà (coût réduit au seul génotypage)
•Les taureaux d ’IA sont les descendants d’un nombre limité de pères
•Les taureaux sont évalués en routine par testage sur descendance
Le
phénotype des fils est similaire à la moyenne des D
performances (petite-filles)
•Haute précision dans l’évaluation (variance résiduelle réduite)
•Puissance de détection augmentée pour un nombre donné de
génotypes
Détection
10/10/2008
de QTL ségrégeant dans les populations exploitées
Cartographie de QTLs chez les bovins
laitiers
• 6 QTL sur 3 chromosomes
– Caractères de production
• Quantité de matière protéique (BTA7 & BTA26)
• Quantité de matière grasse (BTA26)
– Caractères fonctionnels
• Numération cellulaire (BTA15)
• Fertilité femelle (BTA7)
– Caractères morphologiques
• Epaisseur du talon (BTA15)
10/10/2008
La génomique
structurale
1. La cartographie des génomes
animaux
2. Application: l’amélioration
génétique des animaux
a)
Identification de
gènes majeurs
b) Cartographie de
QTL
Exemple 2: chez les porcs
10/10/2008
Détection de QTLs chez le porc
• Caractères de production
Croissance
Epaisseur lard dorsal
Quantité de lipides intramusculaires
…
• Santé et résistance aux maladies
Caractères immunologiques (en cours)
Infection par le PrV
Développement et régression des mélanomes cutanés
10/10/2008
QTL “muscle et epaisseur de gras” chez le porc
LWxPietrain (1032 F2)
Performance de croissance
supérieure
Musculature exceptionnelle
peu de gras
21 phénotypes mesurant les performances de croissance, les proportions
corporelles, la musculature, le dépôt de graisse, la qualité de la viande
Objectif:
Localiser des QTLs responsables des différences génétiques entre les deux
races
Nezer et al., 1999, Nature Genetics 21 : 155-156.
Van Laere et al., 2003, Nature 425 : 832-836.
10/10/2008
QTL sur chromosome 2 soumis à l’empreinte
parentale : seul l’allèle paternel a un effet
HSA11p : IGF2
MYOD1
Log10(H1/H0)
Log10(H2/H0)
H2: QTL
soumis à
empreinte
paternelle
Log10(H3/H0)
H3: QTL
soumis à
empreinte
maternelle
10/10/2008
Gène IGF2 : structure et expression
Expression de l’allèle paternel uniquement
10 gènes soumis à l’empreinte dans cette région chez l’homme et la souris.
Seuls IGF2 et INS2 sont paternellement exprimés.
10/10/2008
Découverte de la mutation causale
Substitution dans une région non-codante (intron 3)
10/10/2008
10/10/2008
Effet de la mutation
Substitution A/G
•Empêche la fixation d’un facteur inhibiteur de l’expression d’IGF2
dans le muscle squelettique et le muscle cardiaque,et uniquement
après la naissance.
•Ne perturbe pas l’empreinte parentale
•Augmente la masse musculaire de 3 à 4 %
10/10/2008
La génomique
structurale
1. La cartographie des génomes
animaux
2. Application: l’amélioration
génétique des animaux
a)
Identification de
gènes majeurs
b) Cartographie de
QTLs
Exemple 3: chez le mouton
10/10/2008
Le dogme central et les ARN non codants
ARN Non Codants :
- miRNA
- siRNA
10/10/2008
Les micro-ARN : quelques éléments
• Ce sont des ARNs non codants (20-23 nt)
– Décrits pour la première fois chez C.elegans : Lee et al. (Cell, 1992)
– Interviennent dans la régulation post-transcriptionnelle de gènes cibles
(plantes et animaux)
– Impliqués dans une multitude de fonctions biologiques (développement,
prolifération cellulaire, apoptose, réponse au stress, tumorigénèse)
– Hautement conservés entre espèces
10/10/2008
Biosynthèse, structure et action
70-80 nt
Riboonucleoprotein
complex
22 nt
Pre-miRNA
Wienholds and Plasterk, FEBS Letters, 2005
10/10/2008
Abondance des miRNAs
– 1-5% des gènes prédits (analyse de la séquence des génomes).
• 1 000 chez l’homme
• 250 chez C. elegans
– > 1/3 de l’ensemble des gènes ont des miRNA-binding
sequences.
– Cela suggère que les miRNA sont impliqués dans de
nombreuses fonctions cellulaires.
– Octobre 2008 : 8619 miRNA
Base de données http://microrna.sanger.ac.uk/
10/10/2008
Exemple de cartographie de QTL
chez le mouton
Juillet 2006
10/10/2008
Introduction…
• Mouton Texel
–
race à viande, hypertrophie musculaire.
• Programme de recherche de QTL
–
10/10/2008
Romanov X Texel, F2, 258 petits
•
37 mesures : muscle, dépôt graisse, composition…
•
153 marqueurs pour le criblage total du génome
Identification d’un QTL avec un effet
majeur sur la musculature
– Localisé sur OAR02
h2=0,05-0,25
Explique 1/5 à 1/3 des
différences entre les 2
races
– Après cartographie fine :
région comprenant le
gène Myostatine (GDF8)…
10/10/2008
Myostatine : un gène candidat positionnel
et fonctionnel « évident »
• Superfamille des TGF-β :
– facteur de croissance et de différenciation.
• Perte de fonction
– augmentation de la musculature chez souris, bovin, humain.
mutant
WT
mutant
WT
Bleu belge
homozygote
mutation myostatine
10/10/2008
WT
mutant
Mais…
• Séquençage région codante du gène :
– 3 Texel F0
– 7 contrôles (5 Romanov F0, 1 Dorset, 1Tarasconnais)
• Aucun polymorphisme identifié…
10/10/2008
Les transcrits de GDF8 (myostatine)
• Northern blot
-Transcrit de taille
attendue chez
Texel / contrôle
Transcrit GDF8
- Même intensité
des bandes.
Ld : longissimus dorsi; St : semitendinosus
Tx : Texel; Rv : Romanov
• ARN provenant muscle Texel/contrôle
Amplification de l’ORF : RT-PCR, séquençage
ARN messager normal chez animaux Texel
– niveau séquence
10/10/2008
Recherche de SNPs : région non codante
3 Texel et 7 contrôles
– 20 SNPs dans 10,2 kb
– Aucun dans des éléments conservés
Génotypage de tous les SNPs
– 42 Texel et 90 contrôles (11 races, 4
Texel/Romanov)
– « monomorphisme virtuel des Texel»
– 18 SNPs éliminés : au moins 1 des 4 T/R
homozygotes
– SNP g-2449C-G éliminé :
• à 2,5kb en amont site d’initiation de la
transcription
•
1 Texel hétérozygote pour cet SNP et
homozygotes pour tous les autres SNPs
Un seul SNP candidat : g+6723G-A
10/10/2008
Étude du SNP g+6723G-A
• En 3’UTR
• Allèle A: crée un motif octamérique –
cible de microARN
–
–
–
–
–
Zhao et al., Nature, 2005
10/10/2008
décrit par Xie et al (Nature, 2005)
miR-1 (.1 et .2), miR-206, miR122a reconnaissent cette
cible
miR-1 : très exprimé dans muscle et coeur souris
Les gènes de ces 4 miARN retrouvés chez le mouton
Expression chez le mouton
Effet de la mutation
• Hypothèse : La mutation provoque un création d’un site cible
de miRNA
• Test de l’hypothèse : diminution de la myostatine circulante?
• Résultats
Immunoprécipitation : chez les
Texel, la bande est 3 fois moins
intense
myostatine
myostatine
T : texel; W : contrôle
La mutation entraîne une instabilité des transcrits
10/10/2008
Démonstration de l’effet de la mutation
•Construction :
•Gène de la Luciferase
•3’UTR mutant vs WT
WT
Mutant
Analyse de la luminescence
produite dans les clones
Réduction de 70% du signal
en présence de miRNA avec
un promoteur présentant la
mutation
10/10/2008
Conclusions de l’étude
•
Une mutation en 3’ du gène de la myostatine crée une cible pour au
moins 2 miRNA exprimé dans les muscles squelettiques.
•
Diminution de la quantité de Myostatine (limitant la croissance des
tissus musculaire) dans le muscle =>Hypertrophie musculaire
10/10/2008
Développement d’une base de donnée
Patrocles (http://www.patrocles.org)
Liaison SNPs/site cible miARN
– Chez l’homme
• 73 497 SNPs dans 3’UTR de 13 621 gènes
–
–
–
–
Crée ou détruit 1 octamer décrit par Xie, Nature, 2005
2 490 SNPs putatifs
crée un site
2 597 SNPs putatifs
détruit un site
Dont 483 affectent un octamère conservé entre 4 espèces mammifères
– Chez Souris
• 77 283 SNPs dans 3’UTR de 10 200 gènes
–
–
10/10/2008
1 183 SNPs putatifs
crée un site
1 321 SNPs putatifs
détruit un site
» Dont 234 conservés au cours de l’évolution
Base de données de QTLs chez les
animaux (http://www.animalgenome.org/QTLdb/)
10/10/2008
La génomique
structurale
1. La cartographie des génomes
animaux
2. Application: l’amélioration
génétique des animaux
c) La sélection
assistée par
marqueur (SAM)
10/10/2008
Amélioration génétique
• Exemple bovins/porcs
• Très efficace durant les dernières décennies
par exemple performances de croissance et efficacité alimentaire
• Méthodes classiques basées sur :
– Collecte d’informations de performances individuelles (paramètres
de production)
– Compilation des observations avec des informations généalogiques
– « Index de sélection » pour identifier les meilleurs candidats à la
sélection
10/10/2008
Quelques limites …
• Efficacité diminue si le :
– Phénotype difficile à mesurer
– Caractère possède une faible héritabilité
• Se limitent aux caractères mesurables dans un grand
nombre d’animaux
• Nouveaux critères de sélection :
– Adéquation aux « produits finis »
– Qualité et acceptabilité pour les consommateurs
– Bien être animal, résistance aux maladies …
10/10/2008
La SAM
Primolocalisation
Etapes
Genome Scan
Physique
Validation du
›
› Localisation Fine › Caractérisation
de la région
polymorphisme causal
Nouveaux polymorphismes
(microsatellites, SNPs)
Identification de gènes candidats
Typages additionnels
*
A
A
B
B
C
*
D
Utilisation
en sélection
10/10/2008
AT
GC
AT
CG
TA
CG
Carte comparée
Carte physique
*
*
Résolution
Méthodes statistiques fines (DL)
Méthodes moléculaires (analyse
d’expression, transgénèse…)
20-50 cM
(20 - 50 Mb)
C
D
5-10 cM
(5 - 10 Mb)
SAM1
BACs
150 kb
SAM2
SAM3
La SAM chez les bovins
10/10/2008
La SAM chez les bovins
•Les Marqueurs : bornes du génome
1
2
1
2
4
4
5
5
7
7
8
8
NOM : INRA83
3
POS : chrm1 - 15
3
9
6
10/10/2008
6
9
La SAM chez les bovins
MELKIOR
10/10/2008
LEHOUX
La SAM
BELLWOOD
MELKIOR
10/10/2008
LEHOUX
La SAM
BELLWOOD
1er groupe des fils
de BELLWOOD
10/10/2008
2eme groupe des fils
de BELLWOOD
La SAM chez les bovins
Comparaison des performances
• Groupe de fils de BELLWOOD pour la MG
1er groupe des fils
de BELLWOOD
Moyenne = 29
2eme groupe des fils
de BELLWOOD
>
Moyenne = 13
Il est donc plus intéressant d’avoir reçu
10/10/2008
que
.
La SAM chez les bovins
•Informations marqueurs
BESNE
On peut avoir de
l’information pour
...
JOCKO
toutes les familles
typées
...
Fille de JOCKO
10/10/2008
La SAM
La SAM permet de lire la carte d’identité
d’animaux sans performance (candidats).
BESNE
...
BELLWOOD
JOCKO
...
...
MELKIOR
LEHOUX
Veau 1
10/10/2008
Veau 2
Fille de
JOCKO
Veau 3
Veau 4
La SAM chez les bovins
Chez les BV laitiers:
• Génotypage des jeunes taureaux et génisses laitiers
pour > 40 marqueurs pour 12 régions QTL
différentes soit 10.000 animaux typés / an.
10/10/2008
La SAM
Primolocalisation
Etapes
Genome Scan
Physique
Validation du
›
› Localisation Fine › Caractérisation
de la région
polymorphisme causal
Nouveaux polymorphismes
(microsatellites, SNPs)
Identification de gènes candidats
Typages additionnels
*
A
A
B
B
C
*
D
Utilisation
en sélection
10/10/2008
AT
GC
AT
CG
TA
CG
Carte comparée
Carte physique
*
*
Résolution
Méthodes statistiques fines (DL)
Méthodes moléculaires (analyse
d’expression, transgénèse…)
20-50 cM
(20 - 50 Mb)
C
D
5-10 cM
(5 - 10 Mb)
SAM1
BACs
150 kb
SAM2
SAM3
Sélection: perspectives
• SAM deuxième et troisième génération
• Introduction de paramètres immunologiques dans les schémas
de sélection
– Etude en cours chez le porc pour estimer la faisabilité et
déterminer les meilleurs paramètres (projet IMMOPIG)
– Suite: études QTL sur ces paramètres
sélection divergente
10/10/2008
La génomique
fonctionnelle
1. Transcriptome et protéome
2. Etude du transcriptome
a) Méthodes bas-débit
b) Méthodes haut-débit
c) Le séquençage du
transcriptome
d) Exemples d’études
du transcriptome à
l’aide des puces à
ADN
10/10/2008
La génomique
fonctionnelle
1. Transcriptome et protéome
2. Etude du transcriptome
a) Méthodes bas-débit
b) Méthodes haut-débit
c) Le séquençage du
transcriptome
d) Exemples d’études
du transcriptome à
l’aide des puces à
ADN
10/10/2008
Génomique structurale
Génome
nucléaire
Dégradation
Traduction
ARNm
Protéome
Transcriptome
Génomique fonctionnelle
10/10/2008
Génome, transcriptome et protéome
10/10/2008
Etude du protéome
Approches utilisées:
Après extraction de protéines
- Electrophorèse sur gel 2D:
Séparation des protéines et recherche des protéines par analyse
d’image
- Spectrométrie de masse
Identification de protéines à partir de leur empreinte peptidique
massique.
Ex: MS MALDI-TOF
-Protein arrays (intéractions
-Séquençage
10/10/2008
protéine-protéine)
Etude du transcriptome
• Etude d’un nombre limité de gènes
Western blot
PCR quantitative en temps reel (qRT-PCR)
• Techniques “haut-débit” :
• Nécessitant de connaître les sondes spécifiques de gènes:
puces à ADN
globales & différentielles
ADNc ou oligonucléotides
– Approche réseau dédié
(CREA exhaustif pour une région donnée, d’une fonction donnée)
– Approche pan-génomique
• Méthodes exhaustives: ne nécessitant pas de connaître les séquences ADN à étudier
– Banques d’hybridation soustractive (SSH)
– Serial Analysis for Gene Expression (SAGE)
10/10/2008
– Le séquençage du transcriptome
RT-PCR quantitative en temps réel:
Principes
Objectif : utiliser la pcr pour quantifier des transcrits (cDNA)
= quantifier N0
4,000
Exponential phase
3,500
3,000
Plateau
2,500
Latency phase
2,000
1,500
Screening step
5 cycles
maxi
Ct
N = N0 x (1+E)n
=2nN0
N = quantité d’ADN amplifié après n
cycles
N0 = quantité initiale d’ADN cible
E = efficacité de la PCR
1,000
0,500
0,000
0
2
10/10/2008
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44
RT-PCR quantitative en temps réel:
Vérification de l’efficacité de la pcr
Ct
N = N0 x (1+E)n
Log N = LogN0 + n Log(1+E)
α
Si n = Ct
LogN = LogN0 + Ct Log(1+E)
Ct = [LogN –LogN0] / Log (1+E)
Ct = -1/Log(1+E) x LogN0 + cte
Quantite (dilutions)
Log (ng)
Ct = a N0 + b avec a = -1/Log(1+E) = pente de la droite
100% d’efficacité => E = 1 et α = -1/Log(1+1) = -1/Log2 = - 3,32
10/10/2008
RT-PCR quantitative en temps réel:
Quantification relative
1)
Normalisation avec le gène de référence
∆ Ct = CTGcible – CT Gref
2) Quantification relative des données normalisées entre une condition et un
calibrateur
∆∆ Ct = (CTGcible – CT Gref)cond1 – (CTGcible – CT Gref) calibrator
Formule de quantification relative 2
–∆∆
∆∆Ct
∆∆
qRT-PCR utilisée pour confirmer les résultats obtenus à l’aide
des puces à ADN
10/10/2008
La génomique
fonctionnelle
1. Etude du protéome
2. Etude du transcriptome
a)
Techniques basdébit
b) Techniques hautdébit
c) Exemples d’études
du transcriptome à
l’aide des puces à
ADN
10/10/2008
Etude du transcriptome
• Etude d’un nombre limité de gènes
Western blot
PCR quantitative en temps reel (qRT-PCR)
• Techniques “haut-débit” :
• Nécessitant de connaître les sondes spécifiques de gènes:
puces à ADN
globales & différentielles
ADNc ou oligonucléotides
– Approche réseau dédié
(CREA exhaustif pour une région donnée, d’une fonction donnée)
– Approche pan-génomique
• Méthodes exhaustives: ne nécessitant pas de connaître les séquences ADN à étudier
– Serial Analysis for Gene Expression (SAGE)
– Le séquençage du transcriptome
10/10/2008
Quelques principes
Puces à ADN
Courtin et al, 2007
10/10/2008
Serial Analysis of Gene Expression
Analyse et validation des résultats
• Importance du traitement statistique des données
• Validation des résultats au niveau des transcrits (qRT-PCR) et au
niveau protéique (immunohistochimie, Cytométrie en flux…)
• Analyse bioinformatiques
-Gene Ontology (GO):(biological process, cellular component, molecular function)
ex: DAVID, PANTHER…
-Réseaux de gènes, voie biologiques et canoniques
Ex: INGENUITY
10/10/2008
Puces à ADN et réseaux dédiés:
approche région candidate
Objectif 1: Localiser finement un gène et une mutation responsable du contrôle d’un
phénotype
- Tous les BAC ou plasmides ou oligonucléotides (ciblant des régions codantes et non codantes) d’une région
chromosomique candidate (QTL) sont déposés sur membrane ou lame de verre
- Hybridation d’ARN sain/ ARN malade
- Identification des BACs, plasmides ou oligonucléotides qui présentent une expression différentielle
- Identification des gènes candidats
Objectif 2: étudier l’expression d’une région chromosomique contenant des gènes d’intérêts dans
plusieurs conditions
- Co-régulation des gènes
- cDNA ou oligonucléotides spécifiques de tous les gènes de la région
- Expression différentielle
Objectif 3: étude des régions codantes et non codantes d’une portion chromosomique
- Tiling array (oligonucléotides)
- Chip on chip:étude de la transcription
10/10/2008
Puces à ADN et réseaux pan-génomiques
Puce de gènes
•
« Maison » INRA-CRB (centre de ressources biologiques)
–
–
•
Membranes (cDNA)
Lames de verre
Truite, Porcs
(oligos)
Bovin, Porc, Poulet
« Commerciaux »
–
–
–
–
Set d’oligos commerciaux (Qiagen, Opéron)
Puces affymetrix
Puces Agilent
Puces Nimblgen
Tiling arrays
•
•
« Maison »
« Commerciaux » en développement pour les animaux de rente
CHip on chip
Objectif: détecter si une proteine donnée se fixe spécifiquement sur une séquence d’ADN
10/10/2008
Le séquençage du transcriptome
Exemple: séquenceur haut débit 454 Roche
10/10/2008
La génomique
fonctionnelle
1. Etude du protéome
2. Etude du transcriptome
a)
Techniques basdébit
b) Techniques hautdébit
c) Exemples d’études
du transcriptome à
l’aide des puces à
ADN
10/10/2008
EXEMPLE 1: Aide à la cartographie chez les bovins
2007
10/10/2008
Aide à la cartographie de QTLS
Arbilly et al, Animal Genetics, 2006
10/10/2008
EXEMPLE 1: Aide à la cartographie chez les bovins
•
Point de départ: Etudes QTL sur les caractères de production laitière
dans différentes race de bovins
Identification de plusieurs QTL contenant quelques centaines de gènes
Identification d’un QTN: mutation de DGAT1 le gène causal affectant
la quantité de matière grasse du lait sur BTA14
•
Objectif : étudier l’expression des gènes dans la glande mammaire de
souris à différents stades (puberté, gestation, lactation, involution) et
combiner ces données avec les résultats des études QTL chez les bovins
pour proposer des gènes candidats à tester.
•
Outil: Puce Affymetrix: 12488 sondes
Tissu: glande mammaire souris C57BL/6J
10/10/2008
EXEMPLE 1: Aide à la cartographie chez les bovins
• Analyse différentielle (ANOVA) et comparaison avec d’autres
études d’expression
249 sondes en commun correspondant à 212 gènes bovins
10/10/2008
EXEMPLE 1: Aide à la cartographie
chez les bovins
• 212 gènes différentiellement exprimés en fonction du stade
K-means-clustering
10/10/2008
EXEMPLE 1: Aide à la cartographie
chez les bovins
• Comparaison avec les données de cartographie
Pbl: beaucoup de gènes ont des fonctions inconnues
http://cowry.agri.huji.ac.il/QTLMAP/qtlmap.htm
clusters
BTA6
DGAT1 est surexprimé
Utilisation de la base de donnée cgQTL pour proposer des gènes candidats
10/10/2008
EXEMPLE 2: Réseau ciblant une fonction
Etude de l’infection par Mycobacterium bovis chez les bovins
Meade et al, 2007, BMC Genomics
•
Objectif : comparaison des niveaux de transcrits de PBMC
provenant de 6 bovins infectés par Mycobacterium bovis/ 6
bovins non infectés
•
Outil: Puce cDNA dédiée immunospécifique: 1391 gènes (spots)
Animaux infectés
•
Analyse PBMC
10/10/2008
Contrôles
EXEMPLE 2: Réseau ciblant une fonction
Etude de l’infection par Mycobacterium bovis chez les bovins
378 gènes diff exprimés (p=0.05) dont 244
réprimés chez les animaux infectés (65%)
Gènes RI innée TLR2, TLR4
Bola class I et Bola class II (DRA)
Confirmation par RT-PCR quantitative
Signature transcriptionnelle: les profils de
transcription permettent de classer les
animaux suivant leur statut (infecté/ non
infecté)
10/10/2008
EXEMPLE 3: Approche combinée région
candidate et pan-génomique
Etude de l’interaction cellule épithéliale porcine-virus de la Pseudorage
Flori et al, 2008, BMC Genomics
PrV
• pathogène bien connu du porc
• responsable de la Maladie d’Aujeszky ou Pseudorage
• alpha-herpesvirus
• genome ADN (140Kb, 70 gènes)
• sequence (Klupp et al, 2004)
• bon modèle expérimental pour étudier la biologie
des alpha-herpesvirus
propagation aisée dans les cellules de plusieurs espèces de
mammifères
inocuité pour le personnel de laboratoire
CELLULES EPITHELIALES PORCINES
• Réplication viral primaire
• Forte production virale
10/10/2008
Etude des intéractions cellule hôte –
pathogène: approches transcriptomiques
• Puces à ADN: outils efficaces pour analyser les interactions
cellule hôte-pathogène
Hossein H et al, 2006, Curr. Opin. Immunol.
• Etudes transcriptomiques:
- Analyse du transcriptome de la cellule OU du pathogène
-Peu d’études simulatanées des transcriptomes de la cellule et du pathogène
P.berghei ANKA et souris (brain)
Lovegrove FE et al, 2006, BMC Genomics
EBV et NK/T cells
Zhang YJH et al, 2005, Br. J. Cancer
Etudes transcriptomiques des intéraction PrV-cellule
- Analyse du transcriptome cellulaire
- Etudes cinétiques
- Modèles hétérologues REF
cells / rat chip
Ray and Enquist. 2004. J. Virol.
Brukman and Enquist. 2006. J. Virol.
HEK-293 cells / human chip Blanchard et al, 2006. Vet. Res.
10/10/2008
Objectifs
Analyser in vitro le dialogue entre les cellules épithéliales
porcines et le PrV
Etablir un lien temporel direct entre l’expression des gènes
viraux et cellulaires.
- Analyse simultanée des modifications du transcriptome viral et cellulaire
- Etude cinétique
- Système homologue (PrV/cellules porcines / puces porcines)
Suivre la mock-infection et l’infection par le PrV des cellules épithéliales porcines
PK15
Détecter les gènes viraux et cellulaires différentiellement exprimés durant
l’infection entre les cellules infectées (I) et mock-infected (MI) à différents
temps
10/10/2008
Outils et méthodes
• Microarrays
Microarray générique Qiagen-NRSP8
8541 gènes
Zhao et al, 2005, Genomics
=> oligonucleotides
Microarray dédié
construit au laboratoire
1.5 % gènes impliqués dans la
réponse immunitaire
SLA/PrV
(CRB-GADIE/LREG)
⇒ADNcs et exons sous-clonés
⇒GEO GPL5622
• PCR quantitative en temps réél
10/10/2008
1515 genes
Couverture ~ 72.5% de la région SLA
(Swine Leucocyte Antigen)
70 gènes du PrV
Schéma expérimental
Qiagen-NRSP8
SLA/Immuno/prV
T0
T2
T4
T8
T12 h pi
I
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
MI
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
R1
Cellules PK15
T1
I
R2
MI
R3
I = Infection par le PrV
MI = Mock-infection
PrV (souche NIA3)
Une lame
10/10/2008
R4
I
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
MI
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
I
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
MI
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Cy5
Cy3
Cy3
Cy5
Acquisition des données, normalisation et analyse statistique
1/ Acquisition des données
• Scan des lames Scanarray (LCE,CEA) and Virtek (PICT, INRA)
• Quantification Imagene software
• Stockage des données BASE (Sigenae)
2/ Normalisation
• Transformation Log2
• Locally weighted polynomial regression
=> Lowess (f=0.3)
M
M
M = Log2(Cy5/Cy3)
A
A
A = 0.5*Log2(Cy5*Cy3)
• Soustraction de la médiane de chaque bloc
M
M
3/ Selection des gènes différentiellement exprimés
Blocs
• Modèle linéaire
Ycfnds = µc + αf + βn + δd + Ecflje
• Comparaisons
Student t test
Blocs
Blocs
- MI vs I à chaque temps
=> 1 pvalue pour chaque gène
• Correction pour tests multiples : False Discovery Rate (FDR) =0,05
4/ Exploration des données
10/10/2008
• Hierarchical clustering : HCL et k-means (TmeV software)
Une image globale de la transcription du PrV
Toutes les
sondes
PrV
I
I
MI
T0
T1
T2
T4
T8
T12
MI
T0
T1
T2
K-means
T4
T8
T12
(n=3, euclidian distance, average
link)
UL49
GP50GD
EP02
UL38
UL362
ORF1
UL48
UL40
UL51
UL37
UL3
Cluster 1
UL46
UL54
LLTE21
ORF2NIA3
ICP18.5
UL30
LLTE1
IEP2
UL2
UL3.5
UL13
UL4
UL34
EP01
UL17
UL32
UL361
UL43
UL18
IL15EX12
UL8
UL20NIA3
UL191
UL10
ORF1NIA3
PKNIA3
UL21NIA3
GP63GI
Cluster 2
UL11
GII
TKNIA3
UL92
UL1
UL41
UL142
UL14
UL31
UL39
UL12
UL33
UL52
GIGE
UL8.5
IEP1
UL50
LLTI2
UL16
UL47
UL25NIA3
GIIINIA3
Ba5
UL42
UL24NIA3
LLTE222
UL26NIA3
11K2
28KNIA3
UL29
UL35
Cluster 3
UL49.5
RSP40
UL6
UL5
GXGG
UL7
GHNIA3
UL192
UL53
UL15EX2
10/10/2008
* Gènes
différentiellement
exprimés
Une image globale de la transcription du PrV et des PK15
UL9
UL28
UL36
US8
UL41
US3
PrV
80
PK15
US1
UL29
UL49.5
40
20
0
8
58
52
IE180
9
7
log (titer)
Nombre de gènes différentiellement exprimas
60
10
34
13
3
6
5
4
3
0
T0
T1
T2
T4
Tim e
T8
2
T12
1
0
0
4000
10
Courbe de croissance du PrV
3509
3500
3184
3000
shutoff
2500
2000
1494
1500
1262
1000
500
1
0
47
134
0
2
T0
T1
T2
0
27
0
10/10/2008
4
0
31
88
93
5
19
14
T4
T8
T12
SLA/PRV up-regulated
SLA/PrV down-regulated
NRSP8 up-regulated
NRSP8 down-regulated
PrV et shutoff cellulaire
• Augmentation du nombre de gènes différentiellement exprimés au
cours du temps à partir de 2h pi parallèlement au nombre de gènes
viraux.
• Beaucoup de gènes cellulaires sont réprimés. Cette down-régulatione
est détéctée à partir de 4h pi et augmente à 8 et 12h pi.
Pas de shutoff précoce
mais shutoff plus précoce dans les cellules porcines
que dans les autres cellules (8h pi)
• Le gène viral UL41 codant pour la virion host shutoff protein (vhs)
est détectée 8h pi
shutoff probablement induit par les protéines vhs
néosynthétisées
10/10/2008
L’infection par le PrV altère de multiples processus
biologiques et fonctions cellulaires
US3 8h pi
Drug
Metabolism
T1
Gene Expression
HIST1H2AL
HISTAH4J
HISTAH2BK
Gene Expression
Molecular
Transport
US3 8h pi
US1 1h pi
Cell
CycleBCl-2
FAIM2
Cell Caspase1
Caspase 3
Death
Caspase 7
NF-KB2
Cellular
Movment
HDAC2
HDAC10
HDAC3
HDAC6
Nucleic acid
HDAC7A
metabolism
HDAC9
Molecular
Transport
SLA-Ia
TAP1
Immune
TAP2
Response
Calnexine
Cellular
Assembly
F-actin
and
B-actin
Organization
Myosin
IRFs
TLR8
PPIA
T8
T2
US3 8h pi
Cell
signalling
DNA Replication
and Repair
Ingenuity Pathways analysis
Gene number/Top function
10/10/2008
T4
Up-regulated
Down-regulated
Résultats de qRT-PCR
Quantification relative
∆∆Ct
∆∆ -1
2-∆∆
TAP1
TAP2
PSMB9
PSMB8
Relative quantity
SLA Ia
Samples
Gène référence: RPL32
Calibrateur: MI T0
10/10/2008
Diminution de SLA Ia à la surface des PK15
Cytométrie en flux
10/10/2008
Stratégie du PrV pour se soustraire à la voie de présentation
antigénique du CMH de classe I
PK15
Diminution des niveaux de
transcrits
Diminution dans
de les cellules
infectées
l’expression des
molécules du CMH Cl I
SLA-Ia
à la surface des cellules
TAP1
Mellencamp et al, 1991,
TAP2
PSMB8 (LMP7)
PSMB9 (LMP2)
J. Virol.
Inhibition de l’activité
du transporteur TAP
Ambagala et al, 2000, J. Immunol.
/interaction avec la
PrV
protéine
gN codée par
le gène UL49.5
UL49.5 (gN)
UL41 (vhs)
Koppers-Lalic et al, 2005, PNAS
1h pi
8h pi
Rupert Abele, Robert Tampe´
FEBS Letters 580 (2006) 1156–1163
Le PrV developpe differentes strategies pour échapper à la voie de présentation
antigénique du CMH de classe I: -arrêter la pompe à peptides
-diminuer la transcription de molécules clefs
10/10/2008
Conclusions et perspectives
Conclusions
•
L’expression des gènes du PrV et des cellules porcines peut être analysée
conjointement avec des puces à ADN
•
Chronologie de la transcription des gènes du PrV jusqu’alors jamais décrite
•
Image globale de la transcription avec un lien temporel direct entre l’expression
des gènes viraux et cellulaires
•
Nouvelles données sur les stratégies virale d’échappement à la réponse immunitaire
(voie de présentation antigénique par les molécules de classe I du CMH)
Perspectives
•
Analyse des intéractions PrV-cellules porcines dans d’autres cellules cibles comme
les cellules dendritiques immatures
•
Etude de l’expression des gènes viraux et cellules en utilisant des virus mutants
10/10/2008
Bilan études du transcriptome chez le porc
Puces à ADN
Tuggle et al, Int.J.Biol.Sci., 2007, 3(3):132-152
• Muscle: 5 études
•Appareil reproducteur (utérus, ovaire, testis): 9 études
•Réponse immunitaire: 12 études
10/10/2008
La génomique
génétique
10/10/2008
La génomique génétique
(« Genetical Genomics »)
Intégrer des génotypes et des données d’expression
Objectif: identifier des régions du génome intervenant dans la
–
variabilité de l’expression des gènes
Principe: Etudier la quantité de transcrits produits pour beaucoup
–
(tous) de gènes comme autant de caractères quantitatifs
analyse de liaison et d’association
Article pionnier
Schadt et al, Nature, 2003,
422:297-302
10/10/2008
La génomique génétique
(« Genetical Genomics »)
Cartographie de QTL d’expression (eQTL)
2 types d’eQTL
Cis-acting eQTL: le gène codant pour le transcrit est situé dans l’intervalle de confiance de l’eQTL
Trans-acting eQTL: l’intervalle de localisation est situé dans une région distante du gène codant pour le
transcrit considéré
Cis et trans-régulation de
l’abondance des transcrits
10/10/2008
Drake et al, 2006, Mammalian Genome
La génomique génétique
10/10/2008
(« Genetical Genomics »)
La génomique génétique
Intérêts
Proposer et classer les gènes candidats
Définir des sous-types moléculaires à l’intérieur de la population
pour un phénotype donné
Identifier des voies métaboliques et cellulaires, impliquées dans
l’apparition du phénotype
Identifier des facteurs causaux impliqués dans une variation
phénotypique
10/10/2008
10/10/2008
CONCLUSION
• Les animaux de rente
– Possibilité de croisements dirigés
– Des espèces modèles pour des mécanismes parfois originaux
– Des mutations régulatrices importantes dans le contrôle des
variations phénotypiques
• La sélection
– L’information moléculaire acquise peut être valorisée (Sélection
assistée par marqueurs)
– Ajout de nouveaux paramètres immunologiques dans les critères
de sélection
– Utilisation des données d’expression
10/10/2008
Merci de votre
attention…
10/10/2008