génomes
Transcription
génomes
Génomique structurale et fonctionnelle chez les animaux de rente Laurence FLORI Génétique Animale et Biologie Intégrative INRA, Jouy-en-Josas 10/10/2008 Plan de l’exposé Introduction et définitions La génomique structurale 1. La cartographie des génomes animaux 2. L’amélioration génétique - Principes - Exemples de détections de QTLs - Sélection assistée par marqueurs (SAM) La génomique fonctionnelle 1. Transcriptome et protéome 2. Etude du transcriptome - Techniques bas et haut-débit - Vers le séquençage du transcriptome - Exemples d’étude du transcriptome La génomique génétique Conclusion 10/10/2008 Introduction et définitions 10/10/2008 Les animaux domestiques Une ressource pour comprendre les bases moléculaires de la variation phénotypique • L’élevage des animaux domestiques a abouti à une grande diversité intra-spécifique (races) • Comprendre la base génétique de la diversité phénotypique inter et intra-spécifique est un des enjeux majeurs de la biologie moderne. 10/10/2008 Les animaux de rente Une vingtaine d’espèces domestiquées il y a plus de 8000 ans (pour la plupart). Bos taurus Equus caballus Orytolagus cuniculus Volailles: Gallus gallus Capra hircus Mammifères: Sus scrofa Ovis aries Anas platyrhyncos Poissons: Onchoryncus mykiss 10/10/2008 Une vision formelle de l’élevage… • L’élevage des animaux de rente est basée sur « maîtrise de la génération animale » (Aristote) • Les trois éléments de la génération animale (Vissac, 2002) Contexte : pratiques d’élevage (nutrition) Contenant : techniques de reproduction (I.A.,OPU/FIV) Contenu : la génétique (Amélioration génétique) 10/10/2008 Quelques exemples de caractères d’intérêt zootechnique … • Mouton – Tremblante – Résistance aux salmonelles • Porc – Composition de la carcasse – Pathologie tumorale (Mélanome) • Lapin – Caractère Rex (pelage) • Chèvre – Débit de traite • Bovin – Caractères de production – Caractères fonctionnels • Fertilité des vaches laitières • Résistance aux mammites • Poulet – Résistance aux maladies – Modèle d’épilepsie • Cheval – Diverses pathologies • Espèces aquacoles – Caractéristique de la chair et des carcasses – Résistance aux maladies virales et bactériennes 10/10/2008 L’amélioration génétique basée sur la sélection sur indice • L’Amélioration Génétique s’appuie sur un choix rationalisé des candidats à la reproduction • Très efficace durant les dernières décennies – Explique de 1/2 à 2/3 de l’amélioration des performances en production laitière (x4 depuis 1950) • Les méthodes classiques sont basées sur : – Collecte d’informations de performances individuelles – Compilation des observations avec des informations généalogiques – Généalogie VS Performance ⇒ « Indice de sélection » pour chaque candidat à la reproduction – Diffusion du progrès génétique (I.A.) 10/10/2008 Amélioration génétique et génomique • Quelques limites de la sélection classique sur indice – Certains caractères sont difficiles à mesurer (résistance aux maladies) – Certains caractères ont une héritabilité faible (fertilité) – Certains caractères sont antagonistes (QL & fert) – Coût de l’évaluation des candidats à la reproduction (40k€/taureau d’IA) • Apport de la dissection moléculaire des caractères d’intérêt – Sélection directe des individus sur la base de leur génotype – Compréhension du déterminisme moléculaire et des mécanismes physiologiques 10/10/2008 Atouts/Limites des animaux de rente • Les Atouts : – Très bon suivis et beaucoup d’informations sur les populations exploitées (pour les besoins de la sélection) : • Information généalogique (Livres généalogiques) • Information phénotypique • Facilités pour l’obtention d’échantillons – Possibilité de réaliser des accouplements dirigés : croisement entre 2 races (variabilité génétique !) • Les Limites : des dispositifs expérimentaux optimaux impossibles (ou difficiles) à réaliser – Il n’existe pas de lignées pures (=! souris, rat) – Temps de génération souvent importants 10/10/2008 Le programme 10/10/2008 de l’INRA Génomique structurale Génome nucléaire Dégradation Traduction ARNm Protéome Transcriptome Génomique fonctionnelle 10/10/2008 La génomique structurale 10/10/2008 La génomique structurale 1. La cartographie des génomes animaux 2. Application: l’amélioration génétique des animaux 10/10/2008 La génomique structurale • C’est d’abord … avoir les outils pour baliser et étudier la structure du génome – Marqueurs génétiques (microsatellites et SNP) • Balises du génome et traceurs de l’information génétique – Cartes génomiques • « Charpente » et « articulation » du génome – Collections représentatives du génome (Banques de grands fragments d’ADN) • BAC (Bacterial Artificial Chromosome) • Intérêts – Connaissance fondamentale – Amélioration génétique 10/10/2008 Cartographie génomique • Cartographie génétique – Loci polymorphes et familles de référence • Cartographie physique chromosomique – Hybrides somatiques – Hybridation In Situ – Hybrides d’irradiation • Cartographie physique moléculaire – Contig du génome – Séquence complète de l ’ADN 10/10/2008 Cartographie génomique • Cartographie génétique – Loci polymorphes et familles de référence • Cartographie physique chromosomique – Hybrides somatiques – Hybridation In Situ – Hybrides d’irradiation • Cartographie physique moléculaire – Contig du génome – Séquence complète de l ’ADN 10/10/2008 Cartographie génétique • Objectif: mesurer la distance entre 2 marqueurs par recombinaison méiotique et déterminer l’ordre des marqueurs le long du chromosome • Principe: – Etude de la co-ségrégation des marqueurs au cours de la méiose – Estimation de leur ordre sur le chromosome – Calculer la distance génétique: d=F(R) d en cM (centimorgan), R=taux de recombinaison La mesure de la distance génétique est la fraction de recombinaison (cM) • Nécessite le développement de marqueurs génétiques et la collecte de familles • Deux approches générales – cartographie par marqueur-caractère : localiser des gènes d ’intérêt – cartographie par marqueur-marqueur : construire une charpente de cartes grâce à des marqueurs 10/10/2008 Les marqueurs moléculaires Intérêt en cartographie : suivi de la transmission de segments chromosomiques au sein du pedigree Les 4 qualités nécessaires des marqueurs Polymorphisme : suivi des évènements de recombinaisons au fil des générations Homogénéité dans la répartition génomique Neutralité (pas de biais de ségrégation) Tous les génotypes peuvent être identifiables (homozygotes et hétérozygotes) Types de marqueurs : VNTR: Mini et microsatellites Mutations ponctuelles: SNP (Single Nucleotide Polymorphism) 10/10/2008 Les marqueurs moléculaires Exemple de microsatellite… CCACCTCTCCCCCTA(CA)25GGTTGAAACGCACCAG Exemple de SNP… Ind 1 Ind 2 10/10/2008 ..GAATCTTATGCTATACATAATTATATACTAATCGGGTATTGTTCTTAT.. ..CTTAGAATACGATATGTATTAATATATGATTAGCCCATAACAAGAATA.. ..GAATCTTATGCTATACATAATTATATACTAATAGGGTATTGTTCTTAT.. ..CTTAGAATACGATATGTATTAATATATGATTATCCCATAACAAGAATA.. SNP Cartographie génétique • Programmes développés par l’INRA Programmes internationaux PIGMAP BOVMAP SALMAP 10/10/2008 Cartographie génomique • Cartographie génétique – Loci polymorphes et familles de référence • Cartographie physique chromosomique – Hybridation In Situ – Hybrides d’irradiation – Cartographie comparée • Cartographie physique moléculaire – Contig du génome – Séquence complète de l ’ADN 10/10/2008 FISH BTA7 BTA10 BTA20 Cartographie génomique Cartographie comparée • Objectifs – Tirer profit des programmes génomes, en particulier humain et murin – La séquence du génome humain est disponible depuis avril 2003 (+ souris et le rat) – Construire des passerelles entre les génomes humain, murin et les génomes de nos espèces domestiques permettant l’extrapolation de données • Développement de cartes comparées haute densité – Facilité pour la cartographie de gènes : développement de cartes comparées – Ancrage des cartes génétiques sur la carte comparée 10/10/2008 15 .6 43 (13.9 Mb) NUCB2 MYOD1 LDHA 500 BDNF 30 (19.9 Mb) 45 S4’ KCNA4 FSHB PAX6 RCN1 CAT CD44 750 EXT2 KAI1 F2 CHST1 AHNAK (2.1 Mb) 75 S3 (5.6 Mb) 90 SSRP1 SERPING1 LPXN GLYAT CD5 FEN1 ROM1 COX8 PLCB3 SIPA1 CTSF GSTP1 GAL KRN1 NUMA1 PDE2A KIAA0769 PHRET1 UCP3 UCP2 ARRB1 MYO7A 1000 3 21. λ= 60 1250 λ=35.0 1500 TYR S1 120 (23.7 Mb) 135 143.4 FDX1 PPP2R1B IL18 SDHD NCAM1 DRD2 APOA1 APOC3 PAFAH1B2 CD3D CD3G ORP150 SOLR1 CRTAM HSPA8 KCNJ1 λ =2 9. 2 105 MMP1 MMP3 10/10/2008 7 38. λ= Human chromosome 11 S4 MGTG13B 250 1750 2000 2128 BR3510 BMS2533 DIK102 BMS1004 FDX1 T441F4 (PPP2R1B) SP441F4 BB712 (IL18) SDHD NCAM1MS (ADCY2MS) DRD2 INRA224 APOA1 APOC3 IDVGA60 PAFAH1B2 ORP150 CD3G CD3D EST1471 JAB8 JAB1 SORL1 HSPA8 CRTAM BMS1782 HEL1 BB1539 (MYOD1) NUCB2 INRA50 NOR04 EST1456 PTH ABS011 BMS2684 ADM SMPD1 APBB1 DIK36 HBBMS RRM1 TRPC2 NUMA1 PDE2A INRA46 KIAA0769 PHRET1 UCP3 UCP2 IDVGA28 IDVGA32 ARRB1 IDVGA10 MYO7A BY1520 (BDNF) BMS2812 FSHBMS FSHB X570335(KCNA4) ILSTS61 T935F11 (PAX6) SP935F11 (PAX6) RCN1 CD44 T608B5 (CAT) SP608B5 (CAT) ILSTS27 BMS812 TGLA75 BMS540 BM4439 RM4 BMS2076 IOBT395 BL1095 IDVGA23 BM686 BM848 KAI1 BMS820 EXT2 F2 CHST1 SSRP1 SERPING1 GLYAT LPXN EST1093 BMS429 S1 (810 cR3000) S2 (319 cR3000) S3 (160 cR3000) S4 (514 cR3000) S4’ (98.7 cR3000) Bovine chromosome 15 S2 Gautier & al. 2002 MMP1 MMP3 λ= NAP1L4 RRM1 IGF2 SMPD1 APBB1 HBB ADM PTH Cartographie génomique • Cartographie génétique – Loci polymorphes et familles de référence • Cartographie physique chromosomique – Hybrides somatiques – Hybridation In Situ – Hybrides d’irradiation • Cartographie physique moléculaire – Contig du génome – Séquence complète de l ’ADN 10/10/2008 Construction de banques génomiques Principes généraux Digestion du génome en fragments de petite taille Clonage des fragments (intégration dans un génome bactérien hôte): Banques de BACs Intérêts Facilité de manipulation car obtention d’ADN en grande quantité de la région clonée Préalable à la cartographie physique d’une région : reconstituer le puzzle en recouvrant la région avec des clones chevauchants = CONTIG 10/10/2008 Essentiel pour les études génétiques : recherche de polymorphismes, séquençage, Le séquençage des génomes Whole genome shotgun 1 2a Fragment d'ADN à séquencer (matrice) Copies incomplètes partant d'un point fixe Fragmentation Sens de la copie --> 3 2b Clonage des fragments d’ADN (5, 50 et 150 kb) Sens de la migration électrophorétique ADN purifié 4 Détection du signal de fluorescence à la sortie du séquenceur Méthode de Sanger Séquence reconstituée 10/10/2008 D’après Dujon Le séquençage des génomes (suite) 5 assemblage contig 1 Type de séquence Exploratoire Ebauche (draft) Finale 10/10/2008 D’après Dujon contig 2 contig 3 Nombre de contigs (G/L) contig 0.8 0.6 0.4 0.2 3X: exploratoire 6X: ébauche 12X: qualité "finale" 0 0 2 4 6 8 10 12 Nombre de séquences (c = NL/G) Caractéristiques Utilisation Très nombreux contigs, petite taille Nombreux contigs, taille variable Peu de contigs, grands Variations polymorphiques, biodiversité Premières analyses globales Analyse génomique fonctionnelle Le séquençage des génomes (fin) 6 Finition (supercontigs) Ossature de supercontigs (scaffolds) 7 Finition (remplissage des trous et zones de basse qualité vérification des assemblages, examen des séquences répétées, … ) Séquence finie, complète et de haute qualité 8 Annotation: ensemble de procédures informatiques qui: 1- prédisent (± efficacement) les limites des gènes, des éléments de contrôle et de tout autre élément du génome 2- suggèrent les fonctions des gènes à partir des comparaisons avec ce qui est déjà connu 10/10/2008 D’après Dujon Le séquençage complet du génome bovin • Consortium international pour la construction d’une carte physique du génome bovin – – Production de profils de restriction • 340 000 BAC (Genome Sequencing Center, Canada) • 100 000 BAC (INRA, LGbC) Séquençage d’extrémités de BAC (Nb de séquences) • 312 000 BES (USA, Brésil, N. Zélande, Australie) • 53 560 BES (INRA-Génoscope) • Séquençage du génome bovin financé (50 M $) par le NIH, l’USDA, le Texas, le Canada, les Pays Bas • Whole Genome Shot Gun Sequencing – Couverture 7X sur un individu – Couverture 1X à partir de plusieurs individus de différentes races : production de marqueurs • Actuellement (09/2007) un assemblage 7X est disponible • La séquence du génome représente l’aboutissement de tous les efforts de cartographie 10/10/2008 Le séquençage complet du génome porcin Consortium pour le séquençage du porc Etats-Unis, Chine, Japon, Corée, Royaume-Uni, France (INRA), Danemark, Allemagne •Séquençage 2-3 x de BAC (MTP) •Séquencage « whole genome shotgun » de 3-5 x (1 x déjà fait Chine - Danemark) 10/10/2008 Genomes animaux domestiques séquencés (2008) Cow Bos taurus Mammal Draft Assembly (7x) BCMHGSC Cat Felis catus Mammal Draft Assembly WUGSC Completed Chicken Gallus gallus Non-Mammalian Vertebrate Draft Assembly (6,6x) WUGSC Completed Dog Canis familiaris Mammal Draft Assembly BI/MIT Completed Horse Equus caballas Mammal Draft Assembly (7x) BI/MIT Completed Pig Sus scrofa Mammal Draft Assembly (BAC to BAC) Sanger In Process Rabbit Oryctolagus cuniculus Mammal Low Coverage WGS (~2X) BI/MIT Completed Sheep Ovis aries Mammal Draft Assembly BCMHGSC In progress Completed D’après A.Eggen - L'ensemble des données est dans le domaine public - ”Genome Browsers” online: ENSEMBL: http://www.ensembl.org 10/10/2008 UCSC: http://genome.ucsc.edu/ La séquence du génome : Intérêts • Pour les efforts d’identification de gènes d’intérêt – Un nombre quasi illimités de marqueurs (microsatellites, SNP…) – Des passerelles immédiates avec les autres génomes séquencés – Identification des séquences codantes, des séquences régulatrices • De manière plus générale – Implication pour la compréhension de la dynamique de l’évolution chez les mammifères (ex.: mise en évidence de régions conservées) 10/10/2008 Le séquençage haut débit 2001 2008 10/10/2008 Plusieurs séquenceurs haut-débit Illumina Genome Analyzer Roche NimbleGen 454 FLX system Applied Biosystems SOLiD Analyzer Amount of DNA 100 ng-1µg ? 5-10 µg Volume of sequence 1,5 Gb (3 Gb) 0,1 Gb 1-1,5 Gb (1,5-2 Gb) Size 36 pb (50 -70 bp) 200-300 pb (400 pb) 35 pb (2 x 25 pb) de novo Sequencing NO YES NO Resequencing YES YES YES Expression studies YES YES YES D’après A.Eggen Coût <1000 $ pour un génome de la taille du génome humain 10/10/2008 La détection de SNPs: valeur ajoutée du séquençage du génome • Séquence référence (couverture 6-12x) • Plusieurs animaux appartenant à des races différentes • Alignement des séquences pour identifier plusieurs millers de SNPs • Validation des SNPs sur un nombre restreint d‘animaux de races différentes • Construction d‘une puce de SNPs pan-génomique (International Consortium) 10/10/2008 Digestion “in silico” In silico estimates 135 92 70 10/10/2008 Van Tassel et al., 2008 Nature Methods 5, 247-252 L’identification des SNPs GGCCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGGCC HaeIII Reference sequence HaeIII CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG CCACGTAATCCGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG Holstein CCACGTAATCGGCACCTTAGGATCTGC CCACGTAATCGGCACCTTAGGATCTGC CCACGTAATCCGCACCTTAGGATCTGCaaacct….cactggATGAGGGCTCAATTGGCCATCATCGG CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG CCACGTAATCCGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG Angus CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAGGGCTCAATTGGCCATCATCGG CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG BEEF CCACGTAATCGGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG CCACGTAATCCGCACCTTAGGATCTGCaaacct….cactggATGAAGGCTCAATTGGCCATCATCGG 10/10/2008 L’identification des SNPs bovins • Analyse de 49 millions de lectures – 5 022 143 tags uniques • 62 042 SNPs putatifs identifiés avec une haute stringence • 1 SNP / 1780 bp • 25 125 SNPs validés et intégrés à la puce bovine: «Bovine SNP50 genotyping BeadChip» (ILLUMINA) contenant plus de 54 000 SNPs 10/10/2008 Van Tassel et al., 2008 Nature Methods 5, 247-252 La génomique structurale 1. La cartographie des génomes animaux 2. Application: l’amélioration génétique des animaux 10/10/2008 L’amélioration génétique des animaux Etude de caractères ayant un contrôle génétique simple déterminisme mendélien Phénotype qualitatif Monogénique Etude de caractères ayant un contrôle génétique complexe Phénotype qualitatif Phénotype quantitatif =>Cartographie de QTLs (Quantitative Trait Locus) - Gènes majeurs - Autres => stratégie: clonage positionnel Sélection assistée par marqueurs (SAM) 10/10/2008 Détection de gènes majeurs • Porcs gène RN • Bovins gène sans corne, anomalie Mulefoot • Ovins OAR : gène Boroola • Caprins CHI : gène PIS • Lapins 10/10/2008 OCU : gène Rex Stratégies d’identification de gènes d’intérêt Du caractère à la fonction Clonage positionnel Gènes/ Allèles Phénotype • • • 10/10/2008 Génomique comparative Carte physique Séquençage des génomes Le clonage positionnel Conditions: Disposer de marqueurs génétiques (Microsatellites, SNP) Disposer de familles informatives Primolocalisation Genome Scan Etapes Analyses de liaison A * B C * D 10/10/2008 Nouveaux polymorphismes (microsatellites, SNPs) Identification de gènes candidats Typages additionnels Analyses d’association Méthodes statistiques fines (DL) Méthodes moléculaires (analyse A d’expression, transgénèse…) B AT GC AT CG TA CG Carte comparée Carte physique * * Résolution Physique Validation du › › Localisation Fine › Caractérisation de la région polymorphisme causal 20-50 cM (20 - 50 Mb) C D 5-10 cM (5 - 10 Mb) BACs 150 kb Rappels analyses de liaison et analyses d’association Analyses de liaison Familles Analyses d’association Populations Cas/contrôles Caractères: Qualitatifs Simple Complexe Intervalles: 10-20cM Caractères: Qualitatifs Quantitatif Contrôle génétique: Simple Complexe Familles Intervalles: 2-5cM Caractères: Qualitatifs Quantitatifs Contrôle génétique: Simple Complexe 10/10/2008 Courtin et al, Infect Genet Evol. 2008 8(3):229-38. La génomique structurale 1. La cartographie des génomes animaux 2. Application: l’amélioration génétique des animaux a) Identification de gènes majeurs Exemple 1: clonage positionnel de la mutation RN- chez le porc 10/10/2008 Clonage positionnel chez le porc La mutation RNClonage positionnel d'un gène influençant la qualité de la viande (rendement technologique du jambon cuit, tendreté & jutosité) Identification d’un gène régulant la quantité de glycogène musculaire, et donc le pH post-mortem de la viande 10/10/2008 La mutation RN• Phénotype RN-: chez les porcs Hampshire • Mutation dominante • Effet: • favorable: croissance • défavorable: taux de glycogène élevé dans les muscles squelettiques Effet négatif sur la qualité de la viande et la transformation (pH) Pertes économiques importantes 10/10/2008 • Objectif: Localisation de la mutation RN• Mutation détectée par analyse de liaison (1000 méioses informatives) • Première analyse de liaison: localisation sur le chromosome 15 => région de 2,5Mb • Construction d’un contig de BAC de 2,5Mb – But: identifier de nouveaux marqueurs microsatellites et de nouveaux marqueurs SNP • Nouvelles analyses de liaison 10/10/2008 Localisation de la mutation RN- Carte génétique Carte RH Contig de BAC •Nouvelles analyses de liaison: exclusion de la région proximale de SLC11A1 et de la région distale SNP S1010 10/10/2008 Localisation de la mutation RN- 10/10/2008 Localisation de la mutation RN• Cartographie comparée: homme (2q), souris (chr1) =>pas de gènes candidats évidents • Analyse de déséquilibre de liaison: association complète entre les allèles des marqueurs S1006, S1007 (BAC 127G6) et RNDL sur 91 porcs Hampshire 10/10/2008 Localisation de la mutation RN- Carte génétique Carte RH Contig de BAC 10/10/2008 Localisation de la mutation RN• Séquençage shotgun du BAC 127G6 (1000 individus) 3 séquences codantes -KIAA173 -CYP27A1 -3e gènes • KIAA173 et CYP27A1 ne sont pas des gènes candidats • 3e gène: similarité avec la sous-unité γ de l’AMP activated protein kinase • Rôle des AMPK: Rôle clef dans la régulation du métabolisme énergétique de la cellule eucaryote Augmentation du ratio AMP/ATP => activation AMPK =>production ATP et inhibition de la consommation d’ATP =>inactivation de la glycogen synthase (Enzyme régulant la synthèse du glycogène). Bon candidat positionnel et fonctionnel 10/10/2008 Localisation de la mutation RN- dans le gène PKARG3 • Détermination de la séquence du gène par RT-PCR et amplification rapide des extrémités de cDNA Chez le porc (RN+/RN+) et chez l’homme => gène différent des autres isoformes et orthologue du gène humain (BLAST) => PRKAG3 • Expression (Northern blot)=> uniquement dans le muscle • Comparaison de la séquence de PRKAG3 d’individus RN-/RN- et individus RN+/RN+ => Différence de 7 nucléotides dont 4 substitutions non synonymes 10/10/2008 Localisation de la mutation RN- dans le gène PKARG3 Analyse d’association des mutations avec le phénotype RN•Animaux: Hampshire + autres PC (15 races) •Phénotype: mesure du taux de glycogène des muscles squelettiques •Génotype: mutation R200Q du gène PRKAG3 10/10/2008 Caractérisation fonctionnelle de la mutation RN•Mesure de l’activité de l’AMPK dans des extraits musculaires: l’activité est 3 fois supérieure chez les porcs RN+ que chez les porcs RN- (en présence et en absence d’AMP) •La mutation semble inhiber l’activation de l’AMPK et la dégradation du glycogène 10/10/2008 La génomique structurale 1. La cartographie des génomes animaux 2. Application: l’amélioration génétique des animaux a) Identification de gènes majeurs Exemple 2: chez le mouton Les brebis callipyges 10/10/2008 La Mutation CALLIPYGE chez le mouton •Initialement observée au début des années 80 •Augmentation de la proportion et du diamètre des fibres musculaires de type rapide •Convoitée initialement mais tendreté moindre de la viande Cockett et al. (Science, 1996) Charlier et al. (Nature Genetics, 2001) Freking et al. (Genome Research, 2002) 10/10/2008 Un mode de transmission original • Observé pour la première fois: ~15% de descendants d’un bélier (Solid Gold) atteints • Après croisement 50% de descendants issus d’un mâle callipyge (CLPG) atteints • Mais… – 0% des descendants issus d’une femelle CLPG atteints – 25% des descendants d’un croisement Femelle CLPG x Mâle CLPG (au lieu de 50% sous l’hypothèse de l’implication d’un gène soumis à une empreinte paternelle) 10/10/2008 La surdominance polaire… CLPG: allèle muté clpg: allèle non muté clpgPAT CLPGMAT CLPGPAT clpgMAT CLPGPAT CLPGMAT Mode de transmission non mendélien. Seuls les hétérozygotes ayant hérité la mutation de leur père expriment 10/10/2008 le phénotype… Le locus impliqué… Etudes de liaison=>400kb sur OAR18=>200Kb (orthologue du domaine à empreinte situé sur HSA14, MMU12) Gènes codant pour des protéines à expression paternelle ARN non codants à expression maternelle 10/10/2008 Expression des gènes selon le génotype de la mutation DLK1: - Gène à expression paternelle - Effecteur de l’hypertrophie musculaire 10/10/2008 Profil d’expression unique dans le génotype affecté Pas de perturbations de l’empreinte parentale. Mutation active la transcription des gènes en cis Découverte de la mutation 184 kb Substitution A to G 10/10/2008 Recherche de la mutation causale Solid Gold animal fondateur Recherche d’un fragment IBD 10/10/2008 Effet de la mutation GGACCACCTGTC clpg GGGCCACCTGTC CLPG Mutation régulatrice de 4 gènes « éparpillés » sur 200 kb (LCR) Facteur inhibiteur qui ne se fixe plus 10/10/2008 L’empreinte génétique : rappels • Forme de régulation génique dépendante de l’origine parentale =>expression monoallélique de certains gènes nucléaires – Décrite dans plusieurs espèces de mammifères placentaires – Soit la copie de l’allèle paternel (ex IGF2R) soit la copie de l’allèle maternel (ex IGF2) est transcriptionnellement active – Nb= environ 80 . Les gènes soumis à empreinte sont organisés en grappe + ICE = élément régulateur commun – Région contenant systématiquement des ARN non codants – En général conservés entre espèces • Variation des empreintes au cours du développement 10/10/2008 Effacement et établissement des empreintes génétiques au cours du développement Exemple souris 13e jour du devt embryonnaire 10/10/2008 L’empreinte et la théorie du conflit… • Paradoxe – L’expression mono-allélique augmente la vulnérabilité aux mutations délétères • La théorie du conflit (Wilkins et Haig, Nature Review Genetics, 2003) – Intérêts génétiques parfois conflictuels entre la mère et le père chez les espèces polygames (majorité des mammifères). Pour augmenter la propagation de ses gènes • Le mâle transmet à sa descendance des gènes qui vont favoriser la croissance fœtale (au détriment de l’avenir reproductif de la mère) • La femelle transmet à sa descendance des gènes qui vont favoriser une économie de ressources et une augmentation du nombre de portée. – La plupart des gènes soumis à empreinte interviennent dans des mécanismes de transfert de ressources maternelles à la descendance (favorisés par les gènes à expression paternelle, inhibés par ceux à expression maternelle) 10/10/2008 La génomique structurale 1. La cartographie des génomes animaux 2. Application: l’amélioration génétique des animaux a) Identification de gènes majeurs b) Cartographie de QTLs Exemple 1: chez les bovins 10/10/2008 La primolocalisation : Dispositif animal (exemple français chez les bovins laitiers) Prim'Holstein Primolocalisation Etapes Normande Montbéliarde Genome Scan A * * * * Résolution Utilisation en sélection 10/10/2008 B …. …. C …. …. …. …. D 20-50 cM (20 - 50 Mb) 26 familles de demi-frères Prim’Holstein: 2138 fils 9 familles Normandes: 548 fils 6 familles Montbéliardes: 370 fils Pourquoi un tel dispositif « petite-fille » ? Le dispositif existe déjà (coût réduit au seul génotypage) •Les taureaux d ’IA sont les descendants d’un nombre limité de pères •Les taureaux sont évalués en routine par testage sur descendance Le phénotype des fils est similaire à la moyenne des D performances (petite-filles) •Haute précision dans l’évaluation (variance résiduelle réduite) •Puissance de détection augmentée pour un nombre donné de génotypes Détection 10/10/2008 de QTL ségrégeant dans les populations exploitées Cartographie de QTLs chez les bovins laitiers • 6 QTL sur 3 chromosomes – Caractères de production • Quantité de matière protéique (BTA7 & BTA26) • Quantité de matière grasse (BTA26) – Caractères fonctionnels • Numération cellulaire (BTA15) • Fertilité femelle (BTA7) – Caractères morphologiques • Epaisseur du talon (BTA15) 10/10/2008 La génomique structurale 1. La cartographie des génomes animaux 2. Application: l’amélioration génétique des animaux a) Identification de gènes majeurs b) Cartographie de QTL Exemple 2: chez les porcs 10/10/2008 Détection de QTLs chez le porc • Caractères de production Croissance Epaisseur lard dorsal Quantité de lipides intramusculaires … • Santé et résistance aux maladies Caractères immunologiques (en cours) Infection par le PrV Développement et régression des mélanomes cutanés 10/10/2008 QTL “muscle et epaisseur de gras” chez le porc LWxPietrain (1032 F2) Performance de croissance supérieure Musculature exceptionnelle peu de gras 21 phénotypes mesurant les performances de croissance, les proportions corporelles, la musculature, le dépôt de graisse, la qualité de la viande Objectif: Localiser des QTLs responsables des différences génétiques entre les deux races Nezer et al., 1999, Nature Genetics 21 : 155-156. Van Laere et al., 2003, Nature 425 : 832-836. 10/10/2008 QTL sur chromosome 2 soumis à l’empreinte parentale : seul l’allèle paternel a un effet HSA11p : IGF2 MYOD1 Log10(H1/H0) Log10(H2/H0) H2: QTL soumis à empreinte paternelle Log10(H3/H0) H3: QTL soumis à empreinte maternelle 10/10/2008 Gène IGF2 : structure et expression Expression de l’allèle paternel uniquement 10 gènes soumis à l’empreinte dans cette région chez l’homme et la souris. Seuls IGF2 et INS2 sont paternellement exprimés. 10/10/2008 Découverte de la mutation causale Substitution dans une région non-codante (intron 3) 10/10/2008 10/10/2008 Effet de la mutation Substitution A/G •Empêche la fixation d’un facteur inhibiteur de l’expression d’IGF2 dans le muscle squelettique et le muscle cardiaque,et uniquement après la naissance. •Ne perturbe pas l’empreinte parentale •Augmente la masse musculaire de 3 à 4 % 10/10/2008 La génomique structurale 1. La cartographie des génomes animaux 2. Application: l’amélioration génétique des animaux a) Identification de gènes majeurs b) Cartographie de QTLs Exemple 3: chez le mouton 10/10/2008 Le dogme central et les ARN non codants ARN Non Codants : - miRNA - siRNA 10/10/2008 Les micro-ARN : quelques éléments • Ce sont des ARNs non codants (20-23 nt) – Décrits pour la première fois chez C.elegans : Lee et al. (Cell, 1992) – Interviennent dans la régulation post-transcriptionnelle de gènes cibles (plantes et animaux) – Impliqués dans une multitude de fonctions biologiques (développement, prolifération cellulaire, apoptose, réponse au stress, tumorigénèse) – Hautement conservés entre espèces 10/10/2008 Biosynthèse, structure et action 70-80 nt Riboonucleoprotein complex 22 nt Pre-miRNA Wienholds and Plasterk, FEBS Letters, 2005 10/10/2008 Abondance des miRNAs – 1-5% des gènes prédits (analyse de la séquence des génomes). • 1 000 chez l’homme • 250 chez C. elegans – > 1/3 de l’ensemble des gènes ont des miRNA-binding sequences. – Cela suggère que les miRNA sont impliqués dans de nombreuses fonctions cellulaires. – Octobre 2008 : 8619 miRNA Base de données http://microrna.sanger.ac.uk/ 10/10/2008 Exemple de cartographie de QTL chez le mouton Juillet 2006 10/10/2008 Introduction… • Mouton Texel – race à viande, hypertrophie musculaire. • Programme de recherche de QTL – 10/10/2008 Romanov X Texel, F2, 258 petits • 37 mesures : muscle, dépôt graisse, composition… • 153 marqueurs pour le criblage total du génome Identification d’un QTL avec un effet majeur sur la musculature – Localisé sur OAR02 h2=0,05-0,25 Explique 1/5 à 1/3 des différences entre les 2 races – Après cartographie fine : région comprenant le gène Myostatine (GDF8)… 10/10/2008 Myostatine : un gène candidat positionnel et fonctionnel « évident » • Superfamille des TGF-β : – facteur de croissance et de différenciation. • Perte de fonction – augmentation de la musculature chez souris, bovin, humain. mutant WT mutant WT Bleu belge homozygote mutation myostatine 10/10/2008 WT mutant Mais… • Séquençage région codante du gène : – 3 Texel F0 – 7 contrôles (5 Romanov F0, 1 Dorset, 1Tarasconnais) • Aucun polymorphisme identifié… 10/10/2008 Les transcrits de GDF8 (myostatine) • Northern blot -Transcrit de taille attendue chez Texel / contrôle Transcrit GDF8 - Même intensité des bandes. Ld : longissimus dorsi; St : semitendinosus Tx : Texel; Rv : Romanov • ARN provenant muscle Texel/contrôle Amplification de l’ORF : RT-PCR, séquençage ARN messager normal chez animaux Texel – niveau séquence 10/10/2008 Recherche de SNPs : région non codante 3 Texel et 7 contrôles – 20 SNPs dans 10,2 kb – Aucun dans des éléments conservés Génotypage de tous les SNPs – 42 Texel et 90 contrôles (11 races, 4 Texel/Romanov) – « monomorphisme virtuel des Texel» – 18 SNPs éliminés : au moins 1 des 4 T/R homozygotes – SNP g-2449C-G éliminé : • à 2,5kb en amont site d’initiation de la transcription • 1 Texel hétérozygote pour cet SNP et homozygotes pour tous les autres SNPs Un seul SNP candidat : g+6723G-A 10/10/2008 Étude du SNP g+6723G-A • En 3’UTR • Allèle A: crée un motif octamérique – cible de microARN – – – – – Zhao et al., Nature, 2005 10/10/2008 décrit par Xie et al (Nature, 2005) miR-1 (.1 et .2), miR-206, miR122a reconnaissent cette cible miR-1 : très exprimé dans muscle et coeur souris Les gènes de ces 4 miARN retrouvés chez le mouton Expression chez le mouton Effet de la mutation • Hypothèse : La mutation provoque un création d’un site cible de miRNA • Test de l’hypothèse : diminution de la myostatine circulante? • Résultats Immunoprécipitation : chez les Texel, la bande est 3 fois moins intense myostatine myostatine T : texel; W : contrôle La mutation entraîne une instabilité des transcrits 10/10/2008 Démonstration de l’effet de la mutation •Construction : •Gène de la Luciferase •3’UTR mutant vs WT WT Mutant Analyse de la luminescence produite dans les clones Réduction de 70% du signal en présence de miRNA avec un promoteur présentant la mutation 10/10/2008 Conclusions de l’étude • Une mutation en 3’ du gène de la myostatine crée une cible pour au moins 2 miRNA exprimé dans les muscles squelettiques. • Diminution de la quantité de Myostatine (limitant la croissance des tissus musculaire) dans le muscle =>Hypertrophie musculaire 10/10/2008 Développement d’une base de donnée Patrocles (http://www.patrocles.org) Liaison SNPs/site cible miARN – Chez l’homme • 73 497 SNPs dans 3’UTR de 13 621 gènes – – – – Crée ou détruit 1 octamer décrit par Xie, Nature, 2005 2 490 SNPs putatifs crée un site 2 597 SNPs putatifs détruit un site Dont 483 affectent un octamère conservé entre 4 espèces mammifères – Chez Souris • 77 283 SNPs dans 3’UTR de 10 200 gènes – – 10/10/2008 1 183 SNPs putatifs crée un site 1 321 SNPs putatifs détruit un site » Dont 234 conservés au cours de l’évolution Base de données de QTLs chez les animaux (http://www.animalgenome.org/QTLdb/) 10/10/2008 La génomique structurale 1. La cartographie des génomes animaux 2. Application: l’amélioration génétique des animaux c) La sélection assistée par marqueur (SAM) 10/10/2008 Amélioration génétique • Exemple bovins/porcs • Très efficace durant les dernières décennies par exemple performances de croissance et efficacité alimentaire • Méthodes classiques basées sur : – Collecte d’informations de performances individuelles (paramètres de production) – Compilation des observations avec des informations généalogiques – « Index de sélection » pour identifier les meilleurs candidats à la sélection 10/10/2008 Quelques limites … • Efficacité diminue si le : – Phénotype difficile à mesurer – Caractère possède une faible héritabilité • Se limitent aux caractères mesurables dans un grand nombre d’animaux • Nouveaux critères de sélection : – Adéquation aux « produits finis » – Qualité et acceptabilité pour les consommateurs – Bien être animal, résistance aux maladies … 10/10/2008 La SAM Primolocalisation Etapes Genome Scan Physique Validation du › › Localisation Fine › Caractérisation de la région polymorphisme causal Nouveaux polymorphismes (microsatellites, SNPs) Identification de gènes candidats Typages additionnels * A A B B C * D Utilisation en sélection 10/10/2008 AT GC AT CG TA CG Carte comparée Carte physique * * Résolution Méthodes statistiques fines (DL) Méthodes moléculaires (analyse d’expression, transgénèse…) 20-50 cM (20 - 50 Mb) C D 5-10 cM (5 - 10 Mb) SAM1 BACs 150 kb SAM2 SAM3 La SAM chez les bovins 10/10/2008 La SAM chez les bovins •Les Marqueurs : bornes du génome 1 2 1 2 4 4 5 5 7 7 8 8 NOM : INRA83 3 POS : chrm1 - 15 3 9 6 10/10/2008 6 9 La SAM chez les bovins MELKIOR 10/10/2008 LEHOUX La SAM BELLWOOD MELKIOR 10/10/2008 LEHOUX La SAM BELLWOOD 1er groupe des fils de BELLWOOD 10/10/2008 2eme groupe des fils de BELLWOOD La SAM chez les bovins Comparaison des performances • Groupe de fils de BELLWOOD pour la MG 1er groupe des fils de BELLWOOD Moyenne = 29 2eme groupe des fils de BELLWOOD > Moyenne = 13 Il est donc plus intéressant d’avoir reçu 10/10/2008 que . La SAM chez les bovins •Informations marqueurs BESNE On peut avoir de l’information pour ... JOCKO toutes les familles typées ... Fille de JOCKO 10/10/2008 La SAM La SAM permet de lire la carte d’identité d’animaux sans performance (candidats). BESNE ... BELLWOOD JOCKO ... ... MELKIOR LEHOUX Veau 1 10/10/2008 Veau 2 Fille de JOCKO Veau 3 Veau 4 La SAM chez les bovins Chez les BV laitiers: • Génotypage des jeunes taureaux et génisses laitiers pour > 40 marqueurs pour 12 régions QTL différentes soit 10.000 animaux typés / an. 10/10/2008 La SAM Primolocalisation Etapes Genome Scan Physique Validation du › › Localisation Fine › Caractérisation de la région polymorphisme causal Nouveaux polymorphismes (microsatellites, SNPs) Identification de gènes candidats Typages additionnels * A A B B C * D Utilisation en sélection 10/10/2008 AT GC AT CG TA CG Carte comparée Carte physique * * Résolution Méthodes statistiques fines (DL) Méthodes moléculaires (analyse d’expression, transgénèse…) 20-50 cM (20 - 50 Mb) C D 5-10 cM (5 - 10 Mb) SAM1 BACs 150 kb SAM2 SAM3 Sélection: perspectives • SAM deuxième et troisième génération • Introduction de paramètres immunologiques dans les schémas de sélection – Etude en cours chez le porc pour estimer la faisabilité et déterminer les meilleurs paramètres (projet IMMOPIG) – Suite: études QTL sur ces paramètres sélection divergente 10/10/2008 La génomique fonctionnelle 1. Transcriptome et protéome 2. Etude du transcriptome a) Méthodes bas-débit b) Méthodes haut-débit c) Le séquençage du transcriptome d) Exemples d’études du transcriptome à l’aide des puces à ADN 10/10/2008 La génomique fonctionnelle 1. Transcriptome et protéome 2. Etude du transcriptome a) Méthodes bas-débit b) Méthodes haut-débit c) Le séquençage du transcriptome d) Exemples d’études du transcriptome à l’aide des puces à ADN 10/10/2008 Génomique structurale Génome nucléaire Dégradation Traduction ARNm Protéome Transcriptome Génomique fonctionnelle 10/10/2008 Génome, transcriptome et protéome 10/10/2008 Etude du protéome Approches utilisées: Après extraction de protéines - Electrophorèse sur gel 2D: Séparation des protéines et recherche des protéines par analyse d’image - Spectrométrie de masse Identification de protéines à partir de leur empreinte peptidique massique. Ex: MS MALDI-TOF -Protein arrays (intéractions -Séquençage 10/10/2008 protéine-protéine) Etude du transcriptome • Etude d’un nombre limité de gènes Western blot PCR quantitative en temps reel (qRT-PCR) • Techniques “haut-débit” : • Nécessitant de connaître les sondes spécifiques de gènes: puces à ADN globales & différentielles ADNc ou oligonucléotides – Approche réseau dédié (CREA exhaustif pour une région donnée, d’une fonction donnée) – Approche pan-génomique • Méthodes exhaustives: ne nécessitant pas de connaître les séquences ADN à étudier – Banques d’hybridation soustractive (SSH) – Serial Analysis for Gene Expression (SAGE) 10/10/2008 – Le séquençage du transcriptome RT-PCR quantitative en temps réel: Principes Objectif : utiliser la pcr pour quantifier des transcrits (cDNA) = quantifier N0 4,000 Exponential phase 3,500 3,000 Plateau 2,500 Latency phase 2,000 1,500 Screening step 5 cycles maxi Ct N = N0 x (1+E)n =2nN0 N = quantité d’ADN amplifié après n cycles N0 = quantité initiale d’ADN cible E = efficacité de la PCR 1,000 0,500 0,000 0 2 10/10/2008 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 RT-PCR quantitative en temps réel: Vérification de l’efficacité de la pcr Ct N = N0 x (1+E)n Log N = LogN0 + n Log(1+E) α Si n = Ct LogN = LogN0 + Ct Log(1+E) Ct = [LogN –LogN0] / Log (1+E) Ct = -1/Log(1+E) x LogN0 + cte Quantite (dilutions) Log (ng) Ct = a N0 + b avec a = -1/Log(1+E) = pente de la droite 100% d’efficacité => E = 1 et α = -1/Log(1+1) = -1/Log2 = - 3,32 10/10/2008 RT-PCR quantitative en temps réel: Quantification relative 1) Normalisation avec le gène de référence ∆ Ct = CTGcible – CT Gref 2) Quantification relative des données normalisées entre une condition et un calibrateur ∆∆ Ct = (CTGcible – CT Gref)cond1 – (CTGcible – CT Gref) calibrator Formule de quantification relative 2 –∆∆ ∆∆Ct ∆∆ qRT-PCR utilisée pour confirmer les résultats obtenus à l’aide des puces à ADN 10/10/2008 La génomique fonctionnelle 1. Etude du protéome 2. Etude du transcriptome a) Techniques basdébit b) Techniques hautdébit c) Exemples d’études du transcriptome à l’aide des puces à ADN 10/10/2008 Etude du transcriptome • Etude d’un nombre limité de gènes Western blot PCR quantitative en temps reel (qRT-PCR) • Techniques “haut-débit” : • Nécessitant de connaître les sondes spécifiques de gènes: puces à ADN globales & différentielles ADNc ou oligonucléotides – Approche réseau dédié (CREA exhaustif pour une région donnée, d’une fonction donnée) – Approche pan-génomique • Méthodes exhaustives: ne nécessitant pas de connaître les séquences ADN à étudier – Serial Analysis for Gene Expression (SAGE) – Le séquençage du transcriptome 10/10/2008 Quelques principes Puces à ADN Courtin et al, 2007 10/10/2008 Serial Analysis of Gene Expression Analyse et validation des résultats • Importance du traitement statistique des données • Validation des résultats au niveau des transcrits (qRT-PCR) et au niveau protéique (immunohistochimie, Cytométrie en flux…) • Analyse bioinformatiques -Gene Ontology (GO):(biological process, cellular component, molecular function) ex: DAVID, PANTHER… -Réseaux de gènes, voie biologiques et canoniques Ex: INGENUITY 10/10/2008 Puces à ADN et réseaux dédiés: approche région candidate Objectif 1: Localiser finement un gène et une mutation responsable du contrôle d’un phénotype - Tous les BAC ou plasmides ou oligonucléotides (ciblant des régions codantes et non codantes) d’une région chromosomique candidate (QTL) sont déposés sur membrane ou lame de verre - Hybridation d’ARN sain/ ARN malade - Identification des BACs, plasmides ou oligonucléotides qui présentent une expression différentielle - Identification des gènes candidats Objectif 2: étudier l’expression d’une région chromosomique contenant des gènes d’intérêts dans plusieurs conditions - Co-régulation des gènes - cDNA ou oligonucléotides spécifiques de tous les gènes de la région - Expression différentielle Objectif 3: étude des régions codantes et non codantes d’une portion chromosomique - Tiling array (oligonucléotides) - Chip on chip:étude de la transcription 10/10/2008 Puces à ADN et réseaux pan-génomiques Puce de gènes • « Maison » INRA-CRB (centre de ressources biologiques) – – • Membranes (cDNA) Lames de verre Truite, Porcs (oligos) Bovin, Porc, Poulet « Commerciaux » – – – – Set d’oligos commerciaux (Qiagen, Opéron) Puces affymetrix Puces Agilent Puces Nimblgen Tiling arrays • • « Maison » « Commerciaux » en développement pour les animaux de rente CHip on chip Objectif: détecter si une proteine donnée se fixe spécifiquement sur une séquence d’ADN 10/10/2008 Le séquençage du transcriptome Exemple: séquenceur haut débit 454 Roche 10/10/2008 La génomique fonctionnelle 1. Etude du protéome 2. Etude du transcriptome a) Techniques basdébit b) Techniques hautdébit c) Exemples d’études du transcriptome à l’aide des puces à ADN 10/10/2008 EXEMPLE 1: Aide à la cartographie chez les bovins 2007 10/10/2008 Aide à la cartographie de QTLS Arbilly et al, Animal Genetics, 2006 10/10/2008 EXEMPLE 1: Aide à la cartographie chez les bovins • Point de départ: Etudes QTL sur les caractères de production laitière dans différentes race de bovins Identification de plusieurs QTL contenant quelques centaines de gènes Identification d’un QTN: mutation de DGAT1 le gène causal affectant la quantité de matière grasse du lait sur BTA14 • Objectif : étudier l’expression des gènes dans la glande mammaire de souris à différents stades (puberté, gestation, lactation, involution) et combiner ces données avec les résultats des études QTL chez les bovins pour proposer des gènes candidats à tester. • Outil: Puce Affymetrix: 12488 sondes Tissu: glande mammaire souris C57BL/6J 10/10/2008 EXEMPLE 1: Aide à la cartographie chez les bovins • Analyse différentielle (ANOVA) et comparaison avec d’autres études d’expression 249 sondes en commun correspondant à 212 gènes bovins 10/10/2008 EXEMPLE 1: Aide à la cartographie chez les bovins • 212 gènes différentiellement exprimés en fonction du stade K-means-clustering 10/10/2008 EXEMPLE 1: Aide à la cartographie chez les bovins • Comparaison avec les données de cartographie Pbl: beaucoup de gènes ont des fonctions inconnues http://cowry.agri.huji.ac.il/QTLMAP/qtlmap.htm clusters BTA6 DGAT1 est surexprimé Utilisation de la base de donnée cgQTL pour proposer des gènes candidats 10/10/2008 EXEMPLE 2: Réseau ciblant une fonction Etude de l’infection par Mycobacterium bovis chez les bovins Meade et al, 2007, BMC Genomics • Objectif : comparaison des niveaux de transcrits de PBMC provenant de 6 bovins infectés par Mycobacterium bovis/ 6 bovins non infectés • Outil: Puce cDNA dédiée immunospécifique: 1391 gènes (spots) Animaux infectés • Analyse PBMC 10/10/2008 Contrôles EXEMPLE 2: Réseau ciblant une fonction Etude de l’infection par Mycobacterium bovis chez les bovins 378 gènes diff exprimés (p=0.05) dont 244 réprimés chez les animaux infectés (65%) Gènes RI innée TLR2, TLR4 Bola class I et Bola class II (DRA) Confirmation par RT-PCR quantitative Signature transcriptionnelle: les profils de transcription permettent de classer les animaux suivant leur statut (infecté/ non infecté) 10/10/2008 EXEMPLE 3: Approche combinée région candidate et pan-génomique Etude de l’interaction cellule épithéliale porcine-virus de la Pseudorage Flori et al, 2008, BMC Genomics PrV • pathogène bien connu du porc • responsable de la Maladie d’Aujeszky ou Pseudorage • alpha-herpesvirus • genome ADN (140Kb, 70 gènes) • sequence (Klupp et al, 2004) • bon modèle expérimental pour étudier la biologie des alpha-herpesvirus propagation aisée dans les cellules de plusieurs espèces de mammifères inocuité pour le personnel de laboratoire CELLULES EPITHELIALES PORCINES • Réplication viral primaire • Forte production virale 10/10/2008 Etude des intéractions cellule hôte – pathogène: approches transcriptomiques • Puces à ADN: outils efficaces pour analyser les interactions cellule hôte-pathogène Hossein H et al, 2006, Curr. Opin. Immunol. • Etudes transcriptomiques: - Analyse du transcriptome de la cellule OU du pathogène -Peu d’études simulatanées des transcriptomes de la cellule et du pathogène P.berghei ANKA et souris (brain) Lovegrove FE et al, 2006, BMC Genomics EBV et NK/T cells Zhang YJH et al, 2005, Br. J. Cancer Etudes transcriptomiques des intéraction PrV-cellule - Analyse du transcriptome cellulaire - Etudes cinétiques - Modèles hétérologues REF cells / rat chip Ray and Enquist. 2004. J. Virol. Brukman and Enquist. 2006. J. Virol. HEK-293 cells / human chip Blanchard et al, 2006. Vet. Res. 10/10/2008 Objectifs Analyser in vitro le dialogue entre les cellules épithéliales porcines et le PrV Etablir un lien temporel direct entre l’expression des gènes viraux et cellulaires. - Analyse simultanée des modifications du transcriptome viral et cellulaire - Etude cinétique - Système homologue (PrV/cellules porcines / puces porcines) Suivre la mock-infection et l’infection par le PrV des cellules épithéliales porcines PK15 Détecter les gènes viraux et cellulaires différentiellement exprimés durant l’infection entre les cellules infectées (I) et mock-infected (MI) à différents temps 10/10/2008 Outils et méthodes • Microarrays Microarray générique Qiagen-NRSP8 8541 gènes Zhao et al, 2005, Genomics => oligonucleotides Microarray dédié construit au laboratoire 1.5 % gènes impliqués dans la réponse immunitaire SLA/PrV (CRB-GADIE/LREG) ⇒ADNcs et exons sous-clonés ⇒GEO GPL5622 • PCR quantitative en temps réél 10/10/2008 1515 genes Couverture ~ 72.5% de la région SLA (Swine Leucocyte Antigen) 70 gènes du PrV Schéma expérimental Qiagen-NRSP8 SLA/Immuno/prV T0 T2 T4 T8 T12 h pi I Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 MI Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 R1 Cellules PK15 T1 I R2 MI R3 I = Infection par le PrV MI = Mock-infection PrV (souche NIA3) Une lame 10/10/2008 R4 I Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 MI Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 I Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 MI Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Cy5 Cy3 Cy3 Cy5 Acquisition des données, normalisation et analyse statistique 1/ Acquisition des données • Scan des lames Scanarray (LCE,CEA) and Virtek (PICT, INRA) • Quantification Imagene software • Stockage des données BASE (Sigenae) 2/ Normalisation • Transformation Log2 • Locally weighted polynomial regression => Lowess (f=0.3) M M M = Log2(Cy5/Cy3) A A A = 0.5*Log2(Cy5*Cy3) • Soustraction de la médiane de chaque bloc M M 3/ Selection des gènes différentiellement exprimés Blocs • Modèle linéaire Ycfnds = µc + αf + βn + δd + Ecflje • Comparaisons Student t test Blocs Blocs - MI vs I à chaque temps => 1 pvalue pour chaque gène • Correction pour tests multiples : False Discovery Rate (FDR) =0,05 4/ Exploration des données 10/10/2008 • Hierarchical clustering : HCL et k-means (TmeV software) Une image globale de la transcription du PrV Toutes les sondes PrV I I MI T0 T1 T2 T4 T8 T12 MI T0 T1 T2 K-means T4 T8 T12 (n=3, euclidian distance, average link) UL49 GP50GD EP02 UL38 UL362 ORF1 UL48 UL40 UL51 UL37 UL3 Cluster 1 UL46 UL54 LLTE21 ORF2NIA3 ICP18.5 UL30 LLTE1 IEP2 UL2 UL3.5 UL13 UL4 UL34 EP01 UL17 UL32 UL361 UL43 UL18 IL15EX12 UL8 UL20NIA3 UL191 UL10 ORF1NIA3 PKNIA3 UL21NIA3 GP63GI Cluster 2 UL11 GII TKNIA3 UL92 UL1 UL41 UL142 UL14 UL31 UL39 UL12 UL33 UL52 GIGE UL8.5 IEP1 UL50 LLTI2 UL16 UL47 UL25NIA3 GIIINIA3 Ba5 UL42 UL24NIA3 LLTE222 UL26NIA3 11K2 28KNIA3 UL29 UL35 Cluster 3 UL49.5 RSP40 UL6 UL5 GXGG UL7 GHNIA3 UL192 UL53 UL15EX2 10/10/2008 * Gènes différentiellement exprimés Une image globale de la transcription du PrV et des PK15 UL9 UL28 UL36 US8 UL41 US3 PrV 80 PK15 US1 UL29 UL49.5 40 20 0 8 58 52 IE180 9 7 log (titer) Nombre de gènes différentiellement exprimas 60 10 34 13 3 6 5 4 3 0 T0 T1 T2 T4 Tim e T8 2 T12 1 0 0 4000 10 Courbe de croissance du PrV 3509 3500 3184 3000 shutoff 2500 2000 1494 1500 1262 1000 500 1 0 47 134 0 2 T0 T1 T2 0 27 0 10/10/2008 4 0 31 88 93 5 19 14 T4 T8 T12 SLA/PRV up-regulated SLA/PrV down-regulated NRSP8 up-regulated NRSP8 down-regulated PrV et shutoff cellulaire • Augmentation du nombre de gènes différentiellement exprimés au cours du temps à partir de 2h pi parallèlement au nombre de gènes viraux. • Beaucoup de gènes cellulaires sont réprimés. Cette down-régulatione est détéctée à partir de 4h pi et augmente à 8 et 12h pi. Pas de shutoff précoce mais shutoff plus précoce dans les cellules porcines que dans les autres cellules (8h pi) • Le gène viral UL41 codant pour la virion host shutoff protein (vhs) est détectée 8h pi shutoff probablement induit par les protéines vhs néosynthétisées 10/10/2008 L’infection par le PrV altère de multiples processus biologiques et fonctions cellulaires US3 8h pi Drug Metabolism T1 Gene Expression HIST1H2AL HISTAH4J HISTAH2BK Gene Expression Molecular Transport US3 8h pi US1 1h pi Cell CycleBCl-2 FAIM2 Cell Caspase1 Caspase 3 Death Caspase 7 NF-KB2 Cellular Movment HDAC2 HDAC10 HDAC3 HDAC6 Nucleic acid HDAC7A metabolism HDAC9 Molecular Transport SLA-Ia TAP1 Immune TAP2 Response Calnexine Cellular Assembly F-actin and B-actin Organization Myosin IRFs TLR8 PPIA T8 T2 US3 8h pi Cell signalling DNA Replication and Repair Ingenuity Pathways analysis Gene number/Top function 10/10/2008 T4 Up-regulated Down-regulated Résultats de qRT-PCR Quantification relative ∆∆Ct ∆∆ -1 2-∆∆ TAP1 TAP2 PSMB9 PSMB8 Relative quantity SLA Ia Samples Gène référence: RPL32 Calibrateur: MI T0 10/10/2008 Diminution de SLA Ia à la surface des PK15 Cytométrie en flux 10/10/2008 Stratégie du PrV pour se soustraire à la voie de présentation antigénique du CMH de classe I PK15 Diminution des niveaux de transcrits Diminution dans de les cellules infectées l’expression des molécules du CMH Cl I SLA-Ia à la surface des cellules TAP1 Mellencamp et al, 1991, TAP2 PSMB8 (LMP7) PSMB9 (LMP2) J. Virol. Inhibition de l’activité du transporteur TAP Ambagala et al, 2000, J. Immunol. /interaction avec la PrV protéine gN codée par le gène UL49.5 UL49.5 (gN) UL41 (vhs) Koppers-Lalic et al, 2005, PNAS 1h pi 8h pi Rupert Abele, Robert Tampe´ FEBS Letters 580 (2006) 1156–1163 Le PrV developpe differentes strategies pour échapper à la voie de présentation antigénique du CMH de classe I: -arrêter la pompe à peptides -diminuer la transcription de molécules clefs 10/10/2008 Conclusions et perspectives Conclusions • L’expression des gènes du PrV et des cellules porcines peut être analysée conjointement avec des puces à ADN • Chronologie de la transcription des gènes du PrV jusqu’alors jamais décrite • Image globale de la transcription avec un lien temporel direct entre l’expression des gènes viraux et cellulaires • Nouvelles données sur les stratégies virale d’échappement à la réponse immunitaire (voie de présentation antigénique par les molécules de classe I du CMH) Perspectives • Analyse des intéractions PrV-cellules porcines dans d’autres cellules cibles comme les cellules dendritiques immatures • Etude de l’expression des gènes viraux et cellules en utilisant des virus mutants 10/10/2008 Bilan études du transcriptome chez le porc Puces à ADN Tuggle et al, Int.J.Biol.Sci., 2007, 3(3):132-152 • Muscle: 5 études •Appareil reproducteur (utérus, ovaire, testis): 9 études •Réponse immunitaire: 12 études 10/10/2008 La génomique génétique 10/10/2008 La génomique génétique (« Genetical Genomics ») Intégrer des génotypes et des données d’expression Objectif: identifier des régions du génome intervenant dans la – variabilité de l’expression des gènes Principe: Etudier la quantité de transcrits produits pour beaucoup – (tous) de gènes comme autant de caractères quantitatifs analyse de liaison et d’association Article pionnier Schadt et al, Nature, 2003, 422:297-302 10/10/2008 La génomique génétique (« Genetical Genomics ») Cartographie de QTL d’expression (eQTL) 2 types d’eQTL Cis-acting eQTL: le gène codant pour le transcrit est situé dans l’intervalle de confiance de l’eQTL Trans-acting eQTL: l’intervalle de localisation est situé dans une région distante du gène codant pour le transcrit considéré Cis et trans-régulation de l’abondance des transcrits 10/10/2008 Drake et al, 2006, Mammalian Genome La génomique génétique 10/10/2008 (« Genetical Genomics ») La génomique génétique Intérêts Proposer et classer les gènes candidats Définir des sous-types moléculaires à l’intérieur de la population pour un phénotype donné Identifier des voies métaboliques et cellulaires, impliquées dans l’apparition du phénotype Identifier des facteurs causaux impliqués dans une variation phénotypique 10/10/2008 10/10/2008 CONCLUSION • Les animaux de rente – Possibilité de croisements dirigés – Des espèces modèles pour des mécanismes parfois originaux – Des mutations régulatrices importantes dans le contrôle des variations phénotypiques • La sélection – L’information moléculaire acquise peut être valorisée (Sélection assistée par marqueurs) – Ajout de nouveaux paramètres immunologiques dans les critères de sélection – Utilisation des données d’expression 10/10/2008 Merci de votre attention… 10/10/2008