05-4 Bouchez - INRA Versailles
Transcription
05-4 Bouchez - INRA Versailles
05-4 Bouchez 16/03/06 9:46 Page 38 Dossier Les atouts de la génomique végétale Nouvelles approches génétiques La génomique s'intéresse aux grands principes qui régissent la structure globale et l'évolution des génomes, mais aussi au fonctionnement coordonné des milliers – voire des dizaines de milliers chez les plantes supérieures – de gènes et de protéines qu'ils spécifient. Au-delà des approches de génomique structurale (cartographie physique et génétique, inventaire de gènes, séquençage…), les approches de génomique fonctionnelle ont investi la plupart des champs de la biologie végétale actuelle. * Station de génétique et amélioration des plantes, Institut Jean-Pierre Bourgin Inra, Centre de Versailles, 78026 Versailles Cedex [email protected] ** Unité de recherche en génomique végétale (URGV) UMR Inra 1165 - CNRS 8114 Université d'Évry 2 rue Gaston Crémieux, CP 5708, 91057 Évry Cedex *** [email protected] **** [email protected] ***** [email protected] David Bouchez*, Abdelhafid Bendahmane**,***, Claire Lurin**,****, Bénédicte Sturbois**,***** L a génomique fonctionnelle, discipline récente qui doit beaucoup aux progrès de l'instrumentation, vise à une compréhension fine des fonctions des gènes et des protéines impliqués dans les processus biologiques à l'œuvre dans les organismes vivants. Elle repose sur la mise en œuvre de méthodes à haut débit (les fameux « -omiques ») et de niveaux d’analyse variés (du gène à la population). Le séquençage de génomes complets, comme celui d'Arabidopsis thaliana, a permis de mesurer l'ampleur de la tâche : des informations fonctionnelles fiables ne sont disponibles que pour à peine un cinquième des 26 000 gènes repérés. Pour les plantes comme pour la plupart des organismes supérieurs pour lesquels on dispose d'informations génomiques détaillées, l'étude de la fonction des gènes et des protéines fait appel à des approches de génétique (mutagenèse ciblée ou aléatoire, analyse des phénotypes résultants), mais aussi de transcriptomique (régulation de la transcription), de biochimie des protéines et d'imagerie cellulaire (voir article suivant). Un grand volet des approches de génomique fonctionnelle, en particulier celles menées sur A. thaliana et les modèles génériques, concerne en effet la génétique. Jusqu’aux années 90, il était particulièrement difficile d'isoler un gène repéré sur la base de sa localisation sur une carte génétique. Toutefois les approches de clonage positionnel disponibles aujourd’hui ont fait de grands progrès par rapport à cette époque. Elles demeurent, encore à l'heure actuelle, délicates à mettre en œuvre, mais sont théoriquement applicables dans n'importe quelle espèce où il est possible de réaliser de la cartographie génétique ; ces techniques sont d'un 38 BIOFUTUR 265 • AVRIL 2006 intérêt considérable pour l'identification de gènes importants chez les espèces végétales, en particulier chez les plantes cultivées où elles constituent souvent le seul moyen d'identification disponible. Chez les plantes supérieures comme le maïs, le muflier ou Arabidopsis, la mise au point de techniques de mutagenèse d’insertion a permis dès le début des années 90 de proposer une alternative aux approches de clonage positionnel. En raison de l’absence de technique de ciblage génique par recombinaison efficace chez les plantes supérieures, les collections de mutants d’insertion sont également largement exploitées en génomique fonctionnelle pour l'identification de fonctions géniques. On parle alors de génétique « inverse » : contrairement aux approches classiques dans lesquelles, à partir d'une fonction identifiée sur la base d'un crible phénotypique, on cherche à arriver aux gènes et aux protéines impliquées, il s'agit, à partir de la connaissance du génome et de l'identification des gènes, d'isoler des mutants et d'en analyser les modifications. Plus récemment, les approches de crible de populations de mutants classiques (voir tilling) ou l'utilisation d'approches basées sur l'interférence ARN (ARNi) ont permis de diversifier la palette des outils de mutagenèse et d'élargir le spectre des mutations utilisables. Clonage positionnel de gènes d’intérêt agronomique Parmi les caractères observables sur les plantes, certains ont un impact important en agriculture (précocité, résistance à un pathogène…). On parle alors de 16/03/06 9:46 Page 39 chez les plantes caractères agronomiques. Un caractère agronomique peut être déterminé entièrement par un seul locus, communément appelé « gène majeur » (déterminisme mendélien), ou par plusieurs loci à effet partiel sur la variation du caractère, on parle alors de QTL*1. Des marqueurs génétiquement liés à de tels loci permettent de sélectionner, parmi un grand nombre de plantes, les individus les plus performants. Ils peuvent ainsi être utilisés pour sélectionner un nouveau génotype intéressant par croisements successifs. L’identification précise des gènes en jeu et des polymorphismes responsables des variations observées est l’étape ultime qui permet de connaître les bases moléculaires de ces caractères agronomiques, d’analyser leur variabilité dans les populations naturelles et de les intégrer à des programmes de création variétale. Identifier la séquence d’un gène majeur ou d’un QTL relève en pratique de deux démarches de clonage différentes. L’identification moléculaire rapide d’un gène majeur ou parfois d’un QTL peut reposer sur les techniques d’étiquetage des gènes, lorsqu’elles sont accessibles dans l’espèce étudiée. En l’absence de ce système d’étiquetage, la stratégie la plus couramment utilisée est le clonage positionnel (1). Ce type de clonage repose sur l’identification de marqueurs ADN et d’événements de recombinaison dans la région du locus cible. Les marqueurs sont positionnés avec précision par rapport aux événements de recombinaison pour développer une carte génétique de haute résolution. La seconde étape consiste à construire une carte physique de la région, dans laquelle les distances génétiques*2 sont converties en nombre de paires de bases. Quand un fragment d’ADN cloné recouvrant l’intervalle entre les marqueurs les plus proches a été identifié, le gène d’intérêt peut être localisé par sousclonage et recherche des séquences codantes dans les sous-clones. La validation fonctionnelle est réalisée par cartographie fine du gène dans la zone chromosomique étudiée (figure 1). Cartographie génétique fine La cartographie fine consiste à rechercher et ordonner des marqueurs localisés dans un très petit intervalle autour du locus d’intérêt. La saturation de la région cible en marqueurs et en événements de recombinaison constitue un paramètre clef de l’exploitation de cette stratégie et peut considérablement accélérer le clonage de gènes. Les techniques de marquage permettant de cribler un grand nombre de marqueurs simultanément, comme les AFLP*3, sont particulièrement utiles à cette étape (2). © D.R. s 05-4 Bouchez Figure 1 Étapes du clonage positionnel Localisation primaire de la région d'intérêt par analyse de liaison (quels marqueurs co-ségrègent avec le phénotype ?) Assemblage des clones d'ADN génomique (BAC) chevauchants (formation de contigs) Inventaire des gènes présents Étude des polymorphismes Cartographie physique La construction d’une banque d’ADN génomique est une étape essentielle pour l’établissement de la carte physique. Le système BAC (3) est le plus couramment utilisé pour ce type d’approche. La taille des inserts peut y atteindre 350 kb. La banque BAC est criblée avec les marqueurs les plus proches du gène d’intérêt. On établit ensuite une carte locale des clones par une série de digestions enzymatiques qui permettent de définir les fragments communs à plusieurs clones et de les ordonner les uns par rapport aux autres. Un ensemble de clones ordonnés constitue un contig. La réussite de la construction de la carte physique dépend de la qualité de la carte génétique fine du locus cible. Les extrémités des BAC sont séquencées et de nouveaux marqueurs sont définis et utilisés pour ancrer la carte génétique à la carte physique et pour identifier le clone BAC supposé porter le gène d'intérêt, ou encore pour allonger la taille des contigs. Quand le clone BAC qui recouvre l’intervalle entre les marqueurs les plus proches a été identifié, le gène cible peut être identifié par séquençage et cartographie des gènes prédits relative aux événements de recombinaison. Le polymorphisme des portions codantes identifiées est étudié, afin de rechercher d’éventuelles BIOFUTUR 265 • AVRIL 2006 39 *1 Quantitative trait locus *2 La distance génétique reflète la fréquence des événements de recombinaison sur la portion d’ADN considérée. Elle est exprimée en centimorgans, 1cM = 1 % de recombinaison. *3 Amplification fragment length polymorphism, marqueurs du polymorphisme de longueur des fragments d'amplification. (1) Rommens JM et al. (1989) Science 245, 1059-65 (2) Vos P et al. (1995) Nucl Acids Res 23, 4407-14 (3) Shizuya H et al. (1992) Proc Natl Acad Sci USA 89, 8794-7 05-4 Bouchez 16/03/06 9:46 Page 40 Dossier Les atouts de la génomique végétale Mutagenèse au hasard Clonage positionnel du gène Rfo chez le radis La stérilité mâle cytoplasmique Ogu-INRA, caractérisée chez le radis (Raphanus sativus), est utilisée depuis plusieurs années pour la production de semences hybrides chez les brassicas (crucifères) cultivées. Son utilisation chez le colza cause de nombreux problèmes dus à la maîtrise imparfaite du système de restauration. En effet, le gène de restauration Rfo a été introduit dans le colza par croisements interspécifiques. Les lignées de colza restauratrices actuellement disponibles portent une introgression*1 de génome de radis de grande taille ayant remplacé environ 50 cM du génome de colza (1). Ces manipulations (introgression et/ou délétion) s’accompagnant de caractères défavorables (fort taux en glucosinolates, mauvaises performances agronomiques, faible fertilité femelle), des efforts intensifs de sélection ont été menés au cours des dernières années. Mutagenèse par insertion Utilisé chez la souris depuis plusieurs années, le ciblage génique sur cellules souches embryonnaires n'a permis d'obtenir des mutants que pour environ 10 % des gènes de cette espèce. On découvre actuellement les avantages de la mutagenèse insertionnelle pour la génétique inverse et les cribles génétiques à grande échelle. Chez les plantes supérieures, la mutagenèse d'insertion a été largement utilisée depuis la fin des années 80 pour l'obtention de mutants, tout d'abord dans le cadre de cribles phénotypiques, puis à des fins d'analyse fonctionnelle et de génétique inverse. © D.R. • Un principe relativement simple Carte physique du locus Rfo chez le radis. Le clone BAC B64 portant le gène Rfo a été sequencé et annoté. © D.R. Le clonage du gène Rfo a été réalisé chez le radis en collaboration avec Régine Delourme, Michel Renard (Inra de Rennes) et Françoise Budar (Inra de Versailles) en utilisant la plateforme de clonage positionnel d’Évry (figures et photos). À l’issue de ce travail, il a été démontré que le gène Rfo code une protéine contenant des motifs PPR (pentatricopeptide repeat) (2). Ce gène appartient à une très grande famille chez les plantes supérieures, avec environ 450 membres répertoriés chez Arabidopsis thaliana. La plupart des protéines codées par ces gènes seraient adressées aux organites cellulaires afin de contrôler l’expression des gènes mitochondriaux ou plastidiques. Test de complémentation du phénotype mâle stérile. L’expression transgénique de la PPR B chez le radis mâle stérile (à droite) restaure la production de pollen. À gauche, fleur non-transgénique mâle stérile. *1 Incorporation de gènes d’une espèce au sein du génome d’une autre espèce. (1) Delourme R et al. (1998) Theor Appl Genet 97, 129-34 (2) Desloire S et al. (2003) EMBO report 4, 588-94 relations entre polymorphisme et variation du caractère. Des constructions plasmidiques, porteuses de ces portions, sont produites et utilisées pour transformer des plantes afin de valider leur rôle dans la variation du caractère par complémentation. Le clonage d'un QTL est plus difficile que celui d'un gène majeur car il n'influence que partiellement la variation du caractère. Une « mendelisation » du caractère est nécessaire avant l’établissement du clonage positionnel. Cette opération consiste à comparer deux génotypes identiques sauf pour la zone chromosomique étudiée, porteuse du QTL à identifier. 40 BIOFUTUR 265 • AVRIL 2006 On utilise comme agent mutagène un segment d'ADN de séquence connue, capable de s'insérer de manière aléatoire dans le génome. L'insertion de ce segment au niveau d'un gène provoque, dans la plupart des cas, une perte de fonction. Contrairement aux mutations classiques induites par des agents physico-chimiques, la mutation est facilement repérable dans le génome, « étiquetée » par la présence du segment d'insertion au locus muté. Comme pour toute approche de mutagenèse, le paramètre essentiel est le taux de saturation de la population, c'est-à-dire la probabilité de muter chaque gène au moins une fois. Pour une population d'insertion, ce taux dépend de la taille du génome, de la taille moyenne d'un gène, du nombre moyen d'insertions par lignée, et du nombre total de lignées : pour Arabidopsis, environ 180 000 insertions aléatoires sont nécessaires pour atteindre une saturation de 95 %. Même si ce chiffre peut paraître impressionnant, il reste comparativement faible par rapport à des génomes où la densité en gènes est beaucoup plus faible que chez Arabidopsis. Le segment d'insertion porte un gène de résistance sélectionnable, et peut aussi inclure des marqueurs divers permettant par exemple d'obtenir des informations sur l'activité transcriptionnelle de la région d'insertion, par « piégeage » de promoteurs ou d'éléments régulateurs de transcription. L'élément d'insertion peut également porter un activateur de transcription qui permet le cas échéant « d'allumer » la région d'insertion au lieu de l'éteindre : on obtient alors des mutations de type gain de fonction, le plus souvent dominantes génétiquement. • Éléments transposables Deux grands types d'éléments sont utilisés pour la mutagenèse insertionnelle chez les plantes. En premier lieu, les éléments transposables : ces segments d'ADN, découverts chez le maïs dès les années 40, ont la propriété intrinsèque d'être mobiles au sein des génomes. Les rétrotransposons peuvent même constituer la plus grande partie du génome chez certaines espèces végétales. Bien qu’en général les éléments transposables soient naturellement inactifs, on peut les « réveiller » afin de les utiliser pour la mutagenèse insertionnelle. Par exemple, le rétroélément de riz Tos17 est activé par la culture in vitro, et est de nouveau inactif dans les plantes régénérées, où on peut trouver entre 5 et 30 copies nouvelles du rétroélément. En général, les éléments endogènes sont difficiles à utiliser tels quels, et on préfère utiliser soit des versions 16/03/06 14:22 Page 41 © D. BOUCHEZ 05-4 Bouchez modifiées faciles à repérer (stratégie RescueMu chez le maïs par exemple), soit introduire des transposons en provenance d'autres espèces : divers transposons du maïs (monocotylédone) ont par exemple été utilisés avec succès chez Arabidopsis (dicotylédone), comme ceux de la famille Ac/Ds, ou surtout En/Spm. Deux stratégies sont possibles : dans la première, aucun contrôle n'est exercé sur la transposition, et chaque lignée porte jusqu'à plusieurs centaines de copies de l'élément (cas du transposon Mu du maïs). Dans ce cas, il est relativement aisé de générer un très grand nombre d'insertions, et l'analyse de plusieurs allèles mutés indépendants doit théoriquement permettre de s'affranchir du « bruit de fond génétique » généré par les autres insertions. La seconde stratégie fait appel à des dispositifs génétiques sophistiqués pour limiter le nombre d'insertions. Dans ce cas, l'analyse phénotypique est facilitée, et on n'a pas forcément besoin d'un grand nombre d'allèles mutants pour fiabiliser les conclusions. De plus, beaucoup de transposons montrent une certaine « paresse » et s'insèrent préférentiellement à proximité de leur site de départ, mais là encore il est possible de mettre en place des dispositifs permettant de s'affranchir de ce problème. • ADN-T Le second élément mutagène largement utilisé chez les plantes, tout particulièrement chez Arabidopsis, est l’ADN-T d'Agrobacterium tumefaciens. Cette bactérie, qui possède la capacité unique de transférer une portion d'ADN plasmidique appelée ADN-T dans le génome des cellules végétales qu'elle infecte, est un vecteur biologique largement utilisé en transgenèse végétale. L'insertion de l’ADN-T dans le génome nucléaire est aléatoire et le nombre d'insertions naturellement limité (une à trois) par événement de transformation, ce qui en fait un système de choix pour une approche de mutagenèse par insertion. Cependant, pour atteindre un nombre d'insertions indépendantes permettant une saturation satisfaisante, il est nécessaire de disposer d'une méthode de transformation très efficace, et qui s'affranchisse si possible des étapes de culture in vitro et de régénération, toujours susceptibles d'induire des variations génétiques indésirables. Ces conditions ne sont remplies à l'heure actuelle que chez Arabidopsis : une méthode de transformation très simple, sans passage par la culture in vitro, a été mise au point dès 1987 par Kenneth Feldmann aux ÉtatsUnis (4). Au début des années 90, des chercheurs versaillais apportent des améliorations majeures à cette méthode difficile à reproduire. Cette technique de transformation d'Arabidopsis par infiltration a depuis conquis tous les laboratoires de biologie végétale. Elle Une partie de la collection de lignées d'insertion ADN-T de l'Inra de Versailles, en cours de multiplication. Chaque barquette contient une cinquantaine de plantes issues d'une lignée transgénique indépendante. Les lignées sont examinées attentivement pour la recherche d'altérations phénotypiques. De plus, l'ADN de chaque famille est prélevé et analysé pour repérer le site d'insertion de l’ADN-T. Cette information est ensuite insérée dans les bases de données internationales de génomique d'Arabidopsis. se déroule entièrement en conditions horticoles, non stériles, et permet d'obtenir facilement et rapidement des milliers de plantes transformées indépendantes (photo). Avec un tel outil, il devenait possible d'envisager une mutagenèse d'insertion à saturation. Grâce à ces travaux, de nombreuses populations ont été construites, pour un effectif global qui doit maintenant dépasser le million de lignées, largement plus que la saturation théorique du génome d'Arabidopsis. Malheureusement, cette technique de transformation « in planta » n'a pas pu être transposée à d'autres modèles végétaux. Pour d'autres espèces chez lesquelles des programmes de mutagenèse ADN-T sont mis en place (riz, Medicago), le recours à des techniques de transformation in vitro, incluant une phase de régénération, s'avère incontournable. Une fois établies, les populations d'insertion peuvent être utilisées dans le cadre de cribles génétiques classiques, comme toute population mutagénisée, avec un accès facilité au gène muté. Les populations ADN-T d'Arabidopsis ont été largement utilisées au fil du temps pour le clonage de gènes ou la recherche de nouveaux mutants. Par exemple, beaucoup des gènes impliqués dans le développement de la fleur ont été isolés par ce biais, notamment le gène agamous. Ces populations d'insertions sont également très utiles pour la génétique inverse et la recherche de mutants pour des gènes particuliers. Cela peut se faire facilement, par des méthodes basées sur l'amplification par PCR. Cependant, dans un souci d'efficacité, l'exploitation des populations repose désormais essentiellement sur des programmes d'identification systématique de la totalité des sites d'insertion au sein d'une population. Pour chaque lignée, le site d'insertion est identifié par PCR et séquençage de quelques centaines de nucléotides. La comparaison avec la séquence génomique (il faut donc qu’elle soit disponible) permet alors d'identifier la région concernée, et éventuellement le gène affecté par l'insertion. L'ensemble des informations est intégré dans des bases de données internationales. Le généticien peut facilement y sélectionner les mutations dans ses gènes favoris, et commander les lignées correspondantes dans les centres de ressources afin d'en étudier le phénotype. BIOFUTUR 265 • AVRIL 2006 41 (4) Feldmann KA, Marks MD (1987) Mol Gen Genet 208, 1-9 05-4 Bouchez 16/03/06 9:46 Page 42 Dossier Les atouts de la génomique végétale siques de transgenèse, ce qui le rend inapproprié aux techniques de mutagenèse d’insertion à grande échelle. Le principe du tilling est d’introduire au hasard des mutations dans le génome de milliers de plantes (grâce à un produit chimique mutagène) et ensuite de repérer par une approche moléculaire les plantes renfermant les mutations recherchées dans un gène d’intérêt. Principe du tilling © D.R. • Développement de plates-formes L’ADN génomique est muté par application sur les graines d’éthylméthane sulfonate (EMS), qui provoque des mutations ponctuelles au hasard. L’avantage de l’EMS par rapport aux mutations insertionnelles est que l’on a alors accès à l’analyse de gènes dans lesquels une insertion dans la séquence codante aurait provoqué un phénotype létal et donc difficile à caractériser. On peut donc identifier des mutants dont le phénotype est diversement altéré et donc plus susceptibles d’avoir un intérêt agronomique potentiel. De plus, l’EMS pouvant induire aux doses usuelles plusieurs mutations par génome, une collection de plusieurs milliers de plantes offre tout un panel de mutations différentes pour un gène étudié, et l’opportunité d’évaluer les conséquences de chacune de ces mutations au niveau de ce même gène. On peut ainsi mettre en évidence un phénotype plus ou moins marqué en fonction des mutations et constituer des séries alléliques. On utilise pour le criblage les plantes M2, issues d’autofécondations des plantes mutagénisées (M1) : les plantes M1 présentant des mutations sont hétérozygotes, donc une partie des plantes M2 (1/4 selon les lois de Mendel) sont homozygotes, avec un génome stable. L’ADN est isolé à partir de chaque famille M2*1 et réparti en pools (ce qui permet de réaliser moins de PCR que si les plantes étaient testées individuellement), chacun contenant a priori des plantes mutées et non mutées pour le gène d’intérêt. On procède ensuite à des PCR sur ces pools, en utilisant des oligonucléotides marqués par des fluorophores. Après l’étape de renaturation, deux types de molécules seront obtenues, les homoduplexes (deux brins sauvages ou deux brins mutants) et les hétéroduplexes (un brin sauvage + un brin mutant, donc avec un mésappariement). Une endonucléase reconnaissant les mésappariements*2 (1, 2) clive les hétéroduplexes uniquement, conduisant à l’apparition de deux fragments de digestion sur gel d’acrylamide (qui sépare les fragments d’ADN selon leur taille). On peut ainsi localiser le site de coupure au sein du gène d’intérêt sur la base de la longueur des fragments générés. Lorsqu’un pool contient une mutation d’intérêt, l’expérience est répétée mais uniquement au sein du pool concerné, avec à terme l’identification du plant présentant la mutation. *1 Une famille se compose de quatre plantes, pour optimiser les chances d’y trouver un mutant pour le gène considéré. *2 Même si l’endonucléase préférentiellement utilisée jusqu’à présent est CEL1 (purifiée à partir du céleri), une nouvelle enzyme plus performante, ENDO1, a récemment été purifiée et caractérisée à l’URGV d’Évry. Elle est d’ailleurs commercialisée par une start-up privée (www.serialgenetics.com). (1) Oleykowski et al. (1998) Nucleic Acid Res 26, 4597-602 (2) Till et al. (2004) Nucleic Acid Res 32, 2632-41 On compte à l’heure actuelle 370 000 insertions ADN-T cartographiées chez Arabidopsis, soit une saturation théorique de plus de 99,9 %. Cependant, plusieurs milliers de gènes prédits ne possèdent toujours pas d'insertion identifiée. Parmi ceux-ci, il est probable qu'une bonne partie représente des gènes essentiels ne pouvant être atteints par ce type de mutation qui engendre le plus souvent une perte totale d'activité, incompatible avec la viabilité des gamètes. Tilling Le tilling (targeted induced local lesions in genome, criblage de mutations induites localement dans le génome) est une technique de génétique inverse aux nombreux avantages (encadré). Même si elle a d’abord été mise en œuvre chez Arabidopsis thaliana (5, 6), elle est adaptée aux plantes cultivées. En effet, le génome des plantes cultivées est souvent de grande taille, complexe et récalcitrant aux méthodes clas42 BIOFUTUR 265 • AVRIL 2006 En exploitant la technologie du tilling, des plates-formes de criblage ont donc été mises au point pour les plantes cultivées telles que le pois, le colza et la tomate, au sein de l’URGV d’Évry, et pour le soja aux États-Unis. Le pois et le colza sont deux espèces cultivées de grande importance en France. Le colza est appelé à un grand développement pour la production de biocarburants. Le pois est un substitut direct du soja, massivement importé des États-Unis pour la nourriture du bétail (l'Europe importe 68 % de ses besoins en protéines pour l'alimentation animale). Cependant, les outils de génétique inverse basés sur la mutagenèse insertionnelle ne sont pas applicables à ces deux plantes cultivées en raison de leur génome de très grande taille (plus de 40 fois celui d’Arabidopsis thaliana pour le pois et 10 fois pour le colza) ce qui nécessiterait des collections de mutants d’insertion gigantesques pour effectuer des travaux de génétique inverse. Il était donc crucial de développer et d’exploiter le tilling pour ces deux espèces cultivées. Les gènes étudiés dans un premier temps chez le pois sont issus des programmes de recherche de gènes candidats. On s’intéresse plus particulièrement aux gènes impliqués dans le remplissage de la graine chez le pois protéagineux et à des mutants de pois à floraison tardive. Ces mutants sont recherchés chez les orthologues*4 des gènes très bien caractérisés dans l’initiation florale chez Arabidopsis thaliana, tels que ceux impliqués dans la photopériode (Constans, Gigantea…) ou dans la vernalisation * 5 comme Luminidependens, FCA ou FLC (7, 8). Pour le colza, compte tenu de sa parenté évolutive avec Arabidopsis thaliana chez qui un grand nombre de gènes a déjà été caractérisé par knock-out, on s’intéresse aux gènes présentant un intérêt agronomique potentiel. On cible notamment les gènes impliqués dans la déhiscence des siliques (9). En effet, l’ouverture des siliques chez le colza est à l’origine d’une perte de rendement annuel de 20 à 50 %. D’autres phénotypes d’intérêt, concernant par exemple la teneur en huile, en glucosinolates (10) ou en flavonoïdes, sont recherchés. La technologie du tilling peut s’appliquer à des génomes de plantes encore beaucoup plus complexes, par exemple sur des plantes polyploïdes, puisque des mutants de la production d’amidon dans les graines de blé qui sont hexaploïdes ont pu être caractérisés grâce à cette technique (11). • Une technologie pour tous les organismes Une variante du tilling a été développée pour analyser le polymorphisme allélique : l’ecotilling. Le criblage ne se fait plus sur des populations mutagénisées à l’EMS mais sur des populations naturelles de plantes. Ainsi, on a directement accès à la variation allélique naturelle au sein d’un gène. Cette technologie a été mise en œuvre chez Arabidopsis thaliana, le pois, la tomate et le blé. Elle est beaucoup moins onéreuse à mettre en 16/03/06 9:46 Page 43 œuvre que le séquençage d’allèles pour rechercher du polymorphisme. En conclusion, il est évident que cette technique peut s’appliquer à tous les organismes pour lesquels on veut analyser le polymorphisme de séquences. Elle peut donc être mise en œuvre aussi bien pour les organismes animaux (la drosophile, la souris ou encore le nématode) que pour les végétaux. Cependant, il y a de nombreux avantages à l’utiliser chez des plantes à génome plus complexe. Elle permet en effet d’améliorer un caractère agronomique sans recours systématique au génie génétique. Mutagenèse ciblée Recombinaison homologue chez Physcomitrella Malgré des années d'efforts de la part de nombreuses équipes, les tentatives de maîtrise de la recombinaison homologue pour la modification ciblée de gènes in situ n'ont toujours pas abouti chez les plantes supérieures, alors que ces approches sont très largement utilisées en génétique inverse dans d'autres systèmes biologiques, dont la souris. La balance entre recombinaisons homologue et illégitime penche largement en faveur de cette dernière chez les plantes. Par conséquent, même si des événements de recombinaison homologue peuvent être mis en évidence chez les plantes, ils restent rares. Il existe cependant à ce sujet une exception notable, la mousse Physcomitrella patens (photo). En effet, chez cette espèce, l'introduction dans des protoplastes de molécules d’ADN homologues à un locus génomique conduit majoritairement à une recombinaison ciblée au locus, parfois jusqu'à 90 % des événements de transformation (12). Cette mousse est par ailleurs un excellent modèle biologique qui, malgré sa simplicité morphologique, partage bon nombre de processus avec les plantes supérieures au niveau de sa physiologie ou de son développement. Elle constitue donc une alternative intéressante aux études sur plantes supérieures, notamment quand des analyses fines structure/fonction sont envisagées au niveau de protéines d'intérêt. © D. SCHAEFER 05-4 Bouchez pour que la probabilité de trouver un mutant dans un gène étudié soit suffisamment élevée. Par ailleurs, la mutagenèse insertionnelle n’apporte en général que des mutations correspondant à des pertes totales de fonction, impossibles à analyser du fait de la létalité qu’elles occasionnent lorsque l’on s’intéresse à des fonctions essentielles. L’utilisation de ces approches est donc limitée à des espèces modèles pour lesquelles de grandes collections de mutants existent et aux gènes pour lesquels une perte de fonction est compatible avec la survie de la plante. L’ARN interférence constitue depuis peu une alternative à ces méthodes de mutagenèse de l’ADN génomique : il s’agit d’inactiver l’expression d’un gène par interférence au niveau des ARNm et non plus au niveau de la séquence codante dans l’ADN génomique. Cette méthode tire profit de la découverte récente de la capacité des cellules eucaryotes à reconnaître les ARN double brin et à dégrader de façon spécifique les ARNm ayant la même séquence que ces doubles brins (figure 2). Les mécanismes moléculaires sous-jacents à ce phénomène sont extrêmement complexes et font l’objet de nombreuses recherches actuellement. Découverte à l’origine comme un mécanisme de défense contre les virus à ARN, la dégradation ciblée des transcrits dans les cellules eucaryotes est maintenant considérée comme un phénomène très général de régulation de l’expression des gènes nucléaires (13). Chez les animaux, des oligonucléotides sont généralement injectés dans les cellules afin de provoquer le phénomène d’extinction ciblée par ARN interférence. Chez les plantes, des transgènes permettant l’expression d’ARN ayant une structure en « épingle à cheveux » sont utilisés afin d’éteindre de façon ciblée l’expression des gènes. Cette technologie a l’avantage d’être ciblée mais nécessite la construction d’un vecteur de transformation spécifique pour chaque gène. Dans le cadre d’une collaboration entre six laboratoires européens financée par La mousse Physcomitrella patens en culture in vitro. C'est la seule espèce de plante pour laquelle la recombinaison homologue est maîtrisée au niveau expérimental. Le séquençage de son génome est quasiment terminé. *4 Gènes d'espèces différentes dont les séquences sont homologues. Ils dérivent d'un même gène ancestral et ont divergé au cours de l’évolution. Ils peuvent avoir la même fonction, mais ce n’est pas systématique. *5 Technique permettant de transformer un blé d’automne en blé de printemps à rendement élevé et plus vite mature. (5) McCallum CM et al. (2000) Nature Biotechnology 18, 455-7 (6) McCallum CM et al. (2000) Plant Physiology 123, 439-42 (7) Levy YY, Dean C (1998) The Plant cell 10, 1973-89 (8) Blasquez M (2000) J Cell Sci 113, 3547-8 (9) Liljegren SJ et al. (2000) Nature 404, 766-70 (10) Burel C et al. (2000) British Journal of Nutrition 83, 653-64 (11) Slade AJ et al. (2004) Nature Biotechnology 23, 75-81 (12) Schaefer DG, Zryd JP (1997) Plant J 11, 1195-206 (13) Meins F et al. (2005) Annu Rev Cell Dev Biol 21, 297-318 Interférence ARN L’inactivation d’un gène pour rechercher les conséquences phénotypiques entraînées par cette perte de fonction a été réalisée jusque récemment par mutagenèse de l’ADN génomique. Comme expliqué précédemment, cette mutagenèse étant aléatoire, il est nécessaire de fabriquer de très grandes collections de mutants © D.R. Figure 2 Principe de la dégradation ciblée des ARNm par « ARN interférence » Un transgène est exprimé dans la plante afin de produire un ARN en « épingle à cheveux » dont la séquence est spécifique du gène ciblé. La machinerie cellulaire reconnaît ces structures d’ARN, ce qui va conduire à la formation de petits ARN puis à la dégradation ciblée des ARNm correspondant au gène cible. BIOFUTUR 265 • AVRIL 2006 43 05-4 Bouchez 16/03/06 9:46 Page 44 © H. NORTH Dossier Les atouts de la génomique végétale Figure 3 Crible de mutants d'Arabidopsis par thermographie infrarouge Ce type de capteur d'imagerie, non destructif pour les plantes, permet de déterminer de façon précise la température de surface des feuilles. Ici, on observe une différence de température entre la plante normale (à gauche) et un mutant affecté dans la synthèse d'une hormone végétale impliquée dans la fermeture stomatique (l'acide abscissique). Le mutant, incapable de réguler correctement la fermeture des stomates, transpire plus et a une température de surface plus faible que le sauvage. La déficience entraîne également une réduction de croissance, visible ici. *6 Chacune de ces sondes est spécifique d’un gène d’Arabidopsis thaliana. Les sondes CATMA présentent l’avantage considérable de disposer de l’intégralité des gènes de cette espèce sur une lame (puce, voir article suivant). (14) Koroleva OA et al. (2005) Plant J 41, 162-74 la Commission européenne (projet Agrikola), des techniques de clonage par recombinaison à haut débit sont actuellement utilisées afin de cloner les sondes CATMA*6 dans des vecteurs de type ARNi. Ce projet a pour but de créer un jeu de 25 000 à 30 000 plasmides (un pour chaque gène d'Arabidopsis) afin d'éteindre des gènes par l'approche ARNi. Quatre mille de ces plasmides ont été utilisés pour obtenir des transformants d'Arabidopsis dans lesquels les gènes correspondants ont été spécifiquement éteints. Ces plasmides, ainsi que les lignées transformées, constituent des ressources très importantes pour l'analyse de la fonction des gènes d'Arabidopsis, et par extrapolation, celle des gènes homologues chez d'autres organismes, y compris chez les plantes cultivées de valeur agronomique (14). Analyse des phénotypes Si on se place du point de vue du biologiste d'Arabidopsis, espèce pour laquelle l'ensemble des outils est disponible, on a vu que quel que soit le gène ou la famille de gène considérés, l'expérimentateur dispose d'une large palette de ressources lui permettant d'obtenir des variants ou des mutants dans ses gènes favoris, avec souvent même la possibilité de disposer de plusieurs allèles. Cependant, une des surprises issues des premiers résultats de génétique inverse chez Arabidopsis fut que la plupart des mutations isolées n'avaient pas d'effet majeur sur la croissance et la morphologie des plantes. En réalité, les nombreux cribles réalisés auparavant avaient déjà permis d'identifier l'essentiel des quelques centaines de mutations morphologiques facilement repérables. Pour les autres, l'absence d'altération visible pouvait être reliée à divers phénomènes : compensation physiologique, redondance génétique entre gènes d'une même famille, ou encore phénotypes détectables dans des conditions d'environnement ou d'observation particulières. 44 BIOFUTUR 265 • AVRIL 2006 Dans une optique de génomique fonctionnelle, la détection de phénotypes informatifs est donc un enjeu crucial qui nécessite des efforts spécifiques : d'abord par un contrôle très strict des conditions de culture et d'environnement dans lesquelles les plantes sont placées et comparées entre elles. Il faut d'autre part pouvoir étudier des différences de réponses parfois subtiles, en faisant varier différents facteurs de l'environnement biologique ou physico-chimique : température, humidité de l'air ou du sol, composition gazeuse de l'atmosphère, alimentation minérale, intensité et qualité de lumière reçue, pathogènes viraux ou microbiens, compétition entre plantes, etc. : la liste est longue ! Pour des plantes de petite taille comme Arabidopsis, où il est souvent question d'effectifs importants, il est nécessaire de déployer des moyens de culture et des solutions de robotique sophistiqués. Outre un contrôle fin sur les conditions de culture et les niveaux de contraintes dans lesquelles les plantes sont testées, il importe de disposer d'une batterie d'appareils de mesure, qui permetttent d'acquérir de façon automatique et non destructive des indicateurs fiables et quantitatifs du comportement des plantes. Des capteurs d'imagerie et de fluorescence reliés à des systèmes d'analyse d'image (figure 3) permettent d'ores et déjà d'obtenir des paramètres essentiels liés par exemple à la croissance et au développement, à l'activité métabolique et photosynthétique, à la réponse à des stress. Génétique et génomique La génomique a apporté à la génétique des outils particulièrement puissants d'analyse des génomes et de leur fonctionnement. Elle a permis ces dernières années un renouvellement majeur et un enrichissement de toutes les branches de la discipline : génétique moléculaire et cellulaire, génétique classique et quantitative, génétique évolutive et des populations… De leur côté, les approches de génétique, par définition, explorent les relations complexes entre génome, environnement et phénotype. Elles permettent d'aborder cette relation à tous les niveaux d'organisation du vivant, aussi bien à l'échelle de la molécule qu’à celle de la cellule, de l'organe, etc., jusqu'aux populations. La génétique constitue ainsi un formidable outil d'intégration des connaissances en biologie. En ce qui concerne les plantes, la palette des outils et des ressources disponibles, par exemple pour la génétique inverse, devrait permettre d'obtenir dans les dix prochaines années des informations fonctionnelles sur la majorité des gènes et des protéines présents dans un génome typique comme celui d'Arabidopsis. Dans le même temps, on peut attendre de grands progrès des connaissances sur l'architecture génétique et moléculaire de caractères complexes, les réseaux de signalisation et de régulation, le développement, la physiologie et le métabolisme, les réponses aux contraintes de l'environnement. La mise en relation de ces informations permettra de proposer des modèles intégrés des grandes fonctions des plantes en relation avec leur environnement, à partir desquels il sera possible de fonder de nouvelles stratégies d'amélioration des pantes cultivées. G