05-4 Bouchez - INRA Versailles

Transcription

05-4 Bouchez - INRA Versailles
05-4 Bouchez
16/03/06
9:46
Page 38
Dossier Les atouts de la génomique végétale
Nouvelles approches génétiques
La génomique s'intéresse aux grands principes qui régissent la structure
globale et l'évolution des génomes, mais aussi au fonctionnement
coordonné des milliers – voire des dizaines de milliers chez les plantes
supérieures – de gènes et de protéines qu'ils spécifient. Au-delà des
approches de génomique structurale (cartographie physique et
génétique, inventaire de gènes, séquençage…), les approches de
génomique fonctionnelle ont investi la plupart des champs de la
biologie végétale actuelle.
* Station de génétique
et amélioration des plantes,
Institut Jean-Pierre Bourgin
Inra, Centre de Versailles,
78026 Versailles Cedex
[email protected]
** Unité de recherche
en génomique végétale (URGV)
UMR Inra 1165 - CNRS 8114 Université d'Évry
2 rue Gaston Crémieux,
CP 5708, 91057 Évry Cedex
*** [email protected]
**** [email protected]
***** [email protected]
David Bouchez*, Abdelhafid Bendahmane**,***, Claire Lurin**,****, Bénédicte Sturbois**,*****
L
a génomique fonctionnelle, discipline récente qui
doit beaucoup aux progrès de l'instrumentation,
vise à une compréhension fine des fonctions des
gènes et des protéines impliqués dans les processus biologiques à l'œuvre dans les organismes
vivants. Elle repose sur la mise en œuvre de méthodes
à haut débit (les fameux « -omiques ») et de niveaux
d’analyse variés (du gène à la population).
Le séquençage de génomes complets, comme celui
d'Arabidopsis thaliana, a permis de mesurer l'ampleur
de la tâche : des informations fonctionnelles fiables
ne sont disponibles que pour à peine un cinquième des
26 000 gènes repérés. Pour les plantes comme pour la
plupart des organismes supérieurs pour lesquels on
dispose d'informations génomiques détaillées, l'étude
de la fonction des gènes et des protéines fait appel à
des approches de génétique (mutagenèse ciblée ou aléatoire, analyse des phénotypes résultants), mais aussi
de transcriptomique (régulation de la transcription),
de biochimie des protéines et d'imagerie cellulaire (voir
article suivant).
Un grand volet des approches de génomique fonctionnelle, en particulier celles menées sur A. thaliana
et les modèles génériques, concerne en effet la génétique. Jusqu’aux années 90, il était particulièrement
difficile d'isoler un gène repéré sur la base de sa localisation sur une carte génétique. Toutefois les approches
de clonage positionnel disponibles aujourd’hui ont fait
de grands progrès par rapport à cette époque. Elles
demeurent, encore à l'heure actuelle, délicates à mettre
en œuvre, mais sont théoriquement applicables dans
n'importe quelle espèce où il est possible de réaliser de
la cartographie génétique ; ces techniques sont d'un
38 BIOFUTUR 265 • AVRIL 2006
intérêt considérable pour l'identification de gènes
importants chez les espèces végétales, en particulier
chez les plantes cultivées où elles constituent souvent
le seul moyen d'identification disponible.
Chez les plantes supérieures comme le maïs, le muflier
ou Arabidopsis, la mise au point de techniques de mutagenèse d’insertion a permis dès le début des années 90
de proposer une alternative aux approches de clonage
positionnel. En raison de l’absence de technique de
ciblage génique par recombinaison efficace chez les
plantes supérieures, les collections de mutants d’insertion sont également largement exploitées en génomique fonctionnelle pour l'identification de fonctions
géniques. On parle alors de génétique « inverse » :
contrairement aux approches classiques dans lesquelles,
à partir d'une fonction identifiée sur la base d'un crible
phénotypique, on cherche à arriver aux gènes et aux
protéines impliquées, il s'agit, à partir de la connaissance du génome et de l'identification des gènes, d'isoler des mutants et d'en analyser les modifications.
Plus récemment, les approches de crible de populations
de mutants classiques (voir tilling) ou l'utilisation d'approches basées sur l'interférence ARN (ARNi) ont permis de diversifier la palette des outils de mutagenèse
et d'élargir le spectre des mutations utilisables.
Clonage positionnel
de gènes d’intérêt agronomique
Parmi les caractères observables sur les plantes, certains ont un impact important en agriculture (précocité, résistance à un pathogène…). On parle alors de
16/03/06
9:46
Page 39
chez les plantes
caractères agronomiques. Un caractère agronomique
peut être déterminé entièrement par un seul locus, communément appelé « gène majeur » (déterminisme mendélien), ou par plusieurs loci à effet partiel sur la variation du caractère, on parle alors de QTL*1. Des
marqueurs génétiquement liés à de tels loci permettent
de sélectionner, parmi un grand nombre de plantes, les
individus les plus performants. Ils peuvent ainsi être
utilisés pour sélectionner un nouveau génotype intéressant par croisements successifs.
L’identification précise des gènes en jeu et des polymorphismes responsables des variations observées est
l’étape ultime qui permet de connaître les bases moléculaires de ces caractères agronomiques, d’analyser
leur variabilité dans les populations naturelles et de les
intégrer à des programmes de création variétale.
Identifier la séquence d’un gène majeur ou d’un QTL
relève en pratique de deux démarches de clonage différentes. L’identification moléculaire rapide d’un gène
majeur ou parfois d’un QTL peut reposer sur les techniques d’étiquetage des gènes, lorsqu’elles sont accessibles dans l’espèce étudiée. En l’absence de ce système
d’étiquetage, la stratégie la plus couramment utilisée
est le clonage positionnel (1).
Ce type de clonage repose sur l’identification de marqueurs ADN et d’événements de recombinaison dans
la région du locus cible. Les marqueurs sont positionnés
avec précision par rapport aux événements de recombinaison pour développer une carte génétique de haute
résolution. La seconde étape consiste à construire une
carte physique de la région, dans laquelle les distances
génétiques*2 sont converties en nombre de paires de
bases. Quand un fragment d’ADN cloné recouvrant
l’intervalle entre les marqueurs les plus proches a été
identifié, le gène d’intérêt peut être localisé par sousclonage et recherche des séquences codantes dans les
sous-clones. La validation fonctionnelle est réalisée par
cartographie fine du gène dans la zone chromosomique
étudiée (figure 1).
Cartographie génétique fine
La cartographie fine consiste à rechercher et ordonner des marqueurs localisés dans un très petit intervalle autour du locus d’intérêt. La saturation de la
région cible en marqueurs et en événements de
recombinaison constitue un paramètre clef de l’exploitation de cette stratégie et peut considérablement
accélérer le clonage de gènes. Les techniques de marquage permettant de cribler un grand nombre de marqueurs simultanément, comme les AFLP*3, sont particulièrement utiles à cette étape (2).
© D.R.
s
05-4 Bouchez
Figure 1 Étapes du clonage positionnel
Localisation primaire de la région d'intérêt par analyse de liaison (quels marqueurs
co-ségrègent avec le phénotype ?)
Assemblage des clones d'ADN génomique (BAC) chevauchants (formation de contigs)
Inventaire des gènes présents
Étude des polymorphismes
Cartographie physique
La construction d’une banque d’ADN génomique est
une étape essentielle pour l’établissement de la carte
physique. Le système BAC (3) est le plus couramment
utilisé pour ce type d’approche. La taille des inserts
peut y atteindre 350 kb.
La banque BAC est criblée avec les marqueurs les plus
proches du gène d’intérêt. On établit ensuite une carte
locale des clones par une série de digestions enzymatiques qui permettent de définir les fragments communs à plusieurs clones et de les ordonner les uns par
rapport aux autres. Un ensemble de clones ordonnés constitue un contig.
La réussite de la construction de la carte physique
dépend de la qualité de la carte génétique fine du locus
cible. Les extrémités des BAC sont séquencées et de
nouveaux marqueurs sont définis et utilisés pour ancrer
la carte génétique à la carte physique et pour identifier
le clone BAC supposé porter le gène d'intérêt, ou encore
pour allonger la taille des contigs.
Quand le clone BAC qui recouvre l’intervalle entre
les marqueurs les plus proches a été identifié, le gène
cible peut être identifié par séquençage et cartographie
des gènes prédits relative aux événements de recombinaison. Le polymorphisme des portions codantes
identifiées est étudié, afin de rechercher d’éventuelles
BIOFUTUR 265 • AVRIL 2006 39
*1 Quantitative trait locus
*2 La distance génétique
reflète la fréquence des
événements de recombinaison
sur la portion d’ADN
considérée. Elle est exprimée
en centimorgans, 1cM = 1 %
de recombinaison.
*3 Amplification fragment length
polymorphism, marqueurs du
polymorphisme de longueur
des fragments d'amplification.
(1) Rommens JM et al. (1989)
Science 245, 1059-65
(2) Vos P et al. (1995)
Nucl Acids Res 23, 4407-14
(3) Shizuya H et al. (1992)
Proc Natl Acad Sci USA 89,
8794-7
05-4 Bouchez
16/03/06
9:46
Page 40
Dossier Les atouts de la génomique végétale
Mutagenèse au hasard
Clonage positionnel du gène Rfo chez le radis
La stérilité mâle cytoplasmique Ogu-INRA, caractérisée chez le radis (Raphanus sativus), est
utilisée depuis plusieurs années pour la production de semences hybrides chez les brassicas
(crucifères) cultivées. Son utilisation chez le colza cause de nombreux problèmes dus à la maîtrise imparfaite du système de restauration. En effet, le gène de restauration Rfo a été introduit
dans le colza par croisements interspécifiques. Les lignées de colza restauratrices actuellement disponibles portent une introgression*1 de génome de radis de grande taille ayant remplacé environ 50 cM du génome de colza (1). Ces manipulations (introgression et/ou délétion)
s’accompagnant de caractères défavorables (fort taux en glucosinolates, mauvaises performances agronomiques, faible fertilité femelle), des efforts intensifs de sélection ont été menés
au cours des dernières années.
Mutagenèse par insertion
Utilisé chez la souris depuis plusieurs années, le ciblage
génique sur cellules souches embryonnaires n'a permis
d'obtenir des mutants que pour environ 10 % des gènes
de cette espèce. On découvre actuellement les avantages de la mutagenèse insertionnelle pour la génétique
inverse et les cribles génétiques à grande échelle.
Chez les plantes supérieures, la mutagenèse d'insertion
a été largement utilisée depuis la fin des années 80 pour
l'obtention de mutants, tout d'abord dans le cadre
de cribles phénotypiques, puis à des fins d'analyse fonctionnelle et de génétique inverse.
© D.R.
• Un principe relativement simple
Carte physique du locus Rfo chez le radis. Le clone BAC B64 portant le gène Rfo a été
sequencé et annoté.
© D.R.
Le clonage du gène Rfo a été réalisé chez le radis en collaboration avec Régine Delourme,
Michel Renard (Inra de Rennes) et Françoise Budar (Inra de Versailles) en utilisant la plateforme de clonage positionnel d’Évry (figures et photos). À l’issue de ce travail, il a été démontré que le gène Rfo code une protéine contenant des motifs PPR (pentatricopeptide repeat) (2).
Ce gène appartient à une très grande famille chez les plantes supérieures, avec environ 450
membres répertoriés chez Arabidopsis thaliana. La plupart des protéines codées par ces gènes
seraient adressées aux organites cellulaires afin de contrôler l’expression des gènes mitochondriaux ou plastidiques.
Test de complémentation du phénotype mâle stérile. L’expression transgénique de la
PPR B chez le radis mâle stérile (à droite) restaure la production de pollen. À gauche,
fleur non-transgénique mâle stérile.
*1 Incorporation de gènes
d’une espèce au sein du
génome d’une autre espèce.
(1) Delourme R et al. (1998)
Theor Appl Genet 97, 129-34
(2) Desloire S et al. (2003)
EMBO report 4, 588-94
relations entre polymorphisme et variation du caractère. Des constructions plasmidiques, porteuses de ces
portions, sont produites et utilisées pour transformer des plantes afin de valider leur rôle dans la variation du caractère par complémentation.
Le clonage d'un QTL est plus difficile que celui d'un
gène majeur car il n'influence que partiellement la variation du caractère. Une « mendelisation » du caractère
est nécessaire avant l’établissement du clonage positionnel. Cette opération consiste à comparer deux génotypes identiques sauf pour la zone chromosomique étudiée, porteuse du QTL à identifier.
40 BIOFUTUR 265 • AVRIL 2006
On utilise comme agent mutagène un segment d'ADN
de séquence connue, capable de s'insérer de manière
aléatoire dans le génome. L'insertion de ce segment au
niveau d'un gène provoque, dans la plupart des cas,
une perte de fonction. Contrairement aux mutations
classiques induites par des agents physico-chimiques,
la mutation est facilement repérable dans le génome,
« étiquetée » par la présence du segment d'insertion
au locus muté. Comme pour toute approche de mutagenèse, le paramètre essentiel est le taux de saturation
de la population, c'est-à-dire la probabilité de muter
chaque gène au moins une fois. Pour une population
d'insertion, ce taux dépend de la taille du génome,
de la taille moyenne d'un gène, du nombre moyen d'insertions par lignée, et du nombre total de lignées : pour
Arabidopsis, environ 180 000 insertions aléatoires sont
nécessaires pour atteindre une saturation de 95 %.
Même si ce chiffre peut paraître impressionnant, il reste
comparativement faible par rapport à des génomes où
la densité en gènes est beaucoup plus faible que chez
Arabidopsis.
Le segment d'insertion porte un gène de résistance sélectionnable, et peut aussi inclure des marqueurs divers
permettant par exemple d'obtenir des informations sur
l'activité transcriptionnelle de la région d'insertion,
par « piégeage » de promoteurs ou d'éléments régulateurs de transcription. L'élément d'insertion peut également porter un activateur de transcription qui permet le cas échéant « d'allumer » la région d'insertion
au lieu de l'éteindre : on obtient alors des mutations
de type gain de fonction, le plus souvent dominantes
génétiquement.
• Éléments transposables
Deux grands types d'éléments sont utilisés pour la
mutagenèse insertionnelle chez les plantes. En premier lieu, les éléments transposables : ces segments
d'ADN, découverts chez le maïs dès les années 40,
ont la propriété intrinsèque d'être mobiles au sein des
génomes. Les rétrotransposons peuvent même constituer la plus grande partie du génome chez certaines
espèces végétales. Bien qu’en général les éléments
transposables soient naturellement inactifs, on peut
les « réveiller » afin de les utiliser pour la mutagenèse
insertionnelle. Par exemple, le rétroélément de riz
Tos17 est activé par la culture in vitro, et est de nouveau inactif dans les plantes régénérées, où on peut
trouver entre 5 et 30 copies nouvelles du rétroélément.
En général, les éléments endogènes sont difficiles à utiliser tels quels, et on préfère utiliser soit des versions
16/03/06
14:22
Page 41
© D. BOUCHEZ
05-4 Bouchez
modifiées faciles à repérer (stratégie RescueMu chez le
maïs par exemple), soit introduire des transposons en
provenance d'autres espèces : divers transposons du
maïs (monocotylédone) ont par exemple été utilisés
avec succès chez Arabidopsis (dicotylédone), comme
ceux de la famille Ac/Ds, ou surtout En/Spm.
Deux stratégies sont possibles : dans la première, aucun
contrôle n'est exercé sur la transposition, et chaque
lignée porte jusqu'à plusieurs centaines de copies de
l'élément (cas du transposon Mu du maïs). Dans ce
cas, il est relativement aisé de générer un très grand
nombre d'insertions, et l'analyse de plusieurs allèles
mutés indépendants doit théoriquement permettre
de s'affranchir du « bruit de fond génétique » généré
par les autres insertions. La seconde stratégie fait appel
à des dispositifs génétiques sophistiqués pour limiter
le nombre d'insertions. Dans ce cas, l'analyse phénotypique est facilitée, et on n'a pas forcément besoin
d'un grand nombre d'allèles mutants pour fiabiliser
les conclusions. De plus, beaucoup de transposons
montrent une certaine « paresse » et s'insèrent préférentiellement à proximité de leur site de départ, mais
là encore il est possible de mettre en place des dispositifs permettant de s'affranchir de ce problème.
• ADN-T
Le second élément mutagène largement utilisé chez les
plantes, tout particulièrement chez Arabidopsis, est
l’ADN-T d'Agrobacterium tumefaciens. Cette bactérie, qui possède la capacité unique de transférer une
portion d'ADN plasmidique appelée ADN-T dans le
génome des cellules végétales qu'elle infecte, est un vecteur biologique largement utilisé en transgenèse végétale. L'insertion de l’ADN-T dans le génome nucléaire
est aléatoire et le nombre d'insertions naturellement
limité (une à trois) par événement de transformation,
ce qui en fait un système de choix pour une approche
de mutagenèse par insertion. Cependant, pour atteindre
un nombre d'insertions indépendantes permettant une
saturation satisfaisante, il est nécessaire de disposer
d'une méthode de transformation très efficace, et qui
s'affranchisse si possible des étapes de culture in vitro
et de régénération, toujours susceptibles d'induire des
variations génétiques indésirables.
Ces conditions ne sont remplies à l'heure actuelle que
chez Arabidopsis : une méthode de transformation très
simple, sans passage par la culture in vitro, a été mise
au point dès 1987 par Kenneth Feldmann aux ÉtatsUnis (4). Au début des années 90, des chercheurs versaillais apportent des améliorations majeures à cette
méthode difficile à reproduire. Cette technique de transformation d'Arabidopsis par infiltration a depuis
conquis tous les laboratoires de biologie végétale. Elle
Une partie de la collection de lignées d'insertion ADN-T de
l'Inra de Versailles, en cours de multiplication. Chaque barquette contient une cinquantaine de plantes issues d'une lignée
transgénique indépendante. Les lignées sont examinées attentivement pour la recherche d'altérations phénotypiques.
De plus, l'ADN de chaque famille est prélevé et analysé pour
repérer le site d'insertion de l’ADN-T. Cette information est
ensuite insérée dans les bases de données internationales
de génomique d'Arabidopsis.
se déroule entièrement en conditions horticoles, non
stériles, et permet d'obtenir facilement et rapidement
des milliers de plantes transformées indépendantes
(photo). Avec un tel outil, il devenait possible d'envisager une mutagenèse d'insertion à saturation. Grâce
à ces travaux, de nombreuses populations ont été
construites, pour un effectif global qui doit maintenant
dépasser le million de lignées, largement plus que la
saturation théorique du génome d'Arabidopsis.
Malheureusement, cette technique de transformation
« in planta » n'a pas pu être transposée à d'autres
modèles végétaux. Pour d'autres espèces chez lesquelles
des programmes de mutagenèse ADN-T sont mis en
place (riz, Medicago), le recours à des techniques de
transformation in vitro, incluant une phase de régénération, s'avère incontournable.
Une fois établies, les populations d'insertion peuvent
être utilisées dans le cadre de cribles génétiques classiques, comme toute population mutagénisée, avec un
accès facilité au gène muté. Les populations ADN-T
d'Arabidopsis ont été largement utilisées au fil du temps
pour le clonage de gènes ou la recherche de nouveaux
mutants. Par exemple, beaucoup des gènes impliqués
dans le développement de la fleur ont été isolés par ce
biais, notamment le gène agamous.
Ces populations d'insertions sont également très utiles
pour la génétique inverse et la recherche de mutants pour
des gènes particuliers. Cela peut se faire facilement, par
des méthodes basées sur l'amplification par PCR.
Cependant, dans un souci d'efficacité, l'exploitation des
populations repose désormais essentiellement sur des
programmes d'identification systématique de la totalité
des sites d'insertion au sein d'une population. Pour
chaque lignée, le site d'insertion est identifié par PCR et
séquençage de quelques centaines de nucléotides. La
comparaison avec la séquence génomique (il faut donc
qu’elle soit disponible) permet alors d'identifier la région
concernée, et éventuellement le gène affecté par l'insertion. L'ensemble des informations est intégré dans
des bases de données internationales. Le généticien peut
facilement y sélectionner les mutations dans ses gènes
favoris, et commander les lignées correspondantes dans
les centres de ressources afin d'en étudier le phénotype.
BIOFUTUR 265 • AVRIL 2006 41
(4) Feldmann KA, Marks MD
(1987) Mol Gen Genet 208, 1-9
05-4 Bouchez
16/03/06
9:46
Page 42
Dossier Les atouts de la génomique végétale
siques de transgenèse, ce qui le rend inapproprié aux
techniques de mutagenèse d’insertion à grande échelle.
Le principe du tilling est d’introduire au hasard des
mutations dans le génome de milliers de plantes (grâce
à un produit chimique mutagène) et ensuite de repérer
par une approche moléculaire les plantes renfermant
les mutations recherchées dans un gène d’intérêt.
Principe du tilling
© D.R.
• Développement de plates-formes
L’ADN génomique est muté par application sur les graines d’éthylméthane sulfonate (EMS), qui
provoque des mutations ponctuelles au hasard. L’avantage de l’EMS par rapport aux mutations
insertionnelles est que l’on a alors accès à l’analyse de gènes dans lesquels une insertion dans la
séquence codante aurait provoqué un phénotype létal et donc difficile à caractériser. On peut donc
identifier des mutants dont le phénotype est diversement altéré et donc plus susceptibles d’avoir
un intérêt agronomique potentiel. De plus, l’EMS pouvant induire aux doses usuelles plusieurs
mutations par génome, une collection de plusieurs milliers de plantes offre tout un panel de mutations différentes pour un gène étudié, et l’opportunité d’évaluer les conséquences de chacune de
ces mutations au niveau de ce même gène. On peut ainsi mettre en évidence un phénotype plus
ou moins marqué en fonction des mutations et constituer des séries alléliques.
On utilise pour le criblage les plantes M2, issues d’autofécondations des plantes mutagénisées
(M1) : les plantes M1 présentant des mutations sont hétérozygotes, donc une partie des
plantes M2 (1/4 selon les lois de Mendel) sont homozygotes, avec un génome stable. L’ADN
est isolé à partir de chaque famille M2*1 et réparti en pools (ce qui permet de réaliser moins
de PCR que si les plantes étaient testées individuellement), chacun contenant a priori des
plantes mutées et non mutées pour le gène d’intérêt.
On procède ensuite à des PCR sur ces pools, en utilisant des oligonucléotides marqués par des
fluorophores. Après l’étape de renaturation, deux types de molécules seront obtenues, les
homoduplexes (deux brins sauvages ou deux brins mutants) et les hétéroduplexes (un brin
sauvage + un brin mutant, donc avec un mésappariement). Une endonucléase reconnaissant
les mésappariements*2 (1, 2) clive les hétéroduplexes uniquement, conduisant à l’apparition de
deux fragments de digestion sur gel d’acrylamide (qui sépare les fragments d’ADN selon leur
taille). On peut ainsi localiser le site de coupure au sein du gène d’intérêt sur la base de la longueur des fragments générés.
Lorsqu’un pool contient une mutation d’intérêt, l’expérience est répétée mais uniquement au
sein du pool concerné, avec à terme l’identification du plant présentant la mutation.
*1 Une famille se compose de
quatre plantes, pour optimiser
les chances d’y trouver un
mutant pour le gène considéré.
*2 Même si l’endonucléase
préférentiellement utilisée
jusqu’à présent est CEL1
(purifiée à partir du céleri),
une nouvelle enzyme
plus performante, ENDO1,
a récemment été purifiée
et caractérisée à l’URGV d’Évry.
Elle est d’ailleurs commercialisée par une start-up privée
(www.serialgenetics.com).
(1) Oleykowski et al. (1998)
Nucleic Acid Res 26,
4597-602
(2) Till et al. (2004)
Nucleic Acid Res 32, 2632-41
On compte à l’heure actuelle 370 000 insertions ADN-T
cartographiées chez Arabidopsis, soit une saturation
théorique de plus de 99,9 %. Cependant, plusieurs milliers de gènes prédits ne possèdent toujours pas d'insertion identifiée. Parmi ceux-ci, il est probable qu'une
bonne partie représente des gènes essentiels ne pouvant être atteints par ce type de mutation qui engendre
le plus souvent une perte totale d'activité, incompatible
avec la viabilité des gamètes.
Tilling
Le tilling (targeted induced local lesions in genome,
criblage de mutations induites localement dans le
génome) est une technique de génétique inverse aux
nombreux avantages (encadré). Même si elle a d’abord
été mise en œuvre chez Arabidopsis thaliana (5, 6),
elle est adaptée aux plantes cultivées. En effet, le
génome des plantes cultivées est souvent de grande
taille, complexe et récalcitrant aux méthodes clas42 BIOFUTUR 265 • AVRIL 2006
En exploitant la technologie du tilling, des plates-formes
de criblage ont donc été mises au point pour les plantes
cultivées telles que le pois, le colza et la tomate, au sein
de l’URGV d’Évry, et pour le soja aux États-Unis. Le
pois et le colza sont deux espèces cultivées de grande
importance en France. Le colza est appelé à un grand
développement pour la production de biocarburants.
Le pois est un substitut direct du soja, massivement
importé des États-Unis pour la nourriture du bétail
(l'Europe importe 68 % de ses besoins en protéines
pour l'alimentation animale).
Cependant, les outils de génétique inverse basés sur la
mutagenèse insertionnelle ne sont pas applicables à ces
deux plantes cultivées en raison de leur génome de très
grande taille (plus de 40 fois celui d’Arabidopsis thaliana
pour le pois et 10 fois pour le colza) ce qui nécessiterait des collections de mutants d’insertion gigantesques
pour effectuer des travaux de génétique inverse. Il était
donc crucial de développer et d’exploiter le tilling pour
ces deux espèces cultivées.
Les gènes étudiés dans un premier temps chez le pois
sont issus des programmes de recherche de gènes candidats. On s’intéresse plus particulièrement aux gènes
impliqués dans le remplissage de la graine chez le
pois protéagineux et à des mutants de pois à floraison tardive. Ces mutants sont recherchés chez les
orthologues*4 des gènes très bien caractérisés dans
l’initiation florale chez Arabidopsis thaliana, tels que
ceux impliqués dans la photopériode (Constans,
Gigantea…) ou dans la vernalisation * 5 comme
Luminidependens, FCA ou FLC (7, 8).
Pour le colza, compte tenu de sa parenté évolutive
avec Arabidopsis thaliana chez qui un grand nombre
de gènes a déjà été caractérisé par knock-out, on s’intéresse aux gènes présentant un intérêt agronomique
potentiel. On cible notamment les gènes impliqués
dans la déhiscence des siliques (9). En effet, l’ouverture des siliques chez le colza est à l’origine d’une perte
de rendement annuel de 20 à 50 %. D’autres phénotypes d’intérêt, concernant par exemple la teneur
en huile, en glucosinolates (10) ou en flavonoïdes, sont
recherchés. La technologie du tilling peut s’appliquer
à des génomes de plantes encore beaucoup plus complexes, par exemple sur des plantes polyploïdes,
puisque des mutants de la production d’amidon dans
les graines de blé qui sont hexaploïdes ont pu être
caractérisés grâce à cette technique (11).
• Une technologie pour tous les organismes
Une variante du tilling a été développée pour analyser
le polymorphisme allélique : l’ecotilling. Le criblage
ne se fait plus sur des populations mutagénisées à l’EMS
mais sur des populations naturelles de plantes. Ainsi,
on a directement accès à la variation allélique naturelle au sein d’un gène. Cette technologie a été mise en
œuvre chez Arabidopsis thaliana, le pois, la tomate et
le blé. Elle est beaucoup moins onéreuse à mettre en
16/03/06
9:46
Page 43
œuvre que le séquençage
d’allèles pour rechercher
du polymorphisme.
En conclusion, il est
évident que cette technique peut s’appliquer
à tous les organismes
pour lesquels on veut
analyser le polymorphisme de séquences. Elle
peut donc être mise en
œuvre aussi bien pour les
organismes animaux (la drosophile, la souris ou encore le nématode) que pour les végétaux.
Cependant, il y a de nombreux avantages à
l’utiliser chez des plantes à génome plus complexe. Elle
permet en effet d’améliorer un caractère agronomique
sans recours systématique au génie génétique.
Mutagenèse ciblée
Recombinaison homologue chez Physcomitrella
Malgré des années d'efforts de la part de nombreuses
équipes, les tentatives de maîtrise de la recombinaison
homologue pour la modification ciblée de gènes in situ
n'ont toujours pas abouti chez les plantes supérieures,
alors que ces approches sont très largement utilisées
en génétique inverse dans d'autres systèmes biologiques,
dont la souris. La balance entre recombinaisons homologue et illégitime penche largement en faveur de cette
dernière chez les plantes. Par conséquent, même si des
événements de recombinaison homologue peuvent être
mis en évidence chez les plantes, ils restent rares.
Il existe cependant à ce sujet une exception notable, la
mousse Physcomitrella patens (photo). En effet, chez
cette espèce, l'introduction dans des protoplastes de
molécules d’ADN homologues à un locus génomique
conduit majoritairement à une recombinaison ciblée
au locus, parfois jusqu'à 90 % des événements de transformation (12). Cette mousse est par ailleurs un excellent modèle biologique qui, malgré sa simplicité morphologique, partage bon nombre de processus avec les
plantes supérieures au niveau de sa physiologie ou
de son développement. Elle constitue donc une alternative intéressante aux études sur plantes supérieures,
notamment quand des analyses fines structure/fonction sont envisagées au niveau de protéines d'intérêt.
© D. SCHAEFER
05-4 Bouchez
pour que la probabilité
de trouver un mutant
dans un gène étudié soit
suffisamment élevée.
Par ailleurs, la mutagenèse insertionnelle n’apporte en général que des
mutations correspondant à des pertes totales
de fonction, impossibles à
analyser du fait de la létalité qu’elles occasionnent
lorsque l’on s’intéresse à des
fonctions essentielles.
L’utilisation de ces approches est donc
limitée à des espèces modèles pour lesquelles
de grandes collections de mutants existent et aux gènes
pour lesquels une perte de fonction est compatible
avec la survie de la plante.
L’ARN interférence constitue depuis peu une alternative à ces méthodes de mutagenèse de l’ADN génomique : il s’agit d’inactiver l’expression d’un gène par
interférence au niveau des ARNm et non plus au niveau
de la séquence codante dans l’ADN génomique. Cette
méthode tire profit de la découverte récente de la capacité des cellules eucaryotes à reconnaître les ARN double
brin et à dégrader de façon spécifique les ARNm ayant
la même séquence que ces doubles brins (figure 2). Les
mécanismes moléculaires sous-jacents à ce phénomène
sont extrêmement complexes et font l’objet de nombreuses recherches actuellement. Découverte à l’origine comme un mécanisme de défense contre les virus
à ARN, la dégradation ciblée des transcrits dans les
cellules eucaryotes est maintenant considérée comme
un phénomène très général de régulation de l’expression
des gènes nucléaires (13).
Chez les animaux, des oligonucléotides sont généralement injectés dans les cellules afin de provoquer le
phénomène d’extinction ciblée par ARN interférence.
Chez les plantes, des transgènes permettant l’expression
d’ARN ayant une structure en « épingle à cheveux »
sont utilisés afin d’éteindre de façon ciblée l’expression
des gènes.
Cette technologie a l’avantage d’être ciblée mais nécessite la construction d’un vecteur de transformation spécifique pour chaque gène. Dans le cadre d’une collaboration entre six laboratoires européens financée par
La mousse Physcomitrella
patens en culture in vitro.
C'est la seule espèce
de plante pour laquelle
la recombinaison homologue est maîtrisée
au niveau expérimental.
Le séquençage de son
génome est quasiment
terminé.
*4 Gènes d'espèces différentes
dont les séquences sont
homologues. Ils dérivent
d'un même gène ancestral
et ont divergé au cours de
l’évolution. Ils peuvent avoir
la même fonction, mais ce
n’est pas systématique.
*5 Technique permettant de
transformer un blé d’automne
en blé de printemps à rendement élevé et plus vite mature.
(5) McCallum CM et al. (2000)
Nature Biotechnology 18, 455-7
(6) McCallum CM et al. (2000)
Plant Physiology 123, 439-42
(7) Levy YY, Dean C (1998)
The Plant cell 10, 1973-89
(8) Blasquez M (2000)
J Cell Sci 113, 3547-8
(9) Liljegren SJ et al. (2000)
Nature 404, 766-70
(10) Burel C et al. (2000)
British Journal of Nutrition 83,
653-64
(11) Slade AJ et al. (2004)
Nature Biotechnology 23, 75-81
(12) Schaefer DG, Zryd JP
(1997) Plant J 11, 1195-206
(13) Meins F et al. (2005)
Annu Rev Cell Dev Biol 21,
297-318
Interférence ARN
L’inactivation d’un gène pour rechercher les conséquences phénotypiques entraînées par cette perte de
fonction a été réalisée jusque récemment par mutagenèse de l’ADN génomique. Comme expliqué précédemment, cette mutagenèse étant aléatoire, il est nécessaire de fabriquer de très grandes collections de mutants
© D.R.
Figure 2 Principe de la dégradation ciblée
des ARNm par « ARN interférence »
Un transgène est exprimé dans la plante afin de produire un
ARN en « épingle à cheveux » dont la séquence est spécifique du gène ciblé. La machinerie cellulaire reconnaît ces
structures d’ARN, ce qui va conduire à la formation de petits
ARN puis à la dégradation ciblée des ARNm correspondant
au gène cible.
BIOFUTUR 265 • AVRIL 2006 43
05-4 Bouchez
16/03/06
9:46
Page 44
© H. NORTH
Dossier Les atouts de la génomique végétale
Figure 3 Crible de mutants d'Arabidopsis
par thermographie infrarouge
Ce type de capteur d'imagerie, non destructif pour les
plantes, permet de déterminer de façon précise la température de surface des feuilles. Ici, on observe une différence de
température entre la plante normale (à gauche) et un mutant
affecté dans la synthèse d'une hormone végétale impliquée
dans la fermeture stomatique (l'acide abscissique). Le
mutant, incapable de réguler correctement la fermeture des
stomates, transpire plus et a une température de surface
plus faible que le sauvage. La déficience entraîne également
une réduction de croissance, visible ici.
*6 Chacune de ces sondes
est spécifique d’un gène
d’Arabidopsis thaliana.
Les sondes CATMA présentent
l’avantage considérable de
disposer de l’intégralité des
gènes de cette espèce sur
une lame (puce, voir article
suivant).
(14) Koroleva OA et al. (2005)
Plant J 41, 162-74
la Commission européenne (projet Agrikola), des techniques de clonage par recombinaison à haut débit sont
actuellement utilisées afin de cloner les sondes
CATMA*6 dans des vecteurs de type ARNi. Ce projet a pour but de créer un jeu de 25 000 à 30 000 plasmides (un pour chaque gène d'Arabidopsis) afin
d'éteindre des gènes par l'approche ARNi. Quatre mille
de ces plasmides ont été utilisés pour obtenir des transformants d'Arabidopsis dans lesquels les gènes correspondants ont été spécifiquement éteints.
Ces plasmides, ainsi que les lignées transformées, constituent des ressources très importantes pour l'analyse de
la fonction des gènes d'Arabidopsis, et par extrapolation, celle des gènes homologues chez d'autres
organismes, y compris chez les plantes cultivées de
valeur agronomique (14).
Analyse des phénotypes
Si on se place du point de vue du biologiste
d'Arabidopsis, espèce pour laquelle l'ensemble des
outils est disponible, on a vu que quel que soit le gène
ou la famille de gène considérés, l'expérimentateur dispose d'une large palette de ressources lui permettant
d'obtenir des variants ou des mutants dans ses gènes
favoris, avec souvent même la possibilité de disposer
de plusieurs allèles. Cependant, une des surprises issues
des premiers résultats de génétique inverse chez
Arabidopsis fut que la plupart des mutations isolées
n'avaient pas d'effet majeur sur la croissance et la morphologie des plantes.
En réalité, les nombreux cribles réalisés auparavant avaient
déjà permis d'identifier l'essentiel des quelques centaines
de mutations morphologiques facilement repérables. Pour
les autres, l'absence d'altération visible pouvait être reliée
à divers phénomènes : compensation physiologique,
redondance génétique entre gènes d'une même famille,
ou encore phénotypes détectables dans des conditions
d'environnement ou d'observation particulières.
44 BIOFUTUR 265 • AVRIL 2006
Dans une optique de génomique fonctionnelle, la
détection de phénotypes informatifs est donc un enjeu
crucial qui nécessite des efforts spécifiques : d'abord
par un contrôle très strict des conditions de culture
et d'environnement dans lesquelles les plantes sont
placées et comparées entre elles. Il faut d'autre part
pouvoir étudier des différences de réponses parfois
subtiles, en faisant varier différents facteurs de l'environnement biologique ou physico-chimique : température, humidité de l'air ou du sol, composition
gazeuse de l'atmosphère, alimentation minérale, intensité et qualité de lumière reçue, pathogènes viraux
ou microbiens, compétition entre plantes, etc. : la
liste est longue ! Pour des plantes de petite taille
comme Arabidopsis, où il est souvent question d'effectifs importants, il est nécessaire de déployer des
moyens de culture et des solutions de robotique
sophistiqués.
Outre un contrôle fin sur les conditions de culture et
les niveaux de contraintes dans lesquelles les plantes
sont testées, il importe de disposer d'une batterie d'appareils de mesure, qui permetttent d'acquérir de façon
automatique et non destructive des indicateurs fiables
et quantitatifs du comportement des plantes. Des capteurs d'imagerie et de fluorescence reliés à des systèmes d'analyse d'image (figure 3) permettent d'ores et
déjà d'obtenir des paramètres essentiels liés par
exemple à la croissance et au développement, à l'activité métabolique et photosynthétique, à la réponse
à des stress.
Génétique et génomique
La génomique a apporté à la génétique des outils particulièrement puissants d'analyse des génomes et
de leur fonctionnement. Elle a permis ces dernières
années un renouvellement majeur et un enrichissement de toutes les branches de la discipline : génétique moléculaire et cellulaire, génétique classique et
quantitative, génétique évolutive et des populations…
De leur côté, les approches de génétique, par définition, explorent les relations complexes entre génome,
environnement et phénotype. Elles permettent d'aborder cette relation à tous les niveaux d'organisation
du vivant, aussi bien à l'échelle de la molécule qu’à
celle de la cellule, de l'organe, etc., jusqu'aux populations. La génétique constitue ainsi un formidable
outil d'intégration des connaissances en biologie.
En ce qui concerne les plantes, la palette des outils et
des ressources disponibles, par exemple pour la génétique inverse, devrait permettre d'obtenir dans les dix
prochaines années des informations fonctionnelles
sur la majorité des gènes et des protéines présents
dans un génome typique comme celui d'Arabidopsis.
Dans le même temps, on peut attendre de grands progrès des connaissances sur l'architecture génétique et
moléculaire de caractères complexes, les réseaux de
signalisation et de régulation, le développement, la
physiologie et le métabolisme, les réponses aux
contraintes de l'environnement.
La mise en relation de ces informations permettra de
proposer des modèles intégrés des grandes fonctions
des plantes en relation avec leur environnement, à
partir desquels il sera possible de fonder de nouvelles
stratégies d'amélioration des pantes cultivées. G