Identification des protéines PPR impliquées dans l`épissage des

Transcription

Ecole doctorale :
School of Biomedical, Biomolecular
« Des génomes aux organismes »
and Chemical Sciences
THESE EN COTUTELLE
Présentée pour l’obtention du grade de
DOCTEUR DE L’UNIVERSITE D’EVRY VAL D’ESSONNE
Et le grade de
DOCTEUR DE L’UNIVERSITE DE WESTERN AUSTRALIA
Spécialité : Biologie cellulaire et moléculaire
Identification des protéines PPR impliquées dans l’épissage des
ARN messagers dans les chloroplastes et les mitochondries chez
Arabidopsis Thaliana.
Par :
Andeol Alexis FALCON DE LONGEVIALLE
Le jury est composé de:
Claire LURIN
Ian SMALL
Francis-André WOLLMAN
José GUALBERTO
Christian SCHMITZ-LINNEWEBER
Bénédicte STURBOIS
Directrice de thèse
Directeur de thèse
Rapporteur UEVE et UWA
Rapporteur UEVE
Examinateur
Examinatrice
Dominique GAGLIARDI
Martin CRESPI
Rapporteur UWA
Rapporteur UWA
Préambule :
Cette thèse est le résultat d’un cursus peu habituel. En effet, une grande partie des travaux
qui sont présentés ont été réalisés alors que je n’étais pas encore inscrit en thèse.
Après l’obtention de mon diplôme de DESS intitulé « Productivité VégétaleBiotechnologie-Génome » réalisé à l’université Denis Diderot PARIS VII, j’ai intégré
l’équipe de Ian Small et de Claire Lurin en tant qu’Ingénieur d’étude sur le projet européen
AGRIKOLA. C’est à la fin de ces trois années que j’ai commencé peu à peu à m’immerger
dans le monde des PPR. Puis j’ai suivi Ian Small qui est parti en Australie diriger le centre
Plant Energy Biology à Perth. C’est sous un contrat de Post-doctorant mais sans thèse… que
j’ai effectué mes recherches sur le rôle des protéines PPR dans l’épissage des ARNm. Suite à
ces deux années enrichissantes, j’ai réintégré l’équipe de Claire Lurin à Evry sous un
nouveau contrat européen, AGRONOMICS, sur la mise en place d’une technique
d’interaction protéine-protéine in vivo chez arabidopsis, le Split-DHFR.
Dans l’optique de valoriser le travail que j’avais réalisé en Australie, j’ai donc décidé de
m’inscrire en thèse en co-tutelle entre l’université d’Evry Val d’Essonne et l’université de
Western Australia. Ainsi pendant les deux dernières années, j’ai donc concilié à la fois le
travail sur le Split-DHFR et mon travail de thèse sur les protéines PPR.
Cette thèse est donc le fruit d’un peu plus de quatre ans dans le monde des PPR, deux ans
en Australie et les deux dernières en France dans le laboratoire de Claire Lurin.
1
Remerciements :
Je tiens tout d’abord à remercier Claire et Ian pour m’avoir donné chacun l’opportunité de
travailler sur ces protéines PPR, de m’avoir encadré tout en me donnant une grande liberté de
recherche.
Je remercie également tous les membres du jury qui ont pris le temps de lire ce manuscrit.
En grand Merci à ma chère et tendre épouse, Maud qui m’a accompagné et soutenu pendant
ces quatre années, même si pour elle ce que je fais reste en grande partie incompréhensible.
Un autre merci à Paloma, ma première fille et à ma toute dernière Bianca. Sans elles, la
rédaction de ce manuscrit n’aurait pas été autant un challenge…
Merci à Anne-Laure, l’experte en édition !
Merci à Etienne Delannoy pour toutes nos discussions enrichissantes sur le monde des PPR et
son aide précieuse. Welcome Back !
Merci à Etienne Meyer, mon partenaire de squash, pour son expertise et son aide sur le
complexe I.
Merci à Charles pour son aide au début de la caractérisation des premiers mutants.
Merci également à Cathie qui est devenue l’experte en Epissage, Anne, Kristina, Fred, Sandra,
Nick Taylor et Nick O’Toole à Perth. Et sans oublier Jenny et Jude el leurs agréables sourires !!!
Un grand merci aussi à Alex et Laure, qui ont été mes binômes pendant un moment et qui sont
toujours disponibles et prêtes à me rendre service.
Merci aussi à Dario, mon binôme du split que j’ai laissé un peu tomber au moment de la
rédaction…
Merci à Clément, à Richard, à Sandrine et à tout le reste de l’équipe Génomique fonctionnelle.
Merci a Geert De Jaeger et Mike Bevan pour leur collaboration dans ce travail.
Enfin un dernier merci à toutes les personnes qui de loin ou de près m’ont aidé pendant cette
thèse et que je n’ai pas cité ici.
2
INTRODUCTION
SOMMAIRE
Sommaire.............................................................................................................................. 3
Principales Abréviations : ................................................................................................... 7
CHAPITRE I : INTRODUCTION .................................................................................... 8
I.1
L‟épissage des ARN messagers ............................................................................. 8
I.1.1
Définition .......................................................................................................... 8
I.1.2
Origine de l‟épissage ........................................................................................ 8
I.1.3
Rôle de l‟épissage ............................................................................................. 9
I.1.4
L‟épissage des ARN messagers dans les organites .......................................... 9
Article 1 : de Longevialle A.F., Small I.D. and Lurin C. (2010) Nuclearly Encoded Splicing
Factors Implicated in RNA Splicing in Higher Plant Organelles. Molecular Plant, sous presse. .. 9
I.2 La famille des protéines PPR (Pentatricopeptide Repeat) ......................................... 25
I.2.1
Caractéristiques des PPRs .............................................................................. 25
I.2.1.1 Description des motifs PPRs ..................................................................... 25
I.2.1.2 Composition de la famille ......................................................................... 26
I.2.1.3 Distribution de la famille ........................................................................... 27
I.2.1.4 Données de localisation subcellulaire ....................................................... 29
I.2.2
Rôle des protéines PPR................................................................................... 29
I.2.2.1 Les protéines PPR dans l‟initiation de la transcription ............................. 32
I.2.2.2 Les protéines PPR dans la maturation des ARNm .................................... 33
I.2.2.2.1 Maturation en 5’ et 3’ des ARNm .................................................................. 33
I.2.2.2.2 L’édition des ARNm ....................................................................................... 34
I.2.2.2.3 L’épissage des ARNm .................................................................................... 36
I.2.2.3 Les PPRs dans la stabilisation des ARNm et la traduction ....................... 36
I.2.2.4 Les protéines PPR impliquées dans la restauration de la fertilité mâle
cytoplasmique (CMS) .................................................................................................. 38
Présentation du sujet de thèse : ........................................................................................ 40
CHAPITRE II : RESULTATS ......................................................................................... 41
II.1 Identification de protéines PPR impliquées dans l‟épissage des ARNm dans les
chloroplastes. ........................................................................................................................ 41
II.1.1
OTP51 ............................................................................................................. 41
Article 2 : de Longevialle A.F., Hendrickson L., Taylor N.L., Delannoy E., Lurin C., Badger
M., Millar A.H. and Small I.D. (2008) The pentatricopeptide repeat gene OTP51 with two
LAGLIDADG motifs is required for the cis-splicing of plastid ycf3 intron 2 in Arabidopsis
thaliana. The Plant Journal, 56: 157 – 168. ................................................................................. 41
II.1.2
Identification de défauts d‟épissage en utilisant la PCR quantitative. ........... 62
II.1.2
Identification de défauts d‟épissage en utilisant la PCR quantitative. ........... 62
II.1.2.1 OTP52 (At3g06430, emb2750) ................................................................ 64
3
INTRODUCTION
II.1.2.2 Profil d‟épissage des mutants affectés dans la transcription de type PEP 66
II.2. Identification de protéines PPR impliquées dans l‟épissage des ARNm dans les
mitochondries. ...................................................................................................................... 69
II.2.1
OTP43 ............................................................................................................. 69
Article 3 : de Longevialle A.F., Meyer E.H., Andrés C., Taylor N.L., Lurin C., Millar A.H. and
Small I.D. (2007) The Pentatricopeptide Repeat Gene OTP43 Is Required for trans-Splicing of
the Mitochondrial nad1 Intron 1 in Arabidopsis thaliana. The Plant Cell, 19:3256-3265 ........... 69
II.2.2
TANG2 ........................................................................................................... 84
Article 4 : Li Y., Smith C., Colas des Francs-Small C., de Longevialle A.F., Corke F., Zheng
L., Tanz S., Small I.D. and Bevan M.W. (2010) TANG2, a Glucose-Responsive Gene, Encodes a
Pentatricopeptide Repeat Protein Required for Splicing of Mitochondrial nad5 Transcripts, in
submission. .................................................................................................................................... 84
II.2.3
PPR40 ........................................................................................................... 110
II.2.4
nad ?
Comment identifier de nouvelles PPRs impliquées dans l‟épissage des introns
112
II.2.4.1 Co-régulation des PPRs.......................................................................... 112
II.2.4.2 Les nouveaux facteurs d‟épissage identifiés .......................................... 113
II.3
II.2.4.2.1
« Pure » PPRs (OTP439) ........................................................................... 115
II.2.4.2.2
Influence de l’édition dans l’épissage ........................................................ 117
II.2.4.2.3
Effet du sucre sur l’épissage ...................................................................... 120
L‟épissage alternatif des PPR ............................................................................. 122
II.3.1
Epissage alternatif identifié dans les banques d‟EST ................................... 124
II.3.2
Analyse préliminaire des 48 PPRs « du laboratoire » .................................. 128
II.3.3
Cas d‟OTP43 et de ses différentes isoformes ............................................... 132
II.3.2.1 Identification des isoformes par RT-PCR .............................................. 132
II.3.2.2 Preuves de traduction des différents transcrits :..................................... 134
II.3.2.3 Complémentation fonctionnelle avec les isoformes .............................. 137
II.4
Identification de partenaires des protéines PPR ................................................. 140
II.4.1 Méthode utilisée : TAP-TAG .......................................................................... 141
II.4.2 Partenaires d‟OTP43 ........................................................................................ 142
II.4.3 Partenaires de DYW1 ...................................................................................... 144
II.4.4 Partenaires de CLB19 ...................................................................................... 144
CHAPITRE III : CONCLUSION et DISCUSSION GENERALE ............................. 148
III.1
Les protéines PPR, des facteurs d‟épissage intron spécifique : ......................... 148
III.2
L‟épissage alternatif, un moyen d‟augmenter le nombre de protéines PPR : .... 151
III.3 Rôle de l‟épissage alternatif : une nouvelle hypothèse sur la reconnaissance de
multi-sites d‟édition par une seule protéine PPR ? ............................................................ 152
III.4
Action des protéines PPR, une action seule ou en partenariat : ......................... 154
III.5 Rôle et régulation des protéines PPR .................................................................... 155
4
INTRODUCTION
III.5.1
Régulation transcriptionnelle et post-transcriptionnelle : ......................... 155
III.5.2
Régulation post-traductionnelle : .............................................................. 156
CHAPITRE IV : MATERIELS ET METHODES ....................................................... 159
IV.1 Matériels ............................................................................................................. 159
IV.1.1
Souches bactériennes ................................................................................ 159
IV.1.2
articles.
Oligonucleotides utilisés au cours de ma thèse et non répertoriés dans les
159
IV.1.2
Lignées d‟insertion.................................................................................... 161
IV.2 Méthodes ............................................................................................................ 162
IV.2.1
Méthodes relatives à la culture d'Arabidopsis .......................................... 162
IV.2.1.1 Culture en terre ..................................................................................... 162
IV.2.1.2 Culture in vitro...................................................................................... 162
IV.2.1.3 Préparation des graines d‟Arabidopsis ................................................. 162
IV.2.1.3.1
Vernalisation ............................................................................................. 162
IV.2.1.3.2
Stérilisation des graines ............................................................................ 162
IV.2.2
Protocoles relatifs à l'ADN ....................................................................... 163
IV.2.2.1 Extraction rapide d'ADN génomique ................................................... 163
IV.2.2.2 Extraction d'ADN génomique (Dneasy 96 Plant kit QIAGEN) ........... 163
IV.2.2.3 Amplification d‟ADN par PCR ............................................................ 164
IV.2.2.3.1
Méthode de PCR « classique » ................................................................. 164
IV.2.2.3.2
Méthode de PCR « clonage » .................................................................... 165
IV.2.2.3 PCR quantitative ................................................................................... 165
IV.2.2.3 Electrophorèse ...................................................................................... 165
IV.2.2.4 Purification de produits PCR en vue d‟un clonage ou d‟un séquençage
166
IV.2.2.4.1
Utilisation du kit QIAquick (Qiagen) ........................................................ 166
IV.2.2.4.2
Purification au PEG ................................................................................. 166
IV.2.2.5 Clonage de produit PCR ....................................................................... 166
IV.2.2.5.1
Clonage dans le vecteur pGEMT-Easy (Promega) ................................... 166
IV.2.2.5.2
Technologie de clonage GatewayTM (Invitrogen) ................................... 166
IV.2.2.5.2.1
Principe du clonage Gateway..........................................................................166
IV.2.2.5.2.2
PCR de clonage ...............................................................................................166
IV.2.2.5.2.3 Mutagenèse dirigée par PCR en vue d’un clonage dans un vecteur d’entrée du
système Gateway 167
IV.2.2.5.2.4
Réaction de BP clonase ...................................................................................168
IV.2.2.5.2.5
Réaction de LR clonase ...................................................................................168
IV.2.2.5.3
Transformation bactérienne, sélection et test des colonies transformées . 168
5
INTRODUCTION
IV.2.2.5.3.1
Protocole de préparation de cellules DH5α Thermo-compétentes..................168
IV.2.2.5.3.2
Protocole de transformation par choc thermique de cellules DH5α compétentes
169
IV.2.2.5.4
Tranformation d’Agrobactéries, sélection et test des colonies transformées
169
IV.2.2.5.4.1
Protocole de préparation d’agrobactéries thermocompétentes .....................169
IV.2.2.5.4.2
compétentes
Protocole de transformation par choc thermique de cellules C58C1
169
IV.2.2.6 Extraction et purification de plasmides (miniprépration d‟ADN) ........ 170
IV.2.2.7 Séquençage d‟ADN .............................................................................. 170
IV.2.3
Méthodes relatives à l‟ARN...................................................................... 170
IV.2.3.1 Extraction d‟ARN total ......................................................................... 170
IV.2.3.2 Traitement de décontamination de l‟ADN contaminant ....................... 170
IV.2.3.3 Réaction de transcription « inverse » ................................................... 170
IV.2.3.4 Northern blot......................................................................................... 170
IV.2.3.5 Protocole pour l‟analyse PPE ............................................................... 171
IV.2.4
Méthodes propres à Arabidopsis ............................................................... 171
IV.2.4.1 Transformation d‟Arabidopsis par « floral deeping » .......................... 171
IV.2.4.2 Etude du phénotype .............................................................................. 171
Références Bibliographiques .......................................................................................... 172
ANNEXES :...................................................................................................................... 182
6
INTRODUCTION
PRINCIPALES ABREVIATIONS :
ADN : Acide Desoxyribonucléique
ADNc : ADN complémentaire
ADNg : ADN génomique
AGRIKOLA : Arabidopsis Genomic RNAi Knock-out Line Analysis
ARN : Acide Ribonucléique
ARNm : ARN messager
ARNi : ARN interférence
ARNr : ARN ribosomique
ARNt : ARN de transfert
BET : Bromure d'EThidium
CMS : "Cytoplasmic Male Sterility", stérilité mâle cytoplasmique
dNTP : désoxyribonucléotide
EST : Expressed Sequence Tag
GFP : Green Fluorescente Protein
GST : Gene-specific Sequence Tag
IPTG : Isopropyl-Beta-Thio-Galactoside
MS (1/2MS) : milieu Murashige et Skoog
NEP : Nuclear Encoded Polymerase
NMD : nonsense mediated mRNA decay
ORF : Open Reading Frame
PCR : "Polymerase chain reaction", réaction en chaîne par polymérase
PEP : "Plastidial Encoded Polymerase", polymérase chloroplastique codée par le génome
PLS : sous-famille de protéines PPR
PPE : Poisoned Primer Extension
PPR : PentatricoPeptide Repeat
PTC : Premature Termination Codon
qPCR : PCR quantitative
RIP-CHIP : RNA ImmunoPrecipitation and DNA CHIP hybridization
RRM : RNA Recognition Motifs (motif de reconnaissance de l‟ARN)
RT-PCR : réaction de transcription inverse suivie d‟une PCR
RUST : Regulation by Unproductive Splicing and Translation mechanism
snRNP : Small Nuclear Ribonucleoprotein
TAIR : The Arabidopsis Information Resource
UTR : UnTranslated Region (région non traduite)
Nomenclature :
Pour un gène nucléaire, la nomenclature suivante est utilisée :
Gène : NUC, mutant : nuc, protéine : NUC
Pour un gène cytoplasmique, la nomenclature bactérienne est adoptée :
Gène : cyT, protéine : CyT
7
INTRODUCTION
CHAPITRE I : INTRODUCTION
I.1L’épissage des ARN messagers
I.1.1 Définition
L'épissage est un processus de maturation post-transcriptionnelle par lequel les pré-ARN
transcrits à partir de l'ADN génomique peuvent subir des étapes de coupure et ligature
conduisant à la suppression de certaines régions dans l'ARN mature. Ce phénomène permet
l‟assemblage des séquences codantes, les exons, mais aussi l‟assemblage de séquences non
codantes comme des transcrits d‟ARNt contenant des introns.
L'épissage est assuré par un ensemble de complexes ribonucléoprotéiques, appelés les
spliceosomes. Chaque complexe snRNP pour Small Nuclear Ribonucleoprotein, contient un
ARN et plusieurs protéines. Cet ensemble de protéines reconnait des séquences spécifiques et
permet la mise en place d‟une structure secondaire optimale de l‟ARN pour l‟épissage.
Il existe également des introns appelés auto-épissables ou auto-catalytiques, c‟est-à-dire
capable de s'exciser sans intervention d'un spliceosome, ceux-ci ont été décrits dans les
mitochondries, les plastes et certaines bactéries. Cependant, ce n‟est pas la règle générale dans
les mitochondries et les chloroplastes, chez lesquels la majorité des introns nécessitent
l'intervention de protéines codées par le génome nucléaire et importées dans les organites.
Par analogie avec le fonctionnement du ribosome, il a été proposé que, dans le
spliceosome, c'est l'ARN qui est catalytique et donc que le spliceosome est un ribozyme. Le
mécanisme catalytique exact du spliceosome est encore inconnu.
I.1.2 Origine de l’épissage
Dès la découverte des introns en 1977, trois questions ont été immédiatement posées :
Quelle est l‟origine de ces introns ? Quel est leur rôle dans l‟évolution ? Mais aussi quelle est
leur fonction ?
Deux hypothèses antagonistes s‟opposent concernant l‟origine des introns au cours de
l‟évolution : l‟hypothèse « des introns précoces » propose que les introns existaient avant la
divergence des procaryotes et des eucaryotes (Gilbert 1978). Cependant cette hypothèse ne
peut expliquer l‟absence d‟introns chez les procaryotes et, de ce fait, une explication a été
émise, proposant qu‟il y ait eu une pression de sélection sur les introns chez les procaryotes et
que ceux ci aient été éliminés de leur génome. En effet, la plus grande pression que subit le
monde procaryote est de devoir se multiplier très rapidement, de ce fait toute séquence inutile
est éliminée pour aboutir à un génome minimal.
En revanche, du fait de l‟absence de spliceosome chez les procaryotes, une deuxième
hypothèse a été formulée, dite de « l‟hypothèse des introns tardifs » qui propose que les
introns aient été insérés dans les gènes eucaryotes après cette divergence et que les espèces
n‟ayant pas d‟introns n‟aient jamais eu d‟introns (Doolittle and Stoltzfus 1993). Certains
éléments sont plus en faveur de la première hypothèse et certains de la deuxième et il est donc
difficile de conclure sur l‟une ou l‟autre. De plus, la génomique comparative n‟est toujours
pas capable de dissocier entre ces deux hypothèses et il semblerait plutôt que l‟origine des
introns se situe entre ces deux hypothèses, « existence d‟introns tardifs » et « d‟introns
précoces » (Koonin 2006).
8
INTRODUCTION
Du fait de la caractéristique des introns nucléaires et du mécanisme nécessaire pour leur
épissage, il a été proposé que les introns de group II auto-épissables sont à l‟origine des
introns nucléaires, et qu‟ils auraient envahi massivement le génome nucléaire au cours de
l‟endosymbiose entre une -proteobactérie et une archebactérie.
Quelle que soit l‟origine des introns, ils ont par la suite évolué au sein des eucaryotes.
Ainsi, par exemple, le mécanisme d‟épissage des introns nucléaires chez les plantes diffère
des mammifères, le site de reconnaissance en 3‟ est enrichi en AU dans les introns des
plantes, alors que chez les mammifères, celui-ci est enrichi en poly pyrimidine (Wiebauer,
Herrero et al. 1988). Par ailleurs, les introns de group II dits auto-épissables ne le sont dans la
majorité des cas plus dans les organites et nécessitent désormais différents facteurs d‟épissage
comme il en sera discuté dans cette thèse.
I.1.3 Rôle de l’épissage
L‟épissage de manière générale permet de joindre les exons entres eux en excisant toutes
les parties non codantes afin d‟obtenir un ARNm mature qui va pouvoir être traduit. Cette
étape, d‟une grande complexité au niveau nucléaire mais également dans les organites, fait
partie des différentes étapes de maturation post-transcriptionnelle des ARN pré-messagers et
est donc importante dans la régulation de l‟expression des gènes et peut être contrôlée grâce à
l‟implication de différents facteurs d‟épissage. Cependant d‟autres fonctions peuvent lui être
attribuées. En effet, l‟épissage sous sa forme dite alternative permet d‟établir différents
isoformes dont les fonctions varient.
L‟épissage alternatif est décrit dans le noyau mais n‟est pas présent dans les organites et se
définit sous quatre formes. 1. L‟excision d‟exons ; 2. La rétention d‟introns ; 3. Site
d‟épissage donneur alternatif ; 4. Ou site accepteur d‟épissage alternatif. Ce phénomène qui
sera plus longuement discuté dans le chapitre sur l‟épissage alternatif, permet soit de réguler
l‟expression des gènes, soit de synthétiser de nouvelles protéines à partir d‟un même gène,
conférant ainsi une adaptation et une évolution.
I.1.4 L’épissage des ARN messagers dans les organites
Article 1 : de Longevialle A.F., Small I.D. and Lurin C. (2010) Nuclearly Encoded Splicing Factors
Implicated in RNA Splicing in Higher Plant Organelles. Molecular Plant, sous presse.
9
Molecular Plant Advance Access published July 5, 2010
Molecular Plant
•
Pages 1–15, 2010
REVIEW ARTICLE
Nuclearly Encoded Splicing Factors Implicated
in RNA Splicing in Higher Plant Organelles
Andéol Falcon de Longeviallea,b, Ian D. Smallb and Claire Lurina,1
a Unité Mixte de Recherche en Génomique Végétale (Institut National de la Recherche Agronomique/Centre National de la Recherche Scientifique/Université
d’Evry Val d’Essonne), 91057 Evry, France
b Australian Research Council of Excellence in Plant Energy Biology, University of Western Australia, Crawley 6009, WA, Australia
Key words:
RNA splicing; chloroplast; mitochondria; splicing factors.
INTRODUCTION
Eukaryotic cells contain organelles that are essential for supplying energy via ATP synthesis, namely mitochondria and in
photosynthetic cells, chloroplasts. These two organelles are
the results of two endosymbiosis events: mitochondria derive
from endosymbiotic a-proteobacteria (Andersson et al., 2003)
and chloroplasts derive from endosymbiotic cyanobacteria
(Raven and Allen, 2003). Throughout evolution, organelle
genomes have lost much of their original genomes by the redistribution of genetic material between nucleus, mitochondria, and plastids via inter-compartmental DNA transfer
(Ayliffe et al., 1998; Ellis, 1982; Stern and Lonsdale, 1982;
Weeden, 1981). From the six theoretical DNA transfer possibilities, at least five have been observed (Kleine et al., 2009): DNA
transfer from chloroplasts to mitochondria and, vice versa,
DNA transfer from nucleus to mitochondria and the two most
common events, DNA transfers from chloroplasts or mitochondria to the nucleus. Many of the proteins encoded by genes
transferred from organelles to the nucleus are important for
organelle gene expression or metabolism and need to be targeted back to their original compartment, creating a requirement for coordinate regulation of nuclear and organellar gene
expression. In addition to the genes transferred from organelles, many other nuclearly encoded proteins have acquired
functions in different processes of gene expression in organelles. These host-encoded proteins are needed for a wide
range of transcriptional and post-transcriptional processes including DNA replication, RNA transcription, RNA processing,
RNA editing, RNA splicing and translation. RNA splicing is
a good illustration of the typical evolutionary trajectory of
these processes, which all illustrate a steadily increasing role
for the cell nucleus in controlling organellar activities. Originally, RNA splicing of introns was enhanced by their intronencoded proteins (IEPs). These contained endonuclease and
reverse transcriptase domains believed to play an enzymatic
role in genetic mobility and a maturase domain, thought to
promote splicing. Introns were dispersed as mobile elements,
but in land plants, almost all introns have lost their IEPs, ending
with only two maturases encoded in the organellar genomes
and a set of nuclearly encoded splicing factors.
1
To whom correspondence should be addressed. E-mail [email protected],
fax 33 (0)1 60 87 45 10, tel. 33 (0)1 60 87 45 13.
ª The Author 2010. Published by the Molecular Plant Shanghai Editorial
Office in association with Oxford University Press on behalf of CSPP and
IPPE, SIBS, CAS.
doi: 10.1093/mp/ssq025
Received 12 March 2010; accepted 27 April 2010
Downloaded from http://mplant.oxfordjournals.org by on July 6, 2010
ABSTRACT Plant organelles arose from two independent endosymbiosis events. Throughout evolutionary history, tight
control of chloroplasts and mitochondria has been gained by the nucleus, which regulates most steps of organelle genome
expression and metabolism. In particular, RNA maturation, including RNA splicing, is highly dependent on nuclearly
encoded splicing factors. Most introns in organelles are group II introns, whose catalytic mechanism closely resembles
that of the nuclear spliceosome. Plant group II introns have lost the ability to self-splice in vivo and require nuclearly
encoded proteins as cofactors. Since the first splicing factor was identified in chloroplasts more than 10 years ago, many
other proteins have been shown to be involved in splicing of one or more introns in chloroplasts or mitochondria. These
new proteins belong to a variety of different families of RNA binding proteins and provide new insights into ribonucleo–
protein complexes and RNA splicing machineries in organelles. In this review, we describe how splicing factors, encoded by
the nucleus and targeted to the organelles, take part in post-transcriptional steps in higher plant organelle gene expression. We go on to discuss the potential for these factors to regulate organelle gene expression.
2
|
de Longevialle et al.
d
RNA Splicing in Plant Organelles
INTRON STRUCTURE AND SPLICING
MECHANISMS
Figure 1. Scheme of the Secondary Structure of Group II Introns and their Splicing Mechanisms.
The catalytic mechanism of group II introns closely resembles that of the spliceosome. Splicing occurs via two trans-esterification steps,
annotated 1 and 2. First, the 2’ OH of the branch point adenosine within domain VI performs a nucleophilic attack on the first nucleotide
of the intron at the 5’ splice site, forming the lariat intermediate. Second, the 3’ OH of the released 5’-exon performs a nucleophilic attack at
the last nucleotide of the intron at the 3’ splice site, joining the exons and forming a lariat that will be polyadenylated and degraded.
RNA splicing is a processing event in which the introns of a precursor messenger RNA (pre-mRNA) are removed and its exons
are joined. In plants, several chloroplast and mitochondrial
genes, encoding either tRNAs or proteins, are interrupted
by introns. Depending on their conserved primary and secondary structures as well as their different splicing mechanisms,
these introns are classified into two main families, group I
and group II introns. Twenty group II introns and only one
group I intron have been found in the chloroplast genome
of Arabidopsis thaliana while 17 group II and one group I intron have been described in maize and rice. Similarly, plant mitochondrial genomes contain mostly group II introns. Among
flowering plant mitochondrial genomes, 25 group II introns
have been described (Bonen, 2008), most of which disrupt
nad genes. In addition, one group I intron, coding an intronic
ORF with potential maturase function, was found in the cox1
gene of several plants (Cho et al., 1998).
Group I introns are characterized by a secondary structure of
10 domains, P1 to P10, each of them having a specific role in
RNA folding to enhance splicing and ligation. Splicing of
group I intron is mediated via a two-step phosphoryl transfer
reaction using an exogenous guanosine as a cofactor instead
of the adenosine in domain VI used in group II introns (Kruger
et al., 1982).
Group II introns are composed of six domains (Figure 1) and
are divided into four subclasses. Two subclasses, group IIA and
IIB, are found in flowering plants (Michel et al., 1989), while
two additional subclasses, group IIC and IID, have been discovered only in bacteria (Michel et al., 1989; Toor et al., 2001). For
the most part, the overall organization and structure are
similar in all these classes and reviews of their structure and
folding have been published (Fedorova et al., 2007; Keating
et al., 2010; Pyle et al., 2007). Domain I, which is essential
for ribozyme activity, contains two exon binding sites (EBS1
and EBS2) that interact with two corresponding intron binding
sites (IBS1 and IBS2) located at the 3’ end of the first exon.
Domains II and III enhance the catalysis of splicing, while domain IV, which contains the coding sequence for a maturase in
the case of nad1 intron 4 in plant mitochondria and trnK intron
in chloroplasts, is not involved in catalysis. This domain is also
the break point for eight events of trans-splicing that have
been observed in plants (rps12 intron 1 in chloroplasts, nad1
intron 1, intron 3, intron 4; nad2 intron 2; nad5 intron 2, intron 3
in mitochondria (Bonen, 2008), and recently in the mitochondrial cox2 intron in Allium cepa L. (Kim and Yoon, 2010)). Domain
V is the most phylogenetically conserved domain and contains
a sequence of 34 nucleotides that forms part of the catalytic
core and is essential for ribozyme activity. Domain VI provides
the branchpoint adenosine for the first trans-esterification
step. Although these features are common to most group II
introns in plants, some exceptions have been described. For
Maturases
Maturase proteins are divided into two classes based on the
location of their genes, intron-encoded maturases, and nuclearly encoded maturases. Each organelle genome in plants has
conserved only a single group II intron-encoded maturase. In
chloroplasts, MatK is encoded within the intron of trnK and in
mitochondria, MatR is encoded within the fourth intron of
|
3
nad1. The position of these maturase genes inside introns suggests a specific role in the splicing of precursor RNAs transcribed from the genes in which they reside, but until very
recently, no evidence for this was available. Immunoprecipitation of MatK-associated RNA (Zoschke et al., 2010) captured
seven out the eight group IIA introns in tobacco chloroplasts,
including the trnK intron. MatK preferentially associated with
domains II and IV of the trnK intron. These co-purifications
strongly suggest a role of MatK in RNA splicing for these seven
introns. A similar approach would be very helpful to elucidate
the role of MatR in mitochondria. The second class of maturase
was discovered by analyzing the complete nuclear genomes of
Arabidopsis and rice. Four nuclear genes coding for proteins
closely related to group II intron-encoded maturases were
found in both genomes (Mohr and Lambowitz, 2003). Three
maturases are targeted to mitochondria (Table 1) and one
(At1g74350) has a dual localization, depending on the start
codon used for its translation (Keren et al., 2009). The longer
isoform was observed in mitochondria, while the shorter one is
targeted to chloroplasts. All these maturases are presumed to
act in trans in the splicing of organellar introns. To date, a role
in RNA splicing has been demonstrated by reverse genetic
approaches for only two out of the four nuclearly encoded
maturases. At-nMat1a (At1g30010) is involved in the maturation of nad4 RNA by being required for the splicing of one of
its introns, although which one was not determined (Nakagawa and Sakurai, 2006). AtnMat2 (At5g46920) (Keren
et al., 2009) is a mitochondrial protein found in a large RNP
complex that co-fractionates with group II introns. Mutants
lacking the protein present a decrease in splicing of several
introns, suggesting AtnMat2 is involved in the splicing of
the cox2 intron, nad1 intron 2, and nad7 intron 2. However,
because some splicing of these introns was still observed in
the knockout mutants, it has been suggested that other splicing factors may also be involved. In contrast, mutants affected
in the dual targeted maturase are embryo lethal in Arabidopsis
(Keren et al., 2009) and molecular characterization could not
be done. However, its sub-cellular localization and its high sequence similarity with the two other maturases suggested that
this maturase is involved in RNA splicing in chloroplasts and/or
mitochondria.
CRM Domain Proteins
The Chloroplast RNA splicing and ribosome maturation (CRM)
domain was first described in RNA splicing factor CRS1 (Jenkins
et al., 1997; Till et al., 2001). Although this domain is found
in at least five characterized chloroplast splicing factors in
plants, it derived from an ancient ribosome-associated protein
(Barkan et al., 2007). CRM domains in prokaryotes exist as
stand-alone proteins of ;100 amino acids encoded by a single
copy ORF. The Escherichia coli YhbY protein has been shown to
be associated with pre-50S ribosomal subunits, suggesting
a function in ribosome assembly. In contrast to prokaryotes,
plant genomes encode multiple CRM domain proteins. Sixteen
Arabidopsis and 14 rice proteins containing one or more CRM
example, nad1 intron 1, which does not have a bulged adenosine but, in contrast, has an aberrantly large domain V loop
(Carrillo et al., 2001; de Longevialle et al., 2007); nad1 intron 2,
which has a very short, strongly base-paired domain VI helix
(Li-Pook-Than and Bonen, 2006); nad4 intron 2, which lacks
a bulged adenosine at the expected position (Bonen, 2008);
ycf3 intron 2, which has two additional nucleotides in addition
to the 34 nucleotides expected in domain V (de Longevialle
et al., 2008); and the chloroplast trnV intron, which lacks
a bulged A in domain VI and is spliced by a hydrolytic mechanism (Vogel and Borner, 2002).
In most species, many of these group I or group II introns are
mobile genetic elements whose mobility is mediated by a ribonucleoprotein (RNP) complex composed of the intron RNA
and a conserved intron-encoded protein, also called maturase,
which facilitates the splicing of its host intron (Eickbush, 1999;
Wank et al., 1999). In flowering plants, most of the organellar
intron maturases have been lost. The only remaining
maturases are found in the trnK intron of the chloroplasts,
in nad1 intron 4 of mitochondria and in the cox1 intron of several plants (Cho et al., 1998). The loss of these maturases has
been accompanied by the recruitment of host-encoded proteins to facilitate splicing of introns that have lost their autocatalytic activity. None of the group II introns in plants that
have been tested was able to self-splice in vitro and all have
been shown to require additional trans factors for efficient
splicing in vivo.
The two first nuclear mutations affecting a subset of chloroplast splicing events were identified in maize in the crs1 and
crs2 mutants (described below), opening a new research area
to elucidate the mechanisms that regulate organellar RNA
splicing (Jenkins et al., 1997).
In mitochondria, the first nuclear mutation affecting a splicing event was identified in Nicotiana sylvestris (Brangeon
et al., 2000) in the nuclear nms1 mutant. This mutant presented a defect in RNA splicing of nad4 intron 1 and no spliced
nad4 exon1-exon2 could be detected while all other transcripts were not affected. Unfortunately, the Ms1 locus has
never been identified and thus no information on the MS1
protein is available.
Since then, many other factors acting as splicing factors to
facilitate or enhance RNA splicing have been molecularly characterized during the last 10 years. These factors belong to different families of RNA binding proteins that have acquired
specific roles in RNA splicing during the evolution of land
plants. Their roles are summarized in Table 1, Figure 2, and
Figure 3 and each of them will be discussed in detail below.
d
4
|
d
Table 1. Organellar and Nuclear-Encoded Factors Controlling Splicing of Organellar Introns.
Type
Name
A. thaliana
O. Sativa
Sub-Type
Localisation
Affected introns
References
maturase
proteins
AtnMat3
At5g04050
OS06G44880
maturase
mitochondria
unknown
Keren et al., 2009
AtnMat4
At1g74350
OS06G42770
maturase
chloroplasts and
mitochondria
unknown
Keren et al., 2009
At-nMat1a At1g30010
OS12G21870
maturase
mitochondria
nad4
Nakagawa and
Sakurai, 2006
AtnMat2
OS10G41790
maturase
mitochondria
cox2 intron, nad1
intron2, nad7
intron2
Keren et al.,
2009
matK
maturase
chloroplasts
atpF intron, trnK
intron, trnA intron,
trnl intron, trnV
intron, rpl2 intron,
rps12 intron2
Zoschke et al.,
2010
matR
maturase
mitochondria
unknown
AtCFM2
At3g01370
Os0439080
AtCFM3a
At3g23070
Os11g37990
AtCFM3b
At4g14510
ZmCRS1
At5g16180
Os08g27150
chloroplasts
atpF intron
At3g18390
Os05g47850
chloroplasts
unknown
At4g29750
Os09g19850
chloroplasts
unknown
At4g13070
Os06g20030
mitochondria
and nucleus
unknown
At2g28480
Os01g72820
mitochondria
and nucleus
unknown
At3g25440
Os04g41550
mitochondria
and nucleus
unknown
At3g27550
Os05g05300
mitochondria
and nucleus
unknown
AtCFM6
CRS1
chloroplasts
subfamily
chloroplasts and
mitochondria
trnL intron, ndhA
intron, ycf3
intron1, clpP*
intron2
Asakura and
Barkan 2007
ndhB intron, rpl16
intron, rps16
intron, trnG
intron, petB
intron and petD
intron
Asakura et al.,
2008
chloroplasts
Subfamily
3
Jenkins et al., 1997;
Till et al., 2001;
Asakura and
Barkan 2006
Barkan et al.,
2007
At5g54890
Os08g08860
At4g31010
Os08g07790
ZmCAF2
At1g23400
Os01g21990
chloroplasts
ndhB intron, petB
intron, rps12
intron1, ndhA
intron and
ycf3 intron1
Ostheimer et al.,
2003; Asakura
and Barkan
2006
ZmCAF1
At2g20020
Os01g31110
chloroplasts
petD intron, rpl16
intron, rps16
intron, trnG
intron, ndhA
intron, ycf3
intron1, rpoC1
intron* and
ClpP intron1*
Ostheimer et al.,
2003; Asakura
and Barkan
2006
At2g21350
Os10g36860
chloroplasts or
mitochondria
unknown
chloroplasts
unknown
At4g39040
CAF
mitochondria
subfamily mitochondria
Asakura et al.,
2008
subfamily
4
unknown
unknown
CRM
proteins
At5g46920
d
|
5
Table 1. Continued
Type
Name
A. thaliana
O. Sativa
Sub-Type
PPR
proteins
ZmPPR4
At5g04810
Os04g58780
Pure
chloroplasts
subfamily
AtOTP51
At2g15820
OS02G47360
ZmPPR5
At4g39620
AtHcf152
Affected introns
References
trans rps12 intron1
Schmitz-Linneweber
et al, 2006
chloroplasts
ycf3 intron2
Falcon de
longevialle
et al, 2008
OS02G51480
chloroplasts
trnG-UCC intron
Beick et al., 2008;
Cushing D.A.
et al., 2005
At3G09650
Os12g0102600
or Os11g0103000
chloroplasts
petB intron
Meierhoff et al.,
2003
AtOTP43
At1g74900
OS02G45590
mitochondria
trans nad1 intron1
Falcon de
longevialle
et al, 2007
ZmCRS2
At5G38290
?
chloroplasts
Jenkins et al.,
rps12 intron1, ndhB
2001; Jenkins
intron, petB intron,
et al., 1997
ndhA intron, ycf3
intron1, rpl16
intron, rps16
intron, petD intron,
trnG intron, clpP
intron1* and
rpoC1 intron*
At5g16140
not predictable
At1g18440
OS01G49900
or OS05G47630
mitochondria
unknown
At5g19830
?
mitochondria
unknown
ZmRNC1
At4g37510
Os01g59510
chloroplasts
trnV intron, trnK
intron, trnl intron,
trnA intron, atpF
intron, rps12
intron2, ndhB
intron, petB
intron, petD
intron, trnG
intron
Watkins et al.,
2007
DUF860 or PORR ZmWTF1
At4g01037
Os05g49610
chloroplasts
trnV intron, trnK
intron, trnl intron,
trnA intron, atpF
intron, rps12
intron2, ndhB
intron, petB
intron, petD
intron, trnG
intron
Kroeger et al.,
2009
Whirly’’
protein
ZmWHY
At1G14410 or OS06G05350
At2g02740
chloroplasts
atpF intron
Prikryl et al.,
2008
DEAD-box
protein
AtPMH2
At3G22330
OS12G41715
mitochondria
Matthes et al.,
nad1 intron 2 and
2007; Kohler
3, nad2 intron 1,
et al., 2009
2 and 4, nad4
intron2 and 3,
nad5 intron 1, 2
and 3, nad7 intron1
and 4, cox2 intron,
rps3 intron
and rpl2 intron
unknown
NsNMS1
unknown
unknown
mitochondria
nad4 intron1
ribonuclease III
proteins
Brangeon et al.,
2000
Yellow boxes represent the species in which the different splicing factors have been characterized. Introns found in Arabidopsis thaliana but not in
maize and rice are marked with asterisks. Orthologous genes in Oryza sativa or in Arabidopsis thaliana have been determined using FLAGdb++ v4.2
(http://urgv.evry.inra.fr/FLAGdb) or BLASTP (http://blast.ncbi.nlm.nih.gov/Blast.cgi). The intron whose splicing requires AtCFM3a is marked in red. No
clear orthologs of ZmCRS2 and At5g19830 were found in Oryza sativa. Sub-cellular localizations confirmed by reverse genetics analysis and/or by
localization studies using a fluorescent protein fusion are indicated in bold.
peptidyl-tRNA
hydrolase
Localisation
6
|
d
The group II introns are divided into two subgroups IIA and IIB according to Michel et al. (1989). The introns that are found in Arabidopsis
thaliana but not in maize and rice are marked with asterisks. PPR proteins are represented in gray, CRM domains proteins in green, peptidyltRNA hydrolase protein in blue, maturase in gold, ribonuclease III domains protein in brown, PORR domain protein in red, and ‘Whirly’
protein in purple. This figure is modeled after the figure presented in Kroeger et al. (2009).
domains have been described and were placed into 14 orthologous groups divided into four subfamilies (Barkan et al.,
2007). Seven CRM domain proteins are predicted to be targeted to chloroplasts and among them, five have been characterized as plastidial splicing factors: CFM3, CFM2, CRS1,
CAF1, and CAF2 (described below). Two CRM proteins are predicted to be mitochondrial and five others are potentially targeted to two locations: mitochondria and chloroplasts, or
mitochondria and nucleus (Table 1).
All the CRM proteins characterized so far are involved in
RNA splicing in chloroplasts. The first CRM gene, CRS1 (for
Chloroplast RNA Splicing 1), was identified from a genetic
screen in maize (Jenkins et al., 1997) and later cloned (Till
et al., 2001). CRS1 contains three CRM domains and is required
for the splicing of the group IIA atpF intron via a direct interaction with its intronic target. Two other CRM domain proteins
were discovered in a yeast two-hybrid screen using CRS2 (a
homolog of peptidyl-tRNA hydrolases, which probably lacks
that catalytic activity but is required for the splicing of a subset
of group II introns) as a bait (Ostheimer et al., 2003). These two
proteins, CAF1 and CAF2 (for CRS2-associated factors 1 and 2),
have two CRM domains and each of them is bound to CRS2 in
chloroplasts. The complex CRS2–CAF1 is required for the splicing of a subset of subgroup IIB introns in maize: petD intron,
rpl16 intron, rps16 intron, trnG intron, ycf3 intron 1 (Ostheimer
et al., 2003). In Arabidopsis, two additional introns, absent in
maize (rpoC1 intron and ClpP intron 1), are spliced by the
CRS2–CAF1 complex (Asakura and Barkan, 2006). The complex
CRS2–CAF2, whose formation is mediated by a 22-amino-acid
motif in the C-terminal region of CAF2 (Ostheimer et al., 2006),
is required for the splicing of five subgroup IIB introns: ndhB
intron, petB intron, rps12 intron 1, ndhA intron, and ycf3
intron 1. It was observed that for this last intron, CRS2–
CAF1 and CRS2–CAF2 complexes have overlapping functions
in maize and in Arabidopsis thaliana (Asakura and Barkan,
2006; Ostheimer et al., 2003). Two Arabidopsis paralogs
(At4g31010 and At5g54890) of CAF1 and CAF2 were predicted
to be mitochondrial (Table 1). These proteins end just after the
second CRM domain, lacking the C-terminal CRS2-binding
peptide found in CAF1 and CAF2. In addition, At5g19830,
a paralog of CRS2, is also predicted to be mitochondrial and
does not contain the conserved residues shown in CRS2 to bind
Figure 2. Schematic Representation of Chloroplast Splicing Factors in Land Plants.
PPR Proteins
Pentatricopeptide repeat (PPR) proteins are RNA-binding
proteins that have been identified from the Arabidopsis
thaliana genome sequence and are defined by a canonical
|
7
35-amino-acid motif, repeated in tandem up to 30 times (Small
and Peeters, 2000). More than 450 members compose this family in each land plant genome while only a few per genome
have been described in mammals, suggesting multiple specific
roles in plants (Schmitz-Linneweber and Small, 2008). Plant
PPR proteins can be classified into two major subfamilies based
on the nature of their PPR motifs: the P (for pentatricopeptide)
subfamily and the PLS subfamily (where L and S indicate long
and short variants of the PPR motif). The latter subfamily can
be further divided into several subclasses based on their characteristic C-terminal motifs (Lurin et al., 2004). Abundant
genetic evidence suggests that many PPR proteins have
sequence-specific RNA binding activity and are involved in
organellar gene expression, including RNA transcription,
RNA editing, RNA maturation, RNA translation, and RNA splicing (Schmitz-Linneweber and Small, 2008).
In chloroplasts, four PPR proteins have been shown to be
involved in RNA splicing of specific introns. PPR4 (SchmitzLinneweber et al., 2006) was identified in maize and presents,
in addition to its PPR motifs, an N-terminal RNA recognition
motif (RRM). RNA immunoprecipitation showed that PPR4
was associated with the first intron of rps12 pre-mRNA. In
addition, ppr4 mutants are defective in splicing of this intron,
demonstrating a direct role of PPR4 in trans-splicing of rps12
intron 1. The Arabidopsis PPR protein OTP51 (for ORGANELLAR
TRANSCRIPT PROCESSING 51) carries two C-terminal LAGLIDADG
motifs in addition to seven canonical PPR motifs (de Longevialle
et al., 2008). LAGLIDADG homing endonucleases are encoded by
mobile genetic elements found mostly in group I introns and catalyze DNA cleavage at specific sites lacking the endonuclease
coding region (Chevalier and Stoddard, 2001). Most of the LAGLIDADG proteins are endonucleases, but some of them have acquired a dual function, acting both as homing endonucleases
and as RNA splicing maturases. OTP51 has lost the amino acids
thought to be required for endonuclease activity, but has conserved those described to be essential for the maturase activity.
Reverse genetics has shown that OTP51 is involved in RNA splicing of ycf3 intron 2 and, in addition, influences the splicing of
a subset of tRNA introns and the atpF intron (de Longevialle et al.,
2008). Two other chloroplast PPR proteins may be implicated in
splicing, although the data suggest that the effects on splicing
may be indirect consequences of alterations in RNA stability.
Arabidopsis hcf152 mutants present reduced amounts of spliced
petB RNA and are affected in the accumulation of transcripts
cleaved between the genes psbH and petB (Meierhoff et al.,
2003). HCF152 may bind the exon–intron junction of petB and
be directly involved in splicing of the petB transcript (Nakamura
et al., 2003) or, alternatively, it may play an indirect role by protecting mature mRNAs from degradation, as shown for PPR10 in
maize (Pfalz et al., 2009). Another possible splicing factor is PPR5,
a maize P-class PPR protein that stabilizes unspliced trnG-UCC
precursor but may also promote its splicing (Beick et al., 2008;
Cushing et al., 2005).
In mitochondria, PPR proteins are also likely to be involved
in RNA splicing (Figure 3). Most mitochondrial introns are
CAF1 and CAF2. Nevertheless, it has another hydrophobic domain that could potentially bind to CAF paralogs (Ostheimer
et al., 2005). It seems likely that CRS2–CAF-type complexes
could exist in mitochondria, where they may be involved in
RNA splicing (Ostheimer et al., 2006).
Another CRM domain protein found to be involved in RNA
splicing is closely related to CRS1 but has a fourth CRM domain
at the C-terminus. CFM2 (for CRM Family Member 2) was found
in the large RNP complexes that contain CAF1 and/or CAF2.
RNA co-immunoprecipitation assays (RIP-Chip) in maize have
shown that CFM2 is associated with one group I intron (trnL
intron) and two group II introns (ndhA intron, ycf3 intron 1).
In Arabidopsis, a reverse genetic approach has shown that
CFM2, in addition to these three introns, also promotes the
splicing of the clpP intron 2 (a group II intron), which is not
found in maize (Asakura and Barkan, 2007; Asakura et al., 2008).
CFM3 (for CRM Family Member 3), the latest CRM domain
protein to be characterized in plants, contains three CRM
domains (Asakura et al., 2008). In contrast to the other splicing
factors in the family, CFM3 is dual-targeted to chloroplasts and
mitochondria. In chloroplasts, CFM3 associates in vivo with a
distinct subset of CAF/CRS2-dependent group II introns (ndhB
intron, rpl16 intron, rps16 intron, trnG intron, petB intron,
and petD intron) and promotes their splicing in rice. In Arabidopsis thaliana, two paralogs have been described: AtCFM3a
(At3g23070) is dual-targeted to both organelles and AtCFM3b
(At4g14510) is specific to chloroplasts. Loss of AtCFM3a leads
to a strong decrease in the splicing of ndhB intron while
atcfm3b mutants do not have any phenotype. The double mutant atcfm3a/atcfm3b presents seed lethality, demonstrating
that these two proteins are functionally redundant (Asakura
et al., 2008) and may indirectly be involved in translation by
having a function in splicing of rpl16 (encoding a ribosomal
protein) or the trnG intron, as has been demonstrated for
OsCFM3 (Asakura et al., 2008). In mitochondria, the role of
CFM3 is not completely elucidated and further study will be
required.
Among the CRM domain family, four additional proteins
cluster in the subfamily 3 (Table 1) (Barkan et al., 2007). These
CRM domain proteins have not been characterized so far but
are predicted to localize to the nucleus and mitochondria, and
this has been confirmed by GFP fusion in the case of CFM6
(At4g13070) (Barkan et al., 2007). It has been suggested that
CFM6 may function in ribosome biogenesis within the nucleus
and mitochondrion. However, an additional function in RNA
splicing in mitochondria is not excluded, as also suggested
for the mitochondrial paralogs of CAF1 and CAF2.
Thus, CRM domain proteins are implicated in the metabolism of three classes of catalytic RNA: group I introns, group
II introns, and 23S rRNA.
d
8
|
d
Dashed circles mark introns that might be affected in the At-nMat1a mutant. Dashed arrows mark interactions needed for high splicing efficiency
but not absolutely required. PPR protein is represented in gray, Maturase proteins in gold, DEAD-box protein in brown, and NMS1 in ivory.
localized in nad genes, suggesting that splicing mutants are
likely to be affected in mitochondrial complex I, leading to
partial sterility and delayed development. OTP43 is so far
the only PPR protein characterized to be involved in splicing
in plant mitochondria (de Longevialle et al., 2007). This P-class
PPR is required for trans splicing of nad1 intron 1 and the
splicing defect leads to a complete loss of Complex I activity.
The otp43 mutant exhibits increased expression of alternative
NAD(P)H dehydrogenases and alternative oxidases to bypass
the Complex I defect, similar to that seen in rotenone-treated
cells (Garmier et al., 2008), the ndufs4 mutant in Arabidopsis
(Meyer et al., 2009), and the Nicotiana CMSII mutant (Dutilleul
et al., 2003).
All five PPR proteins identified to be involved in splicing in
organelles so far are P-class proteins, as opposed to the large
class of PLS-class PPR proteins involved in RNA editing (Cai
et al., 2009; Hammani et al., 2009; Kim et al., 2009; Okuda
et al., 2009, 2010; Robbins et al., 2009; Schmitz-Linneweber
and Small, 2008; Takenaka, 2010; Tseng et al., 2010; Verbitskiy
et al., 2009; Yu et al., 2009; Zehrmann et al., 2009). The scarce
data on the RNA binding activity of P-class PPR proteins suggest they generally bind tightly and specifically to their RNA
targets (Schmitz-Linneweber and Small, 2008) and all appear
to be primarily required for splicing of a single, specific intron.
OTHER SPLICING FACTORS
CRS2 (for Chloroplast RNA Splicing 2) is a peptidyl-tRNA hydrolase (pthts) that was first described from maize chloroplasts
(Jenkins and Barkan, 2001). This protein, in association with
the CRM-containing proteins CAF1 and CAF2, is required for
the splicing of nine group II introns (rps12 intron 1, ndhB
intron, petB intron, ndhA intron, ycf3 intron 1, rpl16 intron,
rps16 intron, petD intron, and trnG intron) in maize (Jenkins
and Barkan, 2001; Jenkins et al., 1997) (see paragraph on
CRM proteins). In Arabidopsis, in addition to a plastid-targeted
protein, three orthologs of CRS2 have been described. Two of
them are predicted to be targeted to mitochondria whilst the
last does not appear to contain a predictable targeting signal
(Table 1). The lack of several conserved amino acids important
for the activity of the E. coli pthts enzyme, an enzyme that
cleaves the ester bond linking the tRNA and nascent peptide
(Menninger, 1976), suggests that CRS2 and its three orthologs
may lack peptidyl-tRNA hydrolase activity but have acquired
a function in group II intron splicing. Indeed, in the case of
CRS2, no function in translation has been observed (Jenkins
and Barkan, 2001). However, interestingly, one mitochondrial
paralog of CRS2 in Arabidopsis (At5g19830) has conserved
PTH-like traits, suggesting that this particular protein could
Figure 3. Schematic Representation of Mitochondrial Splicing Factors in Land Plants.
|
9
and telomere maintenance and bind nucleoids in chloroplasts
and mitochondria. ZmWHY promotes atpF intron splicing
in association with CRS1. Many other WHY proteins exist
in plants, raising the question of their functions in RNA
splicing.
In mitochondria (Figure 3), two additional splicing factors
have been described that do not belong to the different families of proteins described above. PMH2 (for Putative Mitochondrial RNA Helicase 2) is a DEAD-box protein (Kohler
et al., 2009; Matthes et al., 2007). In Arabidopsis, 58 genes
encoding DEAD-box proteins have been identified (Boudet
et al., 2001; Mingam et al., 2004). Through their primary function in modifying inter- or intramolecular RNA structures or in
dissolving RNA protein complexes, DEAD-box proteins are
potentially involved in most events of RNA processing, including RNA synthesis, RNA modification, RNA cleavage, RNA degradation, as well as ribosome biogenesis and translation
initiation (Linder, 2006). PMH2 is associated with large
RNA-containing complexes in mitochondria (Matthes et al.,
2007) and is required for the efficient splicing of 15 out of
the 23 group II introns found in Arabidopsis mitochondria
(Kohler et al., 2009). More precisely, the pmh2 mutant
presents a decrease in the splicing of: nad1 intron 2 and 3;
nad2 intron 1, 2, and 4; nad4 intron 2 and 3; nad5 intron 1,
2, and 3; nad7 intron 1 and 4; cox2 intron; rps3 intron; and
rpl2 intron. As suggested by the large number of introns that
are more or less affected in the mutant, PMH2 does not seem
to have a preference for a particular substrate and rather
functions as a RNA chaperone that influences RNA stability.
Three other DEAD-box proteins involved in RNA splicing have
been characterized in other species. In S. cerevisiae, Mss116 is
important for the splicing of all mitochondrial group I and
group II introns (Huang et al., 2005) and Ded1 has been shown
to facilitate group II intron splicing in vitro (Solem et al.,
2006). In N. crassa, CYT-19 enhances group I intron splicing
(Bertrand et al., 1982).
ROLE OF SPLICING FACTORS IN RNA
FOLDING AND SPLICE SITE RECOGNITION
A large set of splicing factors has been identified in recent
years, mainly by reverse genetic approaches and/or because
of their RNA binding activities. However, their precise roles
and the basis for sequence-specific RNA recognition still
need to be elucidated for most of them. Progress in understanding splicing mechanisms has been achieved for some
chloroplast splicing factors, providing new insights into ribonucleoprotein complexes and the need for RNA folding
trans-factors.
As described above, the CRS1 protein, which has three CRM
domains, binds the atpF intron in vivo (Ostheimer et al., 2003;
Till et al., 2001). To further understand its role in RNA splicing,
a recombinant dimeric CRS1 has been used for binding assays
on the atpF intron (Ostersetzer et al., 2005). It revealed that the
maize recombinant CRS1 binds two different sequences within
have a dual function in RNA splicing and translation
(Ostheimer et al., 2005). In Arabidopsis, no mutants in this family have been characterized. However, Arabidopsis CRS2 homologs might have the same functions in splicing of several group
II introns in association with AtCAF1 and AtCAF2 proteins. In
maize, it was impossible to reconstitute splicing in vitro with
these three factors together, suggesting that additional proteins are required. One of these additional factors might be
RNC1, which has been identified by mass-spectrometry analysis
of proteins that co-immunoprecipitate with CAF1 and CAF2
(Watkins et al., 2007).
RNC1 is a plant-specific protein with two ribonuclease III
domains that binds RNA but lacks endonuclease activity. In
bacteria, Rnase III functions in the processing of a polycistronic
rRNA precursor. In maize, rnc1 mutants are deficient in plastid
ribosome accumulation; however, it was not possible to prove
a physical association between rRNA sequences and RNC1.
This, in addition to the lack of endonuclease activity of
RNC1, suggests that in plants, RNC1 is not involved in processing polycistronic rRNA precursors but that the phenotype in
ribosome accumulation might be a secondary effect of the
rnc1 mutation. It has been shown that RNC1 is associated with
a subset of group IIA (trnV intron, trnK intron, trnI intron, trnA
intron, atpF intron, and rps12 intron 2) and IIB introns (ndhB
intron, petB intron, petD intron, trnG intron) and facilitates
their splicing (Watkins et al., 2007). Interestingly, RNC1 is also
associated with ycf3 intron 1 and rpl2 intron but seems not to
be required for their splicing. In addition, this reverse genetic
approach has shown that whereas RNC1 was first identified by
its co-immunoprecipitation with CAF proteins, it does not
seem to be essential for introns that require both CAF/CRS2
complexes, suggesting it plays a supporting role.
Another protein identified by mass-spectrometry analysis of
proteins that co-immunoprecipitate with CAF1 and CAF2 contains a domain of unknown function (DUF860), renamed recently as the PORR (for Plant Organelle RNA Recognition)
domain due to its ability to bind RNA (Kroeger et al., 2009).
WTF1 (for ‘What’s This Factor?’) is part of a family that has
17 members in rice and 15 in Arabidopsis and that comprises
14 orthologous groups. Nearly all these members are predicted
to be targeted to chloroplasts or mitochondria. WTF1 is a
plant-specific protein, which co-immunoprecipitates from
chloroplast extracts with group II introns and is involved in
their splicing (Kroeger et al., 2009). This new factor, by forming
a heterodimer with RNC1, enhances the splicing of all the
RNC1-specific introns. The many other members of this family
of organellar proteins have not been characterized so far. Like
WTF1, they might be involved in organellar RNA metabolism,
opening a new research area of RNA binding proteins, and
putative RNA splicing factors.
In chloroplasts, ZmWHY, which has been identified in maize,
could be also considered as a splicing factor (Prikryl et al.,
2008). ZmWHY is a member of the plant-specific ‘Whirly’
protein family, whose members have been described as
DNA-binding proteins that influence nuclear transcription
d
10
|
d
question of whether all the splicing factors are present in
a single RNP complex. Splicing factors may interact with each
other via direct protein–protein interactions or indirectly by
RNA tethering. For example, whilst RNC1 and WTF1 were
shown to interact together to promote the splicing of most
group II introns in chloroplasts (Kroeger et al., 2009), ZmWHY
is associated with CRS1 in an indirect RNA-mediated manner
to promote the splicing of atpF (Prikryl et al., 2008). So far,
the evidence suggests that factors required for splicing more
than one intron are generally incorporated into one of several alternate multi-protein complexes (Kroeger et al., 2009).
Intron-specific factors have not generally been found to be
physically associated with such splicing complexes. It is possible that they act in an initial sequence-specific binding step
that alters RNA conformation ready for recruitment of the
relevant splicing complex, but such ideas await the challenging reconstitution of RNA splicing in vitro before they can be
tested.
OTHER MECHANISMS INFLUENCING RNA
SPLICING EFFICIENCY INDIRECTLY
RNA Editing
Maturation of organellar mRNAs involves many different processes in plant organelles, which include exonucleolytic processing of 5’ and 3’ termini, RNA splicing, and RNA editing.
RNA editing is usually an early step of RNA maturation and
required for expression of many plant mitochondrial and
chloroplast genes. Thirty-four cytidine to uridine editing sites
have been described in Arabidopsis chloroplast transcripts
(Chateigner-Boutin and Small, 2007) whereas 441 were found
in Arabidopsis mitochondria, 427 in Brassica napus, and 491 in
Oryza sativa (Giege and Brennicke, 1999; Handa, 2003; Notsu
et al., 2002). In addition to their principal effect of changing
coding sequences of mRNA, RNA editing sites have also been
found in introns or near intron–exon junctions. The function
of RNA editing sites in untranslated regions remains to be elucidated, but a role in intron RNA folding is plausible. Such
effects were observed in a chimeric yeast mitochondrial
intron containing the domain V of nad1 intron 3 from Oenothera mitochondria. In these experiments, in vitro self-splicing
was observed only for the edited and not for the unedited
mRNA (Borner et al., 1995). In addition, some RNA editing
events close to exon–intron boundaries are affected by splicing: only unspliced or spliced RNA is edited, depending on the
mRNA. For example, in the case of cox2 exon 1, suppressing an
editing site located in the IBS1 at low temperature reveals an
accumulation of unspliced precursors in wheat, suggesting
that this editing event is required for high splicing efficiency
(Kurihara-Yonemoto and Handa, 2001). On the other hand,
some RNA editing sites very close to intron–exon junctions
are edited only in the spliced mRNA, suggesting that the recognition of the editing site occurs only when the precursor is
spliced or that the different EBS and IBS interactions are
the maize atpF intron, which correspond to 111 nucleotides at
the 3’ end of domain I and 30 nucleotides (680–710) in domain
IV. Through this association, CRS1 promotes the RNA folding of
the atpF intron into its predicted ‘catalytically active’ form. Interestingly, these sequences are not well conserved between
monocotyledons and dicotyledons. For example, a deletion
of the 3’ end of domain I is observed in dicotyledons. Because
the Arabidopsis homolog of CRS1 was shown to be required
for the splicing of the same intron (Asakura and Barkan,
2006), it would be very interesting to discover the sites bound
by the Arabidopsis protein to understand how CRS1 recognizes
its binding sites and how RNA binding proteins have coevolved with their RNA targets. To understand how multiple
CRM domains cooperate to achieve highly specific RNA binding, affinity assays were performed on the three CRM domains
of maize CRS1 (Keren et al., 2008). Through this analysis, these
three CRM motifs did not show the same affinity for the RNA
sequences of the atpF intron. Whereas CRM domain 3 bound
tightly to atpF intron, CRM domain 1 associated with the 111
nucleotides at the 3’ end of domain I and CRM domain 2 interacted with several regions within domains I, III, and IV but with
low affinity.
A similar approach was used to investigate the binding sites
of PPR5 (Beick et al., 2008; Williams-Carrier et al., 2008).
ZmPPR5 binds in vivo to the unspliced precursor of trnG-UCC
and is involved in RNA stabilization and possibly RNA splicing
of this intron. Recombinant ZmPPR5 is associated with high affinity to the central region of the trnG intron (Beick et al.,
2008) and interacts preferentially with single-stranded RNA
in a region of 50 nucleotides in domain I of the trnG intron
(Williams-Carrier et al., 2008). This binding site is located where
the intron is cut in the mutant, confirming a role for PPR5 in
RNase protection.
Through these analyses and RIP-Chip experiments, it seems
quite clear that at least some splicing factors directly interact
with introns in a sequence-specific manner. By this binding
activity, the interacting protein changes the intron RNA folding to enhance its splicing. This conformational change is
mediated by at least one or more proteins, depending on
the intron targeted. For example, even if we cannot exclude
that many splicing factors remain to be identified, only one
splicing factor has been identified for ycf3 intron 2, clpP intron 2, or trnL intron, while the splicing of some other introns
involve four or five known splicing factors, such as, for example, the petB intron. In the case of the atpF intron, six splicing
factors have been described to be absolutely or partially required for its splicing. Sedimentation through sucrose gradients showed that CRS1 is part of a ribonucleoprotein
complex of about 600–700 kDa (Till et al., 2001), comprising
about 270 kDa of the atpF intron and around 160 kDa of dimeric CRS1. By adding in the molecular weight of all the
splicing factors (WTF1, 61 kDa; RNC1, 62 kDa; MatK,
65 kDa; ZmWHY, 29 kDa) that have been shown to be involved in atpF splicing, a complex of 647 kDa, very close to
the experimental observations, is predicted. This raises the
competing with the editing machinery (Li-Pook-Than and
Bonen, 2006).
Temperature
|
11
been described for ycf3 intron 1 in the cl3 mutant (for cytoplasmic line 3) in barley (Landau et al., 2009). Two point mutations
in ycf3 intron 1 lead to a decrease in splicing of this intron at
18C and no splicing was detected when plants were grown at
32C. In silico folding analysis of the mutant ycf3 intron 1 sequence suggested that the temperature increase to 32C might
lead to the disruption of the RNA secondary structure required
for intron splicing.
CONTROL OF ORGANELLAR RNA
SPLICING BY SPLICING FACTORS:
A HYPOTHETICAL MODEL
Most of the nuclearly encoded splicing factors that have been
identified are required for RNA splicing of their corresponding
introns. If splicing were rate-limiting for expression of the organelle proteins encoded by the spliced transcripts, then these
splicing factors could be said to regulate organellar gene
Figure 4. Hypothetical Model of Plant Organellar RNA Splicing.
(A) A primary transcript is produced that is incapable of self-splicing under physiological conditions.
(B) One or more primary-sequence-specific RNA binding factors, such as a PPR protein for example, associates with the selected intron. This
initial protein–RNA association leads to conformational change stabilizing the RNA in a structure that can be recognized by general splicing
factors. In the case of trans-splicing introns, this RNA binding factor could associate with the two parts of the intron, helping in this way the
RNA–RNA interaction.
(C) Association of one of several alternative general splicing complexes enhances the two trans-esterification steps leading to splicing. Two
predictions from this hypothetical schema can be made: the first is that there is no requirement that the initial sequence-specific splicing
factors targeting the selected intron have any physical association with the general splicing complex. The second is that the binding of the
initial RNA binding factor is likely to be the rate-limiting step, making these intron-specific splicing factors good candidates as regulatory
factors.
RNA folding is sensitive to temperature. Interactions within
introns or between intron and exon sequences may be different at low or high temperatures, leading to different RNA
conformations. Changes in RNA folding will modify the interactions between introns and their associated splicing factors
and thus modify splicing efficiency. Such alterations have been
observed for ndhB mRNA in tobacco (Karcher and Bock, 2002).
The processing of ndhB pre mRNA is sensitive to heat stress. At
25 or 37C, the splicing of this intron is normal, but no spliced
ndhB is observed at 42C and an accumulation of the unspliced
mRNA is observed. In this case, the splicing defect may be
explained by an inactivation of the associated splicing factors
at high temperatures. Another example of such an event has
d
12
|
d
CONCLUSIONS AND FUTURE PROSPECTS
RNA splicing in plant organelles is considerably more complicated that was first expected, involving a large number of diverse RNA binding factors. A wide range of nuclearly encoded
proteins have co-evolved with introns, giving rise to several
novel plant-specific RNA binding protein families. Some splicing factors are involved in many intron splicing events. While
no data are available concerning the recognition sites of these
factors, it could be proposed that these proteins bind to specific sequences that are common to all targeted introns or,
more likely, that they recognize secondary structures specific
to each intron class. Other splicing factors are specific to only
one intron, suggesting a specific RNA recognition site, which
may be determined by primary sequence or unique structural
motifs. The result is that each intron requires a different set of
splicing factors. In theory at least, this provides the necessary
flexibility to control expression of any spliced transcript in a
gene-specific manner. It remains to be seen whether regulated
activity of individual splicing factors is a factor in controlling
any aspects of organelle gene expression, but the possibility is
there. It will be interesting in the near future to understand
how these splicing factors are regulated during plant growth
and development, and also to see their responses to imposed
environmental stress. From a mechanistic point of view, more
splicing factors need to be characterized to catalog the splicing
machinery for each intron, with the ultimate goal of examining the splicing mechanism in vitro with a reconstituted splicing complex.
FUNDING
A.F.L. was supported by a fellowship from the AGRON-OMICS Integrated Project (LSHG-CT-2006-037704). I.D.S. is supported as a WA
State Premier’s Fellow. No conflict of interest declared.
REFERENCES
Andersson, S.G., Karlberg, O., Canback, B., and Kurland, C.G.
(2003). On the origin of mitochondria: a genomics perspective.
Philos. Trans. R. Soc. Lond. B. Biol. Sci. 358, 165–177; discussion
177–169.
Asakura, Y., and Barkan, A. (2006). Arabidopsis orthologs of maize
chloroplast splicing factors promote splicing of orthologous and
species-specific group II introns. Plant Physiol. 142, 1656–1663.
Asakura, Y., and Barkan, A. (2007). A CRM domain protein functions
dually in group I and group II intron splicing in land plant chloroplasts. Plant Cell. 19, 3864–3875.
Asakura, Y., Bayraktar, O.A., and Barkan, A. (2008). Two CRM protein subfamilies cooperate in the splicing of group IIB introns in
chloroplasts. RNA. 14, 2319–2332.
Ayliffe, M.A., Scott, N.S., and Timmis, J.N. (1998). Analysis of plastid
DNA-like sequences within the nuclear genomes of higher
plants. Mol. Biol. Evol. 15, 738–745.
Barkan, A. (1989). Tissue-dependent plastid RNA splicing in maize:
transcripts from four plastid genes are predominantly unspliced
in leaf meristems and roots. Plant Cell. 1, 437–445.
Barkan, A., Klipcan, L., Ostersetzer, O., Kawamura, T., Asakura, Y.,
and Watkins, K.P. (2007). The CRM domain: an RNA binding module derived from an ancient ribosome-associated protein. RNA.
13, 55–64.
Beick, S., Schmitz-Linneweber, C., Williams-Carrier, R., Jensen, B.,
and Barkan, A. (2008). The pentatricopeptide repeat protein
PPR5 stabilizes a specific tRNA precursor in maize chloroplasts.
Mol. Cell Biol. 28, 5337–5347.
Bertrand, H., Bridge, P., Collins, R.A., Garriga, G., and
Lambowitz, A.M. (1982). RNA splicing in Neurospora mitochondria: characterization of new nuclear mutants with defects in
splicing the mitochondrial large rRNA. Cell. 29, 517–526.
Bonen, L. (2008). Cis- and trans-splicing of group II introns in plant
mitochondria. Mitochondrion. 8, 26–34.
Borner, G.V., Morl, M., Wissinger, B., Brennicke, A., and Schmelzer, C.
(1995). RNA editing of a group II intron in Oenothera as a prerequisite for splicing. Mol. Gen. Genet. 246, 739–744.
Boudet, N., Aubourg, S., Toffano-Nioche, C., Kreis, M., and Lecharny, A.
(2001). Evolution of intron/exon structure of DEAD helicase
expression, as changes in the level of activity of the splicing
factor should lead to concomitant changes in the level of
spliced transcripts and their translation. It remains unclear
whether any such regulation occurs. This question was partially addressed in a study of mitochondrial transcript profiles
in wheat during early germination and seedling development
(Li-Pook-Than et al., 2004). During early development, RNA
splicing was shown to be incomplete for many introns. For example, in the case of nad7 mRNA, partially spliced mRNA accumulated during the early developmental stages before
subsequently disappearing 4 d after germination. Similar
observations were made for nad4 mRNA, where nad4 intron
1 was inefficiently excised during early development, whilst
introns 2 and 3 were fully spliced. In chloroplasts, examination
of four genes in several tissues of maize suggests that splicing is
part of the regulation of plastid gene expression (Barkan,
1989). While the fraction of spliced transcripts of atpF, petB,
petD, and rpl16 is similar in all leaf tissues examined, it is lower
in meristematic and root tissue. Given that there is little evidence for gene-specific transcriptional regulation in plant
organelles and many assumptions that regulation of gene expression is largely post-transcriptional, intron-specific splicing
factors make attractive candidates as potential regulatory factors (see the model presented in Figure 4). It would be useful to
carry out a systematic analysis of rates of splicing and expression of splicing factors throughout plant development and
correlate the observations with translation rates for organellar
proteins. One such analysis has been partially done in rnc1
mutants. Three alleles have been identified in maize for which
two are mild rnc1 alleles. While some introns are less affected
in the mild rnc1 alleles than with a total loss of function of
RNC1, there is a strong effect on trnA and trnI splicing, indicating that RNC1 is limiting for splicing in these cases and that it
could be a regulatory factor (Watkins et al., 2007).
d
|
13
rapeseed and Arabidopsis thaliana. Nucleic Acids Res. 31,
5907–5916.
Brangeon, J., et al. (2000). Defective splicing of the first nad4 intron
is associated with lack of several complex I subunits in the Nicotiana sylvestris NMS1 nuclear mutant. Plant J. 21, 269–280.
Cai, W., et al. (2009). LPA66 is required for editing psbF chloroplast
transcripts in Arabidopsis. Plant Physiol. 150, 1260–1271.
Huang, H.R., Rowe, C.E., Mohr, S., Jiang, Y., Lambowitz, A.M.,
and Perlman, P.S. (2005). The splicing of yeast mitochondrial
group I and group II introns requires a DEAD-box protein with
RNA chaperone function. Proc. Natl Acad. Sci. U S A. 102,
163–168.
Carrillo, C., Chapdelaine, Y., and Bonen, L. (2001). Variation in sequence and RNA editing within core domains of mitochondrial
group II introns among plants. Mol. Gen. Genet. 264, 595–603.
Jenkins, B.D., and Barkan, A. (2001). Recruitment of a peptidyltRNA hydrolase as a facilitator of group II intron splicing in chloroplasts. EMBO J. 20, 872–879.
Chateigner-Boutin, A.L., and Small, I. (2007). A rapid high-throughput
method for the detection and quantification of RNA editing
based on high-resolution melting of amplicons. Nucleic Acids
Res. 35, e114.
Jenkins, B.D., Kulhanek, D.J., and Barkan, A. (1997). Nuclear mutations that block group II RNA splicing in maize chloroplasts reveal several intron classes with distinct requirements for
splicing factors. Plant Cell. 9, 283–296.
Chevalier, B.S., and Stoddard, B.L. (2001). Homing endonucleases:
structural and functional insight into the catalysts of intron/
intein mobility. Nucleic Acids Res. 29, 3757–3774.
Karcher, D., and Bock, R. (2002). Temperature sensitivity of RNA
editing and intron splicing reactions in the plastid ndhB transcript. Curr. Genet. 41, 48–52.
Cho, Y., Qiu, Y.L., Kuhlman, P., and Palmer, J.D. (1998). Explosive invasion of plant mitochondria by a group I intron. Proc. Natl Acad.
Sci. U S A. 95, 14244–14249.
Cushing, D.A., Forsthoefel, N.R., Gestaut, D.R., and Vernon, D.M.
(2005). Arabidopsis emb175 and other ppr knockout mutants reveal essential roles for pentatricopeptide repeat (PPR) proteins in
plant embryogenesis. Planta. 221, 424–436.
de Longevialle, A.F., et al. (2007). The pentatricopeptide repeat
gene OTP43 is required for trans-splicing of the mitochondrial
nad1 Intron 1 in Arabidopsis thaliana. Plant Cell. 19, 3256–
3265.
de Longevialle, A.F., et al. (2008). The pentatricopeptide repeat
gene OTP51 with two LAGLIDADG motifs is required for the cissplicing of plastid ycf3 intron 2 in Arabidopsis thaliana. Plant J.
56, 157–168.
Dutilleul, C., et al. (2003). Leaf mitochondria modulate whole cell
redox homeostasis, set antioxidant capacity, and determine
stress resistance through altered signaling and diurnal regulation. Plant Cell. 15, 1212–1226.
Eickbush, T.H. (1999). Mobile introns: retrohoming by complete reverse splicing. Curr. Biol. 9, R11–R14.
Ellis, J. (1982). Promiscuous DNA–chloroplast genes inside plant mitochondria. Nature. 299, 678–679.
Fedorova, O., Waldsich, C., and Pyle, A.M. (2007). Group II intron
folding under near-physiological conditions: collapsing to the
near-native state. J. Mol. Biol. 366, 1099–1114.
Garmier, M., et al. (2008). Complex I dysfunction redirects cellular
and mitochondrial metabolism in Arabidopsis. Plant Physiol. 148,
1324–1341.
Giege, P., and Brennicke, A. (1999). RNA editing in Arabidopsis mitochondria effects 441 C to U changes in ORFs. Proc. Natl Acad.
Sci. U S A. 96, 15324–15329.
Hammani, K., Okuda, K., Tanz, S.K., Chateigner-Boutin, A.L.,
Shikanai, T., and Small, I. (2009). A study of new Arabidopsis
chloroplast RNA editing mutants reveals general features
of editing factors and their target sites. Plant Cell. 21, 3686–3699.
Handa, H. (2003). The complete nucleotide sequence and RNA editing content of the mitochondrial genome of rapeseed (Brassica
napus L.): comparative analysis of the mitochondrial genomes of
Keating, K.S., Toor, N., Perlman, P.S., and Pyle, A.M. (2010). A structural analysis of the group II intron active site and implications
for the spliceosome. RNA. 16, 1–9.
Keren, I., et al. (2009). AtnMat2, a nuclear-encoded maturase required for splicing of group-II introns in Arabidopsis mitochondria. RNA. 15, 2299–2311.
Keren, I., Klipcan, L., Bezawork-Geleta, A., Kolton, M., Shaya, F.,
and Ostersetzer-Biran, O. (2008). Characterization of the molecular basis of group II intron RNA recognition by CRS1-CRM
domains. J. Biol. Chem. 283, 23333–23342.
Kim, S., and Yoon, M.K. (2010). Comparison of mitochondrial and
chloroplast genome segments from three onion (Allium cepa L.)
cytoplasm types and identification of a trans-splicing intron of
cox2. Curr. Genet. 56, 177–188.
Kim, S.R., et al. (2009). Rice OGR1 encodes a pentatricopeptide
repeat-DYW protein and is essential for RNA editing in mitochondria. Plant J. 59, 738–749.
Kleine, T., Maier, U.G., and Leister, D. (2009). DNA transfer from
organelles to the nucleus: the idiosyncratic genetics of endosymbiosis. Annu. Rev. Plant Biol. 60, 115–138.
Kohler, D., Schmidt-Gattung, S., and Binder, S. (2009). The DEADbox protein PMH2 is required for efficient group II intron splicing
in mitochondria of Arabidopsis thaliana. Plant Mol. Biol. 72,
459–467.
Kroeger, T.S., Watkins, K.P., Friso, G., van Wijk, K.J., and Barkan, A.
(2009). A plant-specific RNA-binding domain revealed through
analysis of chloroplast group II intron splicing. Proc. Natl Acad.
Sci. U S A. 106, 4537–4542.
Kruger, K., Grabowski, P.J., Zaug, A.J., Sands, J., Gottschling, D.E.,
and Cech, T.R. (1982). Self-splicing RNA: autoexcision and autocyclization of the ribosomal RNA intervening sequence of Tetrahymena. Cell. 31, 147–157.
Kurihara-Yonemoto, S., and Handa, H. (2001). Low temperature
affects the processing pattern and RNA editing status of
the mitochondrial cox2 transcripts in wheat. Curr. Genet. 40,
203–208.
Landau, A.M., Lokstein, H., Scheller, H.V., Lainez, V., Maldonado, S.,
and Prina, A.R. (2009). A cytoplasmically inherited barley mutant
is defective in photosystem I assembly due to a temperaturesensitive defect in ycf3 splicing. Plant Physiol. 151, 1802–1811.
family genes in Arabidopsis, Caenorhabditis, and Drosophila.
Genome Res. 11, 2101–2114.
14
|
d
Li-Pook-Than, J., and Bonen, L. (2006). Multiple physical forms of
excised group II intron RNAs in wheat mitochondria. Nucleic
Acids Res. 34, 2782–2790.
Li-Pook-Than, J., Carrillo, C., and Bonen, L. (2004). Variation in mitochondrial transcript profiles of protein-coding genes during
early germination and seedling development in wheat. Curr.
Genet. 46, 374–380.
Linder, P. (2006). Dead-box proteins: a family affair–active and passive players in RNP-remodeling. Nucleic Acids Res. 34, 4168–4180.
Lurin, C., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell. 16, 2089–2103.
Matthes, A., et al. (2007). Two DEAD-box proteins may be part of
RNA-dependent high-molecular-mass protein complexes in Arabidopsis mitochondria. Plant Physiol. 145, 1637–1646.
Menninger, J.R. (1976). Peptidyl transfer RNA dissociates during
protein synthesis from ribosomes of Escherichia coli. J. Biol.
Chem. 251, 3392–3398.
Meyer, E.H., et al. (2009). Remodeled respiration in ndufs4 with low
phosphorylation efficiency suppresses Arabidopsis germination
and growth and alters control of metabolism at night. Plant
Physiol. 151, 603–619.
Ostheimer, G.J., Hadjivassiliou, H., Kloer, D.P., Barkan, A., and
Matthews, B.W. (2005). Structural analysis of the group II intron
splicing factor CRS2 yields insights into its protein and RNA interaction surfaces. J. Mol. Biol. 345, 51–68.
Ostheimer, G.J., Rojas, M., Hadjivassiliou, H., and Barkan, A. (2006).
Formation of the CRS2–CAF2 group II intron splicing complex is
mediated by a 22-amino acid motif in the COOH-terminal region
of CAF2. J. Biol. Chem. 281, 4732–4738.
Ostheimer, G.J., Williams-Carrier, R., Belcher, S., Osborne, E.,
Gierke, J., and Barkan, A. (2003). Group II intron splicing factors
derived by diversification of an ancient RNA-binding domain.
EMBO J. 22, 3919–3929.
Pfalz, J., Bayraktar, O.A., Prikryl, J., and Barkan, A. (2009). Sitespecific binding of a PPR protein defines and stabilizes 5’ and
3’ mRNA termini in chloroplasts. EMBO J. 28, 2042–2052.
Prikryl, J., Watkins, K.P., Friso, G., van Wijk, K.J., and Barkan, A.
(2008). A member of the Whirly family is a multifunctional
RNA- and DNA-binding protein that is essential for chloroplast
biogenesis. Nucleic Acids Res. 36, 5152–5165.
Pyle, A.M., Fedorova, O., and Waldsich, C. (2007). Folding of group
II introns: a model system for large, multidomain RNAs? Trends
Biochem. Sci. 32, 138–145.
Michel, F., Umesono, K., and Ozeki, H. (1989). Comparative and
functional anatomy of group II catalytic introns: a review. Gene.
82, 5–30.
Raven, J.A., and Allen, J.F. (2003). Genomics and chloroplast
evolution: what did cyanobacteria do for plants? Genome
Biol. 4, 209.
Mingam, A., Toffano-Nioche, C., Brunaud, V., Boudet, N., Kreis, M.,
and Lecharny, A. (2004). DEAD-box RNA helicases in Arabidopsis
thaliana: establishing a link between quantitative expression,
gene structure and evolution of a family of genes. Plant Biotechnol. J. 2, 401–415.
Robbins, J.C., Heller, W.P., and Hanson, M.R. (2009). A comparative
genomics approach identifies a PPR-DYW protein that is essential for C-to-U editing of the Arabidopsis chloroplast accD transcript. RNA. 15, 1142–1153.
Mohr, G., and Lambowitz, A.M. (2003). Putative proteins related
to group II intron reverse transcriptase/maturases are encoded
by nuclear genes in higher plants. Nucleic Acids Res. 31,
647–652.
Nakagawa, N., and Sakurai, N. (2006). A mutation in At-nMat1a,
which encodes a nuclear gene having high similarity to group
II intron maturase, causes impaired splicing of mitochondrial
NAD4 transcript and altered carbon metabolism in Arabidopsis
thaliana. Plant Cell Physiol. 47, 772–783.
Nakamura, T., Meierhoff, K., Westhoff, P., and Schuster, G. (2003).
RNA-binding properties of HCF152, an Arabidopsis PPR protein
involved in the processing of chloroplast RNA. Eur. J. Biochem.
270, 4070–4081.
Notsu, Y., et al. (2002). The complete sequence of the rice (Oryza
sativa L.) mitochondrial genome: frequent DNA sequence acquisition and loss during the evolution of flowering plants. Mol.
Genet Genomics. 268, 434–445.
Okuda, K., et al. (2009). Pentatricopeptide repeat proteins with the
DYW motif have distinct molecular functions in RNA editing and
RNA cleavage in Arabidopsis chloroplasts. Plant Cell. 21, 146–156.
Okuda, K., et al. (2010). The pentatricopeptide repeat protein
OTP82 is required for RNA editing of plastid ndhB and ndhG
transcripts. Plant J. 61, 339–349.
Schmitz-Linneweber, C., and Small, I. (2008). Pentatricopeptide repeat proteins: a socket set for organelle gene expression. Trends
Plant Sci. 13, 663–670.
Schmitz-Linneweber, C., Williams-Carrier, R.E., Williams-Voelker, P.M.,
Kroeger, T.S., Vichas, A., and Barkan, A. (2006). A pentatricopeptide repeat protein facilitates the trans-splicing of the maize
chloroplast rps12 pre-mRNA. Plant Cell. 18, 2650–2663.
Small, I.D., and Peeters, N. (2000). The PPR motif: a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci.
25, 46–47.
Solem, A., Zingler, N., and Pyle, A.M. (2006). A DEAD protein that
activates intron self-splicing without unwinding RNA. Mol. Cell.
24, 611–617.
Stern, D.B., and Lonsdale, D.M. (1982). Mitochondrial and chloroplast genomes of maize have a 12-kilobase DNA sequence in
common. Nature. 299, 698–702.
Takenaka, M. (2010). MEF9, an E-subclass pentatricopeptide repeat
protein, is required for an RNA editing event in the nad7 transcript in mitochondria of Arabidopsis. Plant Physiol. 152,
939–947.
Till, B., Schmitz-Linneweber, C., Williams-Carrier, R., and Barkan, A.
(2001). CRS1 is a novel group II intron splicing factor that
was derived from a domain of ancient origin. RNA. 7, 1227–
1238.
Meierhoff, K., Felder, S., Nakamura, T., Bechtold, N., and Schuster, G.
(2003). HCF152, an Arabidopsis RNA binding pentatricopeptide repeat protein involved in the processing of chloroplast psbB-psbTpsbH-petB-petD RNAs. Plant Cell. 15, 1480–1495.
Ostersetzer, O., Cooke, A.M., Watkins, K.P., and Barkan, A. (2005).
CRS1, a chloroplast group II intron splicing factor, promotes intron folding through specific interactions with two intron
domains. Plant Cell. 17, 241–255.
d
|
15
Toor, N., Hausner, G., and Zimmerly, S. (2001). Coevolution of group
II intron RNA structures with their intron-encoded reverse transcriptases. RNA. 7, 1142–1152.
Weeden, N.F. (1981). Genetic and biochemical implications of the
endosymbiotic origin of the chloroplast. J. Mol. Evol. 17,
133–139.
Tseng, C.C., Sung, T.Y., Li, Y.C., Hsu, S.J., Lin, C.L., and Hsieh, M.H.
(2010). Editing of accD and ndhF chloroplast transcripts is partially affected in the Arabidopsis vanilla cream1 mutant. Plant.
Mol. Biol. 73, 309–323.
Williams-Carrier, R., Kroeger, T., and Barkan, A. (2008). Sequencespecific binding of a chloroplast pentatricopeptide repeat
protein to its native group II intron ligand. RNA. 14, 1930–
1941.
Verbitskiy, D., Zehrmann, A., van der Merwe, J.A., Brennicke, A., and
Takenaka, M. (2009). The PPR protein encoded by the LOVASTATIN
INSENSITIVE 1 gene is involved in RNA editing at three sites in mitochondria of Arabidopsis thaliana. Plant J. 61, 446–455.
Yu, Q.B., Jiang, Y., Chong, K.,
a pentatricopeptide repeat
plast transcript accD RNA
biogenesis in Arabidopsis
1023.
Vogel, J., and Borner, T. (2002). Lariat formation and a hydrolytic
pathway in plant chloroplast group II intron splicing. EMBO J.
21, 3794–3803.
Watkins, K.P., et al. (2007). A ribonuclease III domain protein functions in group II intron splicing in maize chloroplasts. Plant Cell.
19, 2606–2623.
Zehrmann, A., Verbitskiy, D., van der Merwe, J.A., Brennicke, A.,
and Takenaka, M. (2009). A DYW domain-containing pentatricopeptide repeat protein is required for RNA editing at multiple
sites in mitochondria of Arabidopsis thaliana. Plant Cell. 21,
558–567.
Zoschke, R., Nakamura, M., Liere, K., Sugiura, M., Borner, T., and
Schmitz-Linneweber, C. (2010). An organellar maturase associates with multiple group II introns. Proc. Natl Acad. Sci. U S A.
107, 3245–3250.
Wank, H., SanFilippo, J., Singh, R.N., Matsuura, M., and
Lambowitz, A.M. (1999). A reverse transcriptase/maturase promotes splicing by binding at its own coding segment in a group
II intron RNA. Mol. Cell. 4, 239–250.
and Yang, Z.N. (2009). AtECB2,
protein, is required for chloroediting and early chloroplast
thaliana. Plant J. 59, 1011–
INTRODUCTION
I.2 La famille des protéines PPR (Pentatricopeptide Repeat)
Le séquençage du génome d‟Arabidopsis en décembre 2000 a permis de révéler la
présence de milliers de gènes jusque là encore insoupçonnés et dont la fonction était
inconnue. Parmi ces gènes, une nouvelle famille, la famille des gènes PPR (pour
PentatricoPeptide Repeat) a été mise en évidence de façon indépendante par deux équipes
françaises (Aubourg, Boudet et al. 2000; Small and Peeters 2000). Deux grands points
caractérisent cette famille, tout d‟abord les deux tiers de ses membres sont prédits localisés
soit dans les mitochondries, soit dans les chloroplastes en utilisant le logiciel de prédiction
Predotar (Small and Peeters 2000; Small, Peeters et al. 2004) et le deuxième point concerne
leur étrange abondance dans le génome d‟Arabidopsis (Aubourg, Boudet et al. 2000). En
effet, cette famille, comportant plus de 450 membres chez Arabidopsis représente près de 2%
du génome, ce qui a fait d‟elle la plus grande famille pour laquelle la fonction n‟était pas
connue. Au moment de leur découverte, peu de données permettaient de leur attribuer un rôle
fonctionnel, mais, grâce à la caractérisation de trois protéines de ce type dans d‟autres
espèces, une idée plus précise de leur fonction avait pu être proposée. Ainsi, chez le maïs, le
gène CRP1 code pour une protéine PPR impliquée dans la traduction de certains transcrits
chloroplastiques (Barkan, Walker et al. 1994) ; la protéine PET309 chez Saccharomyces
cerevisiae est également impliquée dans la traduction mais aussi dans la stabilité du transcrit
cox1 dans les mitochondries (Manthey and McEwen 1995) ; et le gène cya-5 chez Neurospora
crassa code pour une protéine PPR, homologue de PET309 et impliquée également dans la
maturation post-transcriptionnelle du transcrit cox1 (Coffin, Dhillon et al. 1997). Ces
premières données suggéraient donc une fonction des protéines PPR dans la régulation posttranscriptionnelle des ARN messagers des organites. Mais quelles sont leurs caractéristiques,
leurs fonctions et leur distribution dans le monde vivant ?
I.2.1 Caractéristiques des PPRs
I.2.1.1 Description des motifs PPRs
Les protéines PPR sont caractérisées par la présence d‟un motif de 35 acides aminés répété
en tandem, entre 2 et 26 fois (Lurin, Andres et al. 2004). Ce motif est assez proche du motif
TPR (pour tetratricopeptide repeat). Les protéines TPR sont impliquées dans des interactions
de type protéine-protéine (Blatch and Lassle 1999; Small and Peeters 2000) et le motif TPR
forme une paire d‟hélices alpha antiparallèles, qui en répétitions, conduisent à la formation
d‟une structure super hélicoïdale englobant un sillon central correspondant au site de fixation
à un ligand protéique (Das, Cohen et al. 1998).
L‟analyse bioinformatique prédictive des motifs PPR a également permis de proposer une
structure super hélicoïdale (Small and Peeters 2000). Cependant, à la différence des protéines
TPR, les chaînes exposées dans le sillon central des protéines PPR seraient dans la majorité
des cas hydrophiles et basiques ce qui suggère que ces protéines se lieraient
préférentiellement à des cibles chargées négativement comme des acides aminés acides ou des
acides nucléiques (Small and Peeters 2000).
Des données permettent aujourd‟hui de confirmer ce type d‟interactions pour un certain
nombre de protéines PPR et plus précisément avec des molécules d‟ARN. En effet des
expériences de RIP-CHIP, de retard sur gel ou « d‟UV cross linking », ont montré cette
interaction entre une protéine PPR et un ARN cible. C‟est le cas par exemple de PPR4 chez le
maïs qui a été montrée par RIP-CHIP comme interagissant avec l‟intron 1 de rps12 dans les
chloroplastes (Schmitz-Linneweber, Williams-Carrier et al. 2006). Cela a été aussi montré
25
INTRODUCTION
pour HCF152 dont la protéine recombinante se lie avec une haute affinité à la jonction exonintron de petB, permettant sa stabilité et facilitant l‟épissage de l‟intron (Nakamura, Meierhoff
et al. 2003), mais dont l‟affinité est diminuée lorsque la protéine est tronquée et ne contient
que deux motifs PPR au lieu de 12. C‟est le cas également de CRP1 chez le maïs, se liant à
une région d‟ARN simple brin de 69 nucléotides dans la région 5‟ UTR des transcrits psaC et
petA (Schmitz-Linneweber, Williams-Carrier et al. 2005), de PPR5, se fixant elle aussi
préférentiellement sur de l‟ARN simple brin dans une région de 45 nucléotides dans l‟intron
du trnG-UCC (Beick, Schmitz-Linneweber et al. 2008; Williams-Carrier, Kroeger et al.
2008), ou encore plus récemment de PPR10 chez le maïs qui en interagissant en 5‟ UTR du
transcrit d‟atpH et en 3‟ UTR de psaJ protège ces transcrits face à l‟action d‟exonucléases
(Pfalz, Bayraktar et al. 2009). Il en va également de même pour des protéines PPR impliquées
dans l‟édition. Ainsi CCR4 et CCR21 se lient sur une région de 25 nucléotides en amont et 10
nucléotides en aval des sites d‟édition sur le transcrit de ndhD (Okuda, Nakamura et al. 2006).
L‟interaction entre des molécules d‟ARN et des protéines PPR a également été montrée chez
d‟autres espèces. Ainsi chez l‟homme, LRP130 se lie in vivo à de l‟ARN mitochondrial mais
également à de l‟ARN nucléaire (Mili and Pinol-Roma 2003).
Toutes les protéines PPR caractérisées à ce jour n‟ont pas été montrées se fixant
spécifiquement à leur ARN cible, cependant les nombreux exemples décrits permettent de
proposer que ce soit une propriété commune à l‟ensemble des protéines PPR (Delannoy,
Stanley et al. 2007). Cette fixation spécifique à une séquence d‟ARN leur permettrait ainsi de
jouer un rôle majeur dans la régulation post-transcriptionnelle des ARN mitochondriaux et
chloroplastiques. En revanche, aucune donnée ne permet aujourd‟hui de comprendre le
mécanisme moléculaire permettant cette interaction spécifique mis à part des études in silico
de comparaisons de structure avec les protéines TPR. Un enjeu clef de la compréhension de la
famille PPR sera donc de connaître la structure des protéines par cristallographie ainsi que la
structure de l‟interaction afin de comprendre comment cette interaction s‟établit et pourquoi
elle est spécifique de la séquence de l‟ARN.
I.2.1.2 Composition de la famille
Les protéines PPR, selon les types de motifs qu‟elles portent, peuvent être classées en deux
sous-familles : les PPR de type « Pure » comportant seulement des motifs classiques et les
PPR de type « PLS » comportant en plus des motifs classiques, d‟autres motifs PPR plus
courts (S pour Short) ou plus longs (L pour Long) (Figure 1).
La sous-famille « Pure » est composée de 251 membres chez Arabidopsis. La sous-famille
« PLS » est assez particulière et est elle-même divisée en 4 sous-groupes selon les motifs
retrouvés en partie C-terminale. Le premier sous-groupe comprend des protéines PPR de type
PLS sans aucun motif C-terminal additionnel (6 membres chez Arabidopsis), le deuxième, des
protéines PPR PLS ayant en partie C-terminale un motif E pour « Elongated » (47 membres
chez Arabidopsis), le troisième, des protéines PPR PLS avec un motif E plus un motif E+ (60
membres chez Arabidopsis) et enfin le quatrième sous-groupe comprend des protéines PPR
PLS avec un motif E, E+ et un domaine dénommé DYW (87 membres chez Arabidopsis). Les
motifs E et E+ sont dans l‟ensemble des motifs plus ou moins dégénérés dont l‟identification
reste difficile, en revanche le domaine DYW est un domaine d‟environ 100 acides aminés très
conservé entre les différents membres de ce sous-groupe. Ce motif est composé entre autre de
résidus histidines, cystéines et d‟un triplet final aspartate (D)-tyrosine (Y) tryptophane (W)
quasiment invariants. Ce domaine très conservé pourrait avoir une activité catalytique
(Aubourg, Boudet et al. 2000; Lurin, Andres et al. 2004), activité qui a été proposée par
homologie de séquence comme étant une cytidine désaminase intervenant dans l‟édition des
ARNm (Salone, Rudinger et al. 2007).
26
INTRODUCTION
Figure 1 : Composition de la famille des protéines PPR chez Arabidopsis thaliana. La famille est
divisée en deux sous-familles, la sous-famille « Pure » (P subfamily) comportant des motifs classiques
représentés en orange et la sous-famille PLS (PLS subfamily) caractérisée par des motifs courts (S
pour Short) en jaune, des motifs longs (L1 et L2 pour Long) en orange foncé et l‟addition pour certains
cas de motif E en vert clair, de motif E+ en vert foncé, et d‟un motif DYW en bleu.
La présence de motifs additionnels non PPR a également été décrite dans des PPR de type
« Pure ». Ainsi un domaine RRM (pour RNA Recognition Motif) en N-terminal est présent
sur PPR4 (Schmitz-Linneweber, Williams-Carrier et al. 2006) permettant un deuxième type
de reconnaissance de l‟ARN ; deux domaines LAGLIDADG sont décrits en C-terminal de
OTP51 (de Longevialle, Hendrickson et al. 2008). Une dizaine de protéines PPR ont en partie
C-terminale un domaine SMR apparenté au domaine terminal des protéines bactériennes
MutS2 dont la fonction est d‟inhiber la recombinaison homologue. La fonction de ce domaine
chez les PPR n'est pas connue, mais il pourrait intervenir dans des interactions de type
protéine-protéine ou porter une fonction d‟endonucléase avec une reconnaissance de l‟ADN
simple ou double brin (Moreira and Philippe 1999; Malik and Henikoff 2000; Fukui, Kosaka
et al. 2007; Diercks, Ab et al. 2008). Enfin, une autre PPR de type « Pure », AT5G10690,
comprend un domaine CBS (pour Cystathionine beta-synthase) en partie C-terminale.
Contrairement à la présence des motifs E, E+ et DYW très répandus dans la famille, la
présence de ces motifs additionnels reste sporadique suggérant une fonction particulière pour
ces protéines PPR portant de tels motifs supplémentaires.
I.2.1.3 Distribution de la famille
Les protéines PPR sont présentes chez tous les eucaryotes mais presque totalement
absentes du monde des procaryotes sauf dans quelques cas où des protéines PPR sont
retrouvées dans certaines bactéries.
C‟est le cas chez Erwinia amylovora où la protéine CFBP1430 YP_003530178.1 présente
7 motifs PPR identifiés sous TPRpred (http://toolkit.tuebingen.mpg.de/tprpred) et chez
Rhodobacter sphaeroides où la protéine ATCC 17029 YP_001044140.1 présente 11 motifs
PPR identifiés également sous TPRpred. Rhodobacter est une bactérie photosynthétique qui
présente l‟originalité de posséder deux chromosomes ce qui est rare chez les procaryotes.
Erwinia amylovora est un agent pathogène de la famille des Enterobacteriaceae responsable
27
INTRODUCTION
du feu bactérien qui infecte majoritairement les poiriers, les pommiers, les cognassiers et les
néfliers par le biais des fleurs ou de blessures. Dans ce cas particulier, il est possible que cette
PPR soit le résultat d‟un transfert horizontal.
La distribution de ces protéines dans le monde des eucaryotes n‟est cependant pas très
homogène. En effet, il est très intéressant de voir que la famille des protéines PPR a connu
une très grande expansion dans le monde végétal (Figure 2).
Figure 2 : Distribution des protéines PPR dans différentes espèces.
Alors que l‟on comptabilise seulement 7 protéines PPR chez l‟homme (Lightowlers and
Chrzanowska-Lightowlers 2008), 3 protéines PPR chez la levure Saccharomyces ceriviasae et
11 protéines PPR chez l‟algue Chlamydomonas reinhardtii (Johnson, Wostrikoff et al. 2010),
on en compte plus de 450 chez Arabidopsis thaliana et chez le riz Oryza sativa (O'Toole,
Hattori et al. 2008; Schmitz-Linneweber and Small 2008). Il est néanmoins possible que ce
nombre soit sous estimé chez les espèces autres que les plantes. En effet, les motifs PPR sont
assez dégénérés, donc difficiles à détecter, et les matrices de détection ont été générées
essentiellement à partir de motifs « végétaux ». Cependant, même si leur détection était
améliorée, leur nombre resterait certainement largement inférieur à celui des plantes. Comme
nous le verrons plus tard dans le chapitre concernant la fonction des protéines PPR, cette
expansion chez les plantes pourrait résulter du nombre de gènes restants dans les organites et
d‟une grande complexité de la maturation des ARN dans les organites. Un autre point assez
intéressant à noter est que cette expansion des PPR chez les plantes s‟est également faite avec
l‟apparition de la sous-famille PLS (Figure 2). En effet cette sous-famille n‟est trouvée que
chez les plantes supérieures, tous les autres eucaryotes n‟ayant que des protéines PPR de type
« Pure ». Plusieurs hypothèses peuvent être faites sur l‟apparition de la sous-famille de type
28
INTRODUCTION
PLS, mais la plus probable serait que cette expansion serait liée à la présence d‟un événement
particulier et très répandu chez les plantes terrestres qu‟est l‟édition des ARN. En effet,
Véronique Salone, au cours de sa thèse a montré, par une analyse phylogénétique, une
corrélation stricte entre la présence de séquences codants pour le motif DYW dans les
génomes et l‟existence du phénomène d‟édition dans les organites (Salone, Rudinger et al.
2007). Par ailleurs, une comparaison de la famille des protéines PPR d‟Arabidopsis thaliana,
d‟Oryza sativa et de Physcomitrella patens a permis de montrer qu‟il existe une corrélation
entre l‟expansion de la sous-famille des protéines PPR de type PLS et celle du processus
d‟édition chez les plantes terrestres (O'Toole, Hattori et al. 2008). Enfin, l‟homologie du motif
DYW avec une cytidine désaminase permet de proposer que ces protéines soient impliquées
dans l‟édition des ARNm (Salone, Rudinger et al. 2007).
I.2.1.4 Données de localisation subcellulaire
Les logiciels de prédiction de localisation subcellulaire proposent une localisation pour la
plupart des protéines PPR. Ainsi une grande majorité des PPR est prédite dans les
mitochondries et certaines autres dans les chloroplastes. Des données de protéomique
permettent de confirmer une partie de ces données de prédiction, mais, du fait de leur faible
expression, d‟une demi-vie courte des ARN (Narsai, Howell et al. 2007) et d‟une faible
abondance des protéines PPR, cette confirmation ne peut pas être faite pour une grande
majorité d‟entres elles.
Néanmoins, parmi les 450 protéines PPR, près d‟un quart n‟ont pas de claire prédiction de
localisation dans les organites. Ainsi, selon les cas, des localisations en dehors des organites
sont proposées ou bien il existe une trop grande contradiction entre les différents logiciels de
prédiction. Pour évaluer l‟existence de protéines PPR localisées en dehors des organites, une
étude systématique de la localisation subcellulaire de 167 protéines PPR sans prédiction
précise a été entreprise par le laboratoire de Claire Lurin. Ces expériences de localisation sont
sur le point d‟être terminées par Laure Heurtevin et permettent dès maintenant de montrer que
la grande majorité des protéines PPR sans prédiction claire sont malgré tout localisées dans
les organites. Cependant, parmi les protéines testées, de façon très intéressante, 17 protéines
PPR se trouvent doublement adressées dans les chloroplastes et les mitochondries et 8 autres
ont une localisation cytoplasmique ou nucléaire. Cette analyse étant faite en utilisant des
protéines de fusion entre les 100 premiers acides aminés des PPR et la DsRedII, la
localisation reste à être confirmée en utilisant des fusions avec les protéines entières.
I.2.2 Rôle des protéines PPR
Depuis la découverte de la famille il y a dix ans, de nombreuses protéines PPR ont été
étudiées et caractérisées, permettant de démontrer leur implication majeure dans divers
phénomènes de régulation transcriptionnelle et post-transcriptionnelle dans les organites. Les
tableaux 1, 2 et 3 listent les différentes PPR caractérisées à ce jour, et décrivent leur fonction
lorsque celle-ci a été identifiée.
29
INTRODUCTION
Tableau 1 : Protéines PPR chloroplastiques chez les plantes supérieures décrites dans la littérature
à la date du 25 juin 2010.
30
INTRODUCTION
Tableau 2 : Protéines PPR mitochondriales chez les plantes supérieures décrites dans la littérature
à la date du 25 juin 2010.
Tableau 3 : Protéines PPR décrites dans la littérature à la date du 25 juin 2010 chez les organismes
autres que les plantes supérieures.
31
INTRODUCTION
I.2.2.1 Les protéines PPR dans l‟initiation de la transcription
La première étape de la régulation de l‟expression des gènes s‟effectue au niveau de la
transcription des gènes. Dans les plastes et les mitochondries, plusieurs protéines sont
impliquées dans ce mécanisme, que ce soit des ARN polymérases ou des protéines permettant
la reconnaissance de l‟initiation de la transcription par ces polymérases comme par exemple
les facteurs sigmas reconnaissant des sites d‟initiation spécifiques dans le génome
chloroplastique (Kanamaru and Tanaka 2004). Dans cette première étape, certaines protéines
PPR ont également un rôle primordial.
La première PPR à avoir été montrée comme étant active dans la transcription est P63. En
effet cette protéine PPR de type « Pure », identifiée lors d‟une extraction de protéines se liant
spécifiquement à l‟ADN mitochondrial, possède une forte affinité pour l‟ADN et plus
particulièrement pour la région promotrice du gène cox2 (Ikeda and Gray 1999).
Dans les chloroplastes, la transcription s‟effectue via deux types de complexes de
polymérases. Le premier, la NEP, est constitué de protéines codées par le génome nucléaire et
le deuxième, la PEP, contient des protéines codées par le génome chloroplastique. Ces deux
types de polymérases n‟interviennent pas toujours dans la transcription des mêmes gènes et il
existe donc des gènes transcrits spécifiquement par la NEP : les gènes accD, rpoB et rpoC et
des gènes transcrits spécifiquement par la PEP comme une grande partie des gènes codant des
protéines impliquées dans la photosynthèse, ainsi que des gènes transcrits par les deux mais
avec des sites d‟initiation de la transcription différents. Ainsi, l‟activité de la polymérase PEP
est essentielle dans la transcription des gènes de la photosynthèse et celle de la NEP dans les
gènes dits « housekeeping » pour les fonctions basales (Hajdukiewicz, Allison et al. 1997;
Liere and Maliga 1999).
Plusieurs facteurs influencent et régulent étroitement ces deux activités, ainsi certaines
protéines PPR ont un rôle majeur dans la transcription et font partie intégrante de ces
complexes. C‟est le cas de PTAC2 (pour Platidial Transcriptional Active Complex), une
protéine PPR de type « Pure » qui fait partie également des protéines PPR possédant des
motifs supplémentaires car elle comporte un motif SMR dont la fonction reste à déterminer.
Cette PPR a été montrée associée à la PEP et le mutant ptac2, dont le phénotype
macroscopique est très affecté, présente un défaut majeur dans la transcription des gènes
dépendant de la polymérase de type PEP (Pfalz, Liere et al. 2006). On ne connaît
malheureusement pas comment cette protéine régule cette activité transcriptionnelle, et quel
est son rôle exact dans le complexe actif transcriptionnel. La protéine PPR DG1 (pour
Delayed Greening 1) est aussi impliquée dans l‟activité transcriptionnelle chloroplastique
(Chi, Ma et al. 2008). Cette protéine contrairement à PTAC2 n‟est pas associée au complexe
actif de transcription. En revanche l‟activité de la PEP est fortement affectée chez le mutant.
La protéine PPR GRP23 impliquée dans le développement précoce de l‟embryon, interagit
avec la sous-unité III de l‟ARN polymérase de type II, mais non pas dans les organites comme
la majorité des PPR mais dans le noyau (Ding, Liu et al. 2006). Il est possible que cette
interaction permette une régulation de l‟expression de gènes nucléaires via la PPR. Cependant
un autre rôle au niveau des organites n‟est pas à exclure car cette PPR a également été
localisée dans les mitochondries au sein du laboratoire de Claire Lurin.
Chez les mammifères, il a été montré un lien direct entre les ARN polymérases
mitochondriales et les protéines PPR, car des motifs PPR sont retrouvés directement dans
celles-ci (Shadel 2004). Chez la levure, des protéines PPR associées à l‟ARN polymérase
mitochondriale se lient aux chaînes d‟ARN néosynthétisées afin de les stabiliser (Shadel
2004). Ces différents exemples montrent qu‟il existe un lien direct entre l‟ARN polymérase,
la transcription et les protéines PPR. Néanmoins, le type d‟interaction moléculaire avec les
32
INTRODUCTION
acides nucléiques (PPR-ARN ou PPR-ADN) n‟est pas toujours très clair. Les PPR pourraient
jouer un rôle directement en aval de la transcription en stabilisant les ARN néosynthétisés
et/ou en permettant leur maturation de façon couplée à la transcription.
I.2.2.2 Les protéines PPR dans la maturation des ARNm
Une fois le transcrit immature synthétisé, un certain nombre d‟étapes de maturation sont
nécessaires avant la phase traductionnelle ou une phase de régulation conduisant à la
dégradation des ARN synthétisés. Dans les organites ces étapes sont hautement régulées de
façon spécifique à chaque transcrit; ceci implique un grand nombre de protéines parmi
lesquelles de nombreuses protéines PPR.
I.2.2.2.1 Maturation en 5’ et 3’ des ARNm
Par leurs origines, la majorité des gènes des organites sont transcrits sous des formes
polycistroniques. De ce fait, l‟expression de chaque gène nécessite différentes étapes de
clivages sur chaque transcrit. Ces clivages en 5‟ et 3‟ de chaque transcrit nécessitent
l‟intervention d‟enzymes de type RNase ayant des activités exoribonucléase ou
endoribonucléase. L‟action spécifique de ces RNase dans la reconnaissance ou dans leur arrêt
nécessite soit des protéines de type « RNA binding » soit une structure secondaire spécifique
de l‟ARN. Parmi les protéines reconnaissants des séquences spécifiques de l‟ARN, les
protéines PPR sont de très bon candidats et, à ce jour, un certains nombre de protéines PPR
ont été identifiées dans ce type de maturation.
CRR2 (pour chlororespiratory reduction) est la première PPR identifiée dans les
chloroplastes ayant un rôle dans la maturation des ARN (Hashimoto, Endo et al. 2003). Cette
PPR de type DYW est impliquée dans le clivage du transcrit polycistronique rps7-ndhB. Une
autre PPR du même type, AT2G02980, mais localisée dans les mitochondries a également été
montrée comme ayant une activité endoribonucléase in vitro (Nakamura and Sugita 2008)
mais aucune cible n‟a été déterminée. Récemment une autre PPR, RPF2 appartenant à une
sous-famille particulière des PPR qui sera décrite ultérieurement, les Rf-like, a été montrée
impliquée dans le clivage en 5‟ des transcrits de nad9 et cox3 (Jonietz, Forner et al. 2010).
Enfin, toujours chez Arabidopsis, deux autres PPR de type « Pure », PGR3 (pour Proton
Gradient Regulation) et HCF152 (pour High Chlorophyll Fluorescence), sont impliquées dans
la maturation des transcrits polycistroniques petL-petG-psaJ et psbT-psbH-petB-petD,
respectivement (Meierhoff, Felder et al. 2003; Yamazaki, Tasaka et al. 2004), avec également
un rôle dans l‟épissage de l‟intron de petB pour HCF152.
Dans d‟autres espèces, des protéines PPR ont également été caractérisées comme ayant un
rôle dans la maturation des transcrits. Chez la souris, PTC2, est impliquée dans le clivage du
transcrit polycistronique nd5-cytB (Xu, Ackerley et al. 2008). Chez Physcomitrella patens
PPR531.11, renommée PpPPR_38 est impliquée dans la maturation de clpP (Hattori, Miyake
et al. 2007) et permet le clivage entre clpP et rps12 en se liant directement sur cette région
(Hattori and Sugita 2009). De façon intéressante cette protéine se lie également sur une région
chevauchant l‟exon1 et l‟intron1 de clpP facilitant ainsi l‟épissage de celui-ci, donnant à cette
protéine une double fonction dans la maturation de ce transcrit. Chez la levure Saccharomyces
cerevisiae, le mutant Aep3p présente un défaut de clivage de l‟ARN polycistronique atp8-atp6
(Ellis, Helfenbein et al. 2004), mais il vient également d‟être montré que cette protéine aurait
un rôle dans l‟initiation de la traduction en se liant avec mIF2, un initiateur de la traduction
dans les mitochondries (Lee, Tibbetts et al. 2009).
33
INTRODUCTION
I.2.2.2.2 L’édition des ARNm
Une autre étape de la maturation des ARNm dans les organites est l‟édition. L‟édition est
une modification de la séquence nucléotidique mature de l‟ARNm ; dans les organites des
plantes supérieures, elle consiste généralement en une substitution d‟un nucléotide Cytidine
en Uridine. Ce changement, en modifiant la séquence de l‟ARNm, peut avoir plusieurs
impacts sur la synthèse de la protéine finale. Par exemple, l‟édition peut conduire à la création
d‟un codon d‟initiation de la traduction comme dans le cas du site ndhD-1 par le changement
de ACG en AUG. L‟édition a aussi un impact sur la fonctionnalité de la protéine en changeant
un acide aminé par un autre via l‟édition de l‟ARN. Mais il existe également certains sites
d‟édition qui n‟ont aucun impact sur la séquence en acides aminés, mais dont on pense qu‟ils
auraient un rôle dans la structure secondaire de l‟ARN et permetteraient ou non la maturation
correcte de celui-ci. Ainsi, l‟édition d‟ARNm pourrait influencer l‟efficacité de l‟épissage
lorsque le site d‟édition se situe à proximité de la jonction exon-intron ou au sein même de
l‟intron.
34 sites d‟édition ont été décrits dans les ARN chloroplastiques (Tillich, Funk et al. 2005;
Chateigner-Boutin and Small 2007) et 526 dans les ARN mitochondriaux chez Arabidopsis
(Giege and Brennicke 1999; Bentolila, Chateigner-Boutin et al. 2005; de Longevialle, Meyer
et al. 2007; Bentolila, Elliott et al. 2008; Zehrmann, van der Merwe et al. 2008). Le
mécanisme moléculaire de l‟édition dans les organites des plantes supérieures n‟est toujours
pas réellement connu, en revanche, de plus en plus de protéines sont identifiées comme étant
strictement nécessaires à l‟édition de certains sites d‟édition. De façon très intéressante, ces
protéines sont exclusivement des protéines PPR, et de façon encore plus remarquable, toutes
celles décrites jusqu'à ce jour sont des protéines PPR de la sous-famille PLS et plus
particulièrement des protéines PPR de type E, E+ ou DYW.
Dans les chloroplastes, à ce jour, 16 protéines PPR, représentées dans la figure 3, ont été
caractérisées comme permettant l‟édition de 21 sites d‟édition sur les 34 totaux.
CRR4 est la première protéine PPR de type E identifiée dans l‟édition, elle est nécessaire à
l‟édition du site ndhD-1, créant ainsi un site d‟initiation de la traduction (Kotera, Tasaka et al.
2005). CRR21, une protéine PPR de type E+ est impliquée dans l‟édition du site ndhD-2
(Okuda, Myouga et al. 2007). OTP80, une protéine de type E est nécessaire à l‟édition du site
rpl23 (Hammani, Okuda et al. 2009). Enfin CLB19, PPR de type E+, est impliquée dans
l‟édition des deux sites rpoA et clpP, dont les défauts d‟édition observés chez le mutant créent
un problème dans la transcription par la PEP polymérase (Chateigner-Boutin, Ramos-Vega et
al. 2008).
Douze protéines de type DYW ont également été décrites nécessaires dans l‟édition d‟un
ou plusieurs sites chloroplastiques. C‟est le cas de YS1 impliquée dans l‟édition de rpoB-1
(Zhou, Cheng et al. 2008), et de FLV impliquée dans l‟édition du site rpoC1 (Anne-Laure
Chateigner-Boutin et al., résultats non publiés). LPA66 est impliquée dans l‟édition du site
psbF (Cai, Ji et al. 2009). OTP85 et OTP86 sont nécessaires pour l‟édition respective des sites
ndhD et rps14 (Hammani, Okuda et al. 2009). Et OTP81 permet l‟édition du site dans l‟intron
de rps12, ce dernier n‟ayant visiblement aucun impact sur l‟efficacité de l‟épissage
(Hammani, Okuda et al. 2009).
Dans le cas de l‟édition du site accD-1 (accD C794), deux protéines PPR de type DYW ont
été décrites nécessaires chez Arabidopsis, RARE1 (Robbins, Heller et al. 2009) et ECB2 (Yu,
Jiang et al. 2009). Cependant, une caractérisation récente de la protéine nommée VAC1 codée
par le même gène que ECB2 a mis en évidence un résultat différent de celui publié
précédemment (Tseng, Sung et al. 2010). Ainsi, il a été montré que le mutant vac1 présente
34
INTRODUCTION
une diminution de l‟édition du site accD-1, et non une absence de l‟édition, mais en revanche
également une forte diminution du site en 3‟UTR d‟accD et du site sur ndhF.
Figure 3 : Schématisation des protéines PPR impliquées dans l‟édition des différents sites dans les
chloroplastes chez Arabidopsis.
Les quatre dernières PPR-DYW décrites sont impliquées dans l‟édition de plusieurs sites.
Ainsi, CRR22 permet l‟édition des sites ndhB-7, ndhD-5 et rpoB-3 (Okuda, ChateignerBoutin et al. 2009). L‟édition des sites ndhB-2 et ndhD-3 est sous le contrôle de CRR28
(Okuda, Chateigner-Boutin et al. 2009). OTP82 est impliquée dans l‟édition des sites ndhB-7
(C-95644) et ndhG (Okuda, Hammani et al. 2010). Et les sites psbZ, ndhB-10 et ndhF
nécessitent OTP84 (Hammani, Okuda et al. 2009).
Ainsi, au total, cinq protéines PPR (de type E+ ou DYW) sont nécessaires à l‟édition de
plusieurs sites dans les chloroplastes. Une analyse de la séquence aux alentours de chaque site
a permis d‟identifier des séquences consensus potentielles de reconnaissance pour 4 de ces
protéines PPR. En revanche, ce type d‟analyse n‟a pas permis de proposer une séquence
consensus de fixation pour CRR22 (Hammani, Okuda et al. 2009).
35
INTRODUCTION
Dans les mitochondries, seulement 4 protéines PPR de type DYW et 4 autres de type E et
E+ ont été identifiées dans l‟édition, et donc la quasi totalité des sites d‟édition
mitochondriaux n‟a aucun facteur d‟édition connu. Cependant, il est fort probable que d‟ici
peu, la majorité d‟entre eux sera caractérisée. Dans le riz, OGR1 est essentielle pour l‟édition
de 7 sites d‟édition répartis sur 5 transcrits différents nad4-C401, nad4-C416, nad4-C433,
nad2-C1457, ccmC-C458, cox2-C167, cox3-C572 (Kim, Yang et al. 2009). MEF1 (pour
mitochondrial RNA Editing Factor) est impliquée dans l‟édition de rps4-C956, nad7-C963,
nad2-C1160 (Zehrmann, Verbitskiy et al. 2009). MEF11 ou LOI1 (pour LOvastatin
Insensitive) est nécessaire pour l‟édition de 3 sites, cox3-C422, nad4-C124 and ccb203-C344
(Verbitskiy, Zehrmann et al. 2010). Et MEF22, la dernière protéine DYW, est impliquée dans
l‟édition du site nad3-C149 (Takenaka, Verbitskiy et al. 2010). En ce qui concerne les
protéines PPR de type E et E+, SLO1 (pour SLOW GROWTH1), une protéine PPR de type
E+, est impliquée dans l‟édition des deux sites nad4-449 and nad9-328 pour lesquels une
séquence consensus est détectable en 5‟ du site (Sung, Tseng et al. 2010). Et les protéines
MEF18, MEF19, MEF20, et MEF21 sont impliquées dans les sites respectifs : nad4-C1355 ;
ccb206-C566 ; rps4-C226 et cox3-C257 (Takenaka, Verbitskiy et al. 2010).
Chez la mousse Physcomitrella patens, la proteine PpPPR_71, une protéine PPR de type
DYW, est impliquée dans l‟édition de ccmF-1 (Tasaki, Hattori et al. 2010).
I.2.2.2.3 L’épissage des ARNm
Comme il a déjà été discuté dans la première partie de l‟introduction, l‟épissage des
ARNm dans les organites fait partie des étapes de maturation indispensables à la maturation
correcte de l‟ARN avant la traduction. Certaines PPR sont nécessaires à ce mécanisme. Les
protéines PPR impliquées dans l‟épissage dans les organites chez Arabidopsis sont décrites
dans l‟article 1 présenté dans l‟introduction. Certaines protéines PPR non décrites dans la
revue, car identifiées chez d‟autres organismes que les plantes supérieures, sont également
impliquées dans l‟épissage des introns dans les organites.
Ainsi la protéine Pet309 est nécessaire pour l‟accumulation de la forme non épissée de
cox1 chez la levure, mais son rôle direct dans l‟épissage reste cependant à être prouvé
(Manthey and McEwen 1995) et CCM1 (pour COB and COX1 mRNA Maturation) est
impliquée dans l‟épissage de l‟intron 4 de cob et de l‟intron 4 de cox1, tous deux décrits
comme des introns de group I (Moreno, Buie et al. 2009). Chez la mousse Physcomitrella
patens, la protéine PPR531-11 ou PpPPR_38 est impliquée dans l‟épissage de l‟ARNm de
clpP dans les chloroplastes en se fixant sur la région exon1-intron1 de l‟ARN pré-messager de
clpP (Hattori, Miyake et al. 2007; Hattori and Sugita 2009), cependant cette protéine n‟est pas
essentielle pour l‟épissage car des formes épissées de clpP sont toujours détectables chez le
mutant.
I.2.2.3 Les PPRs dans la stabilisation des ARNm et la traduction
Certaines protéines PPR permettent le clivage en 5‟ ou en 3‟ des ARNm, mais il existe
aussi des protéines PPR dont la fonction essentielle est de protéger les transcrits face à des
dégradations de type exonucléase et des clivages en jouant un rôle protecteur et de
stabilisation de l‟ARNm mature.
Chez le maïs, PPR10 stabilise deux transcrits chloroplastiques en se fixant sur deux
séquences similaires (Pfalz, Bayraktar et al. 2009). Cette interaction en 5‟ UTR du transcrit
d‟atpH et en 3‟ UTR de psaJ permet ainsi la protection des transcrits face à l‟action des 5‟-3‟
ou 3‟-5‟ exoribonucleases et augmente donc ainsi la durée de vie de ces transcrits et permet
également de montrer qu‟une protection protéique est nécessaire pour les transcrits n‟ayant
pas de structure de type boucle en 3‟UTR. Plus récemment, chez Chlamydomonas et
36
INTRODUCTION
Arabidopsis, il a été montré que MRL1, une protéine PPR de type « Pure » se trouvant dans
un complexe de haut poids moléculaire, est nécessaire à la stabilisation et la maturation du
transcrit rbcL en se fixant certainement dans la région en 5‟UTR (Johnson, Wostrikoff et al.
2010). De la même manière, MCA1 permet la stabilisation du transcrit petA en se fixant sur
les premiers 25 nucléotides de la région 5‟UTR et permet sa protection contre des 5‟-3‟
RNases (Loiselay, Gumpel et al. 2008).
Chez la drosophile, la protéine PPR BSF (pour Bicoïd mRNA Stability Factor) stabiliserait
le transcrit bicoïd codant pour une protéine importante dans le développement embryonnaire
en se fixant sur la région 3‟UTR du transcrit (Mancebo, Zhou et al. 2001). Cependant,
l‟homologue humain de cette protéine, LRP130 est localisé dans les mitochondries, alors que
le transcrit bicoïd se situe dans le cytosol, cette différence de compartimentation remet
partiellement en cause cette interaction. La protéine PPR LRP130 est également importante
dans la stabilité des ARNm. Des mutations dans le gène codant pour cette protéine conduisent
à une maladie neurodégénèrative : la LSFC (pour Leigh Syndrome French Canadian), une
déficience de la cytochrome c oxydase chez l‟homme (Mootha, Lepage et al. 2003). Chez les
patients atteints de cette maladie, les transcrits cox1 et cox3 sont très réduits suggérant un rôle
de LRP130 dans la stabilisation des transcrits cox1 et cox3 (Xu, Morin et al. 2004).
La stabilisation des ARN matures permet d‟augmenter leur durée de vie et ainsi influence
leur taux de traduction. Cette dernière étape implique également d‟autres facteurs, notamment
dans la reconnaissance des sites d‟initiation de la traduction, mais aussi dans la biogénèse des
sous-unités ribosomales, et, là encore, des protéines PPR ont été montrées essentielles dans
ces procédés dans les organites.
La protéine CRP1 chez le maïs est nécessaire pour la traduction des transcrits petA et petD
en se liant dans la région 5‟UTR de chaque transcrit (Barkan, Walker et al. 1994; SchmitzLinneweber, Williams-Carrier et al. 2005) et agit ainsi comme régulateur de la traduction de
ces deux transcrits. Le mutant ppr2 chez le maïs présente une absence de ribosomes
chloroplastiques suggérant que la protéine PPR2 est nécessaire dans l‟assemblage de la
machinerie traductionnelle (Williams and Barkan 2003). Une autre PPR, PPR336, identifiée
chez Arabidopsis, serait certainement impliquée dans la traduction au niveau mitochondrial
du fait de son association avec les polysomes (Uyttewaal, Mireau et al. 2008).
Chez l‟homme, PTCD3 (pour pentatricopeptide repeat domain protein) s‟associe
directement avec la petite sous-unité ribosomale mitochondriale (ARNr 12S) et régule ainsi
directement l‟activité traductionnelle de façon positive (Davies, Rackham et al. 2009). En
revanche, PTCD1, une autre protéine PPR chez l‟homme, a un rôle de régulation négative sur
l‟abondance de l‟ARN de transfert Leucine et par ce fait a donc un rôle indirect sur la
traduction, avec un effet négatif sur son activité (Rackham, Davies et al. 2009).
Dans ce même type de régulation de la traduction, il a été montré récemment chez la levure
Saccharomyces cerevisiae que la protéine PPR DMR1 s‟associe avec la sous-unité ribosomale
ARNr 15S et serait impliquée dans la biogénèse des ribosomes mitochondriaux et ainsi dans
la traduction (Puchta, Lubas et al. 2010). Chez la levure, la protéine AEP3p est nécessaire
dans la maturation du transcrit polycistronique atp8-atp6 (Ellis, Helfenbein et al. 2004), mais
pourrait également avoir un rôle dans l‟initiation de la traduction en se liant avec mIF2, un
initiateur de la traduction dans les mitochondries (Lee, Tibbetts et al. 2009). Enfin, la protéine
PPR, PET309, en plus de son rôle dans la stabilité de l‟ARN cox1, est également impliquée
dans la traduction de ce transcrit en se fixant dans la région non traduite 5‟UTR (Manthey and
McEwen 1995) et a été montrée par double hybride comme interagissant avec Nam1p, une
protéine importante dans le métabolisme des ARN mitochondriaux qui permet le transfert des
ARN vers leur site de traduction au niveau de la membrane interne (Naithani, Saracco et al.
37
INTRODUCTION
2003). Plus récemment, des délétions des différents motifs PPR composant cette protéine ont
permis de montrer que tous les motifs PPR sont importants pour la traduction du transcrit
cox1, en revanche, la délétion de ces motifs n‟a pas d‟impact sur la stabilité du transcrit
(Tavares-Carreon, Camacho-Villasana et al. 2008), montrant ainsi l‟importance de cette PPR
dans la traduction et visiblement moins dans la stabilisation.
I.2.2.4 Les protéines PPR impliquées dans la restauration de la fertilité mâle
cytoplasmique (CMS)
La stérilité mâle cytoplasmique (CMS) est un phénomène par lequel une plante
hermaphrodite n‟est plus capable de produire des gamètes mâles fertiles empêchant ainsi son
autofécondation. Le terme cytoplasmique évoque le fait que le phénotype est provoqué par un
facteur porté par le génome mitochondrial. Ce phénomène de grand intérêt agronomique est
dû à l‟expression d‟un gène mitochondrial « toxique », nommé généralement ORF-CMS.
Dans la nature, ce processus favorise les croisements entre individus afin d‟augmenter la
diversité génétique. En agronomie, ce processus a deux intérêts majeurs : faciliter la
production de descendance hybride chez des plantes naturellement autogames et bénéficier
ainsi du phénomène de vigueur hybride ou hétérosis, et, grâce aux gènes restaurateurs,
produire des hétérozygotes fertiles. En effet, sans gène de restauration, la stérilité mâle
cytoplasmique est transmise à la descendance. Très souvent, c'est une production de graines
qui est recherchée pour la plante hybride et il est nécessaire de restaurer la fertilité dans
l‟hybride. C'est le parent mâle de l'hybride qui aura cette fonction en apportant dans son
génome nucléaire le gène de restauration de fertilité.
De façon intéressante, hormis le cas d‟une aldéhyde déshydrogénase codée par le gene Rf2
du maïs (Cui, Wise et al. 1996), tous les gènes restaurateurs de fertilité découverts à ce jour
codent pour des protéines PPR. Ces protéines PPR appartiennent en très grande majorité à la
sous-famille « Pure » et, étrangement, font partie d‟une petite sous-famille de PPR qui a
évolué très rapidement. Par exemple, ces deux sous-familles sont très différentes chez le riz et
chez Arabidopsis, les gènes d‟Arabidopsis n‟ayant pas d‟orthologues chez le riz (O'Toole,
Hattori et al. 2008).
Rf-PPR592, restaurateur de fertilité de type PPR, a été isolé chez le pétunia (Bentolila,
Alfonso et al. 2002). Chez cette espèce, la stérilité male cytoplasmique est conférée par
l‟expression d‟un gène PCF qui est présent au sein d‟un transcrit polycistronique comprenant
atp9, cox2 et cette orf de fonction inconnue. En présence de la protéine PPR592 fonctionnelle,
l‟expression du transcrit pcf est fortement affectée ainsi que l‟expression de la protéine
résultante apportant ainsi une restauration de la fertilité. Ainsi la protéine PPR592, faisant
partie d‟un large complexe protéique, aurait une action sur la maturation posttranscriptionnelle de ce transcrit avec un effet de régulation négative sur l‟expression du gène
PCF en s‟associant directement au transcrit (Gillman, Bentolila et al. 2007).
Chez le riz, la CMS est induite par l‟expression de l‟ORF79 codant pour un peptide
cytotoxique et dont le gène se situe en aval du gène atp6 dans les mitochondries. Lors de la
CMS, un seul transcrit de 2 kb comprenant atp6 et l‟orf79 est observé alors que deux
transcrits sont normalement formés en présence du restaurateur de fertilité (Kazama and
Toriyama 2003). En réalité deux gènes PPR sont capables de restaurer la fertilité chez le riz,
Rf1a and Rf1b (Wang, Zou et al. 2006). Le premier, Rf1a code pour une protéine PPR
impliquée dans le clivage du transcrit de 2 kb mais aussi dans l‟édition d‟atp6 et le deuxième,
Rf1b ou Ifr1 code pour une PPR impliquée dans la dégradation du transcrit dicistronique atp6orf79. En effet il a été montré récemment que la protéine codée par le gène Ifr1 permettrait de
réduire la quantité de transcrit atp6-orf79 mais n‟affecterait en aucun cas le clivage de ce
38
INTRODUCTION
transcrit, montrant ainsi que les deux restaurateurs de fertilité chez le riz induisent deux effets
différents sur les transcrits selon leur site de fixation (Ohta, Ogino et al. 2010).
Chez le radis, le locus Rfo comprenant 3 gènes PPR (PPR-A, PPR-B/ Rfk1 et PPR-C)
réduisent l‟expression des ORF mitochondriales 138 et 125 responsables de la stérilité mâle
cytoplasmique (Brown, Formanova et al. 2003; Desloire, Gherbi et al. 2003; Koizuka, Imai et
al. 2003). Parmi les 3 gènes du locus Rfo, il a été montré que seul le gène PPR-B était le
restaurateur de fertilité en s‟associant in vivo à l‟orf138 (Uyttewaal, Arnal et al. 2008). Ainsi
la protéine PPR-B agirait directement sur la régulation de la traduction du transcrit de
l‟orf138.
Le restaurateur de fertilité chez le sorgho (Sorghum bicolor) est également une protéine
PPR, cependant le mécanisme d„action de cette restauration n‟est pas claire pour le moment
car le gène responsable de la stérilité n‟a toujours pas été identifié (Klein, Klein et al. 2005).
Les protéines PPR impliquées dans la restauration de la fertilité n‟ont pas un rôle
réellement diffèrent des autres PPR car le mécanisme moléculaire réside dans la maturation
des transcrits et/ou dans la régulation de la traduction. Cependant, la présence de la protéine
PPR restauratrice de fertilité a un effet négatif sur l‟expression de l‟Orf-cms (au niveau
transcriptionnel, post-transcriptionnel ou traductionnel) au contraire de l‟effet plus
classiquement positif des protéines PPR sur l‟expression des transcrits chloroplastiques et
mitochondriaux. Il est également intéressant de noter qu‟il est difficile de trouver des
orthologues pour ces protéines PPR entre différentes espèces. Ceci peut s‟expliquer par la
mise en place de différents mécanismes pour la stérilité male cytoplasmique. Cette diversité
des mécanismes a ainsi forcé l‟évolution spécifique de ces protéines PPR, créant ainsi une
plus ou moins grande divergence. Ces protéines devenant donc uniques.
39
INTRODUCTION
PRESENTATION DU SUJET DE THESE :
Depuis la découverte de la famille des protéines PPR, il a été montré que ces protéines ont
un rôle majeur dans la régulation transcriptionnelle, post-transcriptionnelle et traductionnelle
du génome des organites. Parmi les différents processus, l‟épissage des ARNm comprenant
des introns est un évènement essentiel de maturation. Le génome chloroplastique
d‟Arabidopsis est composé de 20 introns de groupe II et d‟un intron de groupe I et le génome
mitochondrial est composé de 23 introns de groupe II. Ces introns ne peuvent pas s‟autoépisser et nécessitent donc un certain nombre de facteurs facilitant la mise en place d‟une
structure secondaire adéquate pour les deux étapes de trans-éstérification caractérisant ce
processus. Avant de commencer ma thèse, peu de facteurs intervenant dans cette maturation
des ARNm avaient été identifiés, mais parmi les quelques caractérisés, deux protéines PPR
avait été identifiées dans ce phénomène. Ainsi PPR4, strictement nécessaire pour l‟épissage
en trans de l‟intron 1 de rps12, fut la première protéine PPR décrite dans l‟épissage en trans
(Schmitz-Linneweber, Williams-Carrier et al. 2006) et HCF152, la première PPR identifiée
dans l‟épissage en stabilisant et en permettant l‟épissage de l‟intron de petB (Meierhoff,
Felder et al. 2003). Cette découverte, le nombre important d‟introns décrits dans les génomes
des organites, ainsi que la capacité des protéines PPR à interagir avec les ARN, suggéraient
que ces deux protéines PPR n‟étaient certainement pas des cas isolés et que d‟autres protéines
PPR pouvaient avoir un rôle majeur dans le processus de l‟épissage. Dans le but de connaître
et de comprendre le fonctionnement des protéines PPR dans les différentes étapes de la
maturation des ARNm, il était donc important de trouver d‟autres protéines PPR impliquées
dans le processus d‟épissage. C‟est dans ce cadre que mon sujet de thèse a été élaboré.
C‟est au cours du projet AGRIKOLA, dans lequel j‟étais responsable des étapes de
clonage, que j‟ai eu l‟opportunité de commencer la caractérisation de certains mutants pour
des protéines PPR d‟intérêt au sein du laboratoire de Ian Small et de Claire Lurin à l‟URGV.
Ce projet Européen consistait à utiliser le système « ARNi » afin de créer une collection de
mutants „knock-down‟ pour tous les gènes d‟Arabidopsis (Hilson, Small et al. 2003). La
famille PPR était une famille cible intéressante pour ce projet car, d‟une part, un certain
nombre de gènes codant pour des PPR ne présentent pas de mutant d‟insertion ADN-T dans
les différentes collections disponibles et, d‟autre part, s‟il existe des mutants d‟insertion, une
grande partie d‟entre-eux est décrite comme embryo-letaux empêchant toute caractérisation
fonctionnelle de ces protéines par une approche classique de génétique inverse. Le projet
AGRIKOLA pouvait donc permettre d‟obtenir par la méthode de « ARNi » des mutants dans
lesquels l‟expression des gènes PPR serait dérégulée mais pas totalement afin d‟obtenir des
plantes suffisamment viables pour leur étude. C‟est dans ce cadre que j‟ai commencé une
analyse systématique des mutants « ARNi » pour les 48 PPRs sélectionnées dans le
laboratoire. Mon analyse s‟est alors plus particulièrement focalisée sur une protéine PPR,
OTP43, dont les mutants « ARNi » présentaient des retards importants de développement.
Afin de valider la corrélation entre l‟extinction du gène OTP43 et le phénotype, j‟ai étudié le
mutant d‟insertion ADN-T associé et commencé la caractérisation de celui-ci. Par la suite,
l‟élaboration de différents outils permettant de cribler des mutants pour des défauts d‟épissage
m‟a permis de caractériser un certain nombre de protéines PPR plus ou moins essentielles
dans le processus d‟épissage, créant ainsi une carte plus complète des facteurs d‟épissage
chloroplastiques et mitochondriaux. Plus récemment, j‟ai mené deux nouvelles approches
dans le but de mieux comprendre la régulation de la fonction des protéines PPR. Ainsi en 3ieme
partie de mon manuscrit, je présente une étude de l‟épissage alternatif des transcrits PPR et de
l‟impact éventuel des différentes isoformes sur la fonction des protéines. Enfin, des données
très récentes d‟interactions protéine-protéine pour les protéines PPR sont présentées et
permettent de proposer de nouvelles hypothèses sur le fonctionnement des protéines PPR
impliquées notamment dans l‟édition des ARN.
40
RESULTATS
CHAPITRE II : RESULTATS
II.1 Identification de protéines PPR impliquées dans l’épissage des ARNm dans les
chloroplastes.
Le génome chloroplastique d‟Arabidopsis est composé de 20 introns de groupe II et d‟un
intron de groupe I (cf Introduction). Ces introns, comme il a été décrit dans la revue présentée
dans l‟introduction, nécessitent l‟intervention de différents facteurs pour leur épissage. Au
début de ma thèse, une grande partie de ces facteurs avait déjà été identifiée dans le
laboratoire d‟Alice Barkan, mais, néanmoins,, les facteurs nécessaires à l‟épissage de certains
introns n‟avaient pas encore été identifiés. Parmi les protéines impliquées dans l‟épissage, une
majorité fait partie d‟une famille contenant des motifs CRM, mais on retrouve également
d‟autres protéines provenant d‟autres familles de protéines comme des protéines PPR.
Seulement deux protéines PPR avaient été identifiées comme jouant un rôle dans l‟épissage
des introns dans le chloroplaste au début de ma thèse. PPR4, impliquée dans l‟épissage en
trans de l‟intron 1 de rps12 et HCF152, impliquée dans la stabilisation et l‟épissage de
l‟intron de petB. Ces deux protéines PPR permettent de démontrer que les protéines PPR,
parmi les nombreuses fonctions dans la modification post-transcriptionnelle, sont impliquées
dans le phénomène d‟épissage. Environ un quart des PPRs (soit environ une centaine de
protéines) sont adressées dans les chloroplastes. En dehors des fonctions dans l‟édition ou le
processing en 5‟ et 3‟, il est fort probable que certaines d‟entre-elles soient impliquées dans
l‟épissage des introns dans les organites.
II.1.1 OTP51
Un des candidats les plus probables était OTP51. Cette « Pure » PPR a une caractéristique
bien particulière. En effet, en plus de ses 7 motifs PPR de type « Pure », deux autres motifs de
type « LAGLIDADG » sont décrits par Pfam (PF00961) en C-terminal. Cette PPR n‟est pas la
seule à présenter des motifs supplémentaires aux motifs PPRs. En revanche, OTP51 est la
seule protéine PPR, mais aussi la seule protéine décrite chez Arabidopsis, à avoir des motifs
de type « LAGLIDADG ». Ces motifs sont majoritairement trouvés chez d‟autres espèces
dans des endonucléases codées par des introns de group I. Grace à leur activité endonucléase,
ces protéines coupent une séquence d‟ADN double brin spécifique dans les gènes ne
contenant pas ce type d‟intron, permettant l‟invasion de cet intron codant dans le génome.
Mais certaines protéines LAGLIDADG ont aussi acquis une fonction de maturase, permettant
l‟épissage de l‟intron, d‟autres encore ont perdu l‟activité endonucléase mais conservé
l‟activité de maturase. C‟est le cas certainement d‟OTP51, comme nous le verrons dans
l‟article suivant, qui a perdu les acides aminés essentiels pour l‟activité endonucléase, mais a
en revanche conservé les acides aminés essentiels pour la fonction de maturase. Le fait
qu‟OTP51 soit prédite dans les chloroplastes et que la fonction de maturase soit conservée
laissent à penser que cette PPR pourrait être fortement impliquée dans l‟épissage d‟introns
chloroplastiques. L‟article suivant montre la caractérisation de cette protéine et de son rôle
primordial dans l‟épissage de l‟intron 2 de ycf3, un des introns chloroplastiques pour lesquels
aucun facteur d‟épissage n‟avait été identifié jusqu‟à présent.
Article 2 : de Longevialle A.F., Hendrickson L., Taylor N.L., Delannoy E., Lurin C., Badger M., Millar A.H.
and Small I.D. (2008) The pentatricopeptide repeat gene OTP51 with two LAGLIDADG motifs is required for
the cis-splicing of plastid ycf3 intron 2 in Arabidopsis thaliana. The Plant Journal, 56: 157 – 168.
41
The Plant Journal (2008) 56, 157–168
doi: 10.1111/j.1365-313X.2008.03581.x
The pentatricopeptide repeat gene OTP51 with two
LAGLIDADG motifs is required for the cis-splicing of
plastid ycf3 intron 2 in Arabidopsis thaliana
Andéol Falcon de Longevialle1,2, Luke Hendrickson3, Nicolas L. Taylor1, Etienne Delannoy1, Claire Lurin2, Murray Badger3,
A. Harvey Millar1 and Ian Small1,2,*
1
Australian Research Council Centre of Excellence in Plant Energy Biology, University of Western Australia,
Crawley 6009 WA, Australia,
2
Unité Mixte de Recherche en Génomique Végétale (Institut National de la Recherche Agronomique/Centre National
de la Recherche Scientifique/Université d’Evry Val d’Essonne), 91057 Evry, France, and
3
Australian Research Council Centre of Excellence in Plant Energy Biology, Australian National University, Canberra,
Canberra 0200 ACT, Australia
Received 27 March 2008; revised 19 May 2008; accepted 22 May 2008; published online 29 July 2008.
*
For correspondence (fax +61 8 6488 4401; e-mail [email protected]).
Summary
The Arabidopsis thaliana chloroplast contains 20 group-II introns in its genome, and seven known splicing
factors are required for the splicing of overlapping subsets of 19 of them. We describe an additional protein
(OTP51) that specifically promotes the splicing of the only group-II intron for which no splicing factor has been
described previously. This protein is a pentatricopeptide repeat (PPR) protein containing two LAGLIDADG
motifs found in group-I intron maturases in other organisms. Amino acids thought to be important for the
homing endonuclease activity of other LAGLIDADG proteins are missing in this protein, but the amino acids
described to be important for maturase activity are conserved. OTP51 is absolutely required for the splicing of
ycf3 intron 2, and also influences the splicing of several other group-IIa introns. Loss of OTP51 has far-reaching
consequences for photosystem-I and photosystem-II assembly, and for the photosynthetic fluorescence
characteristics of mutant plants.
Keywords: PPR protein, RNA splicing, chloroplast, LAGLIDADG motif.
Introduction
Many plant chloroplast and mitochondrial genes contain
introns of the group-II family (Bonen, 2008; Bonen and
Vogel, 2001). Group-II introns, characterized by their secondary structure divided into six domains, can self-splice
in vitro in some cases (although this has never been demonstrated for any of the plant organelle introns), but require
protein splicing factors in vivo. Some organelle group-II introns from a wide range of organisms encode the maturases
required for splicing. Similar genes are found in the fourth
intron of nad1 in Arabidopsis mitochondria (matR), and in
the intron of trnK in plastids (matK), although their role in
splicing remains to be demonstrated. Similar genes are
found in the Arabidopsis nuclear genome, and at least one
encodes a protein involved in mitochondrial intron splicing
(Nakagawa and Sakurai, 2006).
ª 2008 The Authors
Journal compilation ª 2008 Blackwell Publishing Ltd
Some group-I introns also code for maturases: notably
proteins containing the so-called LAGLIDADG motif
encoded by introns in green algae and a wide variety of
other eukaryote organelles, prokaryotes and archaea (Lucas
et al., 2001). These proteins often have a dual function as a
sequence-specific DNA endonuclease, and as an RNA splicing factor. LAGLIDADG proteins can act in ‘intron homing’ to
render the introns that encode them able to invade genomes
that lack the intron (Chevalier and Stoddard, 2001). Many
RNA binding proteins have acquired roles in RNA splicing,
and indeed a variety of often unrelated RNA binding proteins
have essential roles in splicing in most plastid introns in
plants (Asakura and Barkan, 2007; Ostersetzer et al., 2005;
Ostheimer et al., 2003, 2005, 2006; Till et al., 2001; Watkins
et al., 2007), with varying degrees of specificity to different
157
158 Andéol Falcon de Longevialle et al.
introns. The largest family of RNA binding proteins in plant
organelles is the pentatricopeptide repeat (PPR) family
(Andrés et al., 2007; Lurin et al., 2004; Saha et al., 2007;
Small and Peeters, 2000). PPR proteins are involved in many
post-transcriptional processes in both chloroplasts and
mitochondria. Two of them have been described to be
absolutely and specifically required for the trans-splicing of
particular introns: rps12 intron 1 in plastids (SchmitzLinneweber et al., 2006) and nad1 intron 1 (de Longevialle
et al., 2007) in mitochondria.
In this study, we describe a novel plant organelle
splicing factor from Arabidopsis that contains two potential RNA-binding domains, namely an array of PPR motifs
and a tandem pair of LAGLIDADG domains. This factor
is required for the optimal splicing of several plastid
introns, including most notably, ycf3 intron 2. Further
characterization of mutants show that loss of this factor,
and concomitantly the splicing event, has far-reaching
consequences for the assembly of photosystem I (PSI)
and PSII.
Results
A gene encoding a protein with both PPR and
LAGLIDADG motifs
Among the 451 PPR genes in Arabidopsis thaliana, many
have additional motifs or domains. The commonest are
the C-terminal E and DYW domains, which are probably
linked to RNA editing (Lurin et al., 2004; Okuda et al., 2007;
Salone et al., 2007), but other RNA-binding or DNA-binding domains, such as RRM domains (Schmitz-Linneweber
et al., 2006) or SMR domains (Koussevitzky et al., 2007),
are also found. Liu et al. (2005) reported 21 different
domains linked to PPR motifs, and although closer examination suggests most of these links result from gene
fusion errors during annotation, one of the linked domains
merited further verification. The gene model for At2g15820
contains PPR motifs and two C-terminal LAGLIDADG
motifs. This is the only predicted protein in all three
Arabidopsis genomes to contain LAGLIDADG motifs.
Comparison with putative orthologs from other plants
suggests that the current At2g15820 gene model is wrong,
and by 5¢ RACE we could demonstrate that the mRNA is
longer than previously thought, and includes two exons
(see Figure S1). We have named this gene ORGANELLE
TRANSCRIPT PROCESSING 51 (OTP51), after the molecular phenotype of the mutants (see below).
Figure 1a shows an alignment of the predicted A. thaliana OTP51 protein with putative orthologs from grape
(Vitis vinifera), poplar (Populus trichocarpa) and rice (Oryza
sativa). The least conserved part of the sequence is the
N-terminal extremity, predicted by Predotar (Small et al.,
2004) and TargetP (Emanuelsson et al., 2000) to be a
plastid targeting sequence. OTP51 comprises seven PPR
motifs in equivalent positions in each sequence. Although
the sequences of the PPR motifs are not particularly similar
between species, three other domains are highly conserved. Two domains with unknown function and no
similarity with other known proteins surround the first
PPR motif, and two LAGLIDADG domains are found
towards the C terminus. The alignment of the two LAGLIDADG motifs (Figure 1b) of OTP51 with other LAGLIDADG
endonuclease proteins encoded by group-I introns shows
a high conservation of these motifs. The glycine in
position 3 in the LAGLIDADG motif has been shown to
be essential for the maturase activity of the protein
encoded by intron bi2 in Saccharomyces cerevisiae (Szczepanek et al., 2000). None of the OTP51 LAGLIDADG motifs
have the aspartate residue in position 8 of the motif
(Figure 1b). The two acidic residues in the motif have
been shown to bind a catalytic metal ion required for the
endonuclease activity (Chevalier et al., 2001). The substitutions of these two residues by alanine in the bifunctional
protein I-AniI in Aspergillus nidulans completely inhibit the
DNA cleavage activity, without affecting RNA splicing
(Chatterjee et al., 2003). The lack of conservation of critical
catalytic residues and the conservation of amino acids
important for the maturase activity in the LAGLIDADG
domains of OTP51 (Figure 1b) suggest that it lacks the
DNA endonuclease activity, but could conserve a maturase
function.
otp51 mutants are chlorophyll deficient
To evaluate a putative role in the splicing of OTP51, we
obtained and analyzed two independent T-DNA insertion
lines. The position of the insertions were confirmed by
PCR and sequencing. The Salk_112013 line (otp51-1) has
the insertion of the T-DNA in the first exon of the gene
(position 6897907 in chromosome 2), and the Sail_713D08
line (otp51-2) has the T-DNA inserted in the second exon
(position 6897626 in chromosome 2) (Figure 2a). Both
mutants show identical phenotypes (Figure 2b). Seedlings
are pale straw yellow; rosettes are pale yellow in normal
light and pale green for young leaves in low light conditions. Plants that are homozygous for either of these
alleles die on soil, but can be rescued by in vitro culture
(with sucrose) under low light. The plants are much
smaller than the wild-type plants and develop more
slowly.
Mutant otp51 plants are depleted in protein (60–80% of
wild-type levels) primarily because of a lack of chloroplasts
and thylakoid membranes (26–48% of wild-type levels)
(Table 1). The chlorophyll content of the mutant is extremely
low at 11–12% of the wild-type levels on a fresh weight basis,
and the chlorophyll a/b ratios are higher than that of
wild-type plants (Table 1).
ª 2008 The Authors
Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56, 157–168
Splicing of ycf3 intron 2 requires OTP51 159
Figure 1. The predicted OTP51 Protein.
(a) Multiple sequence alignment of Arabidopsis
thaliana OTP51 (AtOTP51) with its Poplar trichocarpa, Vitis vinifera and rice orthologs (PtOPT51,
VvOTP51 and OsOTP51, respectively). The
domain organization of OTP51 is shown diagrammatically at top. Identical residues are
shaded in black, and similar residues are set in
bold. The gray bars beneath the alignment mark
the pentatricopeptide repeat (PPR) domains, and
the black diagonally striped bars mark the two
LAGLIDADG domains. VvOTP51 corresponds to
CAO47772.1 and OsOTP51 corresponds to
Os02g0702000. The transient peptide cleavage
sites predicted by TARGETP (Emanuelsson et al.,
2000) are after amino acids 94 and 56 for
AtOTP51, and OsOTP51 respectively.
(b) Multiple sequence alignment of the two
LAGLIDADG domains from AtOTP51, PtOPT51,
VvOTP51, and OsOTP51 with LAGLIDADG domains from Trebouxia aggregata chloroplast
homing endonuclease (AAL77574), Trichosarcina mucosa chloroplast homing endonuclease
(AAG61151), Nephroselmis olivacea mitochondrial homing endonuclease (YP_665643) and
Saccharomyces cerevisiae homing endonuclease I-SceI chain A (1R7M_A). The black diagonally striped bars mark the two LAGLIDADG
domains. Residues known to be important for
maturase or DNA endonuclease activity are
boxed.
(a)
(b)
otp51 shows splicing defects in chloroplast mRNAs
As virtually all of the PPR proteins characterized so far are
involved in RNA processing within organelles, we employed
a quantitative RT-PCR screen to gain a general overview of
plastid transcripts in the mutant plants (Figure 3). A striking
decrease in the accumulation of ycf3 transcripts was
observed. The ycf3 gene is annotated to consist of two exons
in Arabidopsis (Sato et al., 1999), whereas three exons are
described in other plant species. Cross-species comparisons
and verification by RT-PCR demonstrate that the Arabidop-
sis ycf3 gene is mis-annotated, and that two cis-splicing
events are necessary for the complete maturation of the
ycf3 transcript (see Figure S2). Given the association of
LAGLIDADG motifs with intron maturases, we verified if
the failure to amplify spliced ycf3 transcript resulted from a
defect in the splicing of one or both of the two ycf3 introns.
Total RNA blots from wild-type and mutant plants were
probed with sequences specific to ycf3 exon 3 and ycf3
intron 2 (Figure 4). An RNA of approximately 900 nucleotides is detected specifically with the exon probe, and not
with the intron probe, and corresponds to the expected size
ª 2008 The Authors
spliced to unspliced introns in otp51 mutants compared with
wild-type plants (Figure 5a). In both otp51 mutants we were
unable to detect spliced ycf3 mRNA lacking intron 2,
whereas the first intron of ycf3 was correctly and efficiently
spliced (see Figure S3a). In addition to this absolute splicing
defect, both mutants also present an eightfold decrease in
splicing of the atpF intron. These results were confirmed by
poisoned primer extension (see Figure S3). Other mRNA
transcripts are largely unaffected in otp51, apart from the
twofold increases in rrn23, matK and accD transcripts, and a
decrease in spliced atpF mRNA (Figure 3).
(a)
(b)
Decreased splicing of tRNA introns
Figure 2. Mutant alleles of otp51.
(a) Positions of the two T-DNA insertions in the otp51 gene. Salk_112013 was
named otp51-1 and Sail_713D08 was named otp51-2.
(b) Phenotype of an otp51 mutant seedling at the cotyledon stage (left) and
otp51 mutants at the 8–10-leaf stage grown in low light conditions.
Table 1 Total protein, total chlorophyll contents and chlorophyll a/b
ratios, and relative protein levels (as a percentage of wild-type
levels) for hydroponic cultured wild-type (Col-0) and the otp51
mutant lines of Arabidopsis thaliana
Col-0
)1
otp51-2
a
otp51-1
ab
10.4 0.5
12.4 1.3
Total protein, mg g
fresh weight (FW)
Thylakoid membrane
1.1 0.2b
2.3 0.5a
)1
protein, mg g FW
Chlorophyll (a + b),
49 3b
462 84a
)1
mg g FW
Chlorophyll a/b
3.1 0.1a
4.2 0.3b
Relative protein levels, as a % of wild type
6 1b
PsaD
100 4a
Lhca1
100 20
n.d.
PsbA
100 26
n.d.
AtpB
100 9a
74 5b
Porin
100 8a
164 19a
RbcL
100 8a
78 3b
7.7 0.7b
0.6 0.1b
57 12b
In A. thaliana, five tRNA precursors contain group-II introns,
and trnL has a group-I intron. The quantitative RT-PCR assay
is not well-adapted to measuring the splicing of tRNA precursors, because of the rapid cleavage of the precursors, and
because of the strong secondary structure and base modifications in mature tRNAs that make reverse transcription
unreliable. Therefore, to determine whether the splicing of
tRNA precursors is affected in otp51, we carried out an RNA
gel blot hybridization assay using oligonucleotide probes
specific for each tRNA. We found a large decrease in the
correctly processed forms of tRNAVal and tRNALys, coupled
with increases in the unprocessed precursor (Figure 5b).
Unprocessed precursors from trnL, trnG, trnI and trnA also
accumulated (Figure 5b), but without any obvious affect on
the quantity of mature tRNAs. The accumulation of trnK,
trnA and trnI precursors is consistent with the qRT-PCR
results for matK and rrn23, as they are part of the same
precursor transcripts.
3.9 0.1a,b
n.d.
n.d.
n.d.
74 6b
103 6a
77 4b
Each value is the mean SE of three or four replicate plants. The
superscript letters indicate a significant difference based on a oneway ANOVA and Tukey’s Honestly Significantly Different test
(P < 0.05).
of the mature ycf3 mRNA. This RNA species is undetectable
in the mutant plants, whereas the longer precursor RNAs are
present in the usual quantities. The major RNA in both the
wild type and the mutant is a 1.6-kb RNA, which from its size,
contains unspliced intron 2, but from which intron 1 has
been spliced out. This transcript pattern closely resembles
that for the ycf3 transcripts reported previously (Asakura and
Barkan, 2007). We designed primers to detect each splicing
event by qRT-PCR and to compare the change in ratios of
Unconventional domain V, but a conventional splicing
mechanism
In group-II introns, domain V is the most conserved
sequence. This domain is composed of 34 nucleotides, and
is usually highly conserved in sequence and secondary
structure. The domain V of ycf3 intron 2 is highly conserved
between plant species, but differs a little from the classical
group-II intron domain V (see Figure S4a) in having two
nucleotides more than the 34 usually seen.
To see if this difference has an impact on the splicing
mechanism, we performed RT-PCR assays to detect lariat
formation or other forms of excised introns in the wild type
and in both otp51 mutants. Reverse transcription with a
specific primer designed to bind to ycf3 intron 2, followed by
amplification with carefully chosen primers (Figure S4b),
revealed the presence of the lariat, as well as the correct
junction formation in wild-type plants. Splicing of ycf3
intron 2 has been previously shown to follow a classical
lariat pathway in barley (Vogel and Börner, 2002). Twenty
of the numerous clones obtained were sequenced with
ª 2008 The Authors
Figure 3. Levels of plastid transcripts in otp51 mutants.
All mRNA and rRNA transcripts were measured from both alleles of otp51 and wild-type plants. The graph depicts the log2 ratio of transcript levels in the mutants
compared with levels in the wild-type plantsAu: Is the edited text OK: compared with levels in the wild-type plants. Fully spliced ycf3 transcripts are undetectable in
otp51 mutants. A strong decrease (between three- and fourfold) in atpF transcripts was also observed. All other transcripts showed minor or insignificant changes.
identical results. The same experiment in both otp51 mutants
failed to reveal any correctly formed lariats (Figure S4c).
Loss of PSI and PSII
The Ycf3 protein is essential for the assembly of PSI,
and appears to act as a chaperone that interacts directly and
specifically with at least two of the PSI subunits, PsaA and
PsaD, during assembly of the PSI complex (Naver et al.,
2001). As no mature ycf3 mRNA is detected, it is probable
that no Ycf3 protein is produced in the mutant plants. Bluenative (BN)/SDS-PAGE on thylakoid extracts revealed a
typical pattern of PSI, PSII and ATP synthase membrane
complexes in wild-type samples (Figure 6a; Kügler et al.,
1997), but failed to detect any subunits of the photosytem-I
complex or assembled PSII in mutant samples (Figure 6a).
We observed the presence of assembled ATP synthase and
LHCB subunits in a low molecular weight complex, and in
the mutant samples, but with both at decreased abundance
compared with wild-type. These results were verified by
western blot analysis (Figure 6b; Table 1). RbcL and AtpB
proteins were limited to approximately 75% of wild-type
levels on a fresh-weight basis, but there was a dramatic
reduction in PSI and PSII core complex proteins, and their
peripheral light-harvesting complex proteins (LHCA and
LHCB, respectively), to the extent that the majority of proteins evaluated were either at significantly less than 20%
of the wild-type levels or were undetectable (Figure 6b;
Table 1). In contrast, the wild-type and otp51 samples had
approximately equal levels of the mitochondrial marker
protein, porin, on a fresh-weight basis, indicating that
mitochondrial abundance is unaffected in otp51.
The maximal intrinsic quantum efficiency of PSII from
dark-acclimated plate-grown seedlings was significantly
ª 2008 The Authors
suggests that the loss of PSI is more significant than the loss
of PSII in these mutants. The relative ratios of LHCII : PSII
and LHCI : PSI emission peaks indicates a functional disconnection of light harvesting proteins from their respective
core reaction centers. These data clearly indicate that the
distribution of excitation energy to each of the photosystems, and/or their relative abundance within the thylakoid
membranes, as well as PSI organization and function, are
greatly affected in the otp51 mutant.
Discussion
OTP51 encodes a PPR protein with two LAGLIDADG motifs
Figure 4. RNA gel blots showing a ycf3 intron 2 splicing defect in otp51
mutants.
Total leaf RNA (10 lg) was probed with exon 3- or intron 2-specific probes.
The spliced (S) and unspliced (U) transcripts for each gel are indicated on the
right. The two blots used were stained with methylene blue, and are shown
below to illustrate the loading of RNAs in each samples. No spliced ycf3
transcripts are seen in either otp51 allele, and neither is a moderate
accumulation of unspliced ycf3 transcripts observedAu: Is the edited text
OK:, and neither is a moderate accumulation of unspliced ycf3 transcripts
observed?.
lower in the otp51 mutant (Fv/Fm = 0.27 0.10) compared
with the wild type (Fv/Fm = 0.76 0.01). After illumination at
growth light intensity for 5–10 min, the fluorescence signal
was maximal, leading to undetectable PSII quantum
efficiencies in the otp51 mutant lines, compared with wild
type (FPSII = 0.27 0.01).
Wild-type leaves of hydroponic-cultured plants exhibited
low temperature (77 K) chlorophyll fluorescence emission
spectra typical for higher plants, consisting of four main
emission peaks at 683, 699, 723 and 737 nm (Figure 7a,b).
These peaks were assigned to the PSII core complex
subunits CP43 and CP47 (at 685 and 695 nm, respectively), the PSI core complex (at 720 nm) and LHCI (at
740 nm) (Govindjee, 1995). Consistent with our western
blot data, the otp51 mutants exhibited a drastically reduced
PSI emission peak at F720 nm compared with wild-type
Arabidopsis (Figure 7a; Figure 7b). The emission peak
(F685 nm) commonly associated with CP43 of the PSII
complex was also reduced. The new emergent peak at
680 nm can be ascribed to fluorescence from the LHCII
complex, which is not detectable in wild type because of the
efficient energy transfer to PSII (Govindjee, 1995). Despite
the significant loss of the CP43 fluorescence peak, the CP47
peak (F695 nm) remains detectable as a shoulder at
696–697 nm in the otp51 mutant lines (Figure 7a,b). This
LAGLIDADG homing endonucleases are encoded by mobile
genetic elements, and catalyze DNA cleavage at specific
sites lacking the endonuclease coding region (Chevalier and
Stoddard, 2001). Most of the LAGLIDADG proteins described
so far are DNA endonucleases, but some of them have
acquired a dual function, acting both as homing endonucleases and as RNA-splicing maturases. The best-known of
these is I-AniI from A. nidulans. This protein promotes the
splicing of the mitochondrial cob intron in vitro by facilitating the folding of this intron (Ho and Waring, 1999; Solem
et al., 2002). Amino acid substitutions that affect endonuclease activity often have little effect on the splicing of the
cob intron, and vice versa, suggesting that the DNA and RNA
recognition sites are different (Bolduc et al., 2003; Chatterjee
et al., 2003). Recently it has been shown that this protein
preferentially stabilizes one conformation of the intron relative to another, in order to facilitate the formation of the
RNA–protein complex (Caprara et al., 2007). Other LAGLIDADG endonucleases have been described to have lost their
DNA endonuclease activity and have conserved only the
maturase activity. The best known of these is the bI3
maturase that facilitates the splicing of the mitochondrial
cob intron 3 in S. cerevisiae (Lazowska et al., 1989; Bassi
et al., 2002). One of the reasons for the loss of the endonuclease activity is the substitution of the acidic residue in
position 8 of the LAGLIDADG motif by a lysine (Longo et al.,
2005). Whereas the bI3 maturase has lost its original function, crystallographic analysis has shown that the global
architecture of this protein is unchanged from its DNAbinding homologs (Longo et al., 2005).
The loss of amino acids important for the endonuclease
activity strongly suggests that OTP51 is unable to cleave
DNA. On the other hand, the high conservation of the two
LAGLIDADG domains, including amino acids known to be
important for maturase activity, suggests that these
domains have a role in splicing. Presumably, OTP51 is
derived from the transfer of an organelle maturase gene to
the nucleus, followed by fusion to a nuclear PPR gene. This
occurred a long time ago, as two similar PPR-LAGLIDADG
proteins are encoded in the Physcomitrella genome
ª 2008 The Authors
(a)
(b)
Figure 5. Splicing defects in otp51 mutants.
(a) Change in ratios of spliced to unspliced introns in otp51 mutants compared with wild-type plants by quantitative RT-PCR. A strong decrease of the ratio in spliced/
unspliced mutants for ycf3 intron 2 is observed for the two mutants, as well a decrease in the ratio for the atpF intron. The others splicing events are not affected in
both mutants.
(b) RNA gel blot hybridizations showing trnK, trnL, trnV, trnG, clpP, trnI and trnA transcripts. Leaf RNA (10 lg) was analyzed in each lane: lane 1 corresponds to the
wild type, lane 2 corresponds to otp51-2 and lane 3 corresponds to otp51-1. The spliced (S) and unspliced (U) transcripts for each gel are indicated on the left. The
two blots used were stained with methylene blue, and are shown below to illustrate the RNAs in each samples. A decrease of spliced tRNAs as well as an
accumulation of unspliced tRNAs are observed in both otp51 alleles for trnK and trnV. One of the blots was also probed with clpP as a control, as splicing of this
transcript had already been shown to be unaffected (by quantitative RT-PCR).
(O’Toole et al., 2008). The most closely related organellar
LAGLIDADG domains are found in the rrnL intron (a group-I
intron) of certain green algae (Lucas et al., 2001; Pombert
et al., 2006). Whether the change in specificity (from promoting group-I intron splicing to promoting group-II intron
splicing) occurred before or after the transfer to the nucleus
cannot be ascertained from the current data.
OTP51 is required for the splicing of ycf3 intron 2
Previously, six other nucleus-encoded proteins have been
identified to be required for RNA splicing in land plant
chloroplasts. The complexes CAF2/CRS2 and CRS2/CAF2 are
required for the splicing of overlapping subsets of nine
group-II introns out of the 17 in maize (Ostheimer et al.,
2003, 2005, 2006), RNC1 is required for the splicing of 10
introns (Watkins et al., 2007), CRS1 is required for the
splicing of atpF (Till et al., 2001) and PPR4 is required for
the trans-splicing of rps12 intron 1 (Schmitz-Linneweber
et al., 2006). From the 17 group-II introns in maize, 15 have
at least one splicing factor identified. Of the two remaining, the rpl2 intron showed a strong RNC1-dependent
enrichment in RIP-chip assays, although this protein is not
required for the optimal splicing of this intron (Watkins
et al., 2007). None of the mutants for any of the six previously known splicing factors show a decrease in splicing
of ycf3 intron 2.
Identification of orthologous splicing factors in Arabidopsis for CRS1, CAF1 and CAF2 demonstrates that these factors
are involved in the splicing of the same chloroplast introns
as their maize counterparts, and that two of the three
additional introns found in Arabidopsis require the CAF1
ª 2008 The Authors
(a)
(b)
Figure 6. Loss of photosystem I and photosystem II in otp51.
(a) Two-dimensional blue native/SDS-PAGE of thylakoid proteins from Col-0 wild-type plants (left) and otp51-1 mutants (right). The gels are stained with Coomassie
blue. The apparent molecular mass of the subunits is shown in kDa. Spots that have been identified by mass spectrometry are described in Figure S5 and Table S2.
PsbB (AtCg00680), PsbC (AtCg00280) and PsbD (AtCg00270) are subunits of photosystem II, and none are visible in the gel of otp51-1 proteins. PsaA (AtCg00350),
PsaB (AtCg00340), PsaL (At4g12800), PsaF (At1g31330), PsaD1 (At4g02770) and PsaD2 (At1g03130) are subunits of photosystem I, and none are visible in the gel of
otp51-1 proteins. RbcL (AtCg00490) is the large subunit of Rubisco, and has been identified in both wild-type and otp51-1 plants. AtpA (AtCg00120) and AtpB
(AtCg00480), identified in both wild-type and otp51-1, are both subunits of the ATP synthase complex. LHCB4 (At5g01530), LHCB5 (At4g10340) and LHCB1
(At1g29910) are subunits of the photosystem-II light harvesting complex, and have been identified both in the wild-type and in the otp51-1 plants. LHCA3
(At1g61520) and LHCA4 (At3g47470) are subunits of the photosystem-I light harvesting complex, and are only observed in the wild type.
(b) Western blots comparing wild-type (left lanes) and the otp51 mutant lines otp51-1 and otp51-2 (right lanes) immunochemically detected with antisera for
chloroplast thylakoid membrane proteins (PsaD, Lhca1, AtpB and PsbA), the soluble stromal protein RbcL and a mitochondrial protein (porin). Each lane was loaded
on an equal fresh-weight basis.
ortholog for splicing (Asakura and Barkan, 2006). Recently,
CFM2, a protein with four CRM domains, has been identified
in Arabidopsis to be a required splicing factor for the third
additional intron, clpP intron 2, as well as for ndhA, ycf3
intron 1 and trnL (Asakura and Barkan, 2007). Orthologs for
RNC1 and PPR4 are also present in Arabidopsis, and are
likely to have the same roles as the maize proteins (SchmitzLinneweber et al., 2006; Watkins et al., 2007). This would
leave only ycf3 intron 2 lacking a previously identified
splicing factor. OTP51, described in this study, is absolutely
required for the splicing of ycf3 intron 2: in the two mutant
alleles, the correctly spliced ycf3 exon 1–exon 2 is totally
absent. In addition to this primary effect, OTP51 is also
involved in other splicing events, as the otp51 mutants show
a strong decrease in the splicing of atpF, trnV and trnK
transcripts. We were unable to find a feature common to
these four introns that might explain this pattern of specificity. There is no obvious conserved sequence that might
represent an OTP51 binding site in the four introns, for
example. CRS1 is required for the splicing of atpF (Till et al.,
2001), and is found together with the atpF intron RNA in a
complex of 700 kDa in size (Ostheimer et al., 2003; Till
et al., 2001). It is possible that OTP51 is also part of this
complex, although we cannot rule out that the effect on atpF
splicing is an indirect, secondary effect.
Loss of PSI and PSII
The PSI of higher plants contains 18 subunits, and several
steps are needed for its biogenesis. PsaA and PsaB assemble
at an early stage of PSI biogenesis to form a pre-complex
that is needed for the assembly of the extrinsic PsaC. The
stromal subunits PsaD and PsaE then assemble coordinately
around PsaC, before the rest of the complex forms.
In Arabidopsis, several mutants for these subunits have
been identified and described. A double mutant for the two
nuclear genes encoding PsaD shows no detectable subunits
of PSI, demonstrating that these proteins are essential for
the stability of the complex (Ihnatowicz et al., 2004). In
addition, a drastic reduction of PSII was observed by
BN–SDS-PAGE in this double mutant, just as we observed
in otp51. A lack of PsaE does not affect the levels of PsaA and
PsaB, but is associated with a decrease in the other subunits
and a decrease in PSII (Ihnatowicz et al., 2007). A lack of
ª 2008 The Authors
(a)
(b)
assemble. However, otp51 also lacks PSII, which was not
seen in the tobacco and Chlamydomonas ycf3 mutants. This
may represent a species difference, as a range of Arabidopsis mutants in the PSI subunits outlined above also have
decreased PSII, but it is also possible that some of the other
splicing decreases in otp51 contribute to the physiological
phenotype. The mutant presents decreased splicing of atpF,
and at least trnV and trnK. The latter two could have an
impact on the translation of PSII subunits; however, at least
some plastid-encoded proteins, such as AtpB, accumulate
normally, so translation is not universally impeded.
Experimental procedures
Plant material and culture conditions
Figure 7. Chlorophyll fluorescence.
(a) Low-temperature (77 K) chlorophyll fluorescence emission spectra of wildtype (WT) and otp51 mutant lines of Arabidopsis thaliana chloroplasts. Each
fluorescence spectrum is the mean of four corrected scans. Chlorophyll
fluorescence was excited at 440 nm.
(b) Parameters describing theAu: Is the inserted text OK: Parameters
describing the 77-K chlorophyll fluorescence emission peaks for hydroponic-cultured wild-type (Col-0) and otp51 mutant lines of Arabidopsis
thaliana. Each value is the mean of four replicate plants. Non-detectable
peaks are marked as n.d.
PsaG is associated with a decrease in the abundance of most
PSI core proteins (Varotto et al., 2002). In addition to
mutants of subunits of PSI, several mutants have also been
described for proteins involved in PSI biosynthesis. The
Arabidopsis pyg7-1 and hcf101 mutants have no detectable
subunits of PSI, but contain normal levels of PSII (Stockel
and Oelmuller, 2004; Stockel et al., 2006).
The first ycf3 mutant described was created by biolistic
transformation in tobacco (Ruf et al., 1997). Homoplasmic
Dycf3 plants display a photosynthetically incompetent phenotype, lack detectable levels of all PSI subunits, but still
have PSII subunits. The second mutant described was in
Chlamydomonas (Boudreau et al., 1997). Transformants
lacking Ycf3 were unable to grow photoautotrophically and
were lacking PSI subunits. Further studies on this mutant
have shown that Ycf3 is involved in the assembly of PSI by
interaction with PsaA and PsaD (Naver et al., 2001).
The mutant that we describe here, otp51, presents a
somewhat similar phenotype to these ycf3 mutants; a
photosynthetically incompetent phenotype and a lack of
PSI subunits that could be explained by ‘epistasy of synthesis’, as has been described in Chlamydomonas (Wostrikoff
et al., 2004) as a result of the inability of PsaA and PsaD to
The A. thaliana (ecotype Columbia) T-DNA mutants and wild-type
plants were germinated on ½ MS medium, with 1% sucrose, at
22C, with a 16-h photoperiod and a light intensity of 10 lmol
quanta m)2 sec)1. Seedlings from solid medium were transferred
on a grid in liquid ½ MS medium, with 1% sucrose, in the same
conditions as described above.
DNA and RNA isolation and RT-PCR analysis
Leaf DNA was isolated as described by Edwards et al. (1991). A
10-ng portion from the extraction was used for PCR with primers
sail_713_D08_LP (5¢-GTACACAAACGCCTGAGAAGG-3¢), sail_713_
D08_RP (5¢-TTTTCACGGCTAATTCCACAG-3¢) and LB1 (5¢-GCCTTTTCAGAAATGGATAAATAGCCTTGCTTCC-3¢) for the Sail T-DNA
line, and primers salk_112013_RP (5¢-TTCACTTGGTACACGTCCTTG-3¢), salk_112013_LP (5¢-TTTCAATTTTAGTTTCGAACATGAAC3¢) and Lba1 (5¢-TGGTTCACGTAGTGGGCCATCG-3¢) for the Salk
T-DNA insertion line. PCR was performed at 35 cycles using Taq
DNA polymerase (New England Biolabs, http://www.neb.com). Leaf
RNA was isolated using the plant RNeasy extraction kit (Qiagen,
http://www.qiagen.com). The leaf RNA was treated with DNase
(Ambion, http://www.ambion.com) and 3 lg was reverse-transcribed with Superscript III (Invitrogen, http://www.invitrogen.com)
according to the manufacturer’s directions using random hexamers
(Invitrogen).
Quantitative RT-PCR analysis
Quantitative RT-PCR was performed using LightCycler 480 SYBR
Green I Master Mix (Roche Diagnostics, http://www.roche.com/
div_diag.htm) and a LightCycler 480 Roche Real Time PCR
system with the following thermal cycling program: 95C for
10 min, followed by 45 cycles of 95C for 10 sec, 60C for 10 sec
and 72C for 20 sec. The primer sequences used are described in
Table S1. Data were analyzed using the LIGHTCYCLER 480 software
version 1.2 (Roche Diagnostics). The data set was normalized
using cytosolic 18S rRNA as a reference, setting the median
value to 0.
RNA gel blot analysis
Arabidopsis leaf RNA (10 lg) was run on 1.2% agarose/formaldehyde gels, and was then transferred to nitrocellulose membrane
ª 2008 The Authors
(0.45-lm pore size, Hybond-N+; Amersham, http://www.amersham.
com) and then hybridized with biotinylated oligomer probes, or
in vitro biotinylated transcript probes specific to chloroplast genes.
The hybridizations were carried out overnight at 50C in 5X SSC,
20 mM Na2HPO4, 7% SDS and 100 lg ml)1 heparin, followed by
washing. For hybridization with biotinylated transcripts, the
hybridization was carried out overnight at 68C in 5X SSC, 50%
deionized formamide, 5X Denhardt and 0.5% SDS, followed by
stringent washes. Signal detection was performed using the
Phototope Star detection kit (New England Biolabs).
The following biotinylated probes were used: trnK, 5¢-AAAGCCGAGTACTCTACCGTTG-3¢; trnL, 5¢-TGGGGATAGAGGGACTTGAAC3¢; trnG, 5¢-CATCGTTAGCTTGGAAGGCTAAGGG-3¢; trnI, 5¢-CTACCACTGAGCTAATAGCCC-3¢; trnV, 5¢-GTGTAAACGAGGTGCTCTACCTAA-3¢; trnA, 5¢-GGACTCGAACCGCTGACATCCGCC-3¢. For
clpP, ycf3 exon 3 and ycf3 intron 2, PCR fragments using primers
clpPfor (5¢-GTAATGATCCATCAACCCGC-3¢) and clpPrev (5¢-TGAACCGCTACAAGATCAAC-3¢), ycf3ex3 For (5¢-GGGAAAGTTCTTATTCGAAGCGCCTCG-3¢) and ycf3ex3 Rev (5¢-ACAGGCCATTCAACAAGGAG-3¢), and ycf3int2 For (5¢-AAAGCATGTCCACTGTTATTAGATATTAGA-3¢) and ycf3int2 Rev (5¢-AGGGCTTTCTACATAAGCATCG-3¢) were cloned into pGEM-T Easy (Promega, http://www.
promega.com), and the biotinylated probes were made according
to the manufacturer’s protocols using the Maxiscript in vitro
transcription kit (Ambion) and Biotin CTP (Invitrogen).
Protein extraction
Equal fresh weights of seedling material were homogenized in
isolation buffer [50 mM Tricine, 0.8 M Sorbitol, 5 mM MgCl2, 2 mM
EDTA, 10 mM NaCl, 1 mM -aminocaproic acid, 10% glycerol (v/v)
and 3% Protease inhibitor cocktail (v/v; Sigma-Aldrich, http://
www.sigmaaldrich.com)] at pH 7.8, and were then filtered through
two layers of 20-lm Miracloth. All extractions were undertaken on
ice or at 4C. The standard and sample absorbance change was
measured at 750 nm in a spectrophotometer (Cary 50 Bio; Varian
Inc., http://www.varianinc.com). Sample extracts were assayed
for protein content using a modified Lowry et al. (1951) method
(Bio-Rad DC Protein Assay; Bio-Rad Laboratories, http://www.
bio-rad.com). For total chlorophyll pigment analyses, fresh extract
was diluted with 80% acetone, buffered with 25 mM Hepes, and
then centrifuged at 800 g for 3 min. The supernatant was used for
the spectrophotometric estimation (Cary 50 Bio; Varian Inc.) of
chlorophyll content per leaf fresh weight according to the method
described by Porra et al. (1989).
Immunodetection of chloroplast and mitochondrial proteins
Chloroplast and mitochondrial proteins were detected in whole-cell
extracts using SDS-PAGE and western immunoblotting. Equal fresh
weights of wild-type and otp51 seedlings were extracted and separated on a 10% (w/v) linear polyacrylamide gel, and were electrophoretically transferred to a nitrocellulose membrane (0.2-lm pore
size, Hybond C Extra; Amersham) at 5C for 1 h at 100 V. Polypeptides of PSI (PsaD and LhcaI), PSII (PsbA), ATP-synthase (AtpB) and
Rubisco (RbcL) were detected with commercially available primary
antisera (Agrisera AB, http://www.agrisera.com), and with an antiIgG alkaline phosphatase conjugated secondary antibody (SIGMAAldrich). A monoclonal antibody against mitochondrial porin,
developed by Dr Tom Elthon (University of Nebraska, http://
nebraska.edu), was used to determine the relative mitochondrial
content. Immunoreactive peptides were identified using the Atto-
Phos fluorescence substrate system (Promega), and were quantified
by densitometry (IMAGEJ software; http://rsb.info.nih.gov/ij/).
Leaf chlorophyll fluorescence
Leaf chlorophyll fluorescence parameters were measured and calculated as described by Bilger et al. (1995) using a pulse-amplitude
modulated chlorophyll fluorometer (PAM 2000; Walz, Effeltrich,
Germany). The intrinsic quantum efficiency of PSII photochemistry
[(Fv/Fm) = (Fm ) Fo)/Fm, where Fo is the minimum chlorophyll
fluorescence yield in the dark-acclimated plants] was derived from
fluorescence measurements on intact seedlings after 30 min of dark
acclimation. The quantum efficiency of open PSII reaction centers
[uPSII = 1 ) (Fs/Fm¢), where Fm¢ is the maximal chlorophyll fluorescence yield during illumination, and Fs is the steady-state, lightacclimated fluorescence yield] was determined under an irradiance
of 50 lmol quanta m)2 sec)1 at 20C in air.
Thylakoid isolation, Blue-Native and 2D SDS-PAGE
Leaf tissue (5 g) grown in hydroponic, low-light conditions was
ground in extraction buffer [50 mM Tricine NaOH, pH 7.8, 0.4 M
sorbitol, 10 mM NaCl, 5 mM MgCl2Æ4H2O, 1 mM -amino caproic
acid, 2 mM EDTA and 3% protease inhibitor cocktail (v/v; SigmaAldrich)] in a polytron (three times for 3 sec each time). The
resulting extract was filtered through two layers of Miracloth and
then spun for 10 min at 12 000 g at 4C. The pellet was resuspended
in 1 ml of extraction buffer before the chlorophyll and protein
content was measured. The extract was spun again for 10 min at
20 000 g at 4C, and the pellet was then resuspended in resuspension buffer (50 mM Tricine NaOH, pH 7.8, 10 mM NaCl, 5 mM
MgCl2Æ4H2O, 1 mM -amino caproic acid and 2 mM EDTA) at a protein concentration of 1 mg ml)1.
Thylakoid proteins (200 lg) were solubilized in 2% N-dodecylmaltoside in ACA750 buffer. BN strips were excised, incubated in
1% (w/v) SDS–1% (w/v) b-mercaptoethanol for 30 min to denature
the complexes, and were then placed horizontally on top of a 12%
SDS-PAGE. The resulting gels were stained with colloidal Coomassie Brilliant Blue G 250, as described previously (Millar et al., 2001).
Identification of gel spots by mass spectrometry
The protein samples to be analyzed were cut from the gels,
destained in 10 mM NH4CO3 and 50% (v/v) acetonitrile, dehydrated
at 50C and rehydrated with 15 lL of digestion solution (10 mM
NH4CO3 and 12.5 lg ml)1 trypsin in 0.01% trifluoroacetic acid), and
were then incubated overnight at 37C. Peptides were extracted
according to the method described by Taylor et al. (2005). Samples
were loaded onto self-packed Microsorb (Varian Inc.) C18 (5 lm,
100 Å) reverse-phase columns (0.5 · 50-mm) using an Agilent
Technologies (http://www.home.agilent.com) 1100 series capillary
liquid chromatography system, were and eluted into an XCT Ultra
IonTrap mass spectrometer (Agilent Technologies) with an ESI
source equipped with a low-flow nebuliser in positive mode, and
controlled by Chemstation [Rev B.01.03 (204); Agilent Technologies] and MSD TRAP CONTROL v6.0 (build 38.15) software (Bruker
Daltoniks, http://www.bdal.de). Peptides were eluted from the C18
reverse-phase column at 10 lL min)1 using a 9-min acetonitrile
gradient (5–60%) in 0.1% formic acid at a regulated temperature of
50C. Ions were selected for MS/MS after reaching an intensity of
25 000 counts per second, and two precursor ions were selected
from the initial MS scan. The resulting MS/MS spectra were
ª 2008 The Authors
exported, and the extracted results were queried against the Arabidopsis nucleus-encoded protein set (TAIR7), and the Arabidopsis
mitochondrial and plastid genome-encoded protein sets (the
combined database contained a total of 30 700 protein sequences
with 12 656 682 residues) using the MASCOT search engine v2.1.01
(Matrix Science, http://www.matrixscience.com), utilizing error
tolerances of 1.2 Da for MS and 0.6 Da for MS/MS, and with
‘Max Missed Cleavages’ set to 1 and the Peptide charge set at 2+ and
3+. The results were filtered using ‘Standard scoring’, ‘Max. number
of hits’ set to 20, ‘Significance threshold’ at P < 0.05 and ‘Ions score
cut-off’ at 20. Ions scores >20 represent a false-positive rate of <5%
against randomized databases of the same protein sequences.
Acknowledgements
This research was supported by an Australian Research Council
Centre of Excellence grant CE0561495. IDS is supported as a WA
Premier’s Fellow, NLT as an ARC Australian Post-doctoral Fellow
(DP0772155) and AHM as an ARC Australian Professorial Fellow
(DP0771156).
Supporting Information
Additional supporting information may be found in the online
version of this article.
Figure S1. Re-annotation of the gene At2g15820.
Figure S2. Re-annotation of the Arabidopsis thaliana gene ycf3.
Figure S3. Detection of splicing defects.
Figure S4. ycf3 intron 2 structure and lariat detection.
Figure S5. Localization of the spots sequenced on the Blue Native
(BN)–SDS-PAGE gels. Identification of each spot is described in
Table S2.
Table S1. qPCR primer sequences and their positions on the
genome.
Table S2. Spots identified by mass spectrometry.
Please note: Wiley-Blackwell are not responsible for the content or
functionality of any supporting materials supplied by the authors.
Any queries (other than missing material) should be directed to the
corresponding author for the article.
References
Andrés, C., Lurin, C. and Small, I.D. (2007) The multifarious roles of
PPR proteins in plant mitochondrial gene expression. Physiol.
Plant. 129, 14–22.
Asakura, Y. and Barkan, A. (2006) Arabidopsis orthologs of maize
chloroplast splicing factors promote splicing of orthologous
and species-specific group II introns. Plant Physiol. 142, 1656–
1663.
Asakura, Y. and Barkan, A. (2007) A CRM domain protein functions
dually in group I and group II intron splicing in land plant chloroplasts. Plant Cell, 19, 3864–3875.
Bilger, W., Schreiber, U. and Bock, M. (1995) Determination of the
quantum efficiency of photosystem II and of non-photochemical
quenching of chlorophyll fluorescence in the field. Oecologia,
102, 425–432.
Bassi, G.S., de Oliveira, D.M., White, M.F. and Weeks, K.M. (2002)
Recruitment of intron-encoded and co-opted proteins in splicing
of the bI3 group I intron RNA. Proc. Natl. Acad. Sci. USA, 99, 128–
133.
Bolduc, J.M., Spiegel, P.C., Chatterjee, P., Brady, K.L., Downing,
M.E., Caprara, M.G., Waring, R.B. and Stoddard, B.L. (2003)
Structural and biochemical analyses of DNA and RNA binding by
a bifunctional homing endonuclease and group I intron splicing
factor. Genes Dev. 17, 2875–2888.
Bonen, L. (2008) Cis- and trans-splicing of group II introns in plant
mitochondria. Mitochondrion, 8, 26–34.
Bonen, L. and Vogel, J. (2001) The ins and outs of group II introns.
Trends Genet. 17, 322–331.
Boudreau, E., Takahashi, Y., Lemieux, C., Turmel, M. and Rochaix,
J.D. (1997) The chloroplast ycf3 and ycf4 open reading frames of
Chlamydomonas reinhardtii are required for the accumulation of
the photosystem I complex. EMBO J. 16, 6095–6104.
Caprara, M.G., Chatterjee, P., Solem, A., Brady-Passerini, K.L. and
Kaspar, B.J. (2007) An allosteric-feedback mechanism for proteinassisted group I intron splicing. RNA, 13, 211–222.
Chatterjee, P., Brady, K.L., Solem, A., Ho, Y. and Caprara, M.G.
(2003) Functionally distinct nucleic acid binding sites for a group I
intron encoded RNA maturase/DNA homing endonuclease.
J. Mol. Biol. 329, 239–251.
Chevalier, B.S. and Stoddard, B.L. (2001) Homing endonucleases:
structural and functional insight into the catalysts of intron/intein
mobility. Nucleic Acids Res. 29, 3757–3774.
Chevalier, B.S., Monnat, R.J.. Jr and Stoddard, B.L. (2001) The
homing endonuclease I-CreI uses three metals, one of which is
shared between the two active sites. Nat. Struct. Biol. 8, 312–316.
Edwards, K., Johnstone, C. and Thompson, C. (1991) A simple and
rapid method for the preparation of plant genomic DNA for PCR
analysis. Nucleic Acids Res. 19, 1349.
Emanuelsson, O., Nielsen, H., Brunak, S. and von Heijne, G. (2000)
Predicting subcellular localization of proteins based on their
N-terminal amino acid sequence. J. Mol. Biol. 300, 1005–1016.
Govindjee. (1995) Sixty-three years since Kautsky: chlorophyll a
fluorescence. Aust. J. Plant Physiol. 22, 131–160.
Ho, Y. and Waring, R.B. (1999) The maturase encoded by a group I
intron from Aspergillus nidulans stabilizes RNA tertiary structure
and promotes rapid splicing. J. Mol. Biol. 292, 987–1001.
Ihnatowicz, A., Pesaresi, P., Varotto, C., Richly, E., Schneider, A.,
Jahns, P., Salamini, F. and Leister, D. (2004) Mutants for photosystem I subunit D of Arabidopsis thaliana: effects on photosynthesis, photosystem I stability and expression of nuclear genes
for chloroplast functions. Plant J. 37, 839–852.
Ihnatowicz, A., Pesaresi, P. and Leister, D. (2007) The E subunit
of photosystem I is not essential for linear electron flow and
photoautotrophic growth in Arabidopsis thaliana. Planta, 226,
889–895.
Koussevitzky, S., Nott, A., Mockler, T.C., Hong, F., SachettoMartins, G., Surpin, M., Lim, J., Mittler, R. and Chory, J. (2007)
Signals from chloroplasts converge to regulate nuclear gene
expression. Science, 316, 715–719.
Kügler, M., Jänsch, L., Kruft, V., Schmitz, U.K. and Braun, H.-P.
(1997) Analysis of the chloroplast protein complexes by bluenative polyacrylamide gel electrophoresis (BN-PAGE). Photosynth. Res. 53, 35–44.
Lazowska, J., Claisse, M., Gargouri, A., Kotylak, Z., Spyridakis, A.
and Slonimski, P.P. (1989) Protein encoded by the third intron of
cytochrome b gene in Saccharomyces cerevisiae is an mRNA
maturase. Analysis of mitochondrial mutants, RNA transcripts
proteins and evolutionary relationships. J. Mol. Biol. 205, 275–
289.
Li-Pook-Than, J. and Bonen, L. (2006) Multiple physical forms of
excised group II intron RNAs in wheat mitochondria. Nucleic
Acids Res. 34, 2782–2790.
Liu, S., Zhang, C. and Zhou, Y. (2005) Domain graph of Arabidopsis
proteome by comparative analysis. J. Proteome Res. 4, 435–
444.
ª 2008 The Authors
de Longevialle, A. Falcon, Meyer, E.H., Andres, C., Taylor, N.L.,
Lurin, C., Millar, A.H. and Small, I.D. (2007) The pentatricopeptide
repeat gene OTP43 is required for trans-splicing of the mitochondrial nad1 intron 1 in Arabidopsis thaliana. Plant Cell, 19,
3256–3265.
Longo, A., Leonard, C.W., Bassi, G.S., Berndt, D., Krahn, J.M., Hall,
T.M. and Weeks, K.M. (2005) Evolution from DNA to RNA recognition by the bI3 LAGLIDADG maturase. Nat. Struct. Mol. Biol. 12,
779–787.
Lowry, O.H., Rosebrough, N.J., Farr, A.L. and Randall, R.J. (1951)
Protein measurement with the Folin-Phenol reagents. J. Biol.
Chem. 193, 265–275.
Lucas, P., Otis, C., Mercier, J.P., Turmel, M. and Lemieux, C. (2001)
Rapid evolution of the DNA-binding site in LAGLIDADG homing
endonucleases. Nucleic Acids Res. 29, 960–969.
Lurin, C., Andres, C., Aubourg, S. et al. (2004) Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals
their essential role in organelle biogenesis. Plant Cell, 16, 2089–
2103.
Millar, A.H., Sweetlove, L.J., Giege, P. and Leaver, C.J. (2001)
Analysis of the Arabidopsis mitochondrial proteome. Plant
Physiol. 127, 1711–1727.
Nakagawa, N. and Sakurai, N. (2006) A mutation in At-nMat1a,
which encodes a nuclear gene having high similarity to group II
intron maturase, causes impaired splicing of mitochondrial NAD4
transcript and altered carbon metabolism in Arabidopsis thaliana.
Plant Cell Physiol. 47, 772–783.
Naver, H., Boudreau, E. and Rochaix, J.D. (2001) Functional studies
of Ycf3: its role in assembly of photosystem I and interactions
with some of its subunits. Plant Cell, 13, 2731–2745.
O’Toole, N., Hattori, M., Andres, C., Iida, K., Lurin, C., SchmitzLinneweber, C., Sugita, M. and Small, I. (2008) On the expansion
of the pentatricopeptide repeat gene family in plants. Mol. Biol.
Evol. 25, 1120–1128.
Okuda, K., Myouga, F., Motohashi, R., Shinozaki, K. and Shikanai, T.
(2007) Conserved domain structure of pentatricopeptide repeat
proteins involved in chloroplast RNA editing. Proc. Natl Acad. Sci.
USA, 104, 8178–8183.
Ostersetzer, O., Cooke, A.M., Watkins, K.P. and Barkan, A. (2005)
CRS1, a chloroplast group II intron splicing factor, promotes
intron folding through specific interactions with two intron
domains. Plant Cell, 17, 241–255.
Gierke, J. and Barkan, A. (2003) Group II intron splicing factors
derived by diversification of an ancient RNA-binding domain.
EMBO J. 22, 3919–3929.
Ostheimer, G.J., Hadjivassiliou, H., Kloer, D.P., Barkan, A. and
Matthews, B.W. (2005) Structural analysis of the group II intron
splicing factor CRS2 yields insights into its protein and RNA
interaction surfaces. J. Mol. Biol. 345, 51–68.
Ostheimer, G.J., Rojas, M., Hadjivassiliou, H. and Barkan, A. (2006)
Formation of the CRS2-CAF2 group II intron splicing complex is
mediated by a 22-amino acid motif in the COOH-terminal region
of CAF2. J. Biol. Chem. 281, 4732–4738.
Pombert, J.F., Lemieux, C. and Turmel, M. (2006) The complete
chloroplast DNA sequence of the green alga Oltmannsiellopsis
viridis reveals a distinctive quadripartite architecture in the chloroplast genome of early diverging ulvophytes. BMC Biol. 4, 3.
Porra, P.J., Thompson, W.A. and Kriedemann, P.E. (1989) Determination of accurate extinction coefficients and simultaneous
equations for assaying chlorophylls a and b extracted with four
different solvents: verification of the concentration of chlorophyll
standards by atomic absorption spectroscopy. Biochim. Biophys.
Acta, 975, 384–394.
Ruf, S., Kossel, H. and Bock, R. (1997) Targeted inactivation of a
tobacco intron-containing open reading frame reveals a novel
chloroplast-encoded photosystem I-related gene. J. Cell Biol. 139,
95–102.
Saha, D., Prasad, A.M. and Srinivasan, R. (2007) Pentatricopeptide
repeat proteins and their emerging roles in plants. Plant Physiol.
Biochem. 45, 521–534.
Salone, V., Rudinger, M., Polsakiewicz, M., Hoffmann, B., GrothMalonek, M., Szurek, B., Small, I., Knoop, V. and Lurin, C. (2007) A
hypothesis on the identification of the editing enzyme in plant
organelles. FEBS Lett. 581, 4132–4138.
Sato, S., Nakamura, Y., Kaneko, T., Asamizu, E. and Tabata, S.
(1999) Complete structure of the chloroplast genome of Arabidopsis thaliana. DNA Res. 6, 283–290.
Schmitz-Linneweber, C., Williams-Carrier, R.E., Williams-Voelker,
P.M., Kroeger, T.S., Vichas, A. and Barkan, A. (2006) A pentatricopeptide repeat protein facilitates the trans-splicing of the maize
chloroplast rps12 pre-mRNA. Plant Cell, 18, 2650–2663.
Small, I.D. and Peeters, N. (2000) The PPR motif – a TPR-related
motif prevalent in plant organellar proteins. Trends Biochem. Sci.
25, 46–47.
Small, I., Peeters, N., Legeai, F. and Lurin, C. (2004) Predotar: a
tool for rapidly screening proteomes for N-terminal targeting
sequences. Proteomics, 4, 1581–1590.
Solem, A., Chatterjee, P. and Caprara, M.G. (2002) A novel mechanism for protein-assisted group I intron splicing. RNA, 8, 412–425.
Stockel, J. and Oelmuller, R. (2004) A novel protein for photosystem
I biogenesis. J. Biol. Chem. 279, 10243–10251.
Stockel, J., Bennewitz, S., Hein, P. and Oelmuller, R. (2006) The
evolutionarily conserved tetratrico peptide repeat protein pale
yellow green7 is required for photosystem I accumulation in
Arabidopsis and copurifies with the complex. Plant Physiol. 141,
870–878.
Szczepanek, T., Jamoussi, K. and Lazowska, J. (2000) Critical base
substitutions that affect the splicing and/or homing activities of
the group I intron bi2 of yeast mitochondria. Mol. Gen. Genet.
264, 137–144.
Taylor, N.L., Heazlewood, J.L., Day, D.A. and Millar, A.H. (2005)
Differential impact of environmental stresses on the pea mitochondrial proteome. Mol. Cell. Proteomics, 4, 1122–1133.
Till, B., Schmitz-Linneweber, C., Williams-Carrier, R. and Barkan, A.
(2001) CRS1 is a novel group II intron splicing factor that was
derived from a domain of ancient origin. RNA, 7, 1227–1238.
Varotto, C., Pesaresi, P., Jahns, P., Lessnick, A., Tizzano, M.,
Schiavon, F., Salamini, F. and Leister, D. (2002) Single and
double knockouts of the genes for photosystem I subunits G, K,
and H of Arabidopsis. Effects on photosystem I composition,
photosynthetic electron flow, and state transitions. Plant Physiol.
129, 616–624.
Vogel, J. and Börner, T. (2002) Lariat formation and a hydrolytic
pathway in plant chloroplast group II intron splicing. EMBO J. 21,
3794–3803.
Watkins, K.P., Kroeger, T.S., Cooke, A.M., Williams-Carrier, R.E.,
Friso, G., Belcher, S.E., van Wijk, K.J. and Barkan, A. (2007) A
ribonuclease III domain protein functions in group II intron
splicing in maize chloroplasts. Plant Cell, 19, 2606–2623.
Wostrikoff, K., Girard-Bascou, J., Wollman, F.A. and Choquet, Y.
(2004) Biogenesis of PSI involves a cascade of translational
autoregulation in the chloroplast of Chlamydomonas. EMBO
J. 23, 2696–2705.
ª 2008 The Authors
Figure S1 : Re-annotation of the gene At2g15820. (a) Multiple sequence alignment of Arabidopsis
thaliana NP_565382 with its Vitis Vinefera and rice orthologs (Vv OTP51 and OsOTP51,
respectively). The Arabidopsis OTP51 sequence is shorter than the putative orthologs. (b) Sequence
alignment of the 5′-RACE PCR sequence against the Arabidopsis genomic sequence and the AGI
gene model At2g15820. The 5′-RACEsequence shows that OTP51 transcripts include an upstream
exon not included in the At2g15820 gene model. (c) Proposed corrected model for Arabidopsis
thaliana gene At2g15820.
Figure S2 : Re-annotation of the Arabidopsis thaliana gene ycf3. (a) Multiple sequence alignment of
Arabidopsis thalianaYcf3 (AtYCF3; BAA84386) with its rice, maize and tobacco orthologs
(OsYCF3;NP_039384, ZmYCF3; NP_043026 and NtYCF3; CAA77415, respectively). Identical
residues are shaded in black. The first 42 amino acids present in YCF3 of rice, maize and tobacco are
missing in the predicted Ycf3 protein of Arabidopsis thaliana, suggesting an erroneous annotation.
(b) Multiple sequence alignment of the chloroplast genome sequence of Arabidopsis thaliana
(AtChloroplast) with ycf3 exon 1of tobacco, rice and maize (Nt_ycf3exon1, Os_ycf3exon1,
Zm_ycf3exon1,respectively). A sequence highly similar to exon 1 is found in the chloroplast genome
of Arabidopsis thaliana (complement (44468..44591)). (c) New proposed annotation of the
Arabidopsis thaliana gene ycf3.
Figure S3 : Detection of splicing defects (a) Detection of ycf3 splicing by RT-PCR on cDNA fromotp51-1,
otp51-2 and wild-type Col-0. Col-0 genomic DNA was compared to indicate the unspliced products. The
primers designed to detect splice junctions were: YCF3_exon1R (5′-CGAGTCATTCCGACAACTTC-3′);
YCF3_exon2F
(5′-TGTGGTAAAAAGGGGTTTCG-3′);YCF3_exon2R
(5′ATGTCGGCTCAATCTGAAGG-3′) and YCF3_exon3F (5′-CTCCTTGTTGAATGGCCTGT-3′).No
amplification of spliced ycf3 exon2-exon3 is detected from otp51-1and otp51-2 with primer pairs
ycf3_exon2R / ycf3_exon3F while the unspliced form is amplified, showing that intron 2 is not spliced in
the mutant. Molecular weight markers are shown at left.(b) Poisoned Primer Extension (PPE) assays of
splicing of ycf3intron 1, ycf3 intron 2 and the atpF intron in wild-type and otp51.Poisoned primer
extension was performed as previously described (Chateigner-BoutinA-L and Small I, 2007). Primers used
to
amplify
the
first
product
were:
for
ycf3intron
1,
YCF3_exon1R
(5′CGAGTCATTCCGACAACTTC-3′); YCF3_exon2F (5′-TGTGGTAAAAAGGGGTTTCG-3′); for
ycf3intron 2, ycf3F (5′-TCCAATACTCAGCGGCTTG-3′);ycf3R (5′-TTCGGGCATTAGAACGAAAC-3′);
for
atpF
intron,
atpF-F
(5′-TGAATAGCTCCTTCACGCAGT-3′);atpF-R
(5′TTAGCAACAAATCCAATAAATCTAAGTG-3′);1/660th of the reverse transcription reaction was used
for PCR with Taq DNApolymerase (New England Biolabs).The primers and dideoxynucleotides for each
intron
were
as
follows:
ycf3
intron
1,
primer
PPE-ycf3-1
5′AATTTCCTTCAGATTGAGCCGACA-3′ddGTP;
ycf3
intron
2,
primer
PPE-ycf3-2,
5′CTTGTTGAATGGCCTGTTCTCCAC-3′,ddCTP;
atpF,
primer
PPE-atpF,
5′CTTTCGGTTATCTAATAAATCA-3′, ddCTP. Gels were imaged with a Typhoon Trio imager (GE
Healthcare) and analysed with IMAGEQUANTsoftware (GE Healthcare). The predicted sizes of the PPE
products for spliced (S) and unspliced (U) transcripts are stated in nucleotides next to each product. No
splicing of ycf3 intron 2 is detectable in otp51. An accumulationof the unspliced atpF transcript and a
decrease of the spliced atpF transcript is also observed in otp51 while no difference is observed forycf3
intron 1.
Figure S4 : ycf3 intron 2 structure and lariat detection. (a) Sequence alignment of the Arabidopsis thaliana
ycf3intron 2 domain V with the ycf3 intron 2 domain V sequence from rice to show the complete
conservation of sequence. The secondary structure prediction of domain V and VI of ycf3 intron 2 is
shown to indicate the position of the two extra nucleotides (bold) with respect to the 34 usually seen in a
classical domain V and the purine (circled adenosine) instead of a pyrimidine at position 10 from the 3′
end. The adenosine in the domain VI needed for the first trans-esterification step is marked with an asterix.
(b) Detection of ycf3 intron 2 lariats by RT-PCR. TheA represents the branchpoint adenosine. RT-PCR
across the intron termini should generate an expected product of 200 bp (denoted by the arrowhead), only
visible in the sample from wild-type plants (left, 1: otp51-1, 2: otp51-2,3: col0). Size markers are shown to
the left of the gel. The RT-PCR to detect ycf3intron 2 lariat molecules was performed according to LiPook-Than and Bonen (2006). 10 µg of Arabidopsis leaf RNA were reverse transcribed using a specific
primer near the 5′ end of ycf3 intron 2 (5′-CGATGGATGAAGTTTAGTTATTTGC-3′) and Superscript II
(Invitrogen).
Subsequently,
a
primer
at
the
5′
end
of
the
intron
(5′TTTGCTACAGCTGATAAAAATCG-3′) and a primer at the 3′ end of the intron, (5′AGTTGGTTGTCGAGCCGTAT-3′) were used for PCR amplification with TaqDNA polymerase (New
England Biolabs). RT-PCR products were cloned into pGEMT-easy (Promega). Cloned products were
size-selected by PCR and clones close to the expected size were sequenced.(c) Sequence analysis of RTPCR clones of intron junctions for ycf3 intron 2 in wild-type, otp51-1 and otp51-2 samples. The bold A or
T nucleotides indicate the branch-point nucleotide. The apparent substitution of the branch-point adenosine
by a thymidine as shown in the sequences from the wild-type sample has been previously reported as a
reverse transcriptase artefact for templates with 2′-5′ bonds (Li-Pook-Than and Bonen,2006).
Figure S5 : Localization of the spots sequenced on the BN-SDS PAGE gels. Identification of each spot
is described in the Table 2.
RESULTATS
Supplemental Table 1. qPCR primer sequences
59
RESULTATS
60
RESULTATS
Supplemental Table 2. Spots identified by mass spectrometry.
61
RESULTATS
II.1.2 Identification de défauts d’épissage en utilisant la PCR quantitative.
Plusieurs méthodes ont été mises au point pour identifier et quantifier des défauts
d‟épissage d‟ARNm. La plus communément utilisée est le northern blot. Celle-ci permet non
seulement de vérifier le taux d‟introns épissés, mais aussi de regarder en parallèle la
maturation des transcrits. Une autre technique, qui a été fortement utilisée lors de
l‟identification de facteurs d‟épissage chloroplastiques, est la PPE (Poisoned Primer
Extension). Cette méthode, décrite dans la Figure 4, permet grâce à sa grande sensibilité de
quantifier très précisément un défaut d‟épissage.
Figure 4 : Principe de la PPE (Poisonned Primer Extension), exemple de détection de l‟épissage de
l‟intron 2 d‟ycf3.
1. Une PCR ayant pour matrice de l‟ADNc dilué est réalisée en présence d‟oligonucléotides
spécifiques de l‟exon 2 et l‟exon 3 de ycf3. Cette PCR permet d‟amplifier à la fois la forme non
épissée et la forme épissée de l‟ARNm. Les produits PCR sont alors purifiés afin d‟éliminer les
oligonuclétides et les dnTPs restants.
2. Une réaction de type « séquençage » sur les produits PCR est réalisée en présence d‟un
oligonucléotide marqué en 5‟ par de la Fluorescéine (FAM) et spécifique de la partie en 5‟ de l‟exon 3,
de dnTPs (dATP, dGTP, dTTP) et d‟un dideoxynucléotide (ddCTP). Lors de l‟inclusion du ddCTP au
cours de la synthèse, la réaction d‟élongation est alors bloquée.
3. La séquence en 3‟ de l‟intron et en 3‟ de l‟exon 2 n‟étant pas les mêmes, deux types de produits
PPE sont alors obtenus. Un premier produit où l‟inclusion du ddCTP se fait 4 nucléotides après
l‟oligonucléotide, alors spécifique de la forme non épissée de l‟intron 2 d‟ycf3, et un autre produit plus
grand car l‟inclusion du ddCTP s‟effectue 9 nucléotides plus loin. Ce dernier produit est spécifique de
la forme épissée d‟ycf3. Ces produits sont dénaturés et déposés sur un gel d‟acrylamide afin de
permettre une séparation à un nucléotide près des produits de PPE et de comparer les ratios des formes
épissées et non épissées obtenues.
Lors de crible de mutants, ces deux méthodes ne sont malheureusement pas envisageables
et dans l‟optique d‟identifier des protéines PPR impliquées dans l‟épissage, il fallait mettre en
62
RESULTATS
place une technique adéquate. La méthode la plus simple était alors d‟amplifier par PCR la
forme épissée en utilisant des oligonucléotides sur chaque exon et de vérifier la présence de
chaque transcrit épissé pour chaque événement d‟épissage chloroplastique mais aussi
mitochondrial. Même si cette méthode, très rapide, permet de cribler un défaut total
d‟épissage chez les mutants étudiés, elle n‟est pas quantitative et permet difficilement
d‟identifier des défauts partiels. De plus, un certain nombre d‟introns se trouvant dans les
ARNt ne peuvent être analysés par cette méthode étant donné l‟impossibilité de dessiner des
oligonucléotides dans ces zones très courtes.
Afin de pallier au problème de la quantitativité, nous avons choisi d‟utiliser une approche
de PCR quantitative. Pour chaque événement d‟épissage des oligonucléotides ont été dessinés
sur les exons et sur l‟intron associé, permettant ainsi d‟amplifier la forme épissée et la forme
non épissée. Le ratio « forme épissée/ forme non épissée » pour chaque événement d‟épissage
est alors comparé entre le mutant étudié et le sauvage (Figure 5).
Figure 5 : Schéma représentant la technique de quantification de l‟épissage par PCR quantitative.
Les conditions et le dessins des oligonucléotides sont décrits dans l‟article 2 (supplemental
table 1) pour les événements d‟épissage chloroplastiques et dans l‟article 3 (supplemental
table 1) pour les événements d‟épissage mitochondriaux.
Comme il a été montré pour OTP51, cette approche permet de quantifier très précisément
des défauts d‟épissage au même titre que de la PPE. Cependant le problème de dessin
d‟oligonucléotides pour de la PCR quantitative sur les introns des ARNt réside, et seul le
northern blot permet de regarder ces événements.
Grâce à ce nouvel outil, il m‟a été possible de quantifier les événements d‟épissage pour un
certain nombre de mutants ppr et ainsi identifier de nouvelles protéines PPR impliquées dans
cette étape importante de modification post-transcriptionnelle.
63
RESULTATS
II.1.2.1 OTP52 (At3g06430, emb2750)
OTP52 est une PPR de type « Pure » prédite dans les chloroplastes sous Predotar
(http://urgi.versailles.inra.fr/predotar/predotar.html)
et
TargetP
(http://www.cbs.dtu.dk/services/TargetP/). Le mutant d‟insertion ADN-T dans ce gène,
emb2750, est décrit comme « embryo-letal » chez Arabidopsis. Chez les dicotylédones,
contrairement aux monocotylédones, un certain nombre de gènes essentiels pour le
développement des chloroplastes sont codés dans le génome chloroplastique (accD, ycf1,
ycf2), alors qu‟ils sont absents du génome chloroplastique chez les monocotylédones
(Konishi, Shinohara et al. 1996; Wakasugi, Tsudzuki et al. 2001). Un défaut de traduction ou
de certaines modifications post-transcriptionnelles au niveau de ces gènes peuvent donc
aboutir à un phénotype très marqué, l‟arrêt de développement des plastes conduisant à un arrêt
précoce du développement embryonnaire. Ainsi, il n‟est pas possible d‟obtenir des mutants
homozygotes pour des gènes essentiels dans la traduction plastidiale. Le gène accD code pour
une β-carboxyl transferase, sous-unité de l‟acetyl-CoA carboxylase. Cette enzyme a un rôle
essentiel dans la synthèse des acides gras (Kode, Mudd et al. 2005) et se trouve essentielle
lors de la germination de la graine. Etienne Delannoy (chercheur post-doctoral dans l‟équipe
de Ian Small à Perth) a envisagé une approche permettant de sauver des mutants homozygotes
en les complémentant avec un transgène accD nucléaire codant pour une protéine ACC-D
portant un peptide d‟adressage chloroplastique. En complémentant avec cette construction
chimérique, il serait éventuellement possible de « passer » certains stades de développement
embryonnaire, et ainsi sauver en partie certains mutants décrits comme embryo-letaux.
Parmi les mutants testés, se trouve le mutant « embryo-letal » otp52. La complémentation
par le gène accD n‟a pas très bien fonctionnée, mais il a été possible de récupérer des mutants
d‟insertion ADN-T homozygotes pour ce gène. Ces mutants présentent un très fort
phénotype : très faible taux de germination mais supérieur chez les mutants complémentés par
le gène accD que chez le mutant non complémenté ; des plantules blanches et très petites en
condition in vitro.
Des analyses réalisées par Etienne sur les ARNt chloroplastiques par northern blot ont
montré que le mutant présente un défaut d‟épissage de l‟ARNt Val UAC. En effet, aucun
ARNt Val mature n‟est observé alors que l‟on observe une accumulation de la forme non
épissée de cet ARNt. En addition de cette absence quasi totale de l‟épissage de cet intron, le
mutant présente également une diminution de l‟épissage des introns ARNt Ile et Ala, celle-ci
étant probablement due a un défaut de maturation de l‟ARN 23S. Afin de voir si d‟autres
événements d‟épissage sont affectés chez ce mutant, j‟ai réalisé une analyse de l‟épissage des
ARN chloroplastiques par PCR quantitative. Comme il est montré sur la Figure 6, en plus du
défaut d‟épissage de l‟ARNt Val, le mutant présente un très fort défaut d‟épissage de l‟intron
d‟atpF, pratiquement aucun ARNm d‟atpF mature ne pouvant être détecté et également un
défaut partiel d‟épissage de l‟intron 2 de rps12.
Un défaut d‟épissage d‟atpF a déjà été observé pour un grand nombre de mutants, tels que
crs1 et why1 (Jenkins, Kulhanek et al. 1997; Till, Schmitz-Linneweber et al. 2001; Asakura
and Barkan 2006; Prikryl, Watkins et al. 2008). Et ce défaut chez ces mutants conduit à un
phénotype assez similaire à celui d‟otp52. L‟absence d‟épissage de l‟ARNt Val devrait
conduire à un problème majeur dans la traduction chloroplastique. Et on peut se demander si
les défauts d‟épissage observés sur les autres introns sont des effets indirects ou des
conséquences du défaut de traduction engendré par le défaut d‟épissage de l‟ARNt Val.
64
RESULTATS
Figure 6 : Détection des événements d‟épissage par qPCR chez le mutant otp52. Pour chaque
intron, le ratio entre les formes épissées et non épissées chez le mutant est comparé au sauvage et est
représenté en abscisse sous la forme d‟un Log2 : Log2 [(forme épissée/ forme non épissée) mutant /
((forme épissée/ forme non épissée) sauvage]. L‟épissage des ARNt n‟est pas représenté sur ce
graphique car la détection de celui-ci a été quantifiée par northern blot (données non montrées).
Deux études différentes permettent en partie de répondre à cette question. La première, qui
a été réalisée au sein du laboratoire de Ian Small à Perth et qui est expliquée ultérieurement
dans ce chapitre, consiste à regarder le profil d‟épissage chez des mutants affectés dans la
transcription de type PEP. En effet, un des effets de l‟arrêt de la traduction conduit à un défaut
de la transcription impliquant les ARN polymerases codées par le génome chloroplastique
(PEP). Et ce défaut de transcription sur des transcrits ayant des introns pourrait provoquer des
défauts apparents d‟épissage.
La deuxième étude consiste à connaître quels sont les introns dépendants de la maturase
chloroplastique, MatK. Un des effets de l‟arrêt de la traduction est l‟absence de synthèse de la
maturase chloroplastique, MatK, codée dans l‟intron trnK. Cette protéine qui a longtemps été
décrite comme jouant certainement un rôle essentiel dans l‟épissage d‟introns
chloroplastiques, vient récemment d‟être mieux caractérisée. MatK pourrait être impliquée
dans l‟épissage de l‟intron d‟atpF, de rpl2, de l‟intron2 de rps12, de l‟intron de trnV, trnK,
trnA et de trnI puisque son association avec ces différents introns a été révélée par RIP-CHIP
(Zoschke, Nakamura et al. 2010).
Chez le mutant otp52, cinq introns sur les sept présentant une interaction avec MatK sont
affectés, néanmoins aucun défaut d‟épissage n‟est observé pour l‟intron de rpl2 et de trnK. Il
faut remarquer que l‟interaction de MatK avec ces 7 introns ne signifie pas nécessairement
que cette maturase ait un rôle essentiel dans leur épissage. Et il est donc envisageable que les
effets observés chez le mutant otp52 ne correspondent qu‟à des effets indirects dus à
l‟absence de traduction. Cependant l‟absence de défaut sur l‟intron de trnK, dont l‟épissage
serait certainement très lié à la maturase codée par son intron, suggère qu‟il existe un certain
taux de traduction de cette maturase et donc que la protéine OTP52 a un effet plutôt direct sur
l‟épissage des introns trnV et atpF et qu‟une partie du défaut de l‟absence de l‟ARNtVal
mature serait compensée par un autre mécanisme permettant un taux « minimal » de la
traduction. En effet, des données de western blot effectuées par Etienne Delannoy montrent
une quantité significative des protéines chloroplastiques AtpB, RbcL, PsaD et PsbA et de
nouvelles données obtenues par Catherine Colas-des-Francs ne montrent aucune différence
65
RESULTATS
dans l‟accumulation de la protéine AccD entre les mutants otp52 et crs1 et, en revanche, une
sur-accumulation comparée au sauvage. En conclusion, ceci suggère que le mutant otp52 est
plus apparenté à un mutant de l‟ATP synthase, au même titre que crs1, et que le défaut de
traduction lié aux problèmes d‟épissage des ARNt est relativement mineur.
II.1.2.2 Profil d’épissage des mutants affectés dans la transcription de type PEP
Un certain nombre de phénomènes de régulation transcriptionnelle et posttranscriptionnelle peuvent affecter l‟efficacité de l‟épissage et il est important, mais difficile,
de dissocier les effets indirects d‟une mutation aux effets directs de celle-ci sur l‟épissage.
L‟outil de PCR quantitative n‟étant pas brin spécifique, il est fort possible que, dans un cas où
il existe un défaut de transcription, on observe moins d‟épissage pour un intron mais que la
forme non épissée observée reste au même niveau que dans le sauvage alors que celle-ci
devrait être réduite en raison du défaut transcriptionnel pour ce transcrit. Cela peut s‟expliquer
par l‟amplification de transcrits chevauchants, en général en sens opposé, qui ne sont pas
forcément affectés et qui peuvent au contraire s‟accumuler et ainsi biaiser le résultât observé.
Seul un northern blot permettrait de discriminer parmi ces deux événements. Cependant, il est
possible d‟avoir une idée du profil d‟épissage des transcrits chloroplastiques dans le cas de
mutants affectés dans la transcription et ainsi de définir quels sont les évènements d‟épissage
affectés dans ces mutants.
La transcription chloroplastique est effectuée par deux types de polymérases. Deux
polymérases codées par le génome nucléaire, RpoTp et RpoTmp, nommées NEP pour
« Nuclear Encoded Polymerase », et une autre codée par le génome chloroplastique, la PEP
(Plastid-Encoded Polymerase), comprenant quatre sous-unités, RpoA, RpoB, RpoC1, RpoC2.
Ces deux types de polymérases ont un rôle bien défini dans la transcription chloroplastique et,
alors que ces trois polymérases vont transcrire un ensemble de gènes en commun, d‟autres
gènes sont transcrits préférentiellement par la PEP ou les polymérases de type NEP. Deux
mutants ppr (ptac2 et clb19) affectés dans la transcription par la PEP ont été identifiés et
présentent le même phénotype. PTAC2 est une PPR de type « Pure » comportant un domaine
endonucléase de type SMR en C-terminal. Plusieurs autres protéines PPR comportant ce motif
sont codées par le génome nucléaire d‟Arabidopsis et sont soit localisées dans les
chloroplastes comme GUN1 intervenant dans le signal rétrograde (Koussevitzky, Nott et al.
2007) ou encore P67 identifiée comme se fixant à l‟ARN (Lahmy, Barneche et al. 2000), soit
dans les mitochondries.
Le mutant ptac2 présente un défaut de transcription de la PEP (Pfalz, Liere et al. 2006).
Cette protéine PPR trouvée dans des complexes de haut poids moléculaire associés à des
protéines impliquées dans la transcription, serait directement liée à l‟activité transcriptionnelle
de type PEP, cependant sa fonction moléculaire exacte n‟est pas encore élucidée.
CLB19 est une PPR de type E+ impliquée dans l‟édition des deux sites chloroplastiques
clpP et rpoA (Chateigner-Boutin, Ramos-Vega et al. 2008). ClpP est une protéase et RpoA est
une sous-unité de la PEP. Le défaut d‟édition de ce transcrit codant pour cette sous-unité
conduit à un défaut de la transcription par la PEP équivalent à celui observé dans le mutant
ptac2 et de ce fait le profil transcriptionnel du génome chloroplastique des deux mutants est
identique.
Afin de déterminer le profil d‟épissage chez un mutant affecté dans la PEP, ces deux
mutants ont été étudiés. Les résultats des profils d‟épissage pour chacun sont représentés dans
la figure 7.
66
RESULTATS
A.
B.
Figure 7 : Profil de l‟épissage des introns chloroplastiques chez les mutants ptac2 (A.) et clb19
(B.) comparés à des plantes de type sauvage. Les ratios des formes épissées sur les formes non
épissées entre le mutant et le sauvage sont représentés en Log2 : Log2 [(forme épissée/ forme non
épissée) mutant / ((forme épissée/ forme non épissée) sauvage].
Seuls les introns des gènes chloroplastiques codants pour des protéines ont été analysés
dans cette expérience, et aucune donnée n‟a été obtenue concernant l‟épissage des ARNt.
Lorsque l‟on regarde les deux profils d‟épissage chez les deux mutants, on observe les mêmes
défauts d‟épissage. Huit introns présentent un ratio formes épissées sur formes non épissées
au moins deux fois inférieur à celui du sauvage. Ces deux mutants présentent des défauts de
transcription et donc le ratio pourrait être biaisé du fait de l‟existence de zones chevauchantes.
C‟est donc pour cette raison qu‟il est aussi important de regarder le taux des formes épissées
avant de comparer les ratios. En établissant cette comparaison représentée dans la figure 8, les
deux mutants présentent moins de formes épissées pour petB, petD et ndhA et étrangement
plus de formes épissées pour rpoC1. Le transcriptome chloroplastique de ces deux mutants
montre une diminution des transcrits de petB et petD qui sont des gènes majoritairement sous
le contrôle de la PEP. La diminution des formes épissées pour ces transcrits peut donc
s‟expliquer par une diminution de l‟abondance des transcrits primaires.
67
RESULTATS
Figure 8 : Profil des transcrits chloroplastiques épissés des mutants clb19 et ptac2. Log2 des
ratios des formes épissées des ARNm chloroplastiques chez les mutants clb19 et ptac2 sur les formes
épissées chez les sauvages Col0 : Log2 (forme épissée mutant/ forme épissée sauvage).
En parallèle, chez ces deux mutants, un certain nombre de transcrits spécifiques des
polymérases de type NEP s‟accumulent. Comme si en absence de l‟activité de la PEP, les
transcrits NEP ont une durée de vie plus importante et de ce fait s‟accumulent. C‟est le cas de
rpoC1 dont le transcrit s‟accumule, mais aussi la forme épissée, suggérant une durée de vie
plus importante de ces transcrits ou bien que ce défaut de la PEP s‟accompagne d‟une
surexpression des facteurs d‟épissage liés à l‟intron de rpoC1. En ce qui concerne ndhA, il n‟y
a pas de réduction de l‟expression des transcrits polycistroniques ndhH-ndhA-ndhI-ndhGndhE-psaC-ndhD, en revanche une forte diminution de l‟épissage de l‟intron de ndhA est
observée chez les deux mutants. Pour ce transcrit, 5 précurseurs possibles sont décrits et il est
possible que le précurseur adéquat pour l‟épissage soit sous représenté chez les mutants. Les
deux polymérases sont impliquées dans la transcription de ces transcrits mais les précurseurs
ne sont pas les mêmes selon la polymérase. La reconnaissance par les facteurs d‟épissage
pourrait donc s‟effectuer via un seul type de précurseur, qui serait préférentiellement transcrit
via la PEP.
En conclusion, ce profil d‟épissage est spécifique des mutants ayant un défaut de la
polymérase PEP, et permet désormais d‟avoir une certaine signature de ce type de mutant.
Ces défauts ne sont visiblement pas liés à des défauts d‟épissage mais plus à une diminution
des transcrits ou des formes correctes pour l‟épissage.
Concernant OTP52, le profil d‟épissage du mutant correspondant n‟est pas similaire au
profil des mutants PEP. Des défauts partiels de l‟épissage de ndhA, petB, petD et une
augmentation de l‟épissage de rpoC1 sont observés chez otp52 lorsque l‟on compare les taux
de formes épissées plutôt que les ratios. Cependant ces défauts sont beaucoup moins
importants que ceux observés chez clb19 et ptac2, suggérant encore qu‟une activité de
traduction existe chez le mutant otp52 malgré le défaut d‟épissage de l‟ARNt Val.
68
RESULTATS
II.2. Identification de protéines PPR impliquées dans l’épissage des ARNm dans les
mitochondries.
Il existe une réelle disproportion entre les facteurs d‟épissage chloroplastiques identifiés et
les facteurs mitochondriaux. En effet, alors que tous les introns chloroplastiques ont au moins
un facteur d‟épissage identifié, au niveau mitochondrial, la quasi-totalité des facteurs
d‟épissage reste à être caractérisée.
Au début de ma thèse, seulement un mutant dans un probable facteur d‟épissage avait été
identifié (nms1) (Brangeon, Sabar et al. 2000), mais pour lequel aucun clonage positionnel n‟a
été entrepris. Et de ce fait, au niveau mitochondrial, tous les facteurs d‟épissage restaient donc
à découvrir.
23 introns de group II sont décrits dans le génome mitochondrial chez Arabidopsis. Un
certain nombre d‟homologues de protéines CRM identifiées comme des facteurs d‟épissage
dans les chloroplastes sont prédits être localisés dans les mitochondries et pourraient avoir un
rôle dans l‟épissage des introns mitochondriaux (cf article 1) mais jusqu‟à présent aucune
preuve n‟a été apportée. Comme il a été montré précédemment, les protéines PPR sont
impliquées dans l‟épissage d‟un certain nombre d‟introns chloroplastiques et il est fort
possible que ces protéines PPR aient aussi un rôle dans l‟épissage dans les mitochondries au
même titre que les protéines CRM.
En utilisant une approche de génétique inverse, j‟ai pu identifier quatre protéines PPR
ayant une fonction plus ou moins majeure dans l‟épissage de certains introns mitochondriaux.
II.2.1 OTP43
OTP43 est la première protéine PPR que j‟ai étudiée et caractérisée. Cette protéine PPR de
type « Pure » fait partie des 48 protéines PPR pour lesquelles j‟avais mis en place une étude
systématique par « “ARNi” » dans le cadre du projet AGRIKOLA. Le « mutant “ARNi” »
d‟OTP43 présente un phénotype de retard de croissance assez fort comparé au sauvage. Dans
le but de comparer un « mutant “ARNi” » à un mutant « knockout » de type insertion ADN-T
pour le même gène, j‟ai entrepris l‟étude du mutant ADN-T Sail_867F07 dont l‟insertion se
situe en 3‟ du gène OTP43. Cette étude a montré, dans un premier temps, que le phénotype du
mutant d‟insertion était plus marqué. En plus du retard de croissance observé dans les lignées
« “ARNi” », des problèmes de germination, des retards de croissance plus forts et une stérilité
des graines issues des homozygotes sont observés chez le mutant Sail_867F07. Afin de
comprendre le rôle de cette protéine PPR, des études plus poussées ont été réalisées et ont pu
montrer que cette protéine est impliquée dans l‟épissage en trans de l‟intron 1 de nad1. Cette
protéine dont la caractérisation est décrite dans le papier suivant est la première protéine PPR
identifiée au niveau mitochondrial ayant un rôle dans l‟épissage.
Article 3 : de Longevialle A.F., Meyer E.H., Andrés C., Taylor N.L., Lurin C., Millar A.H. and Small I.D.
(2007) The Pentatricopeptide Repeat Gene OTP43 Is Required for trans-Splicing of the Mitochondrial nad1
Intron 1 in Arabidopsis thaliana. The Plant Cell, 19:3256-3265
69
The Plant Cell, Vol. 19: 3256–3265, October 2007, www.plantcell.org ª 2007 American Society of Plant Biologists
The Pentatricopeptide Repeat Gene OTP43 Is Required
for trans-Splicing of the Mitochondrial nad1 Intron 1
in Arabidopsis thaliana
W
Andéol Falcon de Longevialle,a,b Etienne H. Meyer,b Charles Andrés,a Nicolas L. Taylor,b Claire Lurin,a
A. Harvey Millar,b and Ian D. Smalla,b,1
a Unité
Mixte de Recherche Génomique Végétale (Institut National de la Recherche Agronomique, Centre National de la
Recherche Scientifique, Université d’Evry/Val d’Essonne), 91057 Evry, France
b Australian Research Council Centre of Excellence in Plant Energy Biology, University of Western Australia,
Crawley 6009 WA, Australia
The mitochondrial NADH:ubiquinone oxidoreductase complex (Complex I) is a large protein complex formed from both
nuclearly and mitochondrially encoded subunits. Subunit ND1 is encoded by a mitochondrial gene comprising five exons,
and the mature transcript requires four RNA splicing events, two of which involve trans-splicing independently transcribed
RNAs. We have identified a nuclear gene (OTP43) absolutely required for trans-splicing of intron 1 (and only intron 1) of
Arabidopsis thaliana nad1 transcripts. This gene encodes a previously uncharacterized pentatricopeptide repeat protein.
Mutant Arabidopsis plants with a disrupted OTP43 gene do not present detectable mitochondrial Complex I activity and
show severe defects in seed development, germination, and to a lesser extent in plant growth. The alternative respiratory
pathway involving alternative oxidase is significantly induced in the mutant.
INTRODUCTION
NADH:ubiquinone oxidoreductase (Complex I) is the major entry
point for the electron transport chain in plant and animal mitochondria (Brandt, 2006). Deficiency in Complex I function has
been associated with various human diseases, including neurodegenerative diseases, and the aging process (Adam-Vizi and
Chinopoulos, 2006; Janssen et al., 2006). In plants, this complex
is still the major entry point under normal conditions, even though
the electron transport chain is potentially more complicated due
to the presence of alternative NAD(P)H dehydrogenases and
alternative oxidase (reviewed in Noctor et al., 2007). Due to these
alternative pathways, the plant mitochondrial respiratory chain
has been a popular target for biochemical studies. Despite this
widespread interest, very few studies have used genetic approaches to look at respiratory chain function. Mitochondrial
Complex I is comprised of >40 subunits in Arabidopsis thaliana
(Heazlewood et al., 2003). The majority of these are encoded by
nuclear genes, and only nine genes have been retained in the
land plant mitochondrial genome, namely, nad1, nad2, nad3,
nad4, nad4L, nad5, nad6, nad7, and nad9 (Sugiyama et al.,
2005). With such a plethora of genes involved, one might have
expected many mutants with alterations in Complex I activity to
have been investigated, but in fact, the literature is very sparse.
1 Address
correspondence to [email protected].
The author responsible for distribution of materials integral to the
findings presented in this article in accordance with the policy described
in the Instructions for Authors (www.plantcell.org) is: Ian D. Small
([email protected]).
W
Online version contains Web-only data.
www.plantcell.org/cgi/doi/10.1105/tpc.107.054841
Two mitochondrial mutants with similar deletions have been
described from Nicotiana sylvestris (Pla et al., 1995) and another
mitochondrial DNA deletion mutant from maize (Zea mays;
Karpova and Newton, 1999). A nuclear mutant almost lacking
Complex I was observed in N. sylvestris (Brangeon et al., 2000),
while three nuclear mutants affected in Complex I have been
identified in Arabidopsis (Lee et al., 2002; Perales et al., 2005;
Nakagawa and Sakurai, 2006). Each of these mutants is defective in a different gene, and the phenotypes of these mutants are
quite varied.
Five of the nad genes are fragmented into different exons that
are flanked by sequences with group II intron features, and their
transcripts need to be spliced. Although other mitochondrial
transcripts (rps3, cox2, ccmF, and rpl2) contain introns, only
nad1, nad2, and nad5 transcripts require trans-splicing (Malek
and Knoop, 1998). Very little is known about RNA splicing factors
in plant mitochondria, but much more is known about the
process in chloroplasts. In maize chloroplasts, four RNA splicing
factors (CRS1, CRS2, CAF1, and CAF2) have been identified,
and three chloroplast protein complexes have been proposed for
the splicing of different intron subsets (Till et al., 2001; Ostheimer
et al., 2003, 2005, 2006; Ostersetzer et al., 2005). Orthologs in
Arabidopsis for these RNA splicing factors have been identified
(Asakura and Barkan, 2006). In addition to these splicing factors,
one highly specific factor has been identified that is required for
the trans-splicing of rps12 intron 1 in chloroplasts (SchmitzLinneweber et al., 2006).
This rps12 RNA splicing factor is a pentatricopeptide repeat
(PPR) protein, one of a very large family in Arabidopsis of at
least 450 proteins (Aubourg et al., 2000; Lurin et al., 2004; Rivals
et al., 2006). They are characterized by tandemly repeated,
OTP43 Is Needed for nad1 trans-Splicing
3257
degenerate, 35–amino acid motifs and have been proposed to
be sequence-specific RNA binding proteins (Small and Peeters,
2000). Most of the few that have been characterized play a role in
posttranscriptional processes in organelles (reviewed in Nakamura
et al., 2004; Andres et al., 2007). PPR proteins have been implicated in RNA editing (Kotera et al., 2005; Okuda et al., 2007),
RNA processing (Meierhoff et al., 2003; Hattori et al., 2007), RNA
splicing (Schmitz-Linneweber et al., 2006), and translational
activation (Schmitz-Linneweber et al., 2005). During a reverse
genetics screen of PPR mutants, we identified one with a defect
in splicing of nad1 transcripts. Nothing is known of RNA transsplicing factors in mitochondria; thus, this mutant is of considerable interest in understanding mitochondrial RNA splicing
processes. This mutant is also specifically affected in nad1 expression and appears to lack Complex I activity. It is thus equally
interesting from the biochemical and physiological point of view
and may be helpful in understanding the role of Complex I and the
alternative pathways in plant mitochondria.
RESULTS
Macroscopic Phenotype
The gene studied in this work (At1g74900) was first flagged as
worthy of interest from a high-throughput RNA interference
screen of a large number of Arabidopsis genes, including many
genes encoding PPR proteins (Hilson et al., 2004). Different
independent lines of knockdown expression of At1g74900
showed delayed development and delayed flowering, so three
T-DNA insertion lines putatively mutated in At1g74900 were
obtained and analyzed. The positions of the three T-DNA inserts
were confirmed by PCR and sequencing, but only one line,
Sail867_F07, proved to contain the T-DNA insert within the
coding region (130 bp upstream of the stop codon) (Figure 1A).
Seeds from each of the three lines were sown on soil. For the two
lines with insertions outside of the coding sequence, all seeds
germinated and homozygous mutant plants exhibited no obvious phenotype. These lines were not considered further. For the
line Sail867_F07, only three-quarters of the seeds germinated,
and no homozygous mutant plants were obtained. Closer examination of seeds from Sail867_F07 plants heterozygous for the
insertion revealed two kinds (Figure 1B); three-quarters of the
seeds were wild-type, while the remaining quarter were smaller
and darker. PCR amplification of DNA from both kinds of seeds
confirmed that the smaller, darker seeds contained homozygous
mutant embryos. A small fraction of mutant seeds could be
germinated on half-strength Murashige and Skoog medium. The
rare seedlings obtained were homozygous for the T-DNA insertion and could be subsequently transferred to soil. The mutant
plants show obviously delayed development and delayed flowering and are smaller than the wild type, but the difficulty in
reproducibly germinating significant numbers of seeds precluded any rigorous statistical analysis of growth rate. The leaves
are often curled (Figure 1C), and the seeds produced from these
plants are invariably malformed and impossible to germinate.
Perhaps surprisingly, male and female gametogenesis appears
to be relatively unaffected; heterozygous plants produce close to
20% phenotypically mutant seeds (38/207), and seed set in
Figure 1. The otp43 Mutant Line.
(A) T-DNA insertion map of the Sail_867F07 line.
(B) Mutant (left) and wild-type (right) seeds from a plant heterozygous for
the Sail_867F07 insertion.
(C) Rosette from a homozygous otp43 plant growing on soil in short-day
conditions.
(D) Rosettes growing on soil in short-day conditions, from left to right:
wild-type (Columbia [Col-0]), otp43, and complemented otp43. Rosettes
from otp43 are 4 weeks older than those of the wild type and the
complemented otp43 to approximately match the developmental stages
of the plants.
homozygous mutants plants is as good as could be expected
given the poor growth of the plants. All the phenotypes observed
were absent from mutant plants transformed with a genome
fragment carrying the wild-type At1g74900 gene (Figure 1D).
Molecular Characterization
The protein encoded by At1g74900 is strongly predicted by
Mitoprot (Claros, 1995) and Predotar (Small et al., 2004) to be
mitochondrial, like the majority of PPR proteins. As virtually all of
the PPR proteins characterized so far are involved in RNA processing within organelles, we employed a mitochondrial transcriptome mapping approach (C. Andrés, A. Falcon de Longevialle,
A.L. Chateigner-Boutin, C. Lurin, and I.D. Small, unpublished
data) to gain a general view of mitochondrial transcripts in the
mutant plants and find any eventual RNA processing defects.
The major defect found in the mutant was an absence of fully
spliced nad1 transcript (Figure 2). We thus named this mutant
otp43 (for organelle transcript processing defect) in line with
other mutants identified by this screen. The nad1 gene encoding
3258
The Plant Cell
Figure 2. A Splicing Defect in nad1 Intron 1 in otp43.
(A) Schematic representation of the localization of the primers used to detect the four splicing events by RT-PCR on the nad1 pre-mRNA.
1, nad1exon1F/nad1exon2R; 2, nad1exon2F/nad1exon3R; 3, nad1exon3F/nad1exon4R; 4, nad1exon4F/nad1exon5R; 5, nad1exon1F/nad1exon5R.
(B) RT-PCR on Col-0 cDNA, on cDNA from otp43, and on cDNA from complemented otp43 using primers designed to amplify across nad1 splice
junctions. No amplification is detected from otp43 with primer pairs 1 and 5, showing that intron 1 is not spliced in the mutant. Molecular weight markers
are shown on the right.
(C) PCR on cDNA from otp43 leaves 48, 72, or 92 h after infiltration with Agrobacterium carrying a T-DNA containing the wild-type OTP43 gene.
subunit 1 of Complex I is fragmented into five coding segments
that are scattered over at least 175 kb and interspersed with
other genes in the Arabidopsis mitochondrial genome. Two
trans-splicing events and two cis-splicing events are necessary
for the complete maturation of the nad1 transcript. To verify if the
absence of spliced nad1 transcript is due to a defect in splicing of
a specific intron, we designed primers to detect each splicing
event by RT-PCR. In the mutant, trans-spliced mRNA joining
exon 1 and exon 2 is not detected, whereas the three other
introns of nad1 are correctly and efficiently spliced (Figure 2). We
tested all 22 other mitochondrial RNA splicing events by quantitative RT-PCR (see Supplemental Figure 1 and Supplemental
Table 1 online) without observing any other qualitative differences between the mutant and the wild type.
Figure 2 online). Their growth and development were indistinguishable from wild-type plants (Figure 1D), and splicing of the
nad1 transcript was fully restored (Figure 2B). Incidentally, the
easy recovery of complemented seedlings also demonstrates
that the defective seed development and germination phenotype
is a property of the mutant embryos, not a maternal effect due to
the poor growth of the plants. To further investigate the restoration of RNA splicing, we infiltrated leaves of homozygous
mutant plants with Agrobacterium tumefaciens carrying the
T-DNA construct with the OTP43 gene. By 48 h after inoculation,
traces of spliced exon1-exon2 nad1 mRNA could be detected by
RT-PCR (Figure 2C), and by 92 h, the complete mature nad1
mRNA could be amplified. We conclude that the defect observed
in nad1 transcript splicing in otp43 plants is solely due to a lack of
functional OTP43.
Complementation of the RNA trans-Splicing Event by
Wild-Type Copies of OTP43
To verify that the RNA splicing defect observed is due to a lack of
functional OTP43, we directly transformed mutant plants with a
wild-type copy of the gene (including the upstream sequences
likely to contain the promoter). As homozygous mutant seeds
almost never germinate, we reasoned that transformed seeds
could be selected simply by their ability to grow, and this proved
to be the case. The seedlings obtained were genotyped and
shown to be carrying the OTP43 transgene (see Supplemental
New RNA Editing Sites in nad1 Intron 1 and Exon 4
As at least one PPR protein is known to be involved in RNA
editing (Kotera et al., 2005), we sequenced cDNAs covering the
five exons of nad1 cDNA and both halves of intron 1 from the
mutant in case an RNA editing defect was at the root of the RNA
splicing defect. Twenty-four C-to-U editing sites have been
described in exons 1, 3, and 5 of nad1 mRNA from Arabidopsis
(Giegé and Brennicke, 1999).
In wheat (Triticum aestivum), a C-to-U editing event in domain
VI of the nad1 intron 1 may have an impact on secondary
structure (Li-Pook-Than and Bonen, 2006). In Arabidopsis, as
previously described (Carrillo et al., 2001), this site is not edited.
However, we found a new C-to-U editing site in domain V of the
nad1 intron 1 (Figure 3). This site is correctly edited in the mutant.
It has also been demonstrated in wheat that an editing site
located very close to the intron/exon junction could be essential
for the correct secondary structure of the group II intron and,
thus, splicing (Li-Pook-Than et al., 2007). No differences between the mutant and the wild type were observed in any of the
nad1 exons, although we did find a new editing site in nad1 exon
4 that was not described from Arabidopsis but has been observed in Brassica napus (Handa, 2003). Thus, the splicing defect
is unlikely to be due to a deficiency in editing; furthermore, none
of the editing events in nad1 transcripts require prior splicing out
of intron 1.
Loss of Mitochondrial Complex I
The NAD1 protein is a central anchor component of Complex I
and would be expected to be essential for assembly of the
complex in the membrane. As no mature nad1 mRNA is detected,
it is highly likely that no NAD1 protein is produced in the mutant
plants. No effective antibodies against the highly hydrophobic
NAD1 protein are available to verify this. However, separation of
mitochondrial complexes by blue-native PAGE and NADH dehydrogenase activity staining (Figure 4A) fail to reveal any trace of
Complex I activity. Two-dimensional blue-native/SDS-PAGE on
the mutant confirms the specific lack of Complex I (Figure 4B);
none of the other complexes appear to be affected. We cannot
rule out that partial complexes formed from some of the other
Figure 3. Secondary Structure Model of Domains V and VI of the
Arabidopsis nad1 Intron 1.
The C-to-U editing site found in nad 1 intron 1 domain VI in wheat,
highlighted in gray, is not edited in Arabidopsis. The second nucleotide
highlighted in gray in domain V is a novel C-to-U editing site that was
found to be edited in the wild type and in otp43. The underlined
adenosine in domain V is a uracil in almost all other group II introns,
while the underlined uracil in domain VI lies approximately where the
bulged adenosine involved in lariat formation would normally be located.
3259
Complex I subunits are still present but not visible under the gel
procedures used.
Accumulation of Alternative Respiratory Pathway
Transcripts and Proteins
The previously described Nicotiana and maize mutants lacking
Complex I had elevated levels of alternative oxidase (AOX)
(Karpova et al., 2002; Dutilleul et al., 2003b). To check whether
this Arabidopsis mutant has the same phenotype, we performed
quantitative RT-PCR assays for transcripts coding for alternative
respiratory pathway proteins, namely, the alternative external
(NDB1-4) and internal (NDA1-2 and NDC1) NAD(P)H dehydrogenases and the AOX isoforms AOX1a-c and AOX2 (Figure 5A).
The levels of many of these transcripts are significantly altered in
the otp43 mutant, and some, such as AOX1c, NDB2, and NDB4,
are highly induced. The transcript increases lead to protein
accumulation, at least of the AOX, as revealed by a protein gel
blot using an antibody against AOX. As shown in Figure 5B, the
mutant plants contain considerably increased levels of AOX
compared with wild-type plants.
DISCUSSION
Plant Organellar Splicing Factors
cis-spliced group II introns can self-splice in vitro, but both cisand trans-spliced group II introns in the chloroplast and mitochondria require RNA splicing factors in vivo. Each organelle
genome contains one group II intron that encodes a conserved
maturase protein. In chloroplasts, the matK maturase is suspected
to be involved in several different splicing events but is not required for splicing of all introns (Vogel et al., 1999). The other
cofactors and RNA splicing factors are encoded by nuclear
genes and are imported into organelles. Four of these (CRS1,
CRS2, CAF1, and CAF2) that act as factors in splicing of one or
more different introns have been identified from maize chloroplasts (Jenkins and Barkan, 2001; Till et al., 2001; Ostheimer
et al., 2003, 2005, 2006; Ostersetzer et al., 2005), and a PPR
protein has been characterized that is specifically needed for
trans-splicing of the rps12 transcript (Schmitz-Linneweber et al.,
2006). RNA trans-splicing probably requires more proteins than
cis-splicing, and many more may remain to be identified in land
plants if we compare the currently known factors with the 14
nuclear genes that are required for the removal of the transspliced introns in the psaA gene in Chlamydomonas reinhardtii
chloroplasts (Goldschmidt-Clermont et al., 1990; Merendino
et al., 2006).
In plant mitochondria, much less is known about RNA splicing
factors. Introns in fungal mitochondria usually require the activity
of intron-encoded maturases, but various other RNA binding
cofactors have been shown to be important for splicing of specific
introns. In land plants, the nad1 intron 4 encodes a maturase, but
it is not known which introns, if any, require its activity for splicing.
Recently, an Arabidopsis nuclear gene encoding a maturase-like
protein was shown to be involved in splicing of the mitochondrial
nad4 transcript (Nakagawa and Sakurai, 2006), but some RNA
splicing still occurs in the mutant described.
3260
The Plant Cell
Figure 4. Complex I Is Lacking from otp43 Mitochondria.
(A) Blue-native gel (left) and NADH dehydrogenase activity staining of the same gel (right) of isolated mitochondrial proteins from Col-0 rosettes and
from otp43 rosettes growing in short-day conditions. I and IIIþI indicate the positions of Complex I and the supercomplex of Complex I þ Complex III.
(B) Two-dimensional blue-native/SDS-PAGE of mitochondrial proteins from Col-0 wild-type plants (left) and otp43 plants (right). The gels are stained
with Coomassie blue. Apparent molecular mass of subunits is shown in kilodaltons. Arrows indicate spots that have been identified by mass
spectrometry (see Supplemental Table 2 online): 1, 76-kD subunit (At5g37510); 2, 51-kD subunit (At5g08530), ND5 (NP_085478/AtMg01460); 3, ND7
(NP_085511/AtMg00510); 4, 39-kD subunit (At2g20360), ND2 (NP_085584/AtMg01450); 5, CAL1 (At5g63510), 23-kD subunit (At1g79010), ND1
(NP_085565/AtMg01275); 6, ND9 (NP_085479/AtMg0070); 7, 16-kD subunit (At2g27730), PDSW subunit (At3g18410, At1g49140); 8, B14 subunit
(At3g12260), B18 subunit (At2g02050); 9, B18 subunit (At2g02050). These proteins are all subunits of Complex I and none are visible in the gel of otp43
proteins. 10 and 19, ATP2 (At5g08670), ATP1 (NP_085571/AtMg01190); 11 and 20, ATP3 (At2g33040); 12 and 21, ATP FAD (At2g21870); 13 and 22,
ATP8 (NP_085508/AtMg00480). These proteins, identified in both wild-type and otp43 plants, are all subunits of Complex V. 14 and 23, MPP b
(At3g02090); 15 and 24, MPP a (At1g51980); 16 and 25, Cyt c1-1 (At3g27240), Cyt c1-2 (At5g40810), COB (NP_085492/AtMg00220); 17 and 26: URC1
(At5g13430); 18 and 27, QCR7 (At4g32470). These proteins, identified in both wild-type and otp43 plants, are all subunits of Complex III.
A Mitochondrial trans-Splicing Factor
Our results clearly show that OTP43 is absolutely and specifically
required for splicing of the first intron in the mitochondrial nad1
transcript. In comparison, all other introns in the mutant mitochondria are correctly spliced to a large extent. A decrease in splicing of
nad2 intron 1 is also observed (see Supplemental Figure 1 online)
and could be due to a minor role for OTP43 in splicing of this intron
too or to pleiotropic effects of the loss of Complex I. The high
degree of specificity of OTP43 resembles that shown for maize
PPR4, but the two PPR proteins are not closely related. PPR4 and
its probable Arabidopsis ortholog (At5g04810) contain an RNA
recognition motif domain, and At5g04810 is the only one of the 450
Arabidopsis PPR proteins to do so. By contrast, At1g74900 is a
more typical PPR protein, containing only canonical PPR motifs.
There is a putative ortholog of At1g74900 in the rice (Oryza sativa)
genome (Os02g45590 using the TIGR 3.0 annotation), as would be
expected considering that the presence of nad1 intron 1 is widely
conserved across angiosperms.
Possible Mechanisms of Action
By immunoprecipitating PPR4-RNA complexes from maize
chloroplast stromal extract, PPR4 was shown to bind specifically
to rps12 intron sequences and thus presumably helps the two
intron halves to associate or fold into an active conformation
(Schmitz-Linneweber et al., 2006). The extreme difficulty in
obtaining sufficient Arabidopsis mitochondrial matrix extract
(particularly from the rare mutant plants we have obtained that
were needed to carry out the necessary controls) precludes an
equivalent test of At1g74900 function. Nevertheless, it is likely
that this PPR protein does interact in some way with the nad1
intron 1. A second possibility is that it acts indirectly by being
required for expression of another splicing factor (e.g., a small
RNA or the mitochondrial matR maturase). A third possibility,
which we have partially disproved, is that At1g74900 is required
for accumulation and processing of nad1 precursors such that
they are in a correct state for RNA splicing. We observed no
differences in RNA abundance, editing, or structure of the
various nad1 precursor transcripts in the mutant, and, indeed,
all other nad1 splicing events take place normally.
nad1 Intron 1 Has Some Unique Features
Based on extensive phylogenetic, biochemical, mutational, and
biophysical data, a consensus sequence has been derived from
112 group IIA/IIB introns (Bonen and Vogel, 2001). The nad1
intron 1 differs from this consensus at several points and has an
3261
Figure 5. Alternative Electron Transport Pathway Transcripts and Proteins Are Induced in otp43.
(A) Quantitative RT-PCR on cDNA from three independent otp43 plants (otp43-a, otp43-b, and otp43-c).
(B) Immunoblot analysis of AOX proteins. Coomassie blue–stained SDS-PAGE gel (left) of mitochondrial proteins extracted from wild-type and otp43
plants. This gel was used for a protein gel blot (right) using anti-AOX antibodies. Bound antibodies were revealed by chemiluminescence.
unconventional domain V sequence with a stem loop of 18
nucleotides instead of the four nucleotides found in the conventional domain V. A second major difference is the presence of an
adenosine nine nucleotides downstream from the 59 end of
domain V (Figure 3). Among 112 domain V sequences from group
II introns, only angiosperm nad1 intron 1 and the Marchantia
polymorpha petB intron contain an adenosine at what is usually a
highly conserved uracil. The base at this position is thought to be
paired with the conserved guanine at position 26 (Costa et al.,
1998). The cytidine at position 25 and the guanosine in position
26 are the site of important 29-OH and phosphoryl groups involved
in intron structure. Domain VI is also unusual in this intron, and,
notably, the bulged adenosine that typically acts as the attacking
nucleophile at the 59 splice site in other group II introns is missing
(Figure 3). It has been proposed that nad1 intron 1 splicing may
involve hydrolysis rather than trans-esterification (Carrillo et al.,
2001). It is possible that one or more of these unique features
explain the need for a specific splicing factor.
Plant Complex I Mutants
In Arabidopsis, three nuclear mutants of Complex I have been
described so far. The fro1 mutant was identified as being cold
sensitive (Lee et al., 2002) and has a mutation affecting the
expression of the FRO1, which codes for an 18-kD subunit of
Complex I. The phenotype of the fro1 mutant is similar to the
phenotype of the otp43 mutant described here: slow growth,
retarded development, and delayed germination. However, no
problems with seed formation were observed, and the fro1
germination phenotype is less severe. Another mutant contained
a T-DNA insertion in a nuclear gene (At1g47260) encoding a
subunit of Complex I with some similarity to carbonic anhydrases
(Perales et al., 2005). These mutants were not visually distinguishable from wild-type plants, although Complex I activity was
decreased by 80%. The third mutant, css1, was identified by its
sensitivity to an inhibitor of cellulose biosynthesis (Nakagawa
and Sakurai, 2006). The nuclear gene affected in this mutant has
a high similarity to group II intron maturases, and the affected
plants show impaired splicing of the mitochondrial nad4 tran-
script. The molecular phenotype of this mutant resembles that of
the NMS1 mutant from N. sylvestris, also specifically defective in
splicing of nad4 transcripts (Brangeon et al., 2000). Complex I
activity was not measured in the css1 mutant, but like the other
previously described Arabidopsis Complex I mutants, the overall
phenotype appears to be milder than the otp43 mutant described here.
Two apparently total knockouts of Complex I activity have
been described from other species, and in both cases, they are
mitochondrial mutants. The best-characterized mutant to date is
the CMSII mutant in N. sylvestris. This mutant carries a mitochondrial deletion in the nad7 gene encoding a 40-kD subunit of
Complex I (Pla et al., 1995). The mutant plants develop slowly,
exhibit conditional male sterility, and have no detectable Complex I, increased amounts and activity of AOX, and multiple
perturbations to primary metabolism (Gutierres et al., 1997,
1999; Lelandais et al., 1998; Sabar et al., 2000; Dutilleul et al.,
2003a, 2003b, 2005; Pineau et al., 2005; Priault et al., 2006a,
2006b; Vidal et al., 2007). A second Complex I mutant has been
described from maize (Karpova and Newton, 1999). The NCS2
mutant carries a deletion of the 39 end of the nad4 gene. This
deletion causes lethality during kernel development, and only
mutant plants containing at least some normal mitochondria can
propagate, giving rise to striped plants containing sectors with
varying ratios of mutant to wild-type mitochondria. The mutant
sectors have no Complex I activity but a partially assembled
Complex I (Karpova and Newton, 1999). As observed in the
CMSII mutant, the amount of AOX is increased in NCS2 sectors
(Karpova et al., 2002). Both of these mutants resemble otp43 in
that they lack a mitochondrially encoded subunit of Complex I,
leading to a partial or complete loss of the complex and a
complete loss of activity. However, the physiological effect on
the plants is quite distinct; in N. sylvestris, loss of Complex I leads
to conditional male sterility but relatively minor effects on growth
and seed development. In maize and Arabidopsis, on the contrary, male fertility is near normal, but seed development is
severely compromised and plant growth drastically affected (to
the point in maize where it is impossible to recover completely
mutant plants). Further research is needed to discover whether
3262
The Plant Cell
these differences are due to differences in the relative importance of Complex I to the physiology of these different species or
whether the differences arise because different Complex I subunits are missing in each mutant.
The Effects of a Loss of Complex I Activity
Inhibition of Complex I by inhibitors, such as rotenone, or by loss
of subunits as in the mutants described above leads to problems
with primary metabolism in the affected plants (reviewed in
Noctor et al., 2007). The primary entry point for electrons into the
electron transport chain is missing, leading to a loss in ATP
synthesis and an initial buildup of unoxidized NADH. It has been
previously shown in other plants that under these conditions the
alternative respiratory pathway is engaged, comprising the induction of alternative NAD(P)H dehydrogenases and AOXs
(Gutierres et al., 1997; Sabar et al., 2000; Karpova et al., 2002;
Dutilleul et al., 2003b), bypassing the classical cytochrome electron transport chain. Our data show that this response is significantly induced in this mutant, with transcriptional induction of
both alternative NADH dehydogenases and AOX and a significant
increase in total AOX protein revealed by immunodetection. The
availability of an Arabidopsis mutant lacking expression of a major
Complex I subunit will be valuable for genetically dissecting the
retrograde signaling pathways involved in this response.
Quantitative RT-PCR Analysis
Quantitative RT-PCR was performed using LightCycler 480 SYBR Green I
Master Mix (Roche Diagnostics) and a LightCycler 480 Roche real-time
PCR system with the following thermal cycling program: 958C for 10 min,
followed by 18 touchdown cycles of denaturation at 948C for 10 s, 858C
(28C per cycle) for 10 s, and extension at 728C for 20 s, followed by 40
cycles of 958C for 10 s, 508C for 10 s, and 728C for 20 s. Primer sequences
used were as follows: AOX1a (At3g22370) forward (F), 59-GACGGTCCGTACGGTTTCG-39, and reverse (R), 59-CTTCTGATTCGCGTCCTCCTCCT-39; AOX1c (At3g27620) F, 59-GCATCAAAGCAAGCGACATCC-39,
and R, 59-TGGCTTCACGCCCCAATAAC-39; NDA1 (At1g07180) F,
59-GTCCGTGAGAGCAAGGAAGG-39, and R, 59-GGCGAAGTGGAGGGGATATG-39; NDA2 (At2g29990) F, 59-CGAGAGCAAGGACGCAAAAG-39,
and R, 59-CAGTAGGCCGAGATTGAGAC-39; NDB1 (At4g28220) F,
59-CTGTGACTGATAAAGATATC-39, and R, 59-GCCAACTGCATATACATTC-39; NDB2 (At4g05020) F, 59-CTGACTCTCTCAAAGAGTTCC-39,
and R, 59-CGATTTGAACTCTTCGATC-39; NDB3 (At4g21490) F, 59-GCAAATCCATCATATAGCAAC-39, and R, 59-CAAGGGAGTGAAAGCAAAG-39;
NDB4 (At2g20800) F, 59-TCAAGTCTTAAGGGCACAACA-39, and R, 59-CGGAAGAGAGAGGCTCTCTCG-39; NDC1 (At5g08740) F, 59-TCCATAAAGAGAGCAAGCAAC-39, and R, 59-CGAATCACCTAATGCAAATATC-39; Actin2.8,
Actin2 (At3g18780), and Actin8 (At1g49240) F, 59-GGTAACATTGTGCTCAGTGGTGG-39, and R, 59-AACGACCTTAATCTTCATGCTGC-39. Actin2.8
was used as an internal reference amplicon. Data were analyzed using
LightCycler 480 software version 1.2 (Roche Diagnostics).
Complementation
The Arabidopsis thaliana Sail867_F07 mutant from the SAIL collection
(Sessions et al., 2002) and Col-0 wild type were germinated on halfstrength Murashige and Skoog medium and 1% sucrose at 228C with a
16-h photoperiod. Two-week-old rosettes were transferred to soil, and
plants were grown at 228C with a 8-h photoperiod for isolation of
mitochondria and RNA and also for the transient complementation
experiments. For the other experiments described, rosettes were transferred to soil and grown at 228C with a 16-h photoperiod.
Genomic DNA fragments were amplified using Pfx polymerase (Invitrogen)
and the primers 59-AAGGTACCAGGGACCCAATTTTCTTTGA-39 and
59-AAGGTACCGGGAGCAGCCACACTATCTC-39. The products were
subcloned into pGEM-T Easy (Promega) and sequenced. The resulting
plasmid was cut by KpnI and transferred into pCAMBIA-1301 (www.
cambia.org). The resulting vector was transformed into Agrobacterium
tumefaciens GV3101pMP90 and used for infiltration of leaves and floral
dip transformation. Agrobacterium-mediated transient expression by leaf
infiltration assays was performed with this strain as described by Marois
et al. (2002) and floral dip transformation of homozygous plants as
described by Clough and Bent (1998). Resulting seeds were sown on soil
without selection because only transformed seeds can germinate and
grow.
DNA and RNA Isolation and RT-PCR Analysis
Mitochondrial Isolation
Leaf DNA was isolated using the DNA plant extraction protocol as
described by Edwards et al. (1991), and 10 ng from the extraction was
used for PCR with primers sail_867_F07_LP (59-TGGTTACAGGAGACTCGGTTG-39), sail_867_F07_RP (59-GGTGAGGAGAGGTTATGAGCC-39),
and LB1 (59-GCCTTTTCAGAAATGGATAAATAGCCTTGCTTCC-39). Leaf
RNA was isolated using the plant RNeasy extraction kit (Qiagen) according to the manufacturer’s protocols. The leaf RNA was treated
with DNase (Ambion) according to the manufacturer’s protocols, and
3 mg was reverse transcribed with Superscript III (Invitrogen) according
to the manufacturer’s directions using random hexamers (Invitrogen).
Primers designed to detect splice junctions were as follows: nad1exon1F
(59-GCAACGTAGAAAGGGTCCTG-39), nad1exon2R (59-TGAGCTGCAGATCGTAATGC-39), nad1exon2F (59-TCGAAATATGCCTTTCTAGGAG-39),
nad1exon3R (59-ATTCAGCTTCCGCTTCTGG-39), nad1exon3F (59-GTCATGGCGCAAAAGCAGATATGG-39), nad1exon4R (59-AGAGCAGACCCCATTGAAGA-39), nad1exon4F (59-TCTTCAATGGGGTCTGCTCT-39), and
nad1exon5R (59-AGGAAGCCATTGAAAGGTGA-39). One microliter of a
33-fold dilution of the reverse transcription reaction was used for PCR
with Taq DNA polymerase (New England Biolabs).
Ten grams of plant tissue were ground in extraction buffer (0.45 M
sucrose, 1.5 mM EDTA, 0.2% BSA, 0.6% PVP40, and 15 mM MOPS/
KOH, pH 7.4) using a mortar and pestle. The resulting extract was filtered
through two layers of Miracloth and spun 5 min at 2500g. The pellet was
discarded, and the supernatant was spun 10 min at 15,000g at 48C. The
pellet was resuspended in 1 mL of wash buffer (0.3 M sucrose and 10 mM
MOPS/KOH, pH 7.2), loaded on a linear 0 to 4% (w/v) PVP-40 gradient in
wash buffer containing 28% Percoll, and spun 45 min at 40,000g at 48C.
The mitochondrial band located in the bottom of the gradient was
recovered, diluted in wash buffer, and loaded on top of a 35% Percoll
gradient and spun 45 min at 40,000g at 48C. Mitochondria form a band in
the top part of the gradient. This band was collected and washed twice in
wash buffer.
METHODS
Plant Material and Culture Conditions
Blue-Native and Two-Dimensional SDS-PAGE and NADH
Dehydrogenase Activity Stain
Four hundred micrograms of mitochondrial membrane proteins were
solubilized in 1% N-dodecylmaltoside in ACA750 buffer as described
by Schagger and von Jagow (1991). Blue-native strips were excised,
incubated in 1% (w/v) SDS and 1% (w/v) b-mercaptoethanol for 30 min to
denature the complexes, and placed horizontally on top of a 12% SDSPAGE. The resulting gels were stained with colloidal Coomassie Brilliant
Blue G 250 as described previously (Millar et al., 2001).
The NADH dehydrogenase activity of Complex I was revealed by
incubating the Blue-Native gel in 1 mM nitroblue tetrazolium and 0.14 mM
NADH in 0.1 M Tris, pH 7.4. The reaction was stopped by soaking the gel
in fixing solution (30% [v/v] methanol and 10% [v/v] acetic acid).
3263
ACKNOWLEDGMENTS
This research was supported by Australian Research Council Centre of
Excellence Grant CE0561495 and the European Union Framework 5
project AGRIKOLA (QLRT-2001-01741). I.D.S. is a WA Premier’s fellow,
A.H.M. is an Australian Research Council Professorial fellow, and N.L.T.
is an Australian Research Council postdoctoral fellow. We thank Kate
Howell and Etienne Delannoy for the primers used for quantitative
RT-PCR.
Immunoblot Analysis
Received August 7, 2007; revised September 26, 2007; accepted October 3, 2007; published October 26, 2007.
Proteins were separated by SDS-PAGE and transferred onto a PVDF
membrane (Amersham Pharmacia Biotech). Protein gel blots with AOX
antibodies were performed at a dilution of 1/5000. Goat anti-mouse
antibodies conjugated to horseradish peroxidase (GE Healthcare) were
used as secondary antibodies and revealed with ECL reagents (GE
Healthcare).
REFERENCES
Identification of Gel Spots by Mass Spectrometry
The protein samples to be analyzed were cut from the gels, destained in
10 mM NH4CO3 and 50% (v/v) acetonitrile, dehydrated at 508C, rehydrated with 15 mL of digestion solution (10 mM NH4CO3 and 12.5 mg/mL
of trypsin in 0.01% trifluoroacetic acid), and incubated overnight at 378C.
Peptides were extracted according to Taylor et al. (2005). Samples were
loaded onto self-packed Microsorb C18 (5 mm, 100 Å; Varian) reverse
phase columns (0.5 3 50 mm) using an Agilent Technologies 1100 series
capillary liquid chromatography system and eluted into a XCT Ultra
IonTrap mass spectrometer (Agilent Technologies) with an electrospray
ionization source equipped with a low flow nebulizer in positive mode and
controlled by Chemstation (rev B.01.03 [204]; Agilent Technologies) and
MSD Trap Control version 6.0 software (build 38.15; Bruker Daltonik).
Peptides were eluted from the C18 reverse phase column at 10 mL/min
using a 9-min acetonitrile gradient (5 to 60%) in 0.1% formic acid at a
regulated temperature of 508C. Ions were selected for tandem mass
spectrometry (MS/MS) after reaching an intensity of 25,000 counts per
second, and two precursor ions were selected from the initial MS scan.
The resulting MS/MS spectra were exported, and the extracted results
were queried against the Arabidopsis protein set (TAIR7) using the
Mascot search engine v2.1.01 (Matrix Science) using error tolerances
of 6 1.2 D for MS and 6 0.6 D for MS/MS, maximum missed cleavages
set to 1, and peptide charge set at 2þ and 3þ. Results were filtered using
standard scoring, maximum number of hits set to 20, significance
threshold at P < 0.05, and ion score cutoff at 0.
Accession Number
Sequence data from this article can be found in the Arabidopsis Genome
Initiative database under accession number At1g74900 (OTP43).
Supplemental Data
The following materials are available in the online version of this article.
Supplemental Figure 1. Intron Splicing in otp43 Mutant Plants.
Supplemental Figure 2. Genotyping of Complemented otp43 Plants.
Supplemental Table 1. Primers Used for RT-PCR Assays.
Supplemental Table 2. Mass Spectrometry Results from the Analysis
of Two-Dimensional BN-PAGE Gels.
Adam-Vizi, V., and Chinopoulos, C. (2006). Bioenergetics and the
formation of mitochondrial reactive oxygen species. Trends Pharmacol. Sci. 27: 639–645.
Andres, C., Lurin, C., and Small, I.D. (2007). The multifarious roles of
PPR proteins in plant mitochondrial gene expression. Physiol. Plant.
129: 14–22.
Asakura, Y., and Barkan, A. (2006). Arabidopsis orthologs of maize chloroplast splicing factors promote splicing of orthologous and speciesspecific group II introns. Plant Physiol. 142: 1656–1663.
Aubourg, S., Boudet, N., Kreis, M., and Lecharny, A. (2000). In
Arabidopsis thaliana, 1% of the genome codes for a novel protein
family unique to plants. Plant Mol. Biol. 42: 603–613.
Bonen, L., and Vogel, J. (2001). The ins and outs of group II introns.
Trends Genet. 17: 322–331.
Brandt, U. (2006). Energy converting NADH:quinone oxidoreductase
(complex I). Annu. Rev. Biochem. 75: 69–92.
Brangeon, J., Sabar, M., Gutierres, S., Combettes, B., Bove, J.,
Gendy, C., Chetrit, P., Des Francs-Small, C.C., Pla, M., Vedel, F.,
and De Paepe, R. (2000). Defective splicing of the first nad4 intron is
associated with lack of several complex I subunits in the Nicotiana
sylvestris NMS1 nuclear mutant. Plant J. 21: 269–280.
Carrillo, C., Chapdelaine, Y., and Bonen, L. (2001). Variation in sequence and RNA editing within core domains of mitochondrial group II
introns among plants. Mol. Gen. Genet. 264: 595–603.
Claros, M.G. (1995). MitoProt, a Macintosh application for studying
mitochondrial proteins. Comput. Appl. Biosci. 11: 441–447.
Clough, S.J., and Bent, A.F. (1998). Floral dip: A simplified method for
Agrobacterium-mediated transformation of Arabidopsis thaliana. Plant
J. 16: 735–743.
Costa, M., Christian, E.L., and Michel, F. (1998). Differential chemical
probing of a group II self-splicing intron identifies bases involved in
tertiary interactions and supports an alternative secondary structure
model of domain V. RNA 4: 1055–1068.
Dutilleul, C., Driscoll, S., Cornic, G., De Paepe, R., Foyer, C.H., and
Noctor, G. (2003a). Functional mitochondrial complex I is required
by tobacco leaves for optimal photosynthetic performance in photorespiratory conditions and during transients. Plant Physiol. 131:
264–275.
Dutilleul, C., Garmier, M., Noctor, G., Mathieu, C., Chetrit, P., Foyer,
C.H., and de Paepe, R. (2003b). Leaf mitochondria modulate whole
cell redox homeostasis, set antioxidant capacity, and determine
stress resistance through altered signaling and diurnal regulation.
Plant Cell 15: 1212–1226.
Dutilleul, C., Lelarge, C., Prioul, J.L., De Paepe, R., Foyer, C.H., and
Noctor, G. (2005). Mitochondria-driven changes in leaf NAD status
exert a crucial influence on the control of nitrate assimilation and the
3264
The Plant Cell
integration of carbon and nitrogen metabolism. Plant Physiol. 139:
64–78.
Edwards, K., Johnstone, C., and Thompson, C. (1991). A simple and
rapid method for the preparation of plant genomic DNA for PCR
analysis. Nucleic Acids Res. 19: 1349.
Giegé, P., and Brennicke, A. (1999). RNA editing in Arabidopsis
mitochondria effects 441 C to U changes in ORFs. Proc. Natl. Acad.
Sci. USA 96: 15324–15329.
Goldschmidt-Clermont, M., Girard-Bascou, J., Choquet, Y., and
Rochaix, J.D. (1990). Trans-splicing mutants of Chlamydomonas
reinhardtii. Mol. Gen. Genet. 223: 417–425.
Gutierres, S., Combettes, B., De Paepe, R., Mirande, M., Lelandais,
C., Vedel, F., and Chetrit, P. (1999). In the Nicotiana sylvestris CMSII
mutant, a recombination-mediated change 59 to the first exon of
the mitochondrial nad1 gene is associated with lack of the NADH:
ubiquinone oxidoreductase (complex I) NAD1 subunit. Eur. J. Biochem.
261: 361–370.
Gutierres, S., Sabar, M., Lelandais, C., Chetrit, P., Diolez, P.,
Degand, H., Boutry, M., Vedel, F., de Kouchkovsky, Y., and De
Paepe, R. (1997). Lack of mitochondrial and nuclear-encoded subunits of complex I and alteration of the respiratory chain in Nicotiana
sylvestris mitochondrial deletion mutants. Proc. Natl. Acad. Sci. USA
94: 3436–3441.
Handa, H. (2003). The complete nucleotide sequence and RNA editing
content of the mitochondrial genome of rapeseed (Brassica napus L.):
Comparative analysis of the mitochondrial genomes of rapeseed and
Arabidopsis thaliana. Nucleic Acids Res. 31: 5907–5916.
Hattori, M., Miyake, H., and Sugita, M. (2007). A pentatricopeptide
repeat protein is required for RNA processing of clpP pre-mRNA in
moss chloroplasts. J. Biol. Chem. 282: 10773–10782.
Heazlewood, J.L., Howell, K.A., and Millar, A.H. (2003). Mitochondrial
complex I from Arabidopsis and rice: Orthologs of mammalian and
fungal components coupled with plant-specific subunits. Biochim.
Biophys. Acta 1604: 159–169.
Hilson, P., et al. (2004). Versatile gene-specific sequence tags for
Arabidopsis functional genomics: Transcript profiling and reverse
genetics applications. Genome Res. 14: 2176–2189.
Janssen, R.J., Nijtmans, L.G., van den Heuvel, L.P., and Smeitink,
J.A. (2006). Mitochondrial complex I: Structure, function and pathology. J. Inherit. Metab. Dis. 29: 499–515.
Jenkins, B.D., and Barkan, A. (2001). Recruitment of a peptidyl-tRNA
hydrolase as a facilitator of group II intron splicing in chloroplasts.
EMBO J. 20: 872–879.
Karpova, O.V., Kuzmin, E.V., Elthon, T.E., and Newton, K.J. (2002).
Differential expression of alternative oxidase genes in maize mitochondrial mutants. Plant Cell 14: 3271–3284.
Karpova, O.V., and Newton, K.J. (1999). A partially assembled complex I in NAD4-deficient mitochondria of maize. Plant J. 17: 511–521.
Kotera, E., Tasaka, M., and Shikanai, T. (2005). A pentatricopeptide
repeat protein is essential for RNA editing in chloroplasts. Nature 433:
326–330.
Lee, B.H., Lee, H., Xiong, L., and Zhu, J.K. (2002). A mitochondrial
complex I defect impairs cold-regulated nuclear gene expression.
Plant Cell 14: 1235–1251.
Lelandais, C., Albert, B., Gutierres, S., De Paepe, R., Godelle, B.,
Vedel, F., and Chetrit, P. (1998). Organization and expression of the
mitochondrial genome in the Nicotiana sylvestris CMSII mutant.
Genetics 150: 873–882.
Li-Pook-Than, J., and Bonen, L. (2006). Multiple physical forms of
excised group II intron RNAs in wheat mitochondria. Nucleic Acids
Res. 34: 2782–2790.
Li-Pook-Than, J., Carrillo, C., Niknejad, N., Calixte, S., Crosthwait,
J., and Bonen, L. (2007). Relationship between RNA splicing and
exon editing near intron junctions in wheat mitochondria. Physiol.
Plant. 129: 23–33.
Lurin, C., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle
biogenesis. Plant Cell 16: 2089–2103.
Malek, O., and Knoop, V. (1998). Trans-splicing group II introns in plant
mitochondria: The complete set of cis-arranged homologs in ferns,
fern allies, and a hornwort. RNA 4: 1599–1609.
Marois, E., Van den Ackerveken, G., and Bonas, U. (2002). The
Xanthomonas type III effector protein AvrBs3 modulates plant gene
expression and induces cell hypertrophy in the susceptible host. Mol.
Plant Microbe Interact. 15: 637–646.
Meierhoff, K., Felder, S., Nakamura, T., Bechtold, N., and Schuster,
G. (2003). HCF152, an Arabidopsis RNA binding pentatricopeptide
repeat protein involved in the processing of chloroplast psbB-psbTpsbH-petB-petD RNAs. Plant Cell 15: 1480–1495.
Merendino, L., Perron, K., Rahire, M., Howald, I., Rochaix, J.D., and
Goldschmidt-Clermont, M. (2006). A novel multifunctional factor
involved in trans-splicing of chloroplast introns in Chlamydomonas.
Nucleic Acids Res. 34: 262–274.
Millar, A.H., Sweetlove, L.J., Giege, P., and Leaver, C.J. (2001).
Analysis of the Arabidopsis mitochondrial proteome. Plant Physiol.
127: 1711–1727.
Nakagawa, N., and Sakurai, N. (2006). A mutation in At-nMat1a, which
encodes a nuclear gene having high similarity to group II intron
maturase, causes impaired splicing of mitochondrial NAD4 transcript
and altered carbon metabolism in Arabidopsis thaliana. Plant Cell
Physiol. 47: 772–783.
Nakamura, T., Schuster, G., Sugiura, M., and Sugita, M. (2004).
Chloroplast RNA-binding and pentatricopeptide repeat proteins. Biochem. Soc. Trans. 32: 571–574.
Noctor, G., De Paepe, R., and Foyer, C.H. (2007). Mitochondrial redox
biology and homeostasis in plants. Trends Plant Sci. 12: 125–134.
Okuda, K., Myouga, F., Motohashi, R., Shinozaki, K., and Shikanai,
T. (2007). Conserved domain structure of pentatricopeptide repeat
proteins involved in chloroplast RNA editing. Proc. Natl. Acad. Sci.
USA 104: 8178–8183.
Ostersetzer, O., Cooke, A.M., Watkins, K.P., and Barkan, A. (2005).
CRS1, a chloroplast group II intron splicing factor, promotes intron
folding through specific interactions with two intron domains. Plant
Cell 17: 241–255.
Ostheimer, G.J., Hadjivassiliou, H., Kloer, D.P., Barkan, A., and
Matthews, B.W. (2005). Structural analysis of the group II intron
splicing factor CRS2 yields insights into its protein and RNA interaction surfaces. J. Mol. Biol. 345: 51–68.
Ostheimer, G.J., Rojas, M., Hadjivassiliou, H., and Barkan, A. (2006).
Formation of the CRS2-CAF2 group II intron splicing complex is
mediated by a 22-amino acid motif in the COOH-terminal region of
CAF2. J. Biol. Chem. 281: 4732–4738.
Gierke, J., and Barkan, A. (2003). Group II intron splicing factors
derived by diversification of an ancient RNA-binding domain. EMBO
J. 22: 3919–3929.
Perales, M., Eubel, H., Heinemeyer, J., Colaneri, A., Zabaleta, E.,
and Braun, H.P. (2005). Disruption of a nuclear gene encoding a
mitochondrial gamma carbonic anhydrase reduces complex I and
supercomplex I þ III2 levels and alters mitochondrial physiology in
Arabidopsis. J. Mol. Biol. 350: 263–277.
Pineau, B., Mathieu, C., Gerard-Hirne, C., De Paepe, R., and Chetrit,
P. (2005). Targeting the NAD7 subunit to mitochondria restores a
functional complex I and a wild type phenotype in the Nicotiana
sylvestris CMS II mutant lacking nad7. J. Biol. Chem. 280: 25994–
26001.
Pla, M., Mathieu, C., De Paepe, R., Chetrit, P., and Vedel, F. (1995).
Deletion of the last two exons of the mitochondrial nad7 gene results
in lack of the NAD7 polypeptide in a Nicotiana sylvestris CMS mutant.
Mol. Gen. Genet. 248: 79–88.
Priault, P., Fresneau, C., Noctor, G., De Paepe, R., Cornic, G., and
Streb, P. (2006a). The mitochondrial CMSII mutation of Nicotiana
sylvestris impairs adjustment of photosynthetic carbon assimilation to
higher growth irradiance. J. Exp. Bot. 57: 2075–2085.
Priault, P., Tcherkez, G., Cornic, G., De Paepe, R., Naik, R.,
Ghashghaie, J., and Streb, P. (2006b). The lack of mitochondrial
complex I in a CMSII mutant of Nicotiana sylvestris increases photorespiration through an increased internal resistance to CO2 diffusion.
J. Exp. Bot. 57: 3195–3207.
Rivals, E., Bruyere, C., Toffano-Nioche, C., and Lecharny, A. (2006).
Formation of the Arabidopsis pentatricopeptide repeat family. Plant
Physiol. 141: 825–839.
Sabar, M., De Paepe, R., and de Kouchkovsky, Y. (2000). Complex I
impairment, respiratory compensations, and photosynthetic decrease
in nuclear and mitochondrial male sterile mutants of Nicotiana
sylvestris. Plant Physiol. 124: 1239–1250.
Schagger, H., and von Jagow, G. (1991). Blue native electrophoresis
for isolation of membrane protein complexes in enzymatically active
form. Anal. Biochem. 199: 223–231.
Schmitz-Linneweber, C., Williams-Carrier, R., and Barkan, A.
(2005). RNA immunoprecipitation and microarray analysis show a
chloroplast pentatricopeptide repeat protein to be associated with
the 59 region of mRNAs whose translation it activates. Plant Cell 17:
2791–2804.
Schmitz-Linneweber, C., Williams-Carrier, R.E., Williams-Voelker,
P.M., Kroeger, T.S., Vichas, A., and Barkan, A. (2006). A penta-
3265
tricopeptide repeat protein facilitates the trans-splicing of the maize
chloroplast rps12 pre-mRNA. Plant Cell 18: 2650–2663.
Sessions, A., et al. (2002). A high-throughput Arabidopsis reverse
genetics system. Plant Cell 14: 2985–2994.
Small, I., Peeters, N., Legeai, F., and Lurin, C. (2004). Predotar: A tool
for rapidly screening proteomes for N-terminal targeting sequences.
Proteomics 4: 1581–1590.
Small, I.D., and Peeters, N. (2000). The PPR motif - A TPR-related motif
prevalent in plant organellar proteins. Trends Biochem. Sci. 25:
46–47.
Sugiyama, Y., Watase, Y., Nagase, M., Makita, N., Yagura, S., Hirai,
A., and Sugiura, M. (2005). The complete nucleotide sequence and
multipartite organization of the tobacco mitochondrial genome: Comparative analysis of mitochondrial genomes in higher plants. Mol.
Genet. Genomics 272: 603–615.
Taylor, N.L., Heazlewood, J.L., Day, D.A., and Millar, A.H. (2005).
Differential Impact of environmental stresses on the pea mitochondrial
proteome. Mol. Cell. Proteomics 4: 1122–1133.
Till, B., Schmitz-Linneweber, C., Williams-Carrier, R., and Barkan, A.
(2001). CRS1 is a novel group II intron splicing factor that was derived
from a domain of ancient origin. RNA 7: 1227–1238.
Vidal, G., Ribas-Carbo, M., Garmier, M., Dubertret, G., Rasmusson,
A.G., Mathieu, C., Foyer, C.H., and De Paepe, R. (2007). Lack of
respiratory chain complex I impairs alternative oxidase engagement
and modulates redox signaling during elicitor-induced cell death in
tobacco. Plant Cell 19: 640–655.
Vogel, J., Borner, T., and Hess, W.R. (1999). Comparative analysis of
splicing of the complete set of chloroplast group II introns in three
higher plant mutants. Nucleic Acids Res. 27: 3866–3874.
Supplemental Figures. de Longevialle et al. (2007). The Pentatricopeptide Repeat Gene OTP43 is Required for trans-Splicing
of the Mitochondrial nad1 Intron 1 in Arabidopsis thaliana.
Log2(ratio Spliced/Unspliced)
2
1
0
-1
-2
-3
-4
-25
rp
l2
in
tr
rp
s 3 on 1
c o i nt
x2 ron
1
in
cc
t ro
b4
n1
52
i
nt
na
d 1 ro n
1
na int
d1 r o
n
na int 1
r
d1 on
2
i
na ntr
d1 on
3
na intr
d2 on
4
na intr
d2 on
in 1
tr
na
d2 on2
na int
d2 r o
n
na int 3
r
d4 o
n
na int 4
d4 r o
na int n1
d4 r o
i n2
na ntr
d5 on
3
i
na ntr
d5 on
1
na intr
d5 on
na int 2
d5 r o
in n3
tr
na
d7 on4
i
na ntro
d7
n1
i
n
na
t
d7 r on
2
i
na ntro
d7
n
in 3
tr o
n4
-30
Supplemental Figure 1. The change in ratios of spliced to unspliced introns in otp43 mutants compared to
complemented otp43 plants. Quantitative RT-PCR was carried out using using primers designed to amplify across
splice junctions (to quantify spliced mRNA) and intron-exon junctions (to quantify unspliced mRNA). The primer
sequences used are described in Supplemental Table 1. The ratio of amplified spliced products to unspliced products
for each splicing event was calculated after normalising the quantities of each product against those in the
complemented plants. The thermal cycling program used was: 95°C for 10 min, followed by 40 cycles of 95°C for 10
sec, 60°C for 10 sec, 72°C for 20 sec. Data were analysed using the LightCycler 480 software version 1.2 (Roche
Diagnostics).
otp43 complemented
A
1
2
3 4
5
6
otp43 complemented
B
1
2
3 4
5
6
col0
7
col0
7
otp43 complemented
C
1
2
3 4
5
6
col0
7
Supplemental Figure 2. Genotyping of complemented otp43 plants.
PCR products from genomic DNA from seven independent otp43 transformants complemented with the wildtype OTP43 gene. A PCR products from genomic DNA using the primer pair LP_Sail867F07-RP_Sail867F07
to amplify the wild type At1g74900 locus. The LP_Sail867F07 primer binds outside of the fragment used for
complementation. The lack of amplification from the seven complemented lines indicates all of them are homozygous for the Sail_867_F07 insertion. B. PCR products from genomic DNA using the primer pair
RP_Sail867F07-LB1. This primer pair amplifies the left border and flanking sequence of the Sail_867_F07
insertion. The amplification product from the complemented plants confirm that they contain the
Sail_867_F07 insertion. C. PCR products from genomic DNA using primer pairs designed to amplify a fragment of the E. coli gusA gene incorporated in the T-DNA carrying the wild-type copy of At1g74900 used for
complementation. This indicates that all seven plants do carry the complementing T-DNA. All seven plants
had wild-type growth rates and morphology.
DNA size markers are 1 kb Plus Ladder (Invitrogen). LP_Sail867F07, RP_Sail867F07 and LB1 primers are
described in Methods. The primers used to amplify gusA were: gus_F 5’-CTGATAGCGCGTGACAAAAA-3’;
gus_R 5’-GGCACAGCACATCAAAGAGA-3’.
RESULTATS
Supplemental Table 1
82
RESULTATS
Supplemental Table 2
83
RESULTATS
II.2.2 TANG2
TANG2 est une PPR de type « Pure » qui a été identifiée par Yunhai Li dans l‟équipe de
Mike Bevan au cours d‟un crible de mutants sensibles au glucose. Le mutant présente un
retard de développement, et des graines plus foncées. Ce phénotype très similaire au mutant
otp43 ainsi qu‟à d‟autres mutants des sous-unités du complexe I étudiés par Etienne Meyer
comme ndufs4 (Meyer, Tomaz et al. 2009) suggère un défaut éventuel de l‟activité du
complexe I. En collaboration avec l‟équipe de Mike Bevan, j‟ai donc eu l‟opportunité
d‟étudier plus en détails le mutant tang2 et ainsi d‟identifier le défaut moléculaire associé.
Cette étude décrite dans le papier suivant montre que cette protéine PPR est impliquée dans
l‟épissage en trans de l‟intron 3 de nad5, ce qui fait de cette protéine la deuxième protéine
PPR décrite comme ayant un rôle dans l‟épissage d‟introns mitochondriaux. Mon rôle dans la
caractérisation de ce mutant a été d‟identifier le défaut moléculaire en utilisant les outils de
transcriptomique mis en place dans le laboratoire de Ian Small. Ainsi, des expériences de RTPCR, de PCR quantitative sur l‟expression des gènes mitochondriaux, mais aussi sur les
évènements d‟épissage, et des expériences de northern blot sur certains transcrits
mitochondriaux ont permis de mettre en évidence en grande partie la fonction de TANG2.
Article 4 : Li Y., Smith C., Colas des Francs-Small C., de Longevialle A.F., Corke F., Zheng L., Tanz S.,
Small I.D. and Bevan M.W. (2010) TANG2, a Glucose-Responsive Gene, Encodes a Pentatricopeptide Repeat
Protein Required for Splicing of Mitochondrial nad5 Transcripts, in submission.
84
RESULTATS
TANG2, a Glucose-Responsive Gene, Encodes a
Pentatricopeptide Repeat
Protein Required for Splicing of Mitochondrial nad5
Transcripts
Yunhai Li
a,b,1
, Caroline Smith a, Catherine Colas des Francs-Small c, Andéol Falcon de
Longevialle c, Fiona Corke a, Leiying Zheng a, Sandra K. Tanz c, Ian Small c, and Michael W.
Bevan a,1
a
Department of Cell and Developmental Biology, John Innes Centre, Norwich NR4 7UH,
UK.
b
State Key Laboratory of Plant Cell and Chromosome Engineering, Institute of Genetics
and Developmental Biology, Chinese Academy of Sciences, Beijing 100101, China
c
Australian Research Council of Excellence in Plant Energy Biology, University of
Western Australia, Crawley 6009 WA, Australia.
1
Corresponding authors
E-mail: [email protected]; Telephone: 86 (10) 64807856; Fax: 86 (10) 64807856
E-mail: [email protected] Telephone: 44 (1603) 450520; Fax: 44 (1603)
450025.
Running title: The TANG2 PPR protein splices mitochondrial nad5 transcripts
Key words: tang2, sugar responses, PPR, Complex I, splicing of mitochondrial genes
85
RESULTATS
ABSTRACT
Pentatricopeptide repeat (PPR) proteins are RNA binding proteins required for RNA
editing, splicing, cleavage and translation of mitochondrial and chloroplast transcripts.
Mutations in PPR genes lead to diverse organelle defects, cytoplasmic male sterility and a
wide variety and severity of other phenotypes. We have identified an Arabidopsis nuclear
PPR gene called TANG2 that is specifically required for splicing of intron 3 of the
mitochondrial nad5 gene. This defect leads to substantially reduced, but not absent,
Complex I activity. tang2 mutant plants have substantially elevated glucose, sucrose and
anthocyanin levels, increased expression of sugar-responsive genes, and greatly enhanced
sensitivity of seedling growth and development to high glucose levels. Expression of the
TANG2 gene is rapidly induced by glucose and is expressed in tissues with a high energy
demand, suggesting nad5 splicing by TANG2 responds to available energy sources such as
sugars.
86
RESULTATS
INTRODUCTION
Metabolism of sugars in the glycolytic and TCA pathways produces reducing equivalents
that generate ATP in the oxidative phosphorylation pathway in mitochondria. The oxidative
phosphorylation system is located on the inner mitochondrial membrane and is composed of
five enzyme complexes. Complex I (NADH:ubiquinone oxidoreductase) is the main entry
point for electrons and is composed of more than 40 subunits in Arabidopsis (Heazlewood,
Howell et al. 2003), of which nine are encoded by the mitochondrial genome. The centrally
important role of Complex I in cellular energetics is reflected in the multiple effects of
mutations and chemicals that reduce Complex I function. In plants the best-known effect of
altered Complex I mitochondrial loci is cytoplasmic male sterility (CMS) (Chase 2007). This
maternally-inherited trait is characterised by mitochondrial dysfunctions that result in nonviable pollen. The Nicotiana sylvestris CMSII mutant, which lacks functional Complex I,
respires using alternative NADH dehydrogenases and alternative oxidase, and manages a
high photosynthetic capacity (Dutilleul, Driscoll et al. 2003). However, Complex I activity was
needed for optimal photosynthetic performance when both respiratory and photorespiratory
substrates needed to be oxidised simultanteously. Inhibition of Complex I activity by rotenone
(Garmier, Carroll et al. 2008) caused a transient decrease in respiration, a subsequent
acclimation by the induction of alternative oxidase, and reduced growth. This study also
identified a physical and functional dissociation of glycolytic enzymes from mitochondria in
response to reduced Complex I activity and associated changes in carbon metabolism
reflecting the activation of compensatory pathways.
Rotenone treatment also led to increased expression of nuclear genes encoding
mitochondrial proteins. This was thought to be be due to retrograde signalling from the
mitochondria to the nucleus mediated by cellular redox status (Garmier, Carroll et al. 2008).
Another link between reduced Complex I function and nuclear gene expression was shown
by the reduced cold-induced gene expression in the fro1 mutant, which is defective in the 18kD Fe-S subunit of complex I (Lee, Lee et al. 2002). fro1 mutant lines exhibited reduced cold
acclimation and accumulate reactive oxygen species (ROS) that are involved in cold
signalling.
Five of the nine mitochondrial nad genes encoding Complex I subunits are composed of
exons that need to be spliced to create functional complex I subunits. The nad1, nad2 and
nad5 transcripts are trans-spliced via type II introns (Malek and Knoop 1998) in a process
that probably requires RNA splicing factors. Several factors involved in splicing analogous
chloroplast introns have been identified, including a pentatricopeptide repeat (PPR) protein
that is required for trans-splicing of rps12 transcripts (Schmitz-Linneweber, Williams-Carrier
et al. 2006). PPR proteins are also necessary for RNA editing, processing and stabilisation
87
RESULTATS
(Schmitz-Linneweber and Small 2008; Zhou, Cheng et al. 2008; Okuda, Chateigner-Boutin et
al. 2009; Zehrmann, Verbitskiy et al. 2009). PPR proteins are encoded by a relatively large
family of 450 genes in Arabidopsis (Lurin, Andres et al. 2004) and other land plants (O'Toole,
Hattori et al. 2008) that are predicted to be predominantly located to mitochondria or plastids.
Biochemical studies have shown the PPR repeat regions, comprising a canonical 35 amino
acid motif repeated in tandem up to 30 times, bind different types of RNA. An understanding
of PPR function is emerging in which PPR repeats function as RNA-binding specificity
determinants and other domains and interacting proteins provide functions for splicing and
editing (Schmitz-Linneweber and Small 2008).
A reverse genetic screen of members of the Arabidopsis PPR gene family using RNAi
(Hilson, Allemeersch et al. 2004) identified the PPR gene OTP43 as a mitochondrial transsplicing factor that is specifically required for splicing of intron 1 of the nad1 transcript in
Arabidopsis (de Longevialle, Meyer et al. 2007). Complex 1 activity was absent in the
mutant, which exhibited severely impaired germination and reduced growth and
development. The otp43 mutant also led to increased expression of alternative NAD(P)H
dehydrogenases and alternative oxidases to bypass the Complex 1 defect, similar to that
seen in rotenone- treated cells (Garmier, Carroll et al. 2008) and the Nicotiana CMSII mutant
(Dutilleul, Driscoll et al. 2003).
Key questions in the biology of PPR proteins concern the specific role of individual family
members in organelle RNA metabolism and whether PPR proteins may have a role, as
nuclear- encoded genes, in coordinating the functions of organelles in a cellular context.
Here we characterise the tang2 mutant, exhibiting extreme sugar-sensitive growth, as being
defective in a sugar-inducible PPR gene. Complex I activity is reduced in tang2 due to
decreased splicing of mitochondrial nad5 transcripts, demonstrating a specific role of TANG2
in mitochondrial RNA processing.
RESULTS
The Sugar-Inducible Gene TANG2 Encodes a Pentatricopeptide Repeat Protein
Microarray data has revealed that the expression of thousands of genes was rapidly
altered in response to glucose (Li, Lee et al. 2006). To further understand the biological
functions of these sugar-responsive genes, we are characterizing their functions, and here
we describe the function of the glucose-inducible gene At1g19290. We first confirmed the
glucose induction of this gene using quantitative RT-PCR (Fig.1A) and called the gene
TANG2 (TANG means “sugar” in Chinese). This gene has a single exon and is predicted to
88
Figure 1. Expression of TANG2 gene.
(A) Quantitative RT–PCR analysis revealed that expression of TANG2 is induced by
glucose. Seven-day-old wild-type seedlings were treated with 3% glucose or mannitol
for 2, 4, and 6h.
B. Cartoon of the predicted structure of TANG2 showing 17 canonical PPR repeats.
(C-H) TANG2 expression was monitored by pTANG2::GUS transgene expression.
GUS staining of seedlings, root tips, lateral root primordia, flowers and stamens.
Bars = 0.1mm in (C), 0.01mm in (D and E), 1mm in (F) and 0.5mm in (G and H).
RESULTATS
encode a pentatricopeptide repeat (PPR) protein comprising 17 conserved PPR motifs
(Fig. 1B). In different plant species, genome sequencing revealed a large number of PPR
domain proteins (O'Toole, Hattori et al. 2008). TANG2 homologs sharing highly conserved
domain structure were identified in Vitis vinifera and rice (Supplementary Fig.1).
Expression pattern of TANG2
The spatial expression patterns of TANG2 were revealed by histochemical assays of βglucuronidase (GUS) activity of transgenic plants grown on Murashige and Skoog (MS)
medium or in the greenhouse expressing TANG2 promoter:GUS fusions (pTANG2 GUS).
Histochemical staining showed the relatively high levels of GUS activity in the shoot and root
apexes, lateral root primordia, young flower buds, and stamens (Fig.1C-G). GUS activity was
essentially undetectable in mature tisses of stems, leaves and flowers.
The tang2 Mutant has Altered Growth and Development
To determine the biological functions of TANG2 in plant growth and development, we
obtained a T-DNA insertion allele of TANG2. The position of the T-DNA insert in a canonical
PPR repeat was confirmed by PCR and sequencing. The line Salk_003139 (hereafter called
tang2) contained the T-DNA insert within the coding region, 1436 bp upstream of the stop
codon (Fig.2A). tang2 was transformed with a genomic DNA fragment carring the wild-type
At1g19290 gene, and two lines expressing TANG2 were identified. One of these lines,
TANG2COM2, was used in further studies; it fully complemented the morphological and
growth phenotypes of tang2 (Fig. 2B-E). In addition, transgenic plants expressing an
antisense transcript to TANG2 (35S:antiTANG2) showed similar phenotypes to tang2
mutants (data not shown).
On Murashige and Skoog (MS) agar medium, tang2 seeds germinated about 1 day later
than wild-type seeds. After germination, tang2 plants also grow more slowly than the wild
type (Fig.2B), and plate-grown tang2 mutants also exhibited smaller stature and shorter roots
compared with wild type (Fig.2B). Soil-grown tang2 plants have smaller stature, with narrow,
dark green leaves, and delayed growth compared with the wild type (Fig.2C and D). Seeds of
the tang2 mutant are larger than those of the wild type (Fig.2E) but seed set was reduced.
tang2 flowers also have shorter stamen filaments than the wild type (data not shown) such
that tang2 pollen is not able to reach stigmatic papillae directly; this may explain the
decreased fertility. These results indicated that TANG2 is required for normal growth and
development.
90
Figure 2. The Growth Phenotypes of tang2.
T-DNA insertion map of Salk-003139 (tang2). The drawing shows the characteristic PPR
repeat structure of the protein encoded by the TANG2 gene.
Plate-grown tang2 plants have delayed growth, dark green leaves, small stature and short
primary roots.
(C and D) Soil-grown plants of Col-0, tang2 and tang2COM2.
(E) Dry seeds of Col-0, tang2 and tang2COM2 showing the larger size of tang2 seeds.
Bars = 1mm in (D), 5cm in (E) and 1cm in (F).
RESULTATS
tang2 Seedlings Are Sensitive to Glucose.
We investigated whether the tang2 mutant has altered sugar responses since the
expression of TANG2 is induced by glucose. Seedling development on different
concentrations of glucose is a widely used assay for assessing glucose sensitivity(Sheen,
Zhou et al. 1999). Seedlings of the wild-type grown on media containing 3% (w/v) glucose for
10 days developed two pairs of true leaves, while tang2 seedlings were arrested at an early
growth stage and did not green or develop true leaves and the cotyledons accumulated
anthocyanins. This demonstrated that that tang2 is hypersensitive to glucose (Fig.3A). This
hypersensitivity of tang2 in response to glucose is not a result of an osmotic effect, because
tang2 seedlings were fully established on medium supplemented with 3% mannitol (data not
shown). Quantitative analysis of seedling establishment on medium containing 3% glucose
showed that tang2 was extremely sensitive to 3% glucose, with less that 5% of the seedlings
(n=100) greening or developing true leaves (Fig.3B). In these conditions all Col-0 seedlings
rapidly developed true leaves.
We assessed the expression levels of several sugar-responsive genes known to have
altered expression patterns in sugar–response mutants (Moore, Zhou et al. 2003; Li, Smith et
al. 2007). For example, genes involved in starch and flavonoid biosynthesis are sugarinducible (Rook, Corke et al. 2001), while in glucose-hypersensitive lines the expression of
these genes is induced at lower glucose concentrations than in wild-type (Baier, Hemmann
et al. 2004; Li, Smith et al. 2007). Expression of the sugar-inducible ApL3 (Rook, Corke et al.
2001) and Atβ-Amylase (Mita, Suzuki-Fujii et al. 1995) genes was significantly increased in
tang2 in response to 1% (w/v) glucose compared with wild type (Fig. 3C). Furthermore the
expression level of both the TT4 and DRF genes involved in flavonoid biosynthesis
(Weisshaar and Jenkins 1998) was also higher in tang2 than in wild type (Fig. 3C).
tang2 Plants Have Altered Starch, Anthocyanin and Sugar Levels
The ApL3 gene encodes one of four large subunits of ADPG-pyrophosphorylase
(AGPase), which catalyses the first committed step in starch synthesis, and TT4 and DRF
are required for anthocyanin biosynthesis. Consistent with the elevated expression of these
genes, starch levels were slightly but significantly increased in the tang2 mutant compared
with the wild- type (Fig. 4A), and anthocyanins also accumulated to higher levels in tang2
compared with the wild type (Fig.4B). These results indicated that the tang2 mutation
enhances several glucose-mediated metabolic responses.
Increased cellular levels of sugars could contribute to enhanced responses of tang2 plants
to exogenous glucose. Therefore glucose, fructose and sucrose levels were measured in 7-
92
Figure 3. tang2 exhibits hypersensitive glucose responses.
(A) The phenotypes of 14-d-old wild-type Col-0 and tang2 seedlings germinated and
grown on MS medium supplemented with 3% glucose.
(B) Seedling establishment of Col-0 and tang2 grown on MS medium supplemented with
0% glucose or 3% glucose .
(C) Quantitative real time RT-PCR analysis of transcript levels in tang2. Quantitative real
time RT-PCR was performed on first-strand cDNA made from 10-d-old seedlings grown
in constant light on MS medium containing 1% glucose. cDNA was standardized by
reference to an actin standard.
Bar = 1cm in (A)
Figure 4. tang2 Plants Have Altered Starch, Anthocyanin and Sugar Levels
(A) Starch content of Col-0, tang2 and tang2COM2 seedlings.
(B) Anthocyanin content of Col-0, tang2 and tang2COM2 seedlings.
(C) Glucose, fructose and sucrose contents of Col-0, tang2 and tang2COM2 seedlings.
RESULTATS
day-old seedlings of the tang2 mutant and the wild type. The tang2 seedlings have
significantly increased levels of glucose, fructose, and sucrose compared to wild type
seedlings of the same age (Fig. 4C), suggesting that altered intracellular sugar levels may
account for the enhanced glucose responses seen in the tang2 mutant.
TANG2 Is Involved in the biogenesis of Complex I.
The phenotypes of the tang2 mutant, such as slow growth and darker, narrower leaves,
are reminiscent of Arabidopsis mitochondrial Complex I mutants (de Longevialle, Meyer et al.
2007). We first demonstrated that a GFP fusion of TANG2 is co-localised with a
mitochondrial-specific protein fused to the red fluorescent protein (Figs. 5A-C). Having
determined that TANG2 is mitochondrial, we used BN-PAGE (Blue-Native polyacrylamide gel
electrophoresis) and NADH oxidase staining to investigate the activity of Complex I in tang2
mitochondria. As shown in Fig.5D, NADH oxidase activity at the position expected for
Complex I was greatly reduced in the tang2 mutant, compared with mitochondria from Col-0
and complemented tang2COM2 plants. A similar BN-PAGE gel was blotted and probed with
a NAD9 antibody (Fig.5E), proving that the high molecular weight band of NADH oxidase
activity is indeed Complex I, and that the tang2 mitochondria not only have very little complex
I activity, but also very little assembled complex I protein. Two-dimensional blue-native/SDSPAGE of mitochondrial proteins from the tang2 mutant further confirmed the specific
reduction of Complex I (arrowed in Figs. 5F and 5G), whereas none of the other complexes
appear to be affected, indicating that TANG2 is specifically required for the biogenesis of
mitochondrial Complex I.
The Splicing of Mitochondrial Transcripts is altered in the tang2 Mutant
As several PPR proteins have been shown to be involved in RNA processing in plant
organelles (Schmitz-Linneweber and Small 2008), we performed RT-PCR on tang2 RNA to
analyse the mitochondrial transcripts encoding subunits of Complex I. Fig.6A shows that the
mature, fully-processed nad5 transcript was hardly detectable in tang2 RNA, whereas other
nad transcripts accumulated normally, suggesting that transcription, processing or stability of
nad5 RNA is defective in tang2. As several other PPR proteins are required for transcriptspecific splicing (Meierhoff, Felder et al. 2003; Schmitz-Linneweber, Williams-Carrier et al.
2006; de Longevialle, Meyer et al. 2007; Hattori, Miyake et al. 2007; Beick, SchmitzLinneweber et al. 2008; de Longevialle, Hendrickson et al. 2008; Williams-Carrier, Kroeger et
al. 2008), we performed an RT-PCR splicing assay designed to quantify the extent of splicing
of each mitochondrial intron in Arabidosis. The results showed clear defects in splicing of
95
Figure 5. TANG2 Protein Localization and Mutation in TANG2 Causes Reduced Activity of
Mitochondrial Complex I.
(A) The TANG2-GFP fusion protein co-localises with a mitochondrial protein in Arabidopsis cells.
TANG2-GFP and ScCOX4-mCherry plasmids were biolistically co-transformed into Arabidopsis
cultured cells. After 24 hrs in the dark, cells were analyzed for GFP (panel A) and RFP
fluorescence (panel C). The overlaid images showing co-localisation is shown in panel B.
(D and E) Blue-native PAGE of mitochondrial membrane protein complexes. At left, in-gel NADH
oxidase activity staining (D); at right, blot of a matched blue-native gel probed with an antibody
against NAD9 (E).
(F and G) Two-dimensional blue-native/SDS-PAGE of mitochondrial proteins from Col-0 (F) and
tang2 plants (G). The arrow indicates the migration of complex I.
Mitochondria were isolated from 8-week-old rosettes of Col-0 (WT), tang2 and complemented
tang2 (tang2COM) plants. Each sample contained 200 g of protein.
RESULTATS
nad2 intron 1 and, much more dramatically, in splicing of nad5 intron 3 (Fig.6,B and C).
Nevertheless, low levels of correctly spliced nad5 transcripts were recovered in tang2 and
verified by sequencing (data not shown). The splicing of other transcripts is not significantly
altered in tang2 mutants. The defect in splicing of nad5 intron 3 is sufficient to explain the
dramatic reduction of fully-processed nad5 transcript, and in turn, that of Complex I activity in
tang2 mutants.
DISCUSSION
Plant organellar genomes contain introns that are excised with the aid of nuclear-encoded
and/or organelle-encoded factors. Several PPR proteins have been implicated directly or
indirectly in organellar RNA splicing. HCF152 increases splicing of the petB-petD precursor
RNA coding for subunits of the cytochrome b6f complex (Meierhoff, Felder et al. 2003). The
maize chloroplast proteins PPR4 and PPR5 are involved in splicing introns in rps12 and
trnG(UCC) transcripts, respectively, and have been shown to associate with these introns in
vivo (Schmitz-Linneweber, Williams-Carrier et al. 2006; Beick, Schmitz-Linneweber et al.
2008; Williams-Carrier, Kroeger et al. 2008). OTP43 is specifically required for trans-splicing
of the mitochondrial nad1 intron 1 in Arabidopsis (de Longevialle, Meyer et al. 2007).
Arabidopsis OTP51 is needed for the splicing of chloroplast ycf3 intron 2, and also influences
the splicing of several other group-IIa introns in plastids (de Longevialle, Hendrickson et al.
2008). TANG2 encodes a pentatricopetide repeat protein similar to OTP43 and OTP51, and
loss of TANG2 gene function causes a 100x reduction in splicing of nad5 intron 3 and a
much smaller reduction in nad2 intron 1 splicing (Fig.6,B and C). As nad2 intron1 splicing is
also affected to the same degree in opt43 (de Longevialle, Meyer et al. 2007), this may be a
secondary effect. The splicing of other mitochondrial transcripts was not significantly altered
in tang2 mutants, indicating a high degree of specificity.
PPR motifs bind RNA directly (Williams-Carrier, Kroeger et al. 2008; Okuda, ChateignerBoutin et al. 2009) and it is thought that diversity in PPR motif organisation provides this
binding specificity reviewed in (Delannoy, Stanley et al. 2007), although direct biochemical
evidence is sparse. The characterisation of TANG2 provides further genetic evidence for a
high degree of specificity of mitochondrial intron recognition by PPR proteins.
Mitochondrial Complex I is the main entry point for the electron transport chain in plant
and animal mitochondria and is of central importance in cellular energy homeostasis (Sterky
and Larsson 2008). A T-DNA insertion in the TANG2 gene causes a specific major reduction
in the levels of mitochondrial NADH:ubiquinone oxidoreductase (Complex I) as determined
by western blotting and two-dimensional blue-native/SDS-PAGE of mitochondrial proteins
97
Figure 6. Mutation in TANG2 Causes Altered Splicing of Mitochondrial Genes.
(A) Detection of nad1, nad2, nad3, nad4, nad5, nad6, nad7 and nad9 transcripts. The cDNA was
synthetised using 3 g of RNA isolated from 6-week-old rosettes of tang2, complemented tang2
(tang2COM2) and Col-0 plants.
(B) Quantitative RT-PCR of spliced mitochondrial transcripts. The histogram shows the relative
quantities of spliced to unspliced forms of each transcript as log2 values of the ratio.
(C) Location of oligonucleotide primers for quantifying splicing of nad5 transcripts. As an
example, the extent of splicing of nad5 intron 1 is estimated as the ratio between the quantity of
RT-PCR product obtained with primers A, B and the quantity of RT-PCR product obtained with
primers C, B. The sequences of the primers are given in Supplementary Table 2.
RESULTATS
isolated from the tang2 mutant (Figs. 5F and G). None of the other complexes appear to
be significantly affected, indicating that TANG2 is specifically involved in the biogenesis of
mitochondrial Complex I. The link between electron transport and altered sugar levels and
responses we observed in tang2 have also been noticed previously in another mutant that
may affect Complex I activity. The Arabidopsis css1 mutation in a type II intron maturase
gene that reduces nad4 splicing also exhibits sugar hypersensititive seedling establishment
phenotypes, increased amino acid and starch levels, and reduced cellulose synthesis
(Nakagawa and Sakurai 2006). However the effects of this mutation on Complex I levels was
not determined.
The tang2 T-DNA insertion mutant enhances a wide range of responses to physiologically
relevant sugar levels, including increased starch and anthocyanin levels, glucose-sensitive
seedling growth, and enhanced expression of sugar-inducible genes compared with the wild
type (Fig. 3C). These phenotypes are similar to those observed in several mutations that
lead to hypersensitive responses to glucose (Baier, Hemmann et al. 2004; Li, Lee et al.
2006). tang2 mutant plants also exhibited a range of other defects such as growth
retardation, small stature, narrow and dark green leaves, short roots, reduced fertility and
large seeds, showing that TANG2 is required for normal plant growth and development.
Although other mutations that reduce Complex I levels such as fro1 and otp43 (Lee, Lee et
al. 2002; de Longevialle, Meyer et al. 2007) exhibit some similar phenotypes to tang2 such
as retarded growth and small stature, these mutants exhibit very distinct phenotypes. No
difference in root growth between fro1 and the wild type was observed, in contrast to the
shorter primary roots of tang2. The otp43 mutant has smaller and darker seeds than wild
type which have severely reduced germination, whereas tang2 has larger seeds compared to
wild type with only slightly reduced germination. Mutations in fro1 cause reduced cold
induction of stress-responsive genes such as RD29A, KIN1, COR15A, and COR47, in
contrast to the elevated starch and anthocyanin biosynthesis gene expression seen in tang2.
We showed that tang2 mutants accumulate substantially higher levels of glucose, fructose
and sucrose (Fig. 4C). This could be explained by reduced Complex 1 activity, as Complex I
inhibition in cell cultures by rotenone affects carbon metabolism by slowing the TCA cycle
and reducing the association of glycolytic enzymes with mitochondria (Garmier, Carroll et al.
2008). The increased glucose, fructose and sucrose levels seen in tang2 plants is consistent
with reduced TCA cycle activity. Reduced activity of the electron transport chain also leads to
compensatory increases in the activity of alternative oxidase pathways (Dutilleul, Driscoll et
al. 2003; Dutilleul, Lelarge et al. 2005; Vidal, Ribas-Carbo et al. 2007). These contribute to
altered balances between ATP/ADP, NAD/NADH and ROS, which are known to regulate
metabolism and multiple cellular processes, and may therefore also account for altered
99
RESULTATS
sugar- responsive gene expression and growth. However, a recent analysis of an
Arabidopsis mutant specifically lacking Complex 1 activity (Meyer, Tomaz et al. 2009) did not
reveal increased glucose or fructose levels, nor was the expression of sugar-responsive
genes altered despite similar growth conditions (1% glucose in this work and 1% sucrose in
(Meyer, Tomaz et al. 2009)), and there was no reduction in germination in tang2. This may
be due to differences in Complex I activity, although it is unlikely that a partial reduction in
Complex I activity leads to strong sugar-response phenotypes that are not seen when
Complex I activity is abolished. This suggests that tang2 may specifically alter sugar levels
and sugar-responsive gene expression and growth.
The rapid induction of TANG2 expression in response to sugars (Fig. 1A) and its
preponderant expression in tissues with high energy demand such as meristem and floral
tissues, and its virtual absence from mature tissues Fig. 1,B-G), suggest that TANG2 may
mediate nad5 splicing levels and Complex I activity in response to sugar levels. As sugars
are the primary mobile form of photosynthate and the main source of energy in heterotrophic
tissues, it is possible that TANG2 expression could be a link between energy substrates and
energy generation in the mitochondria.
METHODS
Plant Materials and Growth Conditions
All lines were in the Col-0 background. Seeds were surface-sterilized with 100%
isopropanol and 20% (v/v) household bleach, washed at least five times with sterile water,
stratified at 4°C for 4d in the dark, dispersed on Murashige and Skoog (MS) medium
(Duchefa Biochemie BV, Haarlem, The Netherlands) supplemented with 0.9% agar and 1%
and 3% glucose or mannitol, and then grown at 22°C.
Identification of tang2 Mutant and Complementation Tests
The tang2 mutant (SALK_003139) was obtained from the Nottingham Arabidopsis Stock
Centre. SALK_ 003139 T-DNA insertion in the TANG2 gene was confirmed by PCR and
sequencing, by using primers SALK_
003139LP (CTGCAATAGCAAACAAGCCTC),
SALK_003139RP (TGTACGGTGTGTTGATGGATG) and LBa1.
A genomic DNA fragment containing the entire TANG2 coding region, the 1.5kb upstream
sequence, and the 1.0kb downstream sequence was inserted into the binary vector
pCAMBIA1300 to generate the transformation plasmid COM for complementation.The
100
RESULTATS
plasmid COM was introduced into the tang2 mutant using Agrobacterium tumefaciens
GV3101 and transformants were selected on hygromycin-containing medium.
GUS Staining
The TANG2 promoter-GUS construct (pTANG2:GUS) was made using a PCR-based
Gateway
system.
The
promoter
specific
primers
for
the
TANG2
gene
were
TOPOTANG2PROM-F (CACC AGC TAT ACT TTG TAG CCA CGG) and TOPOTANG2-R
(GTC AAA GAC TGT AGG AGA GAA G). PCR products were subcloned into the pENTR/DTOPO vector (Invitrogen) using TOPO enzyme and sequenced. The TANG2 promoter was
then subcloned into Gateway Binary Vector (pGWB3) containing the GUS reporter gene.
Seedlings were grown in the soil or on MS medium supplemented with 1% glucose.
TANG2 Localisation
The first 300 bp of the coding sequence of TANG2 were amplified including adapters
containing
the
attB
Gateway
cloning
sequences
with
the
primers
5’-
GGGGACAAGTTTGTACAAAAAAGCAGGCTTCGAAGGAGATAGAACCATGCTCCGACGG
TCTCCG
and
5’-
GGGGACCACTTTGTACAAGAAAGCTGGGTCTCCACCTCCGGATCCGAACTTTTGTTGCT
TTGAAGCCAA using the Expand High Fidelity PCR system (Roche Diagnostics, Germany).
The PCR product was cloned into Gateway® vector pDONR207 (Invitrogen, USA) and
sequenced to check PCR accuracy. The entry vector and a Gateway® cloning cassette were
recombined to clone the targeting sequence of TANG2 in frame with the coding region of the
green fluorescent protein (GFP). For co-localization studies, the mitochondrial targeting
sequence of yeast ScCox4 fused to mCherry in pBIN20 (Nelson BK, Cai X, Nebenfuehr A
(2007) A multicolored set of in vivo organelle markers for co-localization studies in
Arabidopsis and other plants. Plant J 51: 1126-1136) was used as a mitochondrial control.
The constructs were biolistically transformed into Arabidopsis cultured cells as previously
described. In brief, the GFP and mCherry plasmids (5 μg each) were co-precipitated onto
1µm gold particles and transformed using the biolistic PDS-1000/He system (Bio-Rad, USA).
Particles were bombarded onto 2 ml of Arabidopsis cell suspension resting on filter paper on
osmoticum plates. After bombardment, the Arabidopsis cell suspension was placed in the
dark at 22°C. Fluorescence images were obtained 24 hrs after transformation using an
Olympus BX61 epifluorescence microscope with HQ GFP (U-MGFPHQ) and RFP (UMRFPHQ) filters and the Cell® imaging software.
101
RESULTATS
RNA Isolation, Reverse Transcription (RT)-PCR and Quantitative Real-Time RT-PCR
Analysis
Total RNA was extracted from Arabidopsis seedlings grown on MS medium supplemented
with 1% glucose using an RNeasy Plant Mini kit (Qiagen). Reverse transcription (RT)-PCR
analysis was performed as described (Li, Lee et al. 2006). Quantitative real-time RT-PCR
analysis was performed with Biorad system using the SYBR Green JumpStart Taq readyMix
(Sigma). ACTIN mRNA was used as an internal control, and relative amounts of mRNA were
calculated using the comparative threshold cycle method. The primers used for Quantitative
real-time
RT-PCR
are
as
follows:
AT5G09810-ACTIN
(AtactF
-5’-
GAGAAGATGACTCAGATC-3’ and AtactR -5’- ATCCTTCCTGATATCGAC-3’); AT4G39210ApL3
and
(ApL3F-5’-CGTCTGAATCATGCAACC-3’
AT4G15210
GCATTTCCTGATCTTTGTATCCTCG-3’);
CGGAGAAGGGGAAGTTTTTC-3’
and
-AmyR-5’-
ApL3R-
- -Amylase
5’-
( -AmyF-5’-
AATCTCATGCCCGTACTTCG-3’);
AT5G13930-TT4 (TT4F-5’- GGT TCA TGG CTA GTG ATG CG-3’ and TT4R-5’- A ACG CTG
TGC AAG ACG ACT G-3’); AT5G42800-DRF (DRFF-5’- GGT TCA TGG CTA GTG ATG CG3’ and DRFR-5’- AGA CGT TGT GAT GAA TGG ACC-3’) and At1g19290-TANG2
(TANG2QRTF-5’-. ATA ACA CTC TGA TAT CTG GTG C-3’ and TANG2QRTR-5’- TAA TGT
GTG CTT ACC TGA GGC-3’).
Carbohydrate and Anthocyanin Analysis
Carbohydrate and anthocyanin analysis of 12-15 day old seedlings grown on MS medium
supplemented with 1% glucose were performed as described (Baier, Hemmann et al. 2004).
Glucose, fructose, and sucrose were measured sequentially in cleared supernatants of
K2CO3-neutralized HClO4 extracts of ground, frozen plant material (Galtier and Gouy 1995).
Mitochondrial Isolation, BN PAGE and Immunoblot Analysis
Mitochondria were isolated from 8-week-old rosette leaves of greenhouse grown plants
and BN PAGE was performed as previously described (de Longevialle, Meyer et al. 2007).
Proteins separated by BN PAGE were transferred onto PVDF membrane (GE Healthcare) in
cathode buffer for 15 h at 40 mA, using a BioRad Mini transblot cell. The membrane was
then destained with ethanol and restained with Coomassie blue to visualise the complexes,
and subsequently destained before any further treatment. The western blot was performed
using an anti NAD9 antibody at a 1/50,000 dilution, and a goat anti-rabbit conjugated to
102
RESULTATS
horseradish peroxidase secondary antibody at a 1/10,000 dilution, and subsequently
revealed using ECL reagents (GE Healthcare).
Isolation of Mitochondrial RNA and Transcript Analysis
Total leaf RNA was isolated from 6-week-old rosettes of greenhouse grown plants using
the plant RNeasy extraction kit (Qiagen) according to the manufacturers instructions, and
genomic DNA was removed using DNAfree DNAse (Ambion). Complete removal of both
mitochondrial and nuclear DNA was checked by PCR on diluted RNA prior to reverse
transcription. The reverse transcription step was performed on 3 g of DNase-treated RNA
using Superscript III (Invitrogen) and random hexamer primers as described previously (de
Longevialle, Meyer et al. 2007). RT-PCR was performed with 1
l of 1/10 dilution of the
reverse transcriptase reaction (except for nad5 for which 3.5 l of 1/10 dilution were used
and nad3 and nad6 for which 3 l of 1/10 dilution were used). The primers used for detecting
the spliced nad transcripts are given in Supplementary Table 1.
To quantify the splicing of mitochondrial mRNAs, primers were designed to amplify 100200 bp regions spanning intron-exon junctions (unspliced forms) or spanning splice junctions
(spliced forms) of each gene (see example given for nad5 in Fig.5C). The complete list of
these primers is given in Supplementary Table 2. Quantitative RT-PCR was performed using
LightCycler 480 SYBR Green I Master Mix (Roche Diagnostics) and a Roche LightCycler 480
real-time PCR system with the following thermal cycling program: 95ºC for 10 min, followed
by 45 cycles of 95ºC for 10 s, 60ºC for 10 s, and 72ºC for 10 s. The data were analysed
using the LightCycler 480 software version 1.5 (Roche Diagnostics). Three independent
experiments were performed, and each sample at a 1/200 dilution was run in triplicate.
Nuclear and mitochondrial 18S rRNA genes were used as internal controls. The primers
used for quantitative RT-PCR assays are given in Supplementary Table 2.
The same RNA preparations and data analysis methods were used to quantify the
expression of TANG2 in the complemented lines in Fig. 2, Two independent experiments
were performed, and each sample at a 1/200 dilution was run in triplicate. The primers used
were tang2 F; 5' TTGTTCAAGCTTGGCGATTT 3' and R: 5' TGGCTTCATTGACCTTCTCC
3'.
ACKNOWLEDGMENTS
This work was supported by BBSRC Grant BB/C515620, the John Innes Centre Core
Strategic Grant, the National Basic Research Program of China (2009CB941503), Australian
Research Council Centre of Excellence grant CE0561495, and DEST International Science
Linkages grant CG120098. IS is supported as a WA State Premier’s Fellow.
103
RESULTATS
REFERENCES
Baier, M., et al. (2004). Characterization of mutants in Arabidopsis showing increased sugarspecific gene expression, growth, and developmental responses. Plant Physiol
134:81-91.
Beick, S., Schmitz-Linneweber, C., Williams-Carrier, R., Jensen, B., and Barkan, A. (2008).
The pentatricopeptide repeat protein PPR5 stabilizes a specific tRNA precursor in
maize chloroplasts. Mol Cell Biol 28:5337-5347.
Chase, C.D. (2007). Cytoplasmic male sterility: a window to the world of plant mitochondrialnuclear interactions. Trends Genet 23:81-90.
de Longevialle, A.F., et al. (2008). The pentatricopeptide repeat gene OTP51 with two
LAGLIDADG motifs is required for the cis-splicing of plastid ycf3 intron 2 in
Arabidopsis thaliana. Plant J 56:157-168.
de Longevialle, A.F., et al. (2007). The pentatricopeptide repeat gene OTP43 is required for
trans-splicing of the mitochondrial nad1 Intron 1 in Arabidopsis thaliana. Plant Cell
19:3256-3265.
Delannoy, E., Stanley, W.A., Bond, C.S., and Small, I.D. (2007). Pentatricopeptide repeat
(PPR) proteins as sequence-specificity factors in post-transcriptional processes in
organelles. Biochem Soc Trans 35:1643-1647.
Dutilleul, C., Driscoll, S., Cornic, G., De Paepe, R., Foyer, C.H., and Noctor, G. (2003).
Functional mitochondrial complex I is required by tobacco leaves for optimal
photosynthetic performance in photorespiratory conditions and during transients.
Plant Physiol 131:264-275.
Dutilleul, C., Lelarge, C., Prioul, J.L., De Paepe, R., Foyer, C.H., and Noctor, G. (2005).
Mitochondria-driven changes in leaf NAD status exert a crucial influence on the
control of nitrate assimilation and the integration of carbon and nitrogen metabolism.
Plant Physiol 139:64-78.
Galtier, N., and Gouy, M. (1995). Inferring phylogenies from DNA sequences of unequal
base compositions. Proc Natl Acad Sci U S A 92:11317-11321.
Garmier, M., et al. (2008). Complex I dysfunction redirects cellular and mitochondrial
metabolism in Arabidopsis. Plant Physiol 148:1324-1341.
Hattori, M., Miyake, H., and Sugita, M. (2007). A Pentatricopeptide repeat protein is required
for RNA processing of clpP Pre-mRNA in moss chloroplasts. J Biol Chem 282:1077310782.
Heazlewood, J.L., Howell, K.A., and Millar, A.H. (2003). Mitochondrial complex I from
Arabidopsis and rice: orthologs of mammalian and fungal components coupled with
plant-specific subunits. Biochim Biophys Acta 1604:159-169.
Hilson, P., et al. (2004). Versatile gene-specific sequence tags for Arabidopsis functional
genomics: transcript profiling and reverse genetics applications. Genome Res
14:2176-2189.
Lee, B.H., Lee, H., Xiong, L., and Zhu, J.K. (2002). A mitochondrial complex I defect impairs
cold-regulated nuclear gene expression. Plant Cell 14:1235-1251.
Li, Y., et al. (2006). Establishing glucose- and ABA-regulated transcription networks in
Arabidopsis by microarray analysis and promoter classification using a Relevance
Vector Machine. Genome Res 16:414-427.
Li, Y., et al. (2007). Signaling from an altered cell wall to the nucleus mediates sugarresponsive growth and development in Arabidopsis thaliana. Plant Cell 19:25002515.
104
RESULTATS
Lurin, C., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat
proteins reveals their essential role in organelle biogenesis. Plant Cell 16:2089-2103.
Malek, O., and Knoop, V. (1998). Trans-splicing group II introns in plant mitochondria: the
complete set of cis-arranged homologs in ferns, fern allies, and a hornwort. Rna
4:1599-1609.
Meierhoff, K., Felder, S., Nakamura, T., Bechtold, N., and Schuster, G. (2003). HCF152, an
Arabidopsis RNA binding pentatricopeptide repeat protein involved in the processing
of chloroplast psbB-psbT-psbH-petB-petD RNAs. Plant Cell 15:1480-1495.
Meyer, E.H., et al. (2009). Remodeled respiration in ndufs4 with low phosphorylation
efficiency suppresses Arabidopsis germination and growth and alters control of
metabolism at night. Plant Physiol 151:603-619.
Mita, S., Suzuki-Fujii, K., and Nakamura, K. (1995). Sugar-inducible expression of a gene for
beta-amylase in Arabidopsis thaliana. Plant Physiol 107:895-904.
Moore, B., et al. (2003). Role of the Arabidopsis glucose sensor HXK1 in nutrient, light, and
hormonal signaling. Science 300:332-336.
Nakagawa, N., and Sakurai, N. (2006). A mutation in At-nMat1a, which encodes a nuclear
gene having high similarity to group II intron maturase, causes impaired splicing of
mitochondrial NAD4 transcript and altered carbon metabolism in Arabidopsis thaliana.
Plant Cell Physiol 47:772-783.
O'Toole, N., et al. (2008). On the expansion of the pentatricopeptide repeat gene family in
plants. Mol Biol Evol 25:1120-1128.
Okuda, K., et al. (2009). Pentatricopeptide repeat proteins with the DYW motif have distinct
molecular functions in RNA editing and RNA cleavage in Arabidopsis chloroplasts.
Plant Cell 21:146-156.
Rook, F., Corke, F., Card, R., Munz, G., Smith, C., and Bevan, M.W. (2001). Impaired
sucrose-induction mutants reveal the modulation of sugar-induced starch biosynthetic
gene expression by abscisic acid signalling. Plant J 26:421-433.
Schmitz-Linneweber, C., and Small, I. (2008). Pentatricopeptide repeat proteins: a socket set
for organelle gene expression. Trends Plant Sci 13:663-670.
Schmitz-Linneweber, C., Williams-Carrier, R.E., Williams-Voelker, P.M., Kroeger, T.S.,
Vichas, A., and Barkan, A. (2006). A pentatricopeptide repeat protein facilitates the
trans-splicing of the maize chloroplast rps12 pre-mRNA. Plant Cell 18:2650-2663.
Sheen, J., Zhou, L., and Jang, J.C. (1999). Sugars as signaling molecules. Curr Opin Plant
Biol 2:410-418.
Sterky, F.H., and Larsson, N.G. (2008). Complex I: a complex gateway to the powerhouse.
Cell Metab 7:278-279.
Vidal, G., et al. (2007). Lack of respiratory chain complex I impairs alternative oxidase
engagement and modulates redox signaling during elicitor-induced cell death in
tobacco. Plant Cell 19:640-655.
Weisshaar, B., and Jenkins, G.I. (1998). Phenylpropanoid biosynthesis and its regulation.
Curr Opin Plant Biol 1:251-257.
Williams-Carrier, R., Kroeger, T., and Barkan, A. (2008). Sequence-specific binding of a
chloroplast pentatricopeptide repeat protein to its native group II intron ligand. Rna
14:1930-1941.
Zehrmann, A., Verbitskiy, D., van der Merwe, J.A., Brennicke, A., and Takenaka, M. (2009).
A DYW domain-containing pentatricopeptide repeat protein is required for RNA
105
RESULTATS
editing at multiple sites in mitochondria of Arabidopsis thaliana. Plant Cell 21:558567.
Zhou, W., et al. (2008). The Arabidopsis gene YS1 encoding a DYW protein is required for
editing of rpoB transcripts and the rapid development of chloroplasts during early
growth. Plant J.
106
TANG2
Vitis
rice
MLRRSPARVVAYQLLPFLYTRSFSEASRTLRRELRGGNGRIRPELLERVSRLLVLGRYEA 60
-MEVEHSVAIKIKHSNHCHTLLVSFGISQPVEHL------LQSFWVSRICRLVLLRRCNA 53
---MPHGCHFLRPLSFTCRRRRLHSSLPRADGDGTEAGAATDTTLLGRFTRLLLLHRFPA 57
. .
. .
.
. : *. **::* * *
TANG2
Vitis
rice
LHDLSLDFS---DELLNSILRRLRLNPEACLEIFNLASKQQKFRPDYKAYCKMVHILSRA 117
ISKLNFVFS---DDIVDAVLRNLRLNPTASLGFFQFVSKQQNFRPNVKSYCKLVHILSRG 110
AERLLASSSPLTPALLQAALRRVRLDPDAALHLFRLAPS----RPSLVSHAQLLHILARA 113
*
*
:::: **.:**:* *.* :*.:...
**. ::.:::***:*.
TANG2
Vitis
rice
RNYQQTKSYLCELVALN---HSGFVVWGELVRVFKEFSFSPTVFDMILKVYAEKGLVKNA 174
RMYDETRAYLNQLVDLCKFKDRGNVIWDELVGVYREFAFSPTVFDMILKVYVEKGLTKNA 170
RRFHDARALLSSLPPHA------EPLFPHLAEVYRDFTFSAVSFDLLLRAHADAGQLSSA 167
* :.:::: * .*
:: .*. *:::*:**.. **::*:.:.: * ..*
TANG2
Vitis
rice
LHVFDNMGNYGRIPSLLSCNSLLSNLVRKGENFVALHVYDQMISFEVSPDVFTCSIVVNA 234
LYVFDNMGKCGRIPSLRSCNSLLNNLVKNGETHTAHYVYQQMIRVGIVPDVFMVSIMVNA 230
LNVFDGMGKVGCRPSLRSCNRLLNKLVQSGDPGMAAMVYGQMRIAGVLPDEFTVAIMAKA 227
* ***.**: * *** *** **.:**:.*: * ** **
: ** * :*:.:*
TANG2
Vitis
rice
YCRSGNVDKAMVFAKETESSLGLELNVVTYNSLINGYAMIGDVEGMTRVLRLMSERGVSR 294
FCKDGKVDEAAGFVKKMEN-LGVEPNIVTYHSLINGYVSLGDVEAAKGVLKFMSEKGVSR 289
YCRDGRVAQAVEFVEEMEG-MGLEVNLVAYHAVMDCYCGMGWTEDARRILESLQRKGLSP 286
:*:.*.* :* *.:: *. :*:* *:*:*::::: * :* .*
:*. :..:*:*
TANG2
Vitis
rice
NVVTYTSLIKGYCKKGLMEEAEHVFE-LLKEKKLVADQHMYGVLMDGYCRTGQIRDAVRV 353
NVVTYTLLIKGYCKQCKMDEAEKVLRGMQEEAALVPDERAYGVLIDGYCRTGKIDDAVRL 349
NVVTYTLLVKGYCKDGRMEEAERVVKEMKETGDIVVDEVAYGMMINGYCQRGRMDDATRV 346
****** *:*****. *:***:*.. : : :* *: **::::***: *:: **.*:
TANG2
Vitis
rice
HDNMIEIGVRTNTTICNSLINGYCKSGQLVEAEQIFSRMNDWSLKPDHHTYNTLVDGYCR 413
LDEMLRLGLKTNLFICNSLINGYCKRGEIHEAEGVITRMVDWNLKPDSYSYNTLLDGYCR 409
RNEMRDAGIHVNLFVYNTMINGLCKLGRMEEVQKVLQEMEDVGMRPDKYSYNTLIDGYCR 406
::* *::.* : *::*** ** *.: *.: :: .* * .::** ::****:*****
TANG2
Vitis
rice
AGYVDEALKLCDQMCQKEVVPTVMTYNILLKGYSRIGAFHDVLSLWKMMLKRGVNADEIS 473
EGHTSEAFNLCDKMLQEGIEPTVLTYNTLLKGLCRVGAFDDALQIWHLMMKRGVAPDEVG 469
EGSMRKAFEMCRMMVRNGLAATTLTYNTLLKGFCSLHAIDDALRLWFLMLKRGVAPNEIS 466
* :*:::* * :: : .*.:*** **** . : *:.*.* :* :*:**** .:*:.
TANG2
Vitis
rice
CSTLLEALFKLGDFNEAMKLWENVLARGLLTDTITLNVMISGLCKMEKVNEAKEILDNVN 533
YSTLLDGLFKMENFEGASTLWKDILARGFTKSRITFNTMISGLCKMGKMVEAEEIFDKMK 529
CSTLLDGLFKAGKTEQALNLWKETLARGLAKNVITFNTVINGLCKIGRMAEAEELLDRMK 526
****:.*** . : * .**:: ****: .. **:*.:*.****: :: **:*::*.::
TANG2
Vitis
rice
IFRCKPAVQTYQALSHGYYKVGNLKEAFAVKEYMERKGIFPTIEMYNTLISGAFKYRHLN 593
DLGCSPDGITYRTLIDGYCKASNVGQAFKVKGAMEREPISPSIEMYNSLISGLFKSRRLV 589
ELRCPPDSLTYRTLFDGYCKLGQLGTATHLMNKMEHLGFAPSVEMFNSFITGHFIAKQWH 586
: * * **::* .** * .:: * : **: : *::**:*::*:* * ::
TANG2
Vitis
rice
KVADLVIELRARGLTPTVATYGALITGWCNIGMIDKAYATCFEMIEKGITLNVNICSKIA 653
EVTDLLTEMGIRGLTPNIVTYGALIDGWCKEGMLDKAFSSYFEMTENGLSANIIICSTMV 649
KVNDIHSEMSARGLSPNLVTYGALIAGWCKEGNLHEACNLYFEMVNNGMNPNVFICSALM 646
:* *: *: ***:*.:.****** ***: * :.:*
*** ::*:. *: *** :
TANG2
Vitis
rice
NSLFRLDKIDEACLLLQKIVDFDLLLPGYQSLKEFLEASATTCLKTQKIAESVENSTPKK 713
SGLYRLGRIDEANLLMQKMVDHGFFPD-----HECFLKSDIRYAAIQKIADSLDESC-KT 703
SCFYKEGKVDEANLVLQKLVNIDMIPG-----------CSISTIEIDKISHVVDTIADGN 695
. ::: .::*** *::**:*: .::
.
:**:. ::
.
TANG2
Vitis
rice
LLVPNNIVYNVAIAGLCKAGKLEDARKLFSDLLSSDRFIPDEYTYTILIHGCAIAGDINK 773
FLLPNNIVYNIAIAGLCKTGKVDDARRFFS-MLSLKGFVPDNFTYCTLIHGYSAAGNVDE 762
PHSAN-VMWNVIIFGLCKSGRIADAKSLFE-SLRNKRFLPDNFTYSSLIHGCAASGSIDE 753
.* :::*: * ****:*:: **: :*. * . *:**::** **** : :*.:::
TANG2
Vitis
rice
AFTLRDEMALKGIIPNIVTYNALIKGLCKLGNVDRAQRLLHKLPQKGITPNAITYNTLID 833
AFRLRDEMLRRGLVPNIVTYNALINGLCKSENVDRAQRLFHKLHQKGLFPNVVTYNTLID 822
AFSLRDVMLSAGLTPNIITYNSLIYGLCKSGKLSRAVNLFNKLQSKGISPNGITYNTLID 813
** *** * *: ***:***:** **** ::.** .*::** .**: ** :*******
TANG2
Vitis
rice
GLVKSGNVAEAMRLKEKMIEKG----------LVRGSDKQGDVDIPKEVVLDPEVKLGST 883
GYCKIGNMDAAFKLKDKMIEEGISPSVVTYSALINGLCKHGDIER-SMKLLNQMIKAGVD 881
EYCKEGKTTEAFKLKQKMVEEG--------------------YMEEAIKLLDQMIENNVD 853
* *: *::**:**:*:*
:*: :: .
TANG2
Vitis
rice
G-VIEMNS-----------------NELYDVR-----------RVSEAVV---------- 904
SKLIEYCTLVQGYIRSGEMQKIHKLYDMMHIR-----------CLSTTAISHKQVDLRPQ 930
PNYITYCTLIHGYIKSGNMEEISKLYDEMHIRGLLPTNWIGNWKRSDPVVVNNWNRKDGH 913
* :
: .:*
* ..:
TANG2
Vitis
------TTMK--- 934
Supplementary Figure 1
Li, et al., 2009
RESULTATS
Supplementary table 1: Primers Used for Amplifying the Whole nad Transcripts
nad1 exon1-5
nad2 exon1-5
nad3
nad4 exon1-4
nad5 exon1-5
nad6
nad7 exon1-5
nad9
Forward primer
AGCCCGGGATCTTCTTGA
CAAAGGAGAGGGGTATAGCAA
GCACCCCTTTTCCATTCATA
ATTCTATGTTTTTCCCGAAAGC
AACATTGCAAAGGCATAATGA
CGTCCTCCTCATTATAGTCCTCC
ACCTCAACATCCTGCTGCTC
TTGGGTCATCTCAATGGGTT
Reverse primer
TTGCCATATCTTCGCTAGGTG
GGATCCTCCCACACATGTTC
GATGTCAGAATTTGCACCAA
TGAAATTTGCCATGTTGCAC
ACCATGGATCTCATCGGAAAT
CTCTGGTTTGATGGTTGCAC
AGGTGCTTCAACTGCGGTAT
CGATCGATATTTGCGGAGTT
Supplemental table 2: Primers Used for the Splicing qRT-PCR Experiment.
For nad5, the letters refer to the primers shown on the nad5 diagram in Materials and Methods.
rpl2
rpl2 intron exon2
rps3
rps3 intron1 exon2
cox2
cox2 intron1 exon2
ccb452
ccb452 intron1 exon1
nad1 exon1-2
nad1 intron1 exon2
nad1 exon2-3
nad1 intron2 exon2
nad1 exon3-4
nad1 intron3 exon4
nad1 exon4-5
nad1 intron4 exon5
nad2 exon1-2
nad2 intron1 exon2
nad2 exon2-3
nad2 intron2 exon2
nad2 exon3-4
nad2 intron3 exon4
nad2 exon4-5
nad2 intron4exon4
nad4 exon1-2
nad4 intron1 exon2
nad5 intronE-I
nad7 intron4 exon5
nad5 exon K-J
nad5 intronK-L
nad7 intron1 exon2
nad7 intron2 exon3
nad7 intron3 exon4
nad4 exon2-3
nad4 intron2 exon3
nad4 exon3-4
nad4 intron3 exon4
nad5 exon B-A
nad5 intron B-C
nad5 exon E-D
nad5 exon F-D
nad5 intro G-D
nad5 exon E-H
nad7 exon1-2
nad7 exon2-3
nad7 exon3-4
nad7 exon4-5
Forward primer
CCGAAGACGGATCAAGGTAA
TTAGGAAGAGCCGTACGAGG
AGCCGAAGGTGAGTCTCGTA
AGCCGAAGGTGAGTCTCGTA
TGGGGGATTAATTGATTGGA
TGGGGGATTAATTGATTGGA
GTGGGTCCATGTAAATGATCG
CCCGGATCGAATCAGAGTT
GACCAATAGATACTTCATAAGAGACCA
GACCAATAGATACTTCATAAGAGACCA
ATTCAGCTTCCGCTTCTGG
GGTTGGGTTAGGGGAACATC
AAAAGAGCAGACCCCATTGA
AAAAGAGCAGACCCCATTGA
AGCCCGGGATCTTCTTGA
AGCCCGGGATCTTCTTGA
GCGAGCAGAAGCAAGGTTAT
GCGAGCAGAAGCAAGGTTAT
AAAGGAACTGCAGTGATCTTGA
CCCGATCCGATAGTTTACAA
GCGCAATAGAAAGGAATGCT
GCGCAATAGAAAGGAATGCT
CAAAGGAGAGGGGTATAGCAA
CTTATTCGTGGCAACCTTCC
ATTCTATGTTTTTCCCGAAAGC
CCGTATGATGCGGAAGTCTC
AACTCGGATTCGGCAAGAA
CGGCCAAATGACTACAGGAT
ACGGTTTTTAGGGGGATCTG
AGTGGGAGAGCCGTGTTATG
TAAAGTGAAGTGGTGGGCCT
AATACCCATGTTTCCCGAAG
GCGGAACGACCAGAAAAATA
TTCCTCCATAAATTCTCCGATT
TCTAGCTTGGTTCGGAGAGC
TGGACCAAGCTACTTATGGATG
TGGACCAAGCTACTTATGGATG
AACTCGGATTCGGCAAGAA
GTGAGTCCCATGCGTCAGT
GTACGATCGTGTCGGGTGA
AACTCGGATTCGGCAAGAA
ACCTCAACATCCTGCTGCTC
GAGGGACTGAGAAATTAATAGAGTACA
ACTGTCACTGCACAGCAAGC
GATCAAAGCCGATGATCGTAA
108
Reverse primer
CGCAATTCATCACCATTTTG
CGCAATTCATCACCATTTTG
CCGATTTCGGTAAGACTTGG
TCTACGGCGGGGTCACTAT
TGATGCTGTACCTGGTCGTT
AGCAGTACGAGCTGAAAGGC
CACATGGAGGAGTGTGCATC
CACATGGAGGAGTGTGCATC
TTGCCATATCTTCGCTAGGTG
CGTGCTCGTACGGTTCATAG
TCTGCAGCTCAAATGGTCTC
TCTGCAGCTCAAATGGTCTC
TCCGTTTGATCTCCCAGAAG
GGGAGCTGTATGAGCGGTAA
TCTTCAATGGGGTCTGCTC
ACGGAGCTGCATCCCTACT
GGATCCTCCCACACATGTTC
CCCATTCCTAACCAGTGGAG
AATATTTGATCTTAGGTGCATTTT
AATATTTGATCTTAGGTGCATTTT
CTATGGGTCTACTGGAGCTACCC
GGCGAATTTCAAACTTGTGG
TATTTGTTCTTCGCCGCTTT
TATTTGTTCTTCGCCGCTTT
GAAAAACTGATATGCTGCCTTG
GAAAAACTGATATGCTGCCTTG
GCCGTGTAATAGGCGACCA
GTTCCTGCGTTTCGGATATG
CCTGTAAACCCCCATGATGT
AAGGTAAAGCTTGAAGATAAGTTT
TGGTACCTCGCAATTCAAAA
CATTGCACAATGATCCGAAG
TGCTACCTCCAATTCCCTGT
TGCTACCTCCAATTCCCTGT
CCATGGATCTCATCGGAAAT
TTCGCAAATAGGTCCGACT
CTGGCTCTCGGGAGTCTCTT
GTTTTGAAGCCGAGCCTTT
AAGGTAAAGCTTGAAGATAAGTT
TGGTACCTCGCAATTCAAAA
CATTGCACAATGATCCGAAG
RESULTATS
La protéine TANG2 n‟est pas totalement essentielle pour l‟épissage en trans de l‟intron 3 de
nad5. D‟autres défauts mineurs sont présents chez le mutant tang2, et il est intéressant de voir
que ces défauts se retrouvent également chez le mutant otp43. Par exemple, ces deux mutants
présentent aussi une réduction de l‟épissage de l‟intron1 de nad2 et une accumulation de la
forme non épissée (Figure 10). Ces deux protéines ont-elles une action plus ou moins directe
sur l‟efficacité de l‟épissage de cet intron ou s‟agit-il d‟un effet de régulation dû à l‟absence
de l‟assemblage des sous-unités du complexe I ? A ce stade, il est difficile de répondre à cette
question, en revanche il serait intéressant de vérifier ce phénomène chez d‟autres mutants
affectés dans l‟épissage des introns des gènes nad ou chez d‟autres mutants affectés dans les
sous-unités de ce complexe. En collaboration avec Etienne Meyer, j‟ai eu l‟occasion de
regarder le profil chez un mutant affecté dans une des sous-unités du complexe I. Le défaut
d‟épissage de l‟intron 1 de nad2 n‟est pas retrouvé alors que le mutant ndufs4 n‟a plus de
complexe I (Figure 10). Ce défaut n‟est donc pas typique des mutants de complexe I mais il
est plus probable que OTP43 et TANG2 aient une fonction mineure (directe ou indirecte)
dans l‟épissage de l‟intron 1 de nad2.
Un autre point intéressant à noter est la surexpression du transcrit nad6 chez les trois
mutants du complexe I. Comme il est montré sur la figure 9, le transcrit nad6 semble être plus
abondant chez les mutants otp43, tang2 et ndufs4 comparés au sauvage et aux mutants
complémentés. Ce résultat suggère qu‟une régulation de la transcription ou une régulation
post-transcriptionnelle pourrait se mettre en place lorsqu‟une des sous-unités du complexe I
n‟est plus présente.
Figure 9 : Analyse par northern blot des ARN issus des mutants de complexe I et des mutants
complémentés avec la sonde nad6.
109
RESULTATS
Figure 10 : Quantification par PPE des évènements d‟épissage de l‟intron1 de nad2 et de l‟intron
de rps3 chez les mutants otp43, tang2, ndusf4 comparés au sauvage.
II.2.3 PPR40
PPR40 est également une PPR de type « Pure » faisant partie des 48 protéines PPR que
nous avions sélectionnées lors de l‟étude systématique des protéines PPR. Hormis des
clonages et des données de localisation subcellulaire montrant que cette PPR est localisée
dans les mitochondries, aucune étude n‟avait été réalisée sur les mutants d‟insertion pour cette
PPR dans l‟équipe de Ian Small et de Claire Lurin. En revanche, une analyse de deux mutants
d‟insertion faite par l‟équipe de L. Szabados a permis d‟élucider en partie le rôle de cette
protéine PPR (Zsigmond, Rigo et al. 2008).
110
RESULTATS
Cette protéine PPR fusionnée à un TAG HA en C-terminal a été montrée comme étant
apparemment associée au complexe III, cependant des données de spectrométrie de masse sur
le complexe III provenant d‟Etienne Meyer n‟ont jamais permis d‟identifier cette protéine
PPR. Néanmoins, la majorité des protéines PPR étant faiblement exprimées, il est possible
qu‟aucune identification par cette technique ne puisse être faite. Dans les résultats obtenus,
Zsigmond et ses collaborateurs montrent que le mutant présente une diminution du complexe
III. Or le Blue-Native présenté dans le papier semble montrer également une diminution du
complexe I. Les événements d‟épissage pour les introns de nad1, nad4, et nad7 sont présentés
dans l‟article mais aucune mention n‟est faite des introns des gènes nad2 et nad5 alors que
l‟on en dénombre 8 pour ces gènes.
Le phénotype des deux allèles de ppr40 est caractérisé par des plantes plus petites avec un
retard de croissance, phénotype assez similaire à celui des mutants de complexe I, même si
cependant d‟autres défauts pourraient conduire au même phénotype. Ces différentes
observations, ou manque d‟informations, concernant les introns de nad2 et nad5 me laissaient
penser que ce mutant pouvait éventuellement présenter un défaut au niveau du complexe I.
Nous avions au laboratoire un des deux allèles décrits dans le papier, ppr40-2
(SALK_071712), mais pour lequel le phénotype est moins marqué que ppr40-1. J‟ai donc
décidé de regarder les événements d‟épissage chez ce mutant afin de voir si le phénotype
observé pouvait s‟expliquer par un défaut dans ce processus au niveau des introns de nad2 et
nad5. La PCR quantitative sur les formes épissées et non épissées chez le mutant montre des
défauts partiels d‟épissage pour certains introns (figure 11). En effet, le mutant présente huit
fois moins de forme épissée des introns 1 et 4 de nad5. Cette diminution d‟épissage pourrait
expliquer la diminution de complexe I observée dans le BN-PAGE décrit dans le papier de
Zsigmond et al.
Figure 11 : Profil de l‟épissage mitochondrial du mutant ppr40-2. Les ratios des formes épissées
sur les formes non épissées sont représentés en Log2 en abscisse.
111
RESULTATS
Le défaut observé dans l‟épissage de certains introns chez le mutant ppr40 ne signifie pas
que la protéine PPR40 est un facteur d‟épissage. En effet, ce défaut est une diminution et non
une absence d‟épissage et suffisamment de formes épissées sont présentes pour la synthèse et
la formation de complexe I. Cependant, l‟analyse faite ici se porte sur le deuxième allèle dont
le phénotype est moins marqué que celui de ppr40-1. Une nouvelle analyse vient d‟être faite
sur cet allèle par Catherine Colas-des-Francs dans le laboratoire de Ian Small et montre qu‟il
n‟y a pas plus de défaut d‟épissage chez le mutant ppr40-1 que pour ppr40-2. Le phénotype
étant plus marqué il est possible qu‟il existe une autre mutation dans le mutant ppr40-1. Quoi
qu‟il en soit, cette mutation influence clairement l‟efficacité de l‟épissage.
Comme il a été décrit dans l‟introduction, les protéines PPR sont impliquées dans de
nombreuses modifications post-transcriptionnelles. Il est possible que PPR40 ne soit pas
impliquée directement dans l‟épissage car cette protéine ne se trouve pas être indispensable
pour les deux introns de nad5 pour lesquels un défaut d‟épissage a été observé, mais elle
pourrait avoir un rôle dans la stabilité de certaines formes d‟ARNm pré-épissées ou dans des
maturations en 5‟ ou en 3‟ des transcrits primaires, influençant ainsi l‟épissage. Il reste donc
de nombreuses analyses à effectuer afin de comprendre exactement le rôle de cette protéine
PPR.
II.2.4 Comment identifier de nouvelles PPRs impliquées dans l’épissage des introns
nad ?
La majorité des introns dans le génome mitochondrial se situe dans les gènes nad. Ces
gènes codent pour des sous-unités du complexe NADH dehydrogenase. Ces sous-unités
faisant partie du même complexe, il est possible qu‟une co-régulation de l‟expression des
gènes codant ces sous-unités ait lieu. Cette régulation pourrait s‟effectuer à différents niveaux,
en commençant par la transcription, la maturation des ARNm et enfin par l‟activité
traductionnelle. La régulation de l‟épissage pouvant être un mode de régulation de
l‟expression, il est possible que les introns des gènes nad soient épissés et régulés de façon
conjointe. Si c‟est le cas, les facteurs impliqués dans l‟épissage de ces introns doivent être
exprimés de façon conjointe. S‟il existe une régulation quelconque de l‟épissage, il pourrait
être possible d‟identifier d‟autres protéines PPR dont la régulation de l‟expression des gènes
serait similaire à celle des deux gènes codant des protéines PPR décrites dans l‟épissage des
introns nad, et ainsi identifier d‟autres protéines PPR impliquées dans l‟épissage.
II.2.4.1 Co-régulation des PPRs
Comme le montre le graphique d‟expression réalisé sous Genecat (http://genecat.mpg.de/)
dans la figure 12, le profil d‟expression des gènes OTP43 et TANG2 au cours du
développement est assez similaire.
Les données de ce même logiciel donnent un coefficient de corrélation de Pearson de 0,67
entre ces deux gènes, montrant ainsi une corrélation moyenne entre l‟expression des deux
gènes. En utilisant ce logiciel, de nombreux gènes codant pour des protéines PPR sont
identifiés comme étant co-exprimés avec OTP43 et TANG2, mais il est hasardeux de supposer
que ces protéines soient impliquées dans un mécanisme similaire car les coefficients restent
assez faibles.
112
RESULTATS
Figure 12 : Expression des gènes OTP43 (At1g74900) et TANG2 (At1g19290) au cours du
développement. Analyse réalisée sous Genecat (http://genecat.mpg.de/) en utilisant l‟option « profil
d‟expression » et sans normalisation du signal d‟expression.
Le mutant tang2 a été identifié au cours de tests de sensibilité au glucose. En présence de
glucose ce gène est très fortement exprimé. Il est difficile d‟établir une relation directe entre le
glucose et le fonctionnement de la protéine TANG2 dans l‟épissage, mais cette information
pourrait être utile dans la recherche de nouveaux facteurs intervenant dans ce processus.
Sur Genevestigator (https://www.genevestigator.com), logiciel regroupant un grand
nombre d‟expériences de « microarrays », il existe peu de conditions pour lesquelles les deux
gènes réagissent de la même manière dans leur expression (ce qui confirme l‟analyse
effectuée sous Genecat). Seule une condition montre une réelle co-expression : les 2 gènes
OTP43 et TANG2 sont surexprimés en présence de fortes concentrations en saccharose. Une
étude a donc été entreprise à l‟aide de Genevestigator afin d‟identifier les autres gènes PPR
surexprimés dans les mêmes conditions. L‟idée était de tester par la suite en génétique inverse
si les protéines codées par ces gènes ont un rôle dans l‟épissage des introns mitochondriaux. Il
est clair que cette approche reste très critiquable, mais, n‟ayant au début que peu d‟éléments
concernant les facteurs d‟épissage de type PPR dans les mitochondries, cette approche me
semblait plus appropriée qu‟une approche de criblage complètement aléatoire de mutants ppr.
II.2.4.2 Les nouveaux facteurs d’épissage identifiés
Parmi les 450 gènes codant pour des protéines PPR, seulement 378 possèdent une sonde de
type Affymetrix (description dans le tableau 1 en annexe). Une analyse de l‟expression sur
saccharose grâce à Genevestigator a donc été faite pour ces 378 gènes. En plus des 2 gènes
113
RESULTATS
OTP43 et TANG2, 19 autres gènes codant pour des protéines PPR sont surexprimés d‟un
facteur au moins deux dans des expériences de haute concentration en saccharose (Figure 13).
Figure 13 : Capture d‟image de l‟analyse de l‟expression des 19 gènes codant pour des protéines
PPR sous GENEVESTIGATOR. La flèche bleue montre la surexpression de tous ces gènes en
présence d‟une forte concentration en saccharose.
A l‟exception d‟une protéine montrée expérimentalement par fusion GFP localisée dans les
mitochondries, aucune donnée de localisation n‟a été réalisée pour les 18 autres. Cependant,
les
données
de
prédiction
de
localisation
obtenues
sous
SUBA
(http://suba.plantenergy.uwa.edu.au/) permettent de prédire une éventuelle fonction dans les
mitochondries pour la majorité d‟entre-elles (tableau 4).
Parmi ces 19 protéines PPR, 10 sont des PPR de type P, 3 de type E, 5 de type E+ et une de
type DYW. Les protéines PPR de la sous classe PLS sont généralement impliquées dans
l‟édition ou le clivage des ARNm. De ce fait, si ces gènes surexprimés sur saccharose ont un
rôle quelconque dans l‟épissage, il est fort possible que l‟effet sur ce type de maturation chez
ces mutants soit indirect, en raison d‟un défaut soit dans l‟édition de sites proches des sites
d‟épissage (intron ou exon), soit d‟un défaut de clivage des ARN pré-messagers. Pour cette
raison, je me suis focalisé dans un premier temps sur l‟étude des lignées d‟insertion ADN-T
dans les gènes codant pour les 10 protéines PPR-P, car jusqu‟à présent seules des protéines
PPR-P ont été décrites comme jouant un rôle dans l‟épissage.
114
RESULTATS
Tableau 4 : Prédiction de la localisation subcellulaire des 19 protéines PPR surexprimées en présence
de
saccharose.
Prédictions
extraites
((http://suba.plantenergy.uwa.edu.au/).
de
la
base
de
données
SUBA
II.2.4.2.1 « Pure » PPRs (OTP439)
Parmi les 10 gènes codant pour des PPR-P, il a été possible d‟identifier des mutants
d‟insertion ADN-T disponibles dans les bases de données pour 9 d‟entre-elles. Ces lignées ont
été commandées, semées, et un génotypage ainsi qu‟une étude du phénotype ont été réalisés
pour chaque lignée. Les résultats sont présentés dans le tableau 5. Pour deux gènes PPR,
At5g61990 et At3g09060, aucune plante homozygote pour l‟insertion n‟a pu être obtenue.
Pour deux autres gènes, At2g32630 et At2g30780, il n‟a pas été possible d‟amplifier le
transgène pour toutes les lignées décrites, l‟insertion n‟a donc pas été confirmée. Finalement,
seuls 5 gènes sur les 10 de départ ont permis d‟identifier des mutants homozygotes pour
l‟insertion de l‟ADN-T. Une lignée homozygote pour chacun des 5 gènes a été sélectionnée et
une détection des événements d‟épissage mitochondriaux a été entreprise. Les 4 lignées
homozygotes pour les 4 gènes, At1g06580, At1g62670, At1g02060, At2g01390 ne présentent
pas de phénotype particulier et sans surprise aucun défaut d‟épissage n‟est détecté par PCR
quantitative comme le montre la figure 14.
En revanche, la dernière lignée d‟insertion homozygote, correspondant au gène At3g48810
codant pour une protéine PPR nommée OTP439 par la suite, présente un défaut de retard de
développement. La détection des événements d‟épissage représentée sur la figure 15 montre
plusieurs défauts partiels dans l‟épissage de l‟intron 1 de nad2, de l‟intron 1 de nad5 et de
l‟intron 2 de nad5 (dans cette expérience les oligonucléotides dessinés pour la PCR
quantitative ne permettaient pas de distinguer entre l‟intron 2 et 3 de nad5. C‟est au cours
d‟une nouvelle analyse non montrée ici, en redessinant des oligonucléotides, que l‟on a pu
distinguer le défaut entre ces deux introns). A ce stade il est intéressant de noter que l‟on
retrouve un défaut partiel de l‟épissage de l‟intron 1 de nad2 identique aux défauts observés
chez les autres mutants, tang2, otp43 et ppr40, affectés dans l‟épissage des introns
mitochondriaux.
115
RESULTATS
Tableau 5 : Résumé des génotypages et de l‟analyse des phénotypes associés des mutants
présentant des insertions dans des gènes PPR de type « Pure » sur-exprimés sur saccharose.
Figure 14 : Profil de l‟épissage mitochondrial chez les mutants affectés dans les gènes At1g06580
(425 : salk_022879), At1g62670 (428 : salk_146198), At1g02060 (430 :Sail_423B07), At2g01390
(432 : salk_025648).
116
RESULTATS
Figure 15 : Profil de l‟épissage mitochondrial chez le mutant otp439.
Ce retard de développement, observé chez ce mutant est typique des mutants de complexe
I et peut s‟expliquer par une réduction des formes épissées des transcrits nad2 et nad5. Cette
réduction s‟accompagne d‟une diminution mais non une absence de complexe I, ainsi que de
la présence d‟un sous-complexe partiel de taille plus petite comprenant la sous-unité NAD6
(résultats obtenus par Catherine Colas-des-Francs à Perth). Cette présence de ce souscomplexe est accompagnée d‟une sur-expression de la protéine NAD6 et est spécifique du
mutant otp439. Le mutant tang2 est également affecté dans l‟épissage des transcrits nad5
mais, en revanche, il ne présente pas d‟accumulation de la protéine NAD6 et de souscomplexe comme pour otp439. Il est donc possible qu‟OTP439, en plus d‟influencer
l‟épissage, ait une autre action. Même si le défaut d‟épissage est assez marqué chez otp439, ce
défaut n‟est pas total et on ne peut donc pas conclure sans expérience additionnelle que la
protéine OTP439 est un facteur d‟épissage mitochondrial, en revanche cette protéine est
importante pour l‟efficacité d‟épissage de certains introns et est ainsi la quatrième protéine
PPR identifiée influençant l‟épissage mitochondrial. Il sera intéressant d‟effectuer de plus
amples études afin de comprendre comment cette protéine influence l‟épissage, si c‟est en
stabilisant l‟ARNm ou alors en agissant sur sa maturation.
II.2.4.2.2 Influence de l’édition dans l’épissage
Neuf gènes codant pour des protéines de type PLS sont également surexprimés sur
saccharose. Aucune donnée ne permet de montrer la fonction de ces neuf protéines au niveau
mitochondrial, cependant le fait qu‟elles appartiennent à la sous-famille PLS suggère un
éventuel rôle dans l‟édition ou dans le clivage. Certains sites d‟édition dans le génome
mitochondrial sont décrits à proximité de jonctions exon-intron ou au sein même de l‟intron.
Ces sites pourraient avoir une influence sur l‟efficacité de l‟épissage en agissant sur la
structure secondaire des ARN pré-messagers comme il a déjà été montré pour l‟épissage de
117
RESULTATS
l‟intron de cox2 chez le blé où l‟édition d‟un site dans la zone IBS (pour Intron Binding Site)
de l‟exon1 est essentielle pour l‟efficacité de l‟épissage (Kurihara-Yonemoto and Handa
2001).
Afin de savoir si ces neuf gènes ont un rôle quelconque dans l‟épissage, une approche de
génétique inverse a donc été mise en place. Deux gènes, At1g06145 et At2g04860 n‟ont pas
de lignées d‟insertion ADN-T associée dans les bases de données. Pour les 7 autres gènes, une
étude des lignées d‟insertion a permis d‟obtenir des mutants homozygotes pour 3 gènes
uniquement. Cependant, aucune de ces 3 lignées ne présente de phénotype macroscopique.
Les mutants affectés dans le complexe I présentent des délais de germination plus ou moins
sévères selon la mutation. Ainsi pour otp43, des plantes homozygotes ne peuvent être
obtenues qu‟en semant des graines issus d‟hétérozygotes sur un milieu in vitro standard et
après un long délai avant germination. Ainsi, contrairement à des graines issues de plantes
sauvages ou à trois quart des graines issues d‟hétérozygotes, il faut attendre entre 2 et 3
semaines avant que des graines homozygotes ne germent. Dans le cas des lignées pour
lesquelles aucun mutant homozygote n‟avait été obtenu dans une première étude, j‟ai
prolongé les temps de germination et transféré en terre les plantules ayant germé très
tardivement. En utilisant cette méthode, des plantes homozygotes pour l‟insertion ADN-T
SALK_043866 dans le gène At1g03540 ont été obtenues très récemment. Ce mutant présente
un délai de germination très important et montre également un fort délai de développement
ainsi qu‟un phénotype nain (Figure 16). Alors que les graines des plantes hétérozygotes pour
l‟insertion sont déjà récoltées, la majorité des plantes homozygotes commencent seulement à
avoir une hampe florale comme le montre la photo dans la figure 16. Seule une lignée ADN-T
pour ce gène montre ce phénotype. Pour les deux autres lignées, il n‟a jamais été possible de
détecter la présence du transgène par PCR sur ADNg.
Figure 16 : Photos du mutant salk_043866 et description des motifs PPR qui composent la protéine
At1g03540.
Ce phénotype très marqué est probablement le résultat d‟un dysfonctionnement
mitochondrial. Afin d‟identifier le défaut moléculaire, j‟ai tout d‟abord caractérisé les
événements d‟épissage chez ce mutant par PCR quantitative dans l‟espoir qu‟un défaut
d‟édition ou de clivage pourrait avoir un impact sur l‟épissage. Lorsque la comparaison entre
le mutant et le sauvage est effectuée entre les taux de formes épissées, on observe une
118
RESULTATS
diminution de l‟épissage de l‟intron1 de nad2, diminution déjà observée chez les autres
mutants étudiés précédemment (figure 17A). En revanche, lorsque cette comparaison est
effectuée entre les ratios de formes épissées sur les formes non épissées (Figure 17B), le
mutant montre une diminution relativement importante pour une majorité des introns. Ainsi,
le taux d‟épissage ne semble pas être affecté à l‟exception de l‟intron 1 de nad2, mais le taux
de transcrits non épissés est fortement augmenté chez le mutant. Ce mutant est actuellement
en cours d‟étude afin de comprendre quel est le défaut moléculaire primaire. Dans le cadre
d‟un projet de mise au point des nouvelles approches de séquençage « haut-débit » sur
appareil de type « Solexa », ce mutant va être utilisé pour évaluer notre capacité à détecter des
défauts moléculaires chez des mutants PPR par ce type d‟approche.
Figure 17 : Profil de l‟épissage des transcrits mitochondriaux du mutant salk_043866. 043866-1 et
043866-3 sont deux répétitions biologiques. A. Ratios des formes épissées entre le mutant et le
sauvage représentés en Log2 en abscisse. B. Ratios des formes épissées sur les formes non épissées
entre le mutant et le sauvage représentés en Log2 en abscisse.
119
RESULTATS
II.2.4.2.3 Effet du sucre sur l’épissage
Le saccharose ou le glucose ont visiblement une influence sur la transcription de certains
gènes codant pour des protéines PPR impliquées dans l‟épissage des introns mitochondriaux,
mais il reste à vérifier si cette surexpression a un impact sur l‟efficacité de l‟épissage. En
d‟autres termes : Y a t-il une variation de l‟épissage lorsque des graines ou des plantules sont
cultivées sur des milieux plus ou moins riches en sucre ? En vue de mieux comprendre le
phénomène observé et de tenter d‟expliquer cette surexpression des gènes codant ces
proteines PPR, j‟ai donc entrepris différentes expériences de culture d‟Arabidopsis de type
sauvage (Col-0) sur des milieux plus ou moins riches en sucre et analysé les différents
événements d‟épissage afin d‟observer d‟éventuels changements de ratios entre les formes
épissées et non épissées pour chaque intron.
Deux types d‟expériences ont été réalisées, la première a été de caractériser l‟épissage chez
des plantules cultivées sur des milieux ½ MS avec des concentrations de saccharose variant de
0 à 3% et d‟effectuer des comparaisons de ratios avec des plantules poussées sur 1% de
saccharose. La deuxième expérience a consisté à effectuer la même analyse pour des plantules
cultivées sur des concentrations de glucose variant de 0 à 3% comparées à des plantules
cultivées sur des concentrations en mannitol similaires. Comme il est montré dans les deux
figures suivantes (figures 18 et 19), aucun changement significatif n‟a été détecté dans ces
deux types d‟expériences. Alors qu‟une forte concentration en sucres influence l‟expression
de gènes codant pour des PPR impliquées dans l‟épissage, il n‟existe pas de lien entre cet effet
et le taux de transcrits mitochondriaux épissés.
Figure 18 : Profil de l‟épissage mitochondrial chez des plantules cultivées en présence de
différentes concentrations de saccharose. La comparaison est faite avec des plantules cultivées sur 1%
de saccharose.
120
RESULTATS
Figure 19 : Profil de l‟épissage mitochondrial chez des plantules cultivées en présence de
différentes concentrations de glucose et de mannitol.
Il n‟a pas été possible dans cette expérience de regarder en détails le taux de transcription
mitochondrial en présence de sucre, mais il est possible qu‟en condition de forte concentration
de sucre, l‟activité transcriptionnelle mitochondriale soit augmentée et que les facteurs
d‟épissage soient donc aussi sur-exprimés.
121
RESULTATS
II.3 L’épissage alternatif des PPR
Préambule : Au cours de clonages, j’ai été amené à découvrir par hasard des
événements d’épissage alternatif dans des transcrits codant pour des protéines PPR et j’ai
donc voulu évaluer ce phénomène au sein de la famille.
L‟épissage alternatif est un phénomène permettant à un gène de coder pour plusieurs
protéines. Ce phénomène s‟établit soit par l‟épissage de façon alternative de un ou plusieurs
exons, soit par la rétention d‟un ou plusieurs introns ou par l‟utilisation de sites donneurs ou
accepteurs d‟épissage alternatifs. Ce phénomène chez l‟homme joue un rôle très important
dans le développement des cellules, l'organisation des tissus et même dans le développement
d'un individu. Le dogme de « un gène => une protéine » est donc révolu et il est maintenant
montré par séquençage haut-débit que plus de 90 % des gènes chez l‟homme subissent de
l‟épissage alternatif (Wang, Sandberg et al. 2008) créant ainsi une grande variété de protéines
largement supérieure à celle estimée. Ainsi 24 000 gènes chez l‟homme vont permettre de
coder pour environ 100 000 protéines (Modrek and Lee 2002).
Chez les plantes, et notamment chez Arabidopsis, l‟épissage alternatif a longtemps été
largement sous-estimé. Alors que les données d‟EST dénombraient moins de 20% des gènes
chez Arabidopsis possédant des formes alternatives d‟épissage (Kim, Magen et al. 2007), les
nouvelles données provenant de séquençage haut-débit montrent que 42% des gènes
comprenant des introns ont des formes d‟épissage alternatives (Filichkin, Priest et al. 2010).
Contrairement au monde animal, chez les plantes peu d‟études ont été réalisées concernant la
fonction des différents isoformes au niveau protéique cependant il est certain que ces
isoformes permettent d‟augmenter la diversité protéique.
L‟épissage alternatif est régulé de façon temporelle et spatiale et est souvent induit lors de
stress environnementaux (Reddy 2007), permettant ainsi la régulation de l‟expression des
gènes. Dans ce type de régulation, deux mécanismes majeurs sont impliqués. De nombreux
isoformes découverts par séquençage haut-débit aboutissent à des formes pour lesquelles
l‟épissage alternatif conduit à un changement de phase et à l‟apparition d‟un codon stop
prématuré (PTC). Lorsque ce codon apparaît 50 nucléotides avant le codon stop originel, un
processus de dégradation de ces transcrits est alors mis en place par la voie NMD (pour
Nonsense mediated mRNA Decay) qui va reconnaître les transcrits aberrants grâce à un
complexe protéique et ainsi provoquer la dégradation de ceux-ci (Chang, Imam et al. 2007).
Un deuxième mécanisme, qui induit également la voie de dégradation NMD, est l‟apparition
de formes aberrantes d‟épissage de type « RUST » (pour Regulated of unproductive splicing
and translation). Cette voie permet ainsi la régulation de l‟expression de certains gènes et est
notamment décrite chez les gènes codants les protéines SR impliquées dans l‟épissage
alternatif (Lareau, Inada et al. 2007).
Il existe plusieurs types d‟épissage alternatif décrits dans la figure 20. Quatre vont
permettre de changer la séquence protéique et deux autres permettent de contrôler
l‟expression et la stabilité des ARNm. Selon les règnes, ces événements ne sont pas présents
de la même manière et, alors qu‟un type d‟événement est majoritairement présent dans un cas,
il peut se trouver très rare chez un autre. C‟est le cas du phénomène de rétention d‟introns très
répandu chez les plantes alors qu‟il est rare chez les vertébrés et les invertébrés (Keren, LevMaor et al. 2010). Ainsi, chez les plantes supérieures dont le génome a été séquencé et pour
lesquelles suffisamment de séquences d‟ESTs et d‟ADNc sont disponibles, la proportion des
événements d‟épissage alternatif est différente des vertébrés et des invertébrés. Comme le
montre la figure 21, les deux phénomènes majoritaires trouvés chez Arabidopsis, le riz et le
maïs sont des événements d‟épissage alternatif de type « rétention d‟intron » et « site
122
RESULTATS
d‟épissage alternatif accepteur », représentant à eux deux plus des trois quart des formes
trouvées (Barbazuk, Fu et al. 2008).
Figure 20 : Description des différents événements possibles d‟épissage alternatif. L‟épissage
alternatif peut être divisé en quatre sous-groupes : A. L‟excision d‟exon est la forme d‟épissage
alternatif la plus répandue chez les eucaryotes supérieurs et représente 40 % des événements
d‟épissage, en revanche ce phénomène est moins répandu voir même très rare chez les eucaryotes
inférieurs. B. La rétention d‟intron est un mécanisme dans lequel l‟intron n‟étant pas excisé, est
présent dans l‟ARNm mature et va donc être traduit. Ce mécanisme peu répandu chez les vertébrés et
les invertébrés (5% des événements d‟épissage alternatif), est assez répandu chez les plantes, les
mousses et les protozoaires. C. Le site accepteur alternatif et D. le site donneur alternatif sont deux
mécanismes qui ont lieu lorsque plusieurs sites d‟épissage accepteurs ou donneurs sont présents au
sein d‟un même exon. Ces deux événements représentent respectivement 18,4% et 7,9% des
événements d‟épissage alternatif chez les eucaryotes supérieurs. De façon assez rare, l‟épissage
alternatif peut avoir lieu sur des séquences non codantes, dans les régions 5‟ ou 3‟ UTR, conduisant
ainsi à la possibilité d‟obtenir différents sites d‟initiation de la traduction (E) ou des sites alternatifs de
poly Adenylation (F) (Keren, Lev-Maor et al. 2010).
123
RESULTATS
Figure 21 : Proportion des événements d‟épissage alternatif chez Arabidopsis, le riz et le maïs.
Figure extraite de Barbazuk et al. (2008).
Qu‟en est-il des transcrits codant des protéines PPR ? Il faut tout d‟abord noter que les
gènes PPR sont une classe de gènes à part. En effet, la majorité de ces gènes ne contient pas
d‟introns. Alors qu‟une moyenne de 5 introns par gène est observée chez Arabidopsis, un
ratio bien inférieur est observé pour la famille PPR. Environ 80 % des gènes PPR n‟a pas
d‟introns, 12 % ont un intron et seulement 8 % ont plus d‟un intron. Du fait de leur
architecture, si de l‟épissage existe pour ces gènes sans intron il est donc fort probable que
l‟épissage alternatif au sein de cette famille soit différent de ce qui est observé globalement
chez Arabidopsis.
II.3.1 Epissage alternatif identifié dans les banques d’EST
Cette
première
étude
a
été
réalisée
en
utilisant
FLAGdb++
(http://urgv.evry.inra.fr/FLAGdb) (Samson, Brunaud et al. 2004). Pour chaque gène PPR
d‟Arabidopsis, les ESTs et les ADNc décrits dans cette base de données ont été analysés afin
de voir si des formes alternatives d‟épissage étaient décrites. La majorité des gènes PPR sont
très faiblement exprimés et de ce fait aucun ADNc ou EST n‟existe pour une grande partie
d‟entre eux. Ainsi, sur les 450 gènes codant pour des protéines PPR, seulement 201 ont au
moins un ADNc décrit et de fait mon étude s‟est donc portée sur ces derniers.
Sur ces 201 gènes PPR, 6 gènes (At1g13040, At2g02980, At5g60960, At1g09410,
At5g06540, At1g74900) ont des transcrits présentant au moins une isoforme d‟épissage
identifiée par des ADNc ou des ESTs. 4 autres gènes (At1g61870, At1g62350, At1g74900,
At2g02750) présentent également des formes épissées alternatives, cependant, pour ces
derniers, il est difficile de conclure car l‟EST montrant ce phénomène ne couvre qu‟une faible
partie du gène.
Cette première observation suggère que 5% des gènes PPR caractérisés ont des transcrits
alternatifs d‟épissage. Cette proportion est certainement sous estimée car parmi les 201 gènes
PPR étudiés, la majorité n‟a seulement qu‟un ou deux ADNc décrits ce qui ne permet pas
d‟avoir une couverture statistiquement satisfaisante de la structure des transcrits. Néanmoins,
cette première analyse a permis de confirmer l‟existence d‟épissage alternatif au sein de
plusieurs gènes PPR sans intron.
Sur les six gènes présentant différentes isoformes, se trouve le gène OTP43 qui, par
ailleurs, est le premier cas pour lequel des formes alternatives d‟épissage ont été mises en
évidence au laboratoire. Une seule isoforme est décrite dans les différentes banques, alors que
j‟ai pu mettre en évidence quatre autres formes au cours de ma thèse. Le cas d‟OTP43 sera
présenté dans le chapitre « cas d‟OTP43 ».
124
RESULTATS
Les différentes isoformes décrites dans les banques de d‟ADNc sont présentées dans la
figure 22, chaque isoforme après traduction est montrée sous la forme d‟un alignement de
séquence avec la protéine issue d‟un ARNm non épissé. L‟épissage alternatif sur ces 6 gènes
conduit à 3 différentes classes d‟isoformes selon le type d‟impact sur l‟ARNm final et la
synthèse protéique.
La première classe d‟isoformes se caractérise par l‟apparition d‟un codon stop prématuré
comme le montre l‟exemple AT1g09410, conduisant certainement à une dégradation de cet
ARN via la voie NMD. Ce mécanisme, comme cela a été décrit précédemment, permettrait la
régulation de l‟expression de cette PPR.
La deuxième classe, visiblement la plus répandue, est caractérisée par des isoformes dans
lesquelles l‟excision d‟une partie codante ne change pas la phase de lecture. Si l‟isoforme est
traduite, les codons d‟initiation et d‟arrêt de la traduction seront identiques, mais la protéine
présentera un certain nombre de délétions de peptides en comparaison avec la forme non
épissée. Ces délétions de peptides pourraient créer ainsi des protéines différentes pouvant
avoir d‟autres fonctions. De tels événements ont été identifiés pour les gènes At5g06540,
At2g02980, At5g60960.
La troisième classe est définie par l‟apparition potentielle d‟un nouveau codon « start » en
aval du codon d‟initiation de la traduction originel. Deux cas sont présentés : At5g60960 et
At1g13040. La majorité des protéines PPR possèdent une séquence d‟adressage à leur
extrémité N-terminale. Ce changement de codon d‟initiation de la traduction pourrait ainsi
avoir un impact sur la localisation subcellulaire de ces nouvelles isoformes créées, même s‟il
n‟est pas prouvé que ces différentes isoformes soient effectivement traduites.
Ces différentes formes observées sont, dans la majorité des cas, le résultat d‟une excision
par l‟intermédiaire de sites donneurs et accepteurs d‟épissage conventionnels, GT-AG.
Cependant trois autres cas sont décrits ici. La présence d‟un site accepteur GG pour
At2g02980, l‟intervention d‟un site donneur GC pour la synthèse de l‟isoforme 3 de
At5g60960, et la présence d‟un site donneur CT et accepteur AT non conventionnels pour
l‟élaboration de l‟isoforme 2 de At5g60960.
125
RESULTATS
126
RESULTATS
Figure 22 : Description des isoformes de At1g13040, At2g02980, At5g60960, At1g09410,
At5g06540. Les isoformes d‟ARNm sont représentées dans un premier temps sous la forme d‟un
schéma sur lequel les sites donneurs et accepteurs d‟épissage sont annotés. Les protéines résultantes de
ces isoformes sont ensuite représentées dans un alignement avec la forme non épissée traduite sous
Multalin.
Depuis cette première analyse, d‟autres cas ont été identifiés. C‟est le cas de At5g04810
qui, par séquençage haut-débit, a montré une isoforme provenant d‟un site accepteur alternatif
dans l‟exon 4, 8 nucléotides après le site conventionnel (Filichkin, Priest et al. 2010). Ce
changement conduit à un codon de terminaison de la transcription prématuré pour lequel le
transcrit va certainement être pris en charge par la voie de dégradation NMD. D‟autres
exemples sont également répertoriés dans la base de données plantgdb
(http://www.plantgdb.org/). La rétention d‟intron pour At4g26800 conduit à un probable
changement de codon d‟initiation de la traduction alors que la rétention d‟intron dans le cas de
At5g02830 et de At2g17670 conduit a un codon stop prématuré.
127
RESULTATS
II.3.2 Analyse préliminaire des 48 PPRs « du laboratoire »
La majorité des gènes PPR étant faiblement exprimée, il existe peu d‟ADNc décrits. Afin
d‟avoir une meilleure idée de la proportion de gènes PPR présentant des formes alternatives
d‟épissage, une RT-PCR à partir d‟ADNc, suivie d‟un clonage, a été effectuée pour un
échantillon de gènes PPR représentatif. Quarante huit gènes PPR ont été sélectionnés par le
laboratoire il y a une dizaine d‟années afin de mener de nombreuses études fonctionnelles de
la famille des protéines PPR. En vue de réaliser ces études, un clonage systématique avait été
réalisé en utilisant le système de clonage par recombinaison GATEWAY. Ces gènes PPR
n‟ayant pas d‟introns, tous les clonages avaient donc été faits à partir d‟ADNg. Nous avions
toujours au laboratoire les oligonucléotides permettant d‟amplifier ces gènes PPRs. Une PCR
sur ADNg et ADNc après synthèse à partir d‟ARN total de feuilles d‟Arabidopsis a donc été
faite (figure 23).
Figure 23 : Analyse par PCR comparative sur ADNc et ADNg de la présence d‟épissage alternatif
au sein des 48 transcrits PPR du laboratoire. La présence de profils d‟amplification est encadrée en
vert. Dépôt sur gel 1,2% TAE des produits PCR obtenus à partir d‟ADNc (puits de gauche) et
d‟ADNg (puits de droite). Le marqueur de taille utilisé est le « 1kb DNA ladder » de chez Biolabs
(ref : N3232L).
128
RESULTATS
Cette comparaison montre des profils d‟amplification différents selon la matrice utilisée.
Ainsi, des bandes supplémentaires ont été observées lorsque la matrice utilisée est de l‟ADNc,
alors qu‟elles sont absentes lorsque la matrice est de l‟ADNg. Sur les 48 amplifications, 21
présentent des bandes supplémentaires plus ou moins intenses mais qui ne sont pas retrouvées
lorsque l‟amplification est réalisée sur de l‟ADNg (Figure 23). Ces bandes peuvent
correspondre à des bandes parasites dues à une amplification aspécifique ou à des formes
d‟épissage alternatif. Afin de conclure, les produits PCR ont été clonés dans le vecteur
pGEMTeasy, des bactéries DH5 ont été transformées et sélectionnées sur carbenicilline/Xgal/IPTG. Les colonies blanches positives ont été testées par PCR et les plasmides extraits ont
été séquencés en utilisant les amorces M13Fw et M13rev.
Tous les produits n‟ont pu être caractérisés entièrement mais l‟étude a été menée jusqu‟au
bout pour un certain nombre. Nous avons pu montrer que les bandes supplémentaires
obtenues dans certains puits étaient des amplifications aspécifiques, comme par exemple
l‟amplification d‟une palmitoyl thoesterase (At3g60340) avec les oligonucléotides spécifiques
de PPR28, ou d‟une Purine transmembranaire AtPUP14 avec les oligonucléotides spécifiques
de PPR16. Pour d‟autres, comme PPR36, PPR4, PPR13, PPR19, il n‟a pas été possible de
cloner les produits intermédiaires. En revanche, pour deux autres gènes, PPR24 et PPR47, il a
été possible de montrer l‟existence d‟épissage alternatif.
Figure 24 : Isoformes d‟épissage alternatif de PPR24 détectées par RT-PCR suivie d‟un clonage.
Les deux isoformes amplifiées et déposées sur un gel contenant 1% d‟agarose dans du TAE (marqueur
de taille : « 1kb DNA ladder » de chez Biolabs (ref : N3232L)), sont représentées sous la forme d‟un
schéma sur lequel les sites donneurs et accepteurs d‟épissage sont annotés. Le transcrit isoforme 2 peut
coder théoriquement pour 2 protéines comme montré dans l‟alignement effectué sous Multalin.
129
RESULTATS
PPR24 est une protéine PPR de type DYW. Par RT-PCR et dépôt sur gel, deux produits
d‟amplification sont détectés en utilisant les oligonucléotides « start » et « stop » de PPR24
(figure 24). Ces deux produits correspondent à deux transcrits ppr24. Le premier est la forme
pleine longueur sans épissage et le deuxième est le résultat d‟une excision de 586 nucléotides
entre la position 515 et 1101 (Figure XX). Cet épissage crée un changement de phase de
lecture avec la création d‟un codon de terminaison de la traduction prématuré (PTC) (AS1 sur
la figure XX) et le transcrit résultant devrait donc être dégradé via la voie NMD. Cependant
un autre codon d‟initiation de la traduction pourrait être utilisé aboutissant à une nouvelle
protéine identique à PPR24 mais tronquée en N-terminal (AS2 sur la Figure 24). Ceci n‟est
qu‟une hypothèse très théorique qui demande à être confirmée.
Figure 25 : Isoformes d‟épissage alternatif de PPR47 détectées par RT-PCR suivie d‟un clonage.
Les deux isoformes amplifiées et déposées sur un gel contenat 1% d‟agarose dans du TAE (marqueur
de taille : « 1kb DNA ladder » de chez Biolabs (ref : N3232L)), sont représentées sous la forme d‟un
schéma sur lequel les sites donneurs et accepteurs d‟épissage sont annotés. Les deux transcrits peuvent
coder pour 2 protéines différentes comme montré dans l‟alignement effectué sous Multalin.
PPR47 est une protéine PPR de type E+ localisée dans les chloroplastes, dont le mutant
d‟insertion SALK_040629 ne présente pas de défaut d‟édition (Hammani, Okuda et al. 2009).
Deux isoformes ont pu être mises en évidence par séquençage. La première correspond à la
forme pleine longueur du transcrit PPR47 et correspond au transcrit majoritaire détecté par
RT-PCR en utilisant les oligonucleotides « start » et « stop » de PPR47 (Figure 25). La
deuxième isoforme (isoforme 2 sur la Figure 25) correspond à un transcrit épissé, dans lequel
597 nucléotides sont excisés. L‟épissage de cette séquence codante ne change pas la phase de
lecture et, comme le montre l‟alignement de séquence protéique entre les deux isoformes,
l‟isoforme 2 conduit à une protéine similaire ayant une séquence interne tronquée. Il est
possible, que cette isoforme, même si elle est visiblement très peu présente (indétectable par
RT-PCR et dépôt sur gel) ait une fonction alternative.
130
RESULTATS
Des isoformes d‟épissage alternatif ont également été détectées pour PPR14, cependant
comme le montre la Figure 26, il est fort possible que celles-ci n‟existent pas réellement et ne
soient finalement que le résultat d‟un artefact lors de la synthèse du premier brin d‟ADNc ou
de la PCR. En effet au niveau de chacune des jonctions des sites d‟épissage putatifs, on trouve
des séquences identiques de 7 et 9 nucléotides (marquées en rouge sur la Figure 26). Lors de
la synthèse d‟ADNc, il est possible que ces séquences s‟hybrident, éliminant ainsi la séquence
interne. Il serait nécessaire d‟effectuer une synthèse d‟ADNc avec de la Superscript III pour
laquelle la température de synthèse est de 50ºC (au lieu de 42ºC pour la Superscript II) afin de
vérifier si ces formes sont conservées à cette température plus haute et s‟il s‟agit, ou non, de
formes probables d‟épissage alternatif. Faute de temps, cette expérience n‟a pas été réalisée.
Quoi qu‟il en soit ces formes pourraient également résulter d‟événements moléculaires liés à
la PCR qu‟il sera plus difficile d‟éliminer simplement.
Figure 26 : Isoformes detectées pour PPR14. En majuscule sont décrites les zones non épissées. En
rouge, les nucléotides dont la séquence identique pourrait créer des artéfacts lors de la réaction de
transcription inverse de synthèse d‟ADNc ou au cours de la PCR sur ADNc.
En conclusion, cette analyse n‟est pas encore terminée et d‟autres clonages doivent être
entrepris, cependant, sur les 48 gènes PPR sélectionnés, il a été possible de montrer qu‟au
moins 4 gènes, OTP43, PPR15, PPR24 et PPR47 présentent des formes alternatives
d‟épissage. Ces données préliminaires montrent à nouveau que cet événement n‟est pas isolé,
et doit donc jouer un rôle soit dans la régulation de l‟expression, soit dans l‟élaboration de
nouvelles protéines fonctionnelles.
Faute de temps, malheureusement cette expérience n‟a jamais été complètement terminée.
Mais, il a tout de même été possible de caractériser deux nouveaux cas et aussi de montrer
que des artefacts pouvaient avoir lieu au cours de la synthèse du premier brin d‟ADNc.
131
RESULTATS
II.3.3 Cas d’OTP43 et de ses différentes isoformes
II.3.2.1 Identification des isoformes par RT-PCR
OTP43, comme il a été décrit auparavant, est une protéine PPR de type « Pure », dont la
fonction dans l‟épissage en trans de l‟intron 1 de nad1 a été montrée (de Longevialle, Meyer
et al. 2007). Cette protéine PPR fait partie des 48 PPR sélectionnées lors de l‟étude
préliminaire de la détection des formes alternatives d‟épissage par RT-PCR. Un intérêt majeur
étant porté à celle-ci, une étude plus approfondie a été entreprise. L‟annotation TAIR 9
propose l‟existence d‟au moins une isoforme. En effet, alors qu‟une annotation manuelle de
ce gène décrit un gène sans intron, l‟annotation basée sur le séquençage d‟un ADNc propose
un gène présentant un intron dans la région 3‟ du gène. Plusieurs logiciels de prédiction de
sites alternatifs d‟épissage sont disponibles en ligne. En utilisant le logiciel NNSPLICE
version 9.0 (http://www.fruitfly.org/seq_tools/splice.html), deux sites donneurs et deux sites
accepteurs sont détectés et permettent de prédire 5 isoformes possibles pour l‟ARNm otp43.
Une
analyse
similaire
en
utilisant
le
logiciel
ASSP
(http://www.es.embnet.org/~mwang/assp.html), permet de prédire deux sites donneurs
constitutifs, un site accepteur constitutif et un autre site accepteur alternatif. Ces sites
correspondent aux sites décrits en utilisant le premier logiciel. Ces données in silico montrent
que le transcrit d‟OTP43 pourrait avoir au moins 5 isoformes possibles. Afin de vérifier
l‟existence de la forme pleine longueur sans intron et de trouver les autres formes prédites par
les logiciels de prédiction, une RT-PCR, suivie d‟un clonage en pGEMT easy et de
séquençage ont été effectués sur les transcrits d‟OTP43.
Après le séquençage de nombreux plasmides, j‟ai pu identifier 4 isoformes correspondants
à OTP43 (figure 27), mais étrangement je n‟ai pas réussi à cloner la forme décrite dans la
collection d‟ADNc sous TAIR9, représentée dans la Figure 27 par le transcrit noté otp43-2.
Comme le montre le gel (figure 27A), ces différentes formes ne sont pas présentes de manière
équivalente. La forme prédominante est la forme pleine longueur sans épissage et les autres
formes sont moins représentées.
Parmi les 5 isoformes, quatre ont la même phase de lecture que le transcrit non épissé
(OTP43-1, OTP43-2, OTP43-3, OTP43-4). Ces isoformes après traduction codent pour des
protéines ayant des extrémités N- et C-terminales identiques mais présentant des délétions de
motifs plus ou moins importantes selon l‟épissage. La dernière isoforme, OTP43-5, est
l‟isoforme la plus courte et est issue de l‟épissage entre le premier site donneur et le dernier
site accepteur. Ce processus crée un changement de phase de lecture et conduit à l‟apparition
d‟un codon de terminaison de la traduction prématuré. Ce codon se situe à moins de 50
nucléotides de la fin du transcrit, suggérant que ce transcrit n‟est éventuellement pas dégradé
via la voie NMD et pourrait être traduit.
Il existe cinq isoformes différentes pour OTP43, en revanche seule la forme non épissée est
« fortement » exprimée. Toutes ces expériences ont été réalisées à partir d‟ARN extrait de
feuilles. L‟épissage alternatif est un événement qui peut se produire selon le stade de
développement, selon les organes ou lors de conditions de stress. J‟ai voulu rechercher quelle
est la proportion des différentes isoformes d‟OTP43 dans différents organes et si l‟on pouvait
observer une accumulation ou disparition de certaines formes selon les organes examinés.
Afin de commencer à apporter un début de réponse à cette question, j‟ai réalisé une RTPCR en utilisant des ARN provenant de différents organes et les oligonucléotides « start » et
« stop » d‟OTP43. Comme il est montré sur la Figure 28, dans cette expérience, il semble que
la proportion des différents isoformes diffère selon l‟organe.
132
RESULTATS
Figure 27 : Isoformes issues d‟épissage alternatif du transcrit OTP43. A. PCR sur ADNc avec les
amorces « Start » et « Stop » correspondants à OTP43. B. Représentation schématique des 5 isoformes
avec la position des sites donneurs et accepteurs d‟épissage.
Figure 28 : Caractérisation des différents transcrits otp43 dans différents organes d‟Arabidopsis.
RT-PCR à partir d‟ARN extraits de cotylédons, de feuilles, d‟apex, de feuilles caulinaires ou de
boutons floraux. La PCR sur ADNc est faite en présence des amorces « start » et « stop » d‟OTP43. 10
µl sont déposés sur un gel TAE contenant 1,2% d‟agarose. Le marqueur de taille est du « 1kb DNA
ladder » de chez Biolabs (ref : N3232L).
L‟isoforme OTP43-5 n‟est présente que dans les cotylédons, les feuilles caulinaires et les
boutons floraux. Alors qu‟elle est fortement diminuée dans les feuilles, elle n‟est pas
détectable au niveau de l‟apex. L‟isoforme OTP43-4 ne semble être détectable que dans les
133
RESULTATS
cotylédons et la forme OTP43-3 est présente dans l‟apex, les feuilles caulinaires et les boutons
floraux. En parallèle, OTP43-1 n‟est pas exprimée de façon équivalente dans tous les organes,
alors qu‟elle est fortement exprimée au niveau de l‟apex et des feuilles caulinaires, son
expression est diminuée dans les boutons floraux. Ainsi la forme OTP43-5 est la plus
abondante dans les boutons floraux alors que dans tous les autres organes testés, c‟est la
forme pleine longueur sans épissage qui domine. Ces premières données suggèrent qu‟il
existe une régulation de l‟épissage alternatif dans les organes. Malheureusement, une
répétition de cette expérience n‟a pas été très concluante et m‟a conduit à envisager une
approche plus quantitative. Afin de démontrer l‟existence d‟une régulation de l‟épissage du
transcrit OTP43, une autre approche « semi-quantitative » par northern blot ou par PCR
quantitative serait en effet plus judicieuse. En utilisant des oligonucléotides chevauchant les
différentes régions de jonction exon-exon après épissage, j‟ai essayé de quantifier les
différentes isoformes, mais, malheureusement, certains oligonucléotides n‟étant pas
compatibles avec la PCR quantitative et la majorité des produits PCR étant amplifiés trop
tardivement, je n‟ai pas été capable d‟obtenir des conditions permettant une quantification.
Une approche par northern blot devra être envisagée dans le futur pour confirmer ces
résultats.
II.3.2.2 Preuves de traduction des différents transcrits :
La détection de ces différents transcrits ne signifie pas que tous vont être traduits et coder
ainsi pour différentes protéines. Néanmoins, il faut remarquer que la majorité d‟entre eux
conservent les mêmes codons d‟initiation et de terminaison de la traduction ce qui rend plus
probable leur traduction. Il est possible que ces isoformes d‟ARNm aient juste un rôle dans la
régulation de l‟expression d‟OTP43. Et il est donc nécessaire de vérifier leur existence en tant
que « protéine ». Dans les différentes bases de données de protéomiques, aucune donnée
concernant OT43 n‟est disponible, ainsi aucun peptide spécifique de cette protéine n‟a été
séquencé par spectrométrie de masse (ce résultat illustre à nouveau la faible expression des
protéines PPR). Cependant, OTP43 a fait l‟objet, comme nous en discuterons ultérieurement,
d‟une expérience de TAP-TAG dans le but d‟identifier ses partenaires protéiques éventuels.
Une surexpression dans des cellules d‟Arabidopsis de la protéine étiquetée en C-terminal,
nous a permis de la purifier sur colonne d‟affinité et de séquencer par spectrométrie de masse
les protéines co-purifiées avec notre protéine d‟intérêt. Au cours de ce séquençage, un certain
nombre de peptides spécifiques d‟OTP43 ont été observés, mais également des peptides
spécifiques de certaines isoformes. La figure 29 montre un alignement protéique entre les
différentes isoformes possibles d‟OTP43 ainsi que les zones spécifiques permettant de
différencier les différentes isoformes. Aucun peptide permettant d‟identifier un épissage de la
zone A n‟a pu être détecté, en revanche un peptide spécifique de cette zone A permettrait de
prouver sa rétention dans certaines isoformes (OTP43isoform1 et OTP43isoform2). La zone
B est présente pour les isoformes 1 et 3 (OTP43isoform1 et OTP43isoform3) et est absente
pour les isoformes 2 et 4 (OTP43isoform2 et OTP43isoform4). Deux peptides indiqués en
rouge au niveau de cette zone dans la figure 29 permettent de distinguer entre ces deux types
d‟isoformes et la conjugaison entre la présence et l‟absence de la zone A et la zone B selon les
zones où le séquençage a eu lieu sur le gel, permettent de préciser la présence ou l‟absence de
telle ou telle isoforme. Ainsi, dans la zone des 35kDa sur le gel SDS-PAGE, le peptide
spécifique de la zone B est détecté alors qu‟il n‟y a aucune présence de la zone A. Seuls les
peptides après cette zone sont détectés. Il est possible que cette protéine corresponde à
l‟isoforme OTP43-isoform3 mais avec une dégradation en N-terminal. Dans la zone des 42
kDa, aucun peptide spécifique des zones A et B n‟est détecté, en revanche le peptide
spécifique de l‟absence de la zone B est trouvé. Ceci correspond donc à l‟isoforme
OTP43isoform4 avec un poids moléculaire théorique de 42,1 kDa. Dans la zone des 55 kDa,
134
RESULTATS
nous avons une preuve de la présence de la zone A et de l‟absence de la zone B,
correspondant donc à l‟isoforme OT43isoform2 avec un poids moléculaire théorique de 54,4
kDa. Enfin dans la zone supérieure, nous retrouvons l‟isoforme OTP43isoform1 provenant de
la traduction du transcrit non épissé. Dans cette expérience, il n‟a pas été possible d‟identifier
l‟isoforme la plus courte. En effet, cette isoforme présentant un codon de terminaison de la
traduction prématuré, l‟étiquette en C-terminal n‟est pas traduite. Cette isoforme n‟est donc
pas étiquetée et ne peut donc être purifiée. En revanche, les 4 autres isoformes, en phase avec
l‟étiquette, ont pu être mises en évidence au niveau protéique démontrant ainsi une traduction
de chacune d‟entre elles dans ce système d‟expression constitutif. Nous n‟avons
malheureusement jamais réussi à produire des anticorps dirigés spécifiquement contre OTP43,
mais ceux-ci seraient très utiles pour tenter de détecter les différentes isoformes chez une
plante sauvage ayant un niveau d‟expression normal du transcrit otp43. Cependant une
alternative à ce système pourrait être de complémenter le mutant otp43 avec une forme
étiquetée d‟OTP43 sous le contrôle de son propre promoteur et de détecter les éventuelles
isoformes par western blot en utilisant un anticorps spécifique de l‟étiquette.
135
RESULTATS
Figure 29 : Alignement des différentes isoformes d‟OTP43 et définition des peptides permettant
de différencier les différentes protéines.
136
RESULTATS
II.3.2.3 Complémentation fonctionnelle avec les isoformes
OTP43 présente donc 5 isoformes, dont 4 ont pu être détectées au niveau protéique,
laissant suggérer que chacune a un éventuel rôle fonctionnel. Cette fonction est elle
importante pour la régulation de l‟expression d‟OTP43 ? Les isoformes ont-elles des
fonctions additionnelles et complémentaires dans l‟épissage en trans de l‟intron 1 de nad1 ?
Ou bien des fonctions complètement nouvelles ? Finalement, quelle est l‟isoforme nécessaire
pour l‟épissage en trans de l‟intron 1 de nad1 ?
Le mutant otp43 présente un phénotype beaucoup plus marqué que n‟importe quel autre
mutant de complexe I. Il se peut que l‟absence de la sous-unité NAD1, sous-unité importante
dans l‟ancrage du complexe dans la membrane du complexe ait un impact plus important que
n‟importe quelle autre sous-unité, mais il est aussi possible que l‟absence éventuelle des
isoformes d‟OTP43 explique une partie du phénotype.
Afin de répondre à certaines de ces questions, et d‟essayer d‟élucider la fonction de chaque
isoforme, j‟ai entrepris une complémentation fonctionnelle du mutant otp43 avec les
différentes isoformes d‟OTP43, ainsi qu‟avec une forme pleine longueur dont les sites
accepteurs d‟épissage ont été mutés par mutagénèse dirigée de telle sorte qu‟aucun événement
d‟épissage ne puisse avoir lieu.
Quatre constructions on été réalisées et ont été introduites dans un vecteur binaire pGWB2
dont l‟expression est sous le contrôle du promoteur 35S (Figure 30). La première construction
contient la forme pleine longueur ayant les sites accepteurs d‟épissage mutés (OTP43 AS sites
mutés), dans laquelle les nucléotides AG sont modifiés en AA, cette mutation ne change pas
l‟acide aminé codé par le transcrit. La deuxième contient la forme sauvage d‟OTP43 (OTP431). La troisième contient l‟isoforme dont l‟exon 2 est excisé (OTP43-3). La quatrième
contient la plus petite isoforme dans laquelle les exons 2, 3 et 4 sont excisés (OTP43-5).
Toutes ces constructions, après transfert dans une souche d‟Agrobacterium C58C1 pMP90,
ont été utilisées pour la transformation de plantes hétérozygotes pour la mutation otp43 (en
effet, les plantes homozygotes étant stériles, elles ne peuvent pas être transformées
directement). Une sélection des transformants sur kanamycine et un génotypage ont permis
d‟identifier différentes plantes homozygotes pour la mutation otp43 et portant les différentes
constructions.
Figure 30 : Schéma décrivant les différentes isoformes utilisées pour la complémentation du mutant
otp43.
Seule la construction pleine longueur d‟OTP43-1 et la forme dans laquelle les sites
accepteurs d‟épissage ont été mutés (OTP43 AS sites mutés) ont permis d‟obtenir des plantes
homozygotes pour la mutation otp43 et présentant un phénotype « sauvage ». Ce résultat
montre que ces constructions sont capables de complémenter fonctionnellement la mutation
otp43. Cette première observation permet de montrer que la forme pleine longueur sans
épissage permet la complémentation fonctionnelle du mutant. Cependant, une analyse par RTPCR de l‟ARN extrait à partir de deux plantes homozygotes pour l‟insertion Sail867F07
complémentées avec la forme mutée a mis en évidence des produits d‟amplification très
137
RESULTATS
similaires aux différentes isoformes (gel non présenté). Une identification de ces bandes sera
nécessaire pour conclure (ou non) sur la capacité de la forme pleine longueur seule à
complémenter le phénotype.
En parallèle, aucune plante homozygote pour l‟insertion Sail_867F07 n‟a été identifiée lors
de la sélection des plantes transformées avec les deux autres isoformes (OTP43-3 et OTP435). La descendance d‟une plante hétérozygote pour l‟insertion Sail867F07 contenant le
transgène a été semée sur milieu ½ MS contenant 1% de saccharose. Sur les 216 graines
semées pour la complémentation par OTP43-5, 149 graines germent normalement, et 56 ont
un phénotype de germination retardée similaire au mutant otp43 (germination deux semaines
après le « sauvage »). 48 plantules parmi les 149 germant normalement ont été transférées en
terre et génotypées. Aucun homozygote pour l‟insertion Sail867F07 n‟a été identifié. En
revanche il a été possible de sélectionner un certain nombre de mutants portant la construction
codant pour l‟isoforme OTP43-5 parmi les 56 graines ayant germé tardivement. Ainsi, parmi
les 35 plantules génotypées, 19 portent la construction et 3 autres sont seulement
homozygotes pour l‟insertion Sail867F07. Cependant aucune complémentation du phénotype
macroscopique n‟a été observée, suggérant que cette isoforme n‟a pas de rôle dans l‟épissage.
Figure 31 : Photographies de plantes homozygotes pour la mutation otp43 (Sail867F07) portant la
construction OTP43-5. Le phénotype de plantes homozygotes et hétérozygotes pour la mutation est
également présenté.
En ce qui concerne la complémentation par l‟isoforme OTP43-3, parmi les 161 graines
semées issues d‟un hétérozygote, 125 germent normalement et 22 seulement ont germé
tardivement. 48 plantules sur les 125 ont été génotypées et aucun homozygote n‟a été détecté,
en revanche, 38 plantes étaient hétérozygotes pour la mutation et 5 de génotype « sauvage » ;
elles contenaient toutes le transgène. Sur les 22 plantules ayant germé tardivement, 16 ont été
transférées en terre et seulement une plantule présentant le phénotype du mutant otp43 était
homozygote et portait le transgène, 13 étaient des mutants otp43 et 2 plantes étaient de type
sauvage. Il est assez étrange que la proportion d‟homozygotes portant le transgène soit si
faible alors que dans les 48 plantes de type sauvage genotypées toutes montrent la présence du
transgène. Ce résutat très étonnant suggère fortement qu‟il y ait eu un problème au cours du
génotypage et ces expériences sont donc à refaire.
138
RESULTATS
Il reste beaucoup d‟analyses avant de comprendre quel est le rôle de chaque isoforme.
Grace aux différentes expériences de complémentation, on peut penser que l‟isoforme OT435 ne complémente pas le phénotype macroscopique d‟otp43, suggérant donc que cette
protéine n‟a pas de fonction dans l‟épissage de l‟intron1 de nad1. Néanmoins, le fait que la
descendance d‟une seule plante transgénique ait été analysée ne permet pas de conclure
définitivement. Pour les isoformes OTP43-3 et OTP43-4 (de façon indirecte), une seule plante
homozygote pour l‟insertion de l‟ADN-T ayant le transgène a été obtenue et le phénotype
n‟est pas complémenté. L‟étude d‟autres plantes est nécessaire, mais il semblerait que ces
deux isoformes ne sont pas non plus impliquées dans l‟épissage. Des confirmations sont
nécessaires afin de déterminer quelle isoforme est responsable de l‟épissage de l‟intron 1 de
nad1. La complémentation avec la forme pleine longueur mutée sur les sites accepteurs
d‟épissage complémente le phénotype, mais il semblerait que l‟épissage alternatif ait encore
lieu. Rien ne permet pour le moment de savoir laquelle des ces deux isoformes OTP43-1 et
OTP43-2 est impliquée dans ce processus. Et il reste donc à découvrir quelle est la fonction de
chaque isoforme et si elles en ont une.
Mise à part OTP43-5, pour lequel il n‟a pas été possible de vérifier sa présence au niveau
protéique, toutes les autres isoformes sont traduites. Ces différentes isoformes ne sont donc
pas prises en charge majoritairement par une voie de dégradation de l‟ARN et leur rôle ne
semble pas être dans la régulation de l‟expression d‟OTP43. De plus, il faut noter qu‟au moins
pour les formes OTP43-3, -4 et -5, la surexpression n‟a aucun impact phénotypique lorsque
ces isoformes sont exprimées dans un fond génétique sauvage ou hétérozygote.
Il n‟est pas encore possible de définir un rôle pour chaque isoforme d‟OTP43, mais il est
cependant possible d‟émettre quelques hypothèses. En vue du phénotype plus marqué du
mutant otp43 comparé à d‟autres mutants de complexe I, il est possible que certaines
isoformes aient un rôle important autre que dans l‟épissage de l‟intron 1 de nad1, comme par
exemple dans la maturation des graines ou dans la germination. Cependant il n‟a pas encore
été montré qu‟une seule forme est nécessaire pour l‟épissage et il est également possible que
l‟isoforme OTP43-2 ait un rôle complémentaire dans la reconnaissance des deux parties de
l‟intron1.
Tous ces résultats de complémentation sont préliminaires et une dernière vérification qui
n‟a malheureusement pas été encore faite permettra de pouvoir conclure sur le rôle de
certaines isoformes. En effet l‟insertion de l‟ADN-T du mutant otp43 se situe 130 pb avant le
codon de terminaison de la traduction, et est donc dans la dernière séquence de 87 nucléotides
qui peut être excisée. Si cette insertion n‟a pas d‟impact sur l‟épissage, alors 3 isoformes
peuvent exister dans le mutant, OTP43-2, OTP43-4 et OTP43-5. Cette hypothèse pourrait
expliquer le fait que l‟on observe des bandes chez les plantes complémentées avec la forme
mutée.
139
RESULTATS
II.4 Identification de partenaires des protéines PPR
A ce jour, environ 10% des protéines PPR d‟Arabidopsis ont été plus ou moins
caractérisées. Leurs fonctions dans l‟expression, la maturation des ARN ou la traduction sont
très spécifiques et ne nécessitent visiblement, dans la majorité des cas, aucun autre facteur.
Cependant, la plupart des caractérisations a été faite par une approche de génétique inverse et
très peu de données de type « interaction protéique » ont été obtenues. Certains résultats
permettent néanmoins de proposer que, probablement en fonction de leur rôle, certaines
protéines PPR sont associées à d‟autres facteurs ou font partie de complexes protéiques. C‟est
le cas de PTAC2 qui est associé au complexe actif transcriptonnel dans les chloroplastes
(Pfalz, Liere et al. 2006), de GRP23 qui interagit avec la sous-unité III de l‟ARN polymerase
II (Ding, Liu et al. 2006), de PPR40 visiblement associée au complexe III mitochondrial
(Zsigmond, Rigo et al. 2008) et encore de PPR5 associée à un complexe ribonucléoprotéique
(Beick, Schmitz-Linneweber et al. 2008). Ces résultats d‟interactions montrent que les
protéines PPR peuvent en plus de leur reconnaissance à l‟ARN, établir des interactions
protéiques ou être associées à des complexes. Pour ces protéines, mise à part PPR5, la
fonction moléculaire n‟est pas encore élucidée. Qu‟en est il des autres protéines PPR
impliquées dans l‟épissage ou dans l‟édition des ARNm ? Il a été montré par des expériences
de RIP-CHIP que certaines protéines PPR, telles que PPR4 et PPR5 sont liées directement à
des séquences spécifiques au sein de l‟intron, permettant certainement la mise en place de la
structure secondaire optimale de l‟intron pour les deux étapes de trans-esterification.
Contrairement à PPR5, il semblerait que PPR4 ne soit pas lié au complexe d‟épissage mais
aucune donnée ne permet de dire qu‟aucune interaction n‟existe.
Dans l‟optique de mieux comprendre comment les protéines PPR fonctionnent, il est
important de connaître les interactions de type protéine-protéine pour chacune. Ces
informations permettront de mieux comprendre les mécanismes de régulation de l‟expression
du génome des organites et de découvrir de nouveaux facteurs impliqués.
Ce type d‟information est malheureusement difficile à obtenir pour le moment, mais des
projets d‟interaction protéine-protéine comme le test matriciel systématique de plus de 10 000
protéines d‟Arabidopsis en système double hybride chez la levure effectué actuellement dans
le laboratoire de Marc Vidal à Boston vont permettre de révéler un grand nombre
d‟interactions. Ces données ne sont pas encore rendues publiques, mais par l‟intermédiaire
d‟une collaboration du laboratoire de Claire Lurin avec ce grand projet NSF, nous avons eu
accès aux premiers résultats. Parmi les protéines PPR faisant partie de la première matrice
d‟étude, certaines interagissent avec une ou plusieurs protéines autres que des protéines PPR
ouvrant ainsi un nouveau champ d‟étude. Malheureusement toutes ces interactions observées
ne concernent pas nos candidats ou des protéines PPR déjà identifiées, en revanche ce seront
d‟excellents candidats pour des études de caractérisation à venir.
Pour nos protéines candidates à la fois impliquées dans l‟épissage ou dans l‟édition, il était
donc important de trouver une méthode nous permettant d‟identifier potentiellement des
candidats d‟interaction. Que ces protéines fassent parties d‟un important complexe protéique
ou juste présente une simple interaction binaire avec une unique autre protéine, une des
méthodes les plus appropriées est une approche de purification des protéines d‟intérêt
marquées par TAP-TAG. C‟est donc dans ce cadre que nous avons établie une collaboration
avec Geert De Jaeger au VIB à Gent (Belgique) qui a mis en place une plateforme de
purification de protéines marquées après expression dans des cultures cellulaires
d‟Arabidopsis.
140
RESULTATS
II.4.1 Méthode utilisée : TAP-TAG
La technique de « Tandem Affinity Purification » de protéines étiquetées (TAP-TAG) est
une technique qui est de plus en plus utilisée dans la recherche de partenaires mais surtout
dans l‟identification de complexes protéiques car les interactions observées ne sont pas
seulement binaires comme dans la plupart des autres techniques d‟interactions protéineprotéine utilisées. Grace aux adaptations qui ont été apportées dans l‟équipe de Geert De
Jaeger, cette méthode a été optimisée dans des cultures cellulaires d‟Arabidopsis et permet
d‟obtenir une purification avec un minimum de protéines non-spécifiques grâce à l‟utilisation
de deux purifications successives différentes avec des étiquettes adaptées (Van Leene, Witters
et al. 2008). Le vecteur GATEWAY d‟expression utilisé, décrit dans le papier de Van Leene
et al., permet une fusion en C-terminal de la proie avec la construction GS-TAG qui
comprend deux domaines « IgG-binding » de la protéine G et un peptide de liaison à la
streptavidine SBP séparés par un site de clivage à la protéase de type TEV. Une première
purification sur colonne en présence de streptavidine permet d‟éliminer un grand nombre de
protéines n‟interagissant pas avec la proie, cette première étiquette est ensuite éliminée par la
protéase TEV et une seconde purification sur colonne en présence d‟un anticorps IgG permet
ainsi une meilleure co-purification des partenaires.
Quatre protéines PPR, deux impliquées dans l‟épissage, OTP43 et OTP51, et deux autres
dans l‟édition, CLB19 et DYW1, ont été sélectionnées et clonées dans un vecteur d‟entrée
pDONR221 sans codon stop afin de permettre une fusion en C-terminal (Figure 32). Parmi les
quatre, seul le gène codant pour OTP51 n‟a pas pu être cloné malgré trois tentatives. Les
expériences de TAP-TAG se sont donc limitées aux trois autres. La réaction de recombinaison
LR a été faite à Gent ainsi que les transformations de cellules d‟Arabidopsis et le reste des
purifications et analyses.
Figure 32 : Résumé du protocole adopté pour les expériences de TAP-TAG réalisées pour OTP43,
CLB19 et DYW1.
141
RESULTATS
Comme décrit dans l‟article de Van Leene, Witters et al, après transformation, les cellules
transformées et sélectionnées sur antibiotiques sont mises en culture et une purification
protéique est alors faite sur l‟extrait cellulaire total. Après deux purifications successives, une
élution permet de récupérer l‟éluât comprenant la proie avec ses éventuels partenaires
associés. Cet éluât est alors déposé sur un gel SDS-PAGE afin de dissocier toutes les
protéines présentes. Puis le gel est fractionné en 48 bandes qui sont envoyées pour le
séquençage par spectrométrie de masse. Deux extractions indépendantes et analyses ont été
faites pour chaque construction.
En parallèle, afin d‟évaluer si les constructions chimériques étaient encore fonctionnelles,
j‟ai effectué une complémentation des mutants otp43, clb19 et dyw1. Ainsi, j‟ai pu montrer
que la fusion des protéines OTP43 et CLB19 en C-terminal avec les deux étiquettes ne
modifie pas leur fonction car ces deux constructions complémentent le phénotype
macroscopique des deux mutants. En revanche, il semblerait qu‟aucune complémentation
fonctionnelle n‟a lieu dans le cas de DYW1 car tous les homozygotes contenant la
construction chimérique présentent toujours le même défaut moléculaire.
II.4.2 Partenaires d’OTP43
Cette expérience de TAP-TAG réalisée sur OTP43 nous a permis dans un premier temps
de vérifier la présence des isoformes d‟épissage alternatif décrits précédemment. Sur les cinq
isoformes décrites, les données de séquençage par spectrométrie de masse permettent d‟en
identifier trois de façon certaine et une par déduction. Seule la forme la plus courte OTP43-5
n‟a pas pu être détectée (cf Chapitre II.3.2.2).
Après la double purification sur colonne décrite dans le paragraphe sur la méthode du
TAP-TAG, notre protéine étiquetée a été purifiée par élution avec ses partenaires et le tout est
déposé sur un gel SDS-PAGE (figure 33). Les résultats de séquençage de chaque bande
découpée obtenus sont alors filtrés en fonction du nombre de peptides trouvés pour chaque
protéine, du pourcentage de recouvrement, un score de confiance est attribué et toutes les
protéines ne l‟atteignant pas sont éliminées de la liste.
Enfin, les protéines contaminantes trouvées très régulièrement dans ce type d‟extraction
sont éliminées de la liste. Toutefois, si certaines d‟entre elles sont très abondantes dans une
expérience, elles sont conservées. Enfin, une comparaison est faite entre les résultats obtenus
entre les deux extraits.
Pour OTP43, une première analyse a révélé un résultat très surprenant. Alors que dans tous
les gels de TAP-TAG analysés, la bande majoritaire observée correspond toujours à la
protéine étiquetée surexprimée, dans notre expérience, cette bande ne correspond pas à
OTP43 mais à plusieurs protéines de type chaperone dites de « choc thermique » ou « Heat
Shock protein » (Figure 33). Le plus grand nombre de peptides spécifiques d‟OTP43 a été
repéré dans les fragments des bandes F3/F4/F6/F15 ainsi que H3/H4/H6 et H15. D‟autres
peptides sont identifiés ailleurs dans le gel dont certains sont spécifiques des différents
isoformes d‟OTP43. En revanche, aucun n‟a été détecté dans la zone F8 et H8, correspondant
à la bande majoritaire. Cette zone ne comprend que majoritairement des peptides spécifiques
des protéines HSP60 (AT3G23990), HSP60-2 (AT2G33210) et HSP60-3A (AT3G13860).
Dans la liste finale, ces trois protéines sont trouvées en plus d‟une autre protéine, APS1
(AT3G22890). HSP60, HSP60-2 et APS1 sont considérées comme des partenaires faux
positifs, cependant leur surabondance dans les deux extraits comparée à leur présence
générale dans d‟autres extraits suggère une réelle interaction avec OTP43. Les trois protéines
HSP ont toutes été détectées dans les mitochondries par spectrométrie de masse (données sous
142
RESULTATS
SUBA), montrant une fois de plus que les résultats ne sont certainement pas des artefacts.
Cependant leur lien avec OTP43 n‟est pas très clair à première vue.
Figure 33 : SDS-PAGE des extraits de TAP-TAG sur OTP43. Les protéines des deux extraits,
TAP OTP43-1 et TAP OTP43-2, ont été séparées en fonction de leur masse moléculaire. Chaque piste
de gel, découpée en 48 fragments (E1 à F24 pour TAP OTP43-1 et G1 à H24 pour TAP OTP43-2) a
été analysée par spectrométrie de masse.
Les protéines de choc thermique sont directement impliquées dans la mise en place de la
structure tertiaire et quaternaire des protéines nouvellement synthétisées dans les
mitochondries mais elles ont aussi un rôle dans l‟import de protéines cytoplasmiques dans les
mitochondries et dans leur structure. Par cette fonction primordiale dans le fonctionnement et
l‟activation de celles ci, ces protéines sont responsables de la maintenance de la conformation
du pool protéique face à des réponses au stress.
Il est fort possible qu‟OTP43 et ses différents isoformes nécessitent une conformation bien
précise une fois intégrées dans les mitochondries afin d‟être pleinement fonctionnelles. Les
protéines HSP60 sont généralement très présentes dans les expériences de TAP-TAG du fait
de leur fonction dans la conformation protéique et dans la détoxification, mais c‟est la
première fois qu‟elles sont autant représentées. C‟est également la première fois qu‟une
expérience de ce type est réalisée sur des protéines mitochondriales au VIB. Et il est donc
possible que cette surreprésentation de ces HSP60 dans les extraits soit tout à fait liée à la
surexpression d‟une protéine importée dans les mitochondries et non spécifiquement à celle
d‟OTP43. Il serait intéressant lors de futures expériences de TAP-TAG sur des protéines
mitochondriales de voir quelle est la proportion de HSP60 dans les extraits.
L‟autre protéine trouvée associée à OTP43 est APS1 (pour ATP sulfurylase 3), une
enzyme impliquée dans la voie d‟assimilation du sulfate. Cette protéine, contrairement aux
143
RESULTATS
HSP60, est décrite dans les chloroplastes et des données de spectrométrie de masse le
confirment sous SUBA. Cette protéine est elle-aussi considérée comme faux positif, et il est
fort possible qu‟il n‟existe pas une réelle interaction avec OTP43.
En conclusion de ces analyses, peu de protéines passant les différents critères d‟analyse
sont décrites associées à OTP43, et les seules trouvées n‟ont probablement pas de lien direct
avec la fonction d‟épissage dans les mitochondries. OTP43 n‟est probablement pas associé à
un complexe protéique et notre approche n‟a pas permis de montrer l‟importance d‟un autre
facteur dans l‟épissage de l‟intron 1 de nad1.
II.4.3 Partenaires de DYW1
Une des actions des protéines PPR qui a été discutée dans l‟introduction est l‟édition des
ARN des chloroplastes et des mitochondries. Le mécanisme enzymatique d‟édition n‟a pas
encore été élucidé dans les organites, mais à partir des données sur les facteurs impliqués
identifiés à ce jour, un modèle peut être proposé.
Seules les protéines PPR de type E, E+ et DYW ont un rôle dans l‟édition. Dans ce
modèle, les motifs PPRs permettent une reconnaissance spécifique de l‟ARNm cible et c‟est
grâce au motif DYW que l‟édition a lieu du fait de la présence d‟un motif similaire à la
cytidine désaminase (Salone, Rudinger et al. 2007), motif qui aurait donc la fonction de
désaminer une Cytidine en Uridine. Les protéines PPR E et E+ impliquées dans l‟édition
n‟ont pas ce motif DYW en C-terminal et semblent donc nécessiter un facteur enzymatique
additionnel, par exemple un partenaire de type DYW, pour que la réaction catalytique puisse
avoir lieu. Une des protéines de ce type que nous avons longtemps supposée comme étant le
partenaire de toutes les protéines E et E+ impliquées dans l‟édition est DYW1 (At1g47580).
Cette protéine PPR, assez spéciale est composée de très peu de motifs PPR et d‟un motif
DYW très conservé mais sans motifs E et E+.
C‟est donc dans l‟optique de confirmer notre modèle, que nous avons envisagé des
expériences de TAP-TAG sur DYW1. Malheureusement une contamination sur les cultures a
retardé la suite des expériences et nous n‟avons toujours pas de résultats permettant de
montrer quels sont les partenaires de cette protéine.
Cependant, des résultats récents obtenus dans le cadre de la thèse de Clément Boussardon,
semblent indiquer que cette protéine serait impliquée uniquement dans l‟édition d‟un site
chloroplastique, ndhD-1. Une autre protéine PPR, CRR4 est un facteur essentiel de l‟édition
de ce site (Okuda, Nakamura et al. 2006). Et il apparait donc que deux protéines PPR sont
essentielles à l‟édition de ce site. CRR4 est une protéine PPR de type E, n‟ayant pas le motif
E+ et de motif DYW décrit comme portant l‟activité catalytique. Ainsi, pour le site ndhD-1,
un modèle peut être dessiné. CRR4 permettrait la reconnaissance spécifique du site ndhD-1 et
DYW1 se liant à CRR4 apporterait l‟activité catalytique nécessaire à l‟édition. L‟intéraction
est en cours de validation par des techniques de split-luciferase et de split-YFP, mais les
futures données de TAP-TAG permettront également de confirmer ce nouveau modèle.
II.4.4 Partenaires de CLB19
Les nouvelles données sur DYW1 modifient en grande partie notre premier modèle, mais
le modèle d‟association entre une protéine E ou E+ sans motif DYW avec une protéine DYW
est toujours d‟actualité. Il fallait donc trouver quelles sont les protéines DYW susceptibles de
se lier avec les autres PPR E et E+ impliquées dans l‟édition afin de redessiner notre modèle
sur l‟édition. Ainsi une stratégie de type « TAP-TAG » a été privilégiée, et une protéine PPR
144
RESULTATS
de type E+ a été utilisée comme proie. CLB19, première PPR caractérisée au laboratoire
comme ayant un rôle dans l‟édition et impliquée dans l‟édition de deux sites chloroplastiques,
ClpP et RpoA (Chateigner-Boutin, Ramos-Vega et al. 2008), était donc un bon candidat. Les
résultats de purification par « TAP-TAG » des partenaires de CLB19 ont permis d‟identifier
sans aucune ambiguïté deux protéines associées à CLB19. Ces deux protéines sont des
protéines PPR. La première est une PPR de type « Pure », AT3G49240 renommée OTP100,
pour laquelle des mutants ont été décrits comme embryo-léthaux. La deuxième, de façon très
intéressante, est une PPR de type DYW, AT2G15690 renommée DYW2 par la suite. La
prédiction de la localisation subcellulaire n‟est pas très claire concernant ces deux protéines,
en revanche des données de spectrométrie de masse pour OTP100 et des données de
localisation en fusion GFP effectuées par Sandra Tanz à Perth pour DYW2 permettent de
proposer leur double adressage dans les chloroplastes et les mitochondries. De plus, une forte
homologie de séquence en N-terminal de OTP100 avec GRP23 (figure 34) suggère une
éventuelle localisation dans le noyau.
Figure 34 : Alignement grâce au logiciel Multalin des protéines GRP23 et OTP100 (« Pure »PPR).
La région NLS est surlignée en vert et la région de liaison à l‟ADN (Leucine Zipper motif) en bleu.
Au niveau de l‟expression, les deux gènes, OTP100 et DYW2 sont relativement co-régulés
comme le montre la figure 35, suggérant que les deux protéines codées par ces deux gènes
pourraient avoir une fonction similaire au sein des organites.
145
RESULTATS
Figure 35 : Analyse de l‟expression des gènes OTP100 et DYW2 grâce au logiciel « Genecat ».
L‟expression a été normalisée de 0 à 1.
Afin de tester si ces deux protéines sont associées à CLB19, et potentiellement impliquées
dans l‟édition des deux sites dans les transcrits rpoA et clpP, une approche par génétique
inverse a été entreprise. Des mutants d‟insertion ADN-T ont été commandés, semés et
génotypés. Pour le moment, aucun homozygote pour aucune des lignées n‟a pu être obtenu.
Ces deux protéines semblent donc essentielles pour la survie de l‟embryon (ou éventuellement
d‟un des gamètes) ce qui n‟est pas compatible avec une fonction unique dans l‟édition des
mêmes sites que CLB19 ; en effet le mutant clb19, quoique très affecté, est viable. Une
première analyse des siliques prélevées sur des plantes hétérozygotes montre deux types de
populations de graines : des graines de type « sauvage » et des graines blanches et plus
petites. Plusieurs essais de germination en condition in vitro n‟ont pas permis d‟obtenir la
germination d‟homozygotes et des expériences de « sauvetage d‟embryons » sont en cours.
Afin de confirmer les interactions, des expériences de test d‟interaction protéine-protéine
par le biais de la technique de split-luciférase et de split-YFP sont également en cours. Ces
expériences nous permettront ainsi de tester les interactions binaires.
En addition, Clément Boussardon met au point actuellement un essai d‟édition in vitro en
utilisant les extraits purifiés par TAP-TAG sur CLB19 et, en parallèle, il tente de reconstituer
un complexe minimal par expression en système bactérien.
Grace à ces nouvelles données, un nouveau modèle a été élaboré (Figure 36). La protéine
DYW2, est une PPR d‟un type DYW assez particulier, assez proche de DYW1. En effet,
contrairement à la plupart des protéines de type DYW, mais de façon similaire à DYW1, elle
146
RESULTATS
n‟a pas de motifs E et E+ et est composée seulement de quelques motifs PPR en plus de son
motif DYW très conservé (figure 37). Il est donc proposé que cette protéine doublement
adressée se lie à certaines protéines E ou E+ impliquées dans l‟édition au niveau
chloroplastique et mitochondrial (Figure 36). Ainsi, ces protéines E/E+ reconnaitraient de
façon spécifique les molécules d‟ARN à éditer et DYW2 apporterait l‟activité catalytique
nécessaire pour l‟édition dans certains cas. Ce nouveau modèle est assez similaire au
précédent mais une spécificité de l‟interaction « protéine PPR-E »-« protéine DYW »
semblerait exister. Par ailleurs, le rôle de la PPR « Pure » OTP100 dans ce complexe reste à
être élucidé.
Figure 36 : Modèle d‟édition faisant intervenir DYW2, une protéine E+ et la « Pure » PPR
OTP100.
Figure 37 : Composition de la protéine DYW2.
147
CONCLUSION ET DISCUSSION GENERALE
CHAPITRE III : CONCLUSION ET DISCUSSION GENERALE
III.1 Les protéines PPR, des facteurs d’épissage intron spécifique :
Depuis la mise en place de l‟outil de détection des événements d‟épissage chloroplastiques
et mitochondriaux par PCR quantitative, d‟autres protéines PPR ont pu être caractérisées.
Figure 38 : Facteurs d‟épissage chloroplastiques. Les introns marqués par un astérisque sont les
introns présents chez Arabidopsis mais absents chez les monocotylédones comme le maïs (Figure
contenant des résultats non publiés du laboratoire actualisée à partir de celle de l‟article Falcon et al,
2010).
148
La figure 38 présente les facteurs d‟épissage chloroplastiques identifiés à ce jour. Quatre
facteurs de type PPR, OTP51, OTP52, OTP70 et PPR5, ont été caractérisés en plus de PPR4
et de HCF152. A l‟exception d‟OTP52 nécessaire dans l‟épissage de deux introns, les cinq
autres protéines PPR sont indispensables pour l‟épissage d‟un seul intron.
Au niveau mitochondrial, les recherches effectuées dans le domaine ont permis d‟établir
une carte de l‟épissage un peu plus détaillée qu‟il y a quatre ans. A ce jour, 9 à 10 facteurs ont
été caractérisés (figure 39) dont 4 protéines PPR, OTP43, BIR6, OTP439, TANG2,
indispensables ou quasiment indispensables pour l‟épissage d‟introns, et une protéine PPR,
PPR40 influençant l‟efficacité de l‟épissage de certains introns. Comme pour les protéines
PPR impliquées dans l‟épissage au niveau chloroplastique, la majorité des protéines PPR
identifiées dans les mitochondries dans ce processus sont spécifiques d‟un intron.
Le mécanisme d‟épissage s‟effectue par l‟intermédiaire d‟un complexe
ribonucléoprotéique visiblement différent pour chaque intron mais dont les protéines PPR
peuvent faire partie. C‟est le cas de PPR5 dont l‟interaction avec le complexe est plus de
l‟ordre d‟une interaction protéique que via l‟ARN (Beick, Schmitz-Linneweber et al. 2008).
Pour OTP43, aucune interaction avec une protéine de complexe ribonucléoprotéique n‟a pu
être identifiée par TAP-TAG, on pourrait donc penser que cette protéine a une action isolée
sur l‟épissage ; cependant des expériences supplémentaires seraient nécessaire pour affirmer
qu‟aucune interaction avec d‟autres facteurs n‟a lieu. OTP43 est impliquée dans l‟épissage de
l‟intron 1 de nad1. L‟épissage de cet intron s‟effectue en trans et nécessite donc la jonction de
deux transcrits différents. Malheureusement je n‟ai pas entrepris d‟expérience permettant de
mettre en évidence les séquences de liaison avec OTP43 car la production de protéine
recombinante a échoué du fait de l‟impossibilité d‟exprimer celle ci en système bactérien.
Cependant, on peut émettre l‟hypothèse que cette protéine ait un rôle dans la reconnaissance
des deux parties de l‟intron 1 de nad1. Cette interaction permettrait ainsi de joindre l‟intron 1
en 5‟ et l‟intron 1 en 3‟ afin que le complexe ribonucléoprotéique se forme. Cette même
hypothèse peut également être proposée pour les autres introns en trans pour lesquels une
protéine PPR est essentielle pour l‟épissage comme dans le cas de PPR4 et de l‟intron 1 de
rps12 dans les chloroplastes, par exemple.
Ces protéines PPR restent des facteurs d‟épissage à part. Leur reconnaissance spécifique
d‟un intron et d‟une séquence spécifique au sein même de l‟intron comme il a été montré pour
PPR5 (Beick, Schmitz-Linneweber et al. 2008; Williams-Carrier, Kroeger et al. 2008),
confèrent à ces protéines un rôle limitant de l‟épissage et donc, en quelque sorte, elles
pourraient être considérées comme des régulateurs de ce processus de maturation. Cependant
aucune donnée ne permet actuellement d‟affirmer ce dernier rôle.
Même si de plus en plus de protéines PPR sont identifiées dans l‟épissage, leur rôle dans ce
processus n‟est pas encore totalement élucidé. Comme il a été montré, certaines sont
totalement nécessaires dans ce mécanisme alors que d‟autres telles qu‟OTP439 et TANG2
facilitent uniquement ce processus. Il est possible pour ces dernières que le rôle dans
l‟épissage soit de type indirect et qu‟un défaut dans la maturation des ARN pré-messagers, ou
dans leur stabilisation va influencer l‟efficacité de l‟épissage comme c‟est le cas de HCF152
(Meierhoff, Felder et al. 2003).
Pour les autres protéines PPR essentielles dans l‟épissage, la reconnaissance spécifique de
l‟intron pourrait permettre à celui ci d‟adopter une conformation optimale afin d‟être reconnu
par d‟autres facteurs d‟épissage plus généraux (hypothèse émise dans l‟article 1). Cette mise
en place des autres facteurs établirait ainsi la conformation finale divisée en six domaines,
typique des introns de groupe II, et permettrait le mécanisme d‟épissage caractérisé par deux
étapes successives de trans-estérifications.
149
Figure 39 : Facteurs d‟épissage mitochondriaux. Les flèches en pointillés indiquent les introns
pour lesquels une diminution de l‟épissage est observée (Figure contenant des résultats non publiés du
laboratoire actualisée à partir de celle de l‟article Falcon et al, 2010).
Ce modèle n‟est pour le moment qu‟une hypothèse et, évidemment, plusieurs expériences
sont à mettre en place afin de confirmer celle-ci. Dans ce modèle, la protéine PPR est le
premier facteur se liant à l‟ARN à épisser et est donc la protéine clef pour la mise en place de
ce système. Si cette protéine n‟est pas présente, alors le complexe ribonucléoprotéique ne peut
se former. Une analyse des introns et des protéines fixées sur ces introns chez les mutants ppr
permettrait de confirmer ou de réfuter cette hypothèse. Ainsi, dans le cas de PPR5, l‟analyse
de l‟intron trnG chez le mutant ppr5 permettrait de voir si les facteurs CAF1/CRS2, CFM3,
ou encore WTF1/RNC1 sont encore liés à l‟intron de cet ARNt. La même question pourrait
être posée pour OTP52, avec les facteurs MatK, CRS1, WHY1 et WTF1/RNC1.
Une autre étude pourrait être entreprise lorsque les facteurs connus seront cristallisés. La
structure de ces protéines et la connaissance des sites de fixation permettront ainsi de
modéliser in silico l‟interaction. Cette interaction modifie probablement la structure
secondaire de l‟ARN cible et cette « reconfiguration » permettrait l‟accès à d‟autres facteurs
d‟épissage. Ainsi, en absence ou présence des PPR, on pourrait prédire l‟affinité d‟autres
facteurs d‟épissage. En effet, des études in silico permettent aujourd‟hui de prédire des
interactions avec l‟ARN et notamment pour des facteurs d‟épissage nucléaires chez l‟homme
(www.bioquanta.net). Ce type d‟étude, mené sur les PPR, permettrait ainsi de montrer
150
l‟affinité des autres facteurs sur l‟intron en présence ou en l‟absence de la PPR. Et ainsi de
montrer leur rôle primordial dans la mise en place des facteurs d‟épissage.
Tous les facteurs d‟épissage connus dans les organites ont, sauf dans le cas de CRS1,
WHY1 et des protéines PPR, au minimum deux introns cibles. Du fait de la grande
conservation des séquences nucléotidiques dans les introns de groupe II, il est fort possible
que les facteurs plus généraux reconnaissent ces zones et que les PPR reconnaissent des
parties non conservées. Ces zones moins conservées provenant de différentes mutations au
cours de l‟évolution peuvent avoir un impact sur la structure secondaire de l‟ARN, et ce serait
pour cette raison que des protéines de type PPR sont présentes afin de modifier la structure
secondaire pour l‟épissage. Ceci irait dans le sens de l‟hypothèse émise par Maier et al.
(Maier, Bozarth et al. 2008; Schmitz-Linneweber and Small 2008), qui proposent que
l‟expansion des protéines PPR serait liée aux mutations dans le génome et que ces protéines
seraient présentes en tant que suppresseur de ces mutations. En effet, le génome des organites
mute et évolue beaucoup moins rapidement que le génome nucléaire (Lynch, Koskella et al.
2006). Ainsi, lors de délétions ou de mutations, il serait plus rapide de créer des facteurs de
réparation pour lesquels les protéines PPR seraient de très bons candidats.
III.2 L’épissage alternatif, un moyen d’augmenter le nombre de protéines PPR :
Au cours de mon étude sur certains transcrits des gènes PPR, j‟ai pu identifier des formes
alternatives d‟épissage. Etrangement, ces formes sont trouvées pour des gènes dans lesquels
aucun intron n‟avait été identifié. C‟est la première fois qu‟un tel phénomène est décrit. Lors
d‟analyses de l‟épissage alternatif par des approches de séquençage haut-débit (Filichkin,
Priest et al. 2010), les gènes ne contenant pas d‟introns n‟avaient pas été considérés et il est
donc probable que ce phénomène soit en réalité plus général.
Pour les PPR, le phénomène observé est plus proche de l‟épissage alternatif de type
« rétention d‟introns » qui se trouve être très fréquent chez les plantes comparées aux
mammifères. Mais, contrairement à la majorité des transcrits observés dans ce cas, cette
rétention d‟introns dans des transcrits PPR ne crée pas généralement de codon de terminaison
de la traduction prématuré. Ainsi, dans le cas de ce que l‟on appelle généralement une
« rétention d‟intron », le modèle de gène annoté, correspondant au transcrit majoritaire, est
celui dans lequel l‟intron est épissé. La forme non épissée correspond à une « anormalité »
d‟épissage. Les pertes de séquences codantes observées pour les transcrits PPR correspondent
à un phénomène inverse, à ma connaissance jamais observé auparavant. Il est donc difficile de
classer ce phénomène puisque l‟on pourrait parler plutôt de perte d‟exon (« exon skipping »).
Afin de préciser ce nouveau phénomène, je propose de le nommer « coding region skipping ».
Le résultat de cet épissage alternatif est de produire un certain nombre de transcrits
isoformes. Comme il a été montré pour OTP43, ces ARN isoformes sont traduits, créant ainsi
une diversité et une augmentation de la famille des protéines PPR. Dans le cadre de ma thèse,
j‟ai mis en évidence le phénomène et montré l‟existence d‟un certain nombre d‟isoformes
pour plusieurs gènes PPR. Cette analyse étendue à la famille entière, révélera très
certainement de nombreuses autres isoformes. En revanche, nous n‟avons pas obtenu de
données nous permettant de comprendre ce phénomène, et notamment de savoir si ces
isoformes ont un rôle fonctionnel ou pas.
Il est néanmoins possible de formuler de nombreuses hypothèses :
1. Les ARN isoformes ne sont le fruit que du hasard de la séquence nucléotidique, et ces
formes alternatives ne sont pas prises en charge par des voies de dégradation de l‟ARN car
ces isoformes gardent la même séquence terminale. Cependant, ce hasard permettrait
151
d‟élaborer de nouvelles protéines intervenant dans la réparation des mutations créées dans le
génome des organites. Si cela est vraiment le fruit du hasard, alors 2/3 des événements
devraient changer la phase. Nous n‟avons malheureusement pas assez d‟exemples pour
réaliser de véritables tests de probabilité, mais pour l‟ensemble des cas décrits dans ma thèse,
cette proportion est de 3 cas de changement de phase sur 13 sans changement de phase pour
les gènes PPR sans intron, donc bien inférieur au fruit du hasard.
2. Les protéines isoformes produites ont une action d‟autorégulation de l‟expression de
l‟isoforme majeure qui a seule un réel rôle moléculaire.
3. Un moyen de réguler la fonction d‟une protéine à un autre niveau que celui de
l‟expression du gène est de le faire au niveau protéique. Des isoformes plus courtes pourraient
jouer un rôle antagoniste et rentreraient donc en compétition avec la forme fonctionnelle.
4. Les isoformes traduites sont fonctionnelles et ont une fonction propre indépendante de
celle codée par l‟ARN non épissé. Chaque forme joue alors un rôle particulier dans la
maturation des ARNm (les cibles pouvant être différentes).
Par exemple, dans le cas des protéines impliquées dans l‟édition des ARNm, il est possible
que la formation de certaines isoformes permette la reconnaissance de différents sites. Cette
dernière hypothèse pourrait expliquer la reconnaissance de plusieurs sites d‟édition sans
séquences consensus par une même protéine PPR, qui serait en réalité plusieurs isoformes (cf
partie suivante pour le modèle proposé).
La fonction de ce phénomène reste donc un grand mystère mais ouvre de nouvelles voies
d‟investigations sur la régulation et la fonction des protéines PPR.
Ces isoformes d‟épissage alternatif sont-elles régulées en fonction du développement ?
sont-elles activées au cours d‟un stress ? ou sont-elles exprimées de façon tissu- ou organespécifique ? Autant de questions auxquelles malheureusement je n‟ai pas réussi à répondre
dans le temps de ma thèse mais auxquelles il sera intéressant de répondre dans un avenir
proche.
III.3 Rôle de l’épissage alternatif : une nouvelle hypothèse sur la reconnaissance de
multi-sites d’édition par une seule protéine PPR ?
Des formes alternatives d‟épissage ont été identifiées à la fois chez des PPR de type « Pure
» mais aussi sur des protéines PPR de la sous-famille PLS. Cette dernière comprend
notamment les sous-familles de PPR de type E, E+ et DYW impliquées pour la plupart dans
l‟édition. 526 sites d‟édition sont décrits au niveau mitochondrial et 34 sites dans les
chloroplastes. Seulement 193 protéines PPR de type E, E+ et DYW sont décrites dans le
génome d‟Arabidopsis. Partant de l‟hypothèse que seules les protéines PPR sont impliquées
dans l‟édition, il existe donc un ratio d‟un facteur de type PPR pour plusieurs sites d‟édition.
Ainsi, bien que les protéines PPR aient une reconnaissance spécifique de la séquence de
l‟ARN, parmi les facteurs d‟édition identifiés dans les chloroplastes, cinq protéines PPR
(CRR22, CRR28, CLB19, OTP82 et OTP84) sont impliquées dans l‟édition de plusieurs sites.
Pour ces dernières, il existe potentiellement une séquence de reconnaissance commune entre
les sites. En effet, il a été montré récemment qu‟une séquence consensus autour des différents
sites pouvait être définie pour quatre d‟entre elles, même si aucune preuve expérimentale
n‟est apportée et que ces similitudes restent très faibles (Hammani, Okuda et al. 2009). De
façon notable, aucune séquence consensus ne peut être identifiée pour les trois sites d‟édition
impliquant CRR22.
152
Cette difficulté, voire impossibilité, à reconnaitre une séquence consensus peut être
expliquée par trois hypothèses. La première serait que d‟autres facteurs seraient impliqués
dans l‟édition, apportant pour certains la reconnaissance spécifique de l‟ARN. La deuxième
serait que la zone de reconnaissance est une très courte séquence composée éventuellement de
plusieurs éléments cis ou alors que la reconnaissance s‟effectue par l‟élaboration d‟une
structure secondaire spécifique de l‟ARN. La troisième, enfin, pourrait être que des formes
alternatives d‟épissage permettraient de reconnaitre ces différents sites. Ainsi, mon travail de
thèse me permet de proposer, par exemple, que le gène CRR22 pourrait coder pour trois
protéines différentes, et chaque protéine serait impliquée dans l‟édition d‟un des trois sites
d‟édition décrits pour CRR22. Cette dernière hypothèse, très attractive, peut se tester en
regardant s‟il existe des formes alternatives d‟épissage pour cette PPR mais également pour
d‟autres PPRs impliquées dans l‟édition de plusieurs sites (même si une séquence consensus a
pu être définie). Aucun ADNc ne permet de vérifier cette hypothèse pour CRR22, en
revanche des prédictions de sites donneurs et accepteurs peuvent être effectuées (figure 40).
Figure 40 : Prédiction des isoformes d‟épissage alternatif pour CRR22 en utilisant le logiciel
http://www.fruitfly.org/seq_tools/splice.html. Un alignement sous « Multalin » des différentes
isoformes putatives traduites est représenté.
Ces prédictions permettent de proposer l‟existence de trois isoformes putatives. Une sans
épissage et deux autres avec une excision d‟une séquence codante ne changeant pas la phase
de lecture. Ces isoformes ne sont que des prédictions et une analyse par RT-PCR suivie d‟un
clonage serait nécessaire afin de confirmer l‟hypothèse de l‟existence de plusieurs isoformes.
Des premières données d‟amplification sur ADNc faites par Sandra Tanz dans l‟équipe de Ian
153
Small montrent que seule la forme pleine longueur est présente, cependant le signal
d‟amplification étant très faible, ces résultats ne sont pas définitifs et demandent à être
confirmés par une nouvelle expérience d‟amplification suivie d‟un clonage.
Pour tester un éventuel épissage alternatif d‟autres transcrits PPR codant pour une protéine
importante dans l‟édition, nous avions en notre possession les oligonucléotides utilisés pour le
clonage de CLB19. Cette PPR de type E+ chloroplastique est impliquée dans l‟édition de deux
sites, un sur le transcrit ClpP et l‟autre sur RpoA (Chateigner-Boutin, Ramos-Vega et al.
2008). Elle s‟avère donc être une autre candidate pour tester si des formes alternatives
peuvent expliquer la reconnaissance de deux sites. J‟ai effectué quelques expériences dans ce
but au cours de ma thèse (résultats non présentés). Malheureusement, elles n‟ont pas permis
d‟identifier une autre forme que celle décrite, suggérant qu‟aucune forme alternative
d‟épissage n‟existe dans le cas de CLB19 et que la reconnaissance des deux sites
s‟effectuerait par un autre mécanisme.
J‟ai également regardé tous les ESTs disponibles pour toutes les PPR E, E+ et DYW
décrites dans les différentes espèces présentes dans la base de données FlagDB++,
Arabidopsis thaliana, Populus trichocarpa, Oryza sativa et Vitis Vinefera. Malheureusement
trop peu d‟ADNc ou d‟ESTs couvrent ces gènes PPR et aucune forme alternative n‟a été
détectée. Des sites alternatifs d‟épissage peuvent être prédits pour la majorité d‟entre eux mais
seule une PCR sur ADNc suivie d‟un clonage et d‟un séquençage permettrait de confirmer ces
prédictions.
III.4 Action des protéines PPR, une action seule ou en partenariat :
Les premières données d‟interaction protéine-protéine obtenues par TAP-TAG mais aussi
par double hybride montrent que certaines protéines PPR interagissent avec d‟autres protéines
PPR mais également avec d‟autres protéines.
Jusqu‟ici, dans le cas des protéines PPR impliquées dans l‟épissage des ARNm, seule
PPR5 a été montrée associée à un complexe ribonucléoprotéique (Beick, Schmitz-Linneweber
et al. 2008). Aucune donnée ne permet de montrer que PPR4 est associée avec d‟autres
protéines et les données obtenues par TAP-TAG ne montrent pas d‟interaction entre OTP43 et
des protéines pouvant être impliquées dans ce phénomène post-transcriptionnel. Ces deux
dernières protéines sont impliquées dans l‟épissage en trans de l‟intron 2 de rps12 (SchmitzLinneweber, Williams-Carrier et al. 2006) et l‟intron 1 de nad1 (de Longevialle, Meyer et al.
2007). Le rôle de ces deux protéines pourrait être de reconnaître de façon spécifique des
séquences dans les deux parties de l‟intron et de permettre ainsi l‟assemblage du reste du
complexe ribonucleoprotéique sans forcément nécessiter une interaction physique avec les
autres facteurs. Cet assemblage pourrait avoir lieu grâce à la formation d‟interactions entre
elles-mêmes, formation qui a visiblement été suspectée dans le cas de PPR4.
Dans le cas de PPR5, il a été montré que l‟interaction avec le complexe ne se faisait pas via
l‟ARN et il est donc possible que cette protéine interagisse avec un ou plusieurs autres
facteurs d‟épissage.
Dans le cas de protéines PPR impliquées dans l‟édition, le laboratoire a proposé un modèle
depuis plusieurs années dans lequel les protéines de type E et E+ interagissent avec une autre
protéine PPR ayant le motif DYW, mais sans le motif E+. En revanche, pour les protéines
PPR de type DYW avec la présence des motifs E et E+, il est proposé que ces protéines
agissent seules dans l‟édition, sans aucun autre facteur. Grâce à l‟approche de TAP-TAG sur
CLB19, nous avons pu montrer une interaction entre deux ou voire trois protéines PPR
impliquées dans l‟édition. CLB19, une protéine PPR E+ interagit avec une protéine DYW
154
renommée DYW2 et OTP100, une protéine PPR de type « Pure ». Dans ce cas précis, CLB19
n‟ayant pas de motif DYW suspecté comme porteur de la fonction enzymatique, nécessite une
interaction avec une protéine de type DYW. DYW2 apporterait cette fonction. Les résultats de
TAP-TAG ne permettent pas de conclure si les interactions entre CLB19 et OTP100, d‟une
part, et CLB19 et DYW2, d‟autre part, sont directes, même si cette dernière interaction est
plus probable. La fonction d‟OTP100 reste pour le moment inconnue, mais est en cours
d‟étude au laboratoire. L‟interaction pourrait également s‟effectuer de façon indirecte, via le
ou les transcrits sur lesquels sont fixés CLB19. Dans ce cas OTP100 aurait une fonction
différente de l‟édition sur ces transcrits. Afin de tester cette hypothèse, la purification du
complexe en absence d‟ARN (après traitement avec une RNAse) sera effectuée
prochainement.
Dans le génome d‟Arabidopsis, d‟autres gènes codant pour des protéines similaires aux
protéines DYW1 et DYW2 sont décrits. Il serait donc intéressant afin de valider notre
nouveau modèle d‟effectuer d‟autres expériences de TAP-TAG avec celles-ci afin de voir
avec quel type de protéine une éventuelle interaction est observée. Puis, dans un deuxième
temps, étudier la manière dont elles interagissent et quels sont les domaines nécessaires pour
ce type d‟interactions.
III.5 Rôle et régulation des protéines PPR
La caractérisation d‟un certain nombre de protéines PPR permet de montrer leur rôle
primordial dans l‟expression et la maturation des ARNm et des ARNt dans les organites.
Cette famille joue donc un rôle essentiel dans l‟expression de ces deux génomes et établit un
lien étroit entre le noyau et les organites. On peut se demander pour quelle raison, chez les
plantes, une telle complexité a été créée et conservée et implique autant de protéines de type
PPR. Une des hypothèses avancées, et déjà évoquée, est que des mutations intervenant dans le
génome des organites sont plus facilement rectifiées par l‟élaboration de nouveaux facteurs
codés par le noyau corrigeant de telles erreurs. Si cela est vrai, alors les PPR ne peuvent pas
être considérés comme des facteurs de régulation et devraient agir d‟une manière plus ou
moins constitutive.
On peut également proposer que ces PPR jouent au contraire un rôle de régulation très fine
contrôlée par leur état d‟activité et leur expression. Cette régulation des PPR pourrait s‟établir
à deux niveaux. La première au niveau de la transcription et de la régulation posttranscriptionnelle et la deuxième au niveau de l‟activité de la protéine.
III.5.1 Régulation transcriptionnelle et post-transcriptionnelle :
La majorité des gènes PPR est faiblement exprimée et a une durée de demi-vie très courte
(Narsai, Howell et al. 2007) qui peut être expliquée par l‟absence d‟introns. En conséquence,
cette durée de vie courte est un facteur limitant de la traduction des PPR. Cependant ce n‟est
parce qu‟ils sont faiblement exprimés qu‟ils ne sont pas différentiellement exprimés. En effet
selon les conditions environnementales et selon les apports nutritifs, certains gènes PPR sont
plus ou moins exprimés. Ainsi comme nous l‟avons montré certains gènes vont être
surexprimés en présence de sucre. Ce n‟est évidemment pas la seule condition où l‟on observe
un changement dans l‟expression. De nombreuses données de transcriptome ont été
accumulées depuis ces dernières années par l‟intermédiaire des puces CATMA et
AFFYMETRIX. Ces données sont en cours d‟analyse par Richard Berthomé à l‟URGV afin
de faire un « clustering » des PPR selon les conditions et ainsi essayer d‟établir un lien entre
155
leur expression, leur localisation et leur fonction. Cette analyse pourra éventuellement prédire
la fonction de certaines protéines PPR pour lesquelles celle-ci reste pour le moment inconnue.
Un autre moyen de limiter la traduction et de réguler l‟expression est la dégradation de ces
ARN via la voie TGS (Transcriptional Gene Silencing) ou PTGS (Post-Transcriptional Gene
Silencing) qui est induite par les petits ARN de type microARN ou siARN. Chaque petit ARN
est spécifique d‟un gène et certains petits ARN sont également décrits pour des gènes PPR
chez Arabidopsis et également chez le peuplier (Klevebring, Street et al. 2009). Ainsi miR161
code un microARN ciblant 20 gènes PPR et mais dont seule la cible At1g63130 a été validée
(Fahlgren, Howell et al. 2007). Deux autres microARN, miR400 et miR158 sont prédits pour
avoir plusieurs gènes PPR comme cibles mais aucune validation n‟a été faite pour ces deux
derniers (Rhoades, Reinhart et al. 2002; Sunkar and Zhu 2004).
Il est possible également que la traduction soit limitée via de l‟épissage alternatif. En effet,
en plus des phénomènes décrits précédemment dans les séquences codantes, des introns sont
également décrits pour certains gènes PPR dans les parties 5‟ et 3‟ UTR. Si ces introns ne
sont pas épissés, ils peuvent avoir une action sur la stabilité des ARNm comme il est montré
pour le gène AUF1 chez l‟homme codant une protéine intervenant dans la reconnaissance
d‟éléments AU-rich et qui induit la déstabilisation des ARNm via la voie NMD
(Banihashemi, Wilson et al. 2006). L‟intron en 3‟ UTR de ce gène possède ces éléments et sa
rétention conduit donc à une autorégulation de son expression. Je n‟ai pas regardé si de tels
éléments étaient présents dans les introns en 3‟ UTR pour les gènes PPR, mais il est fort
possible que ceux-ci aient un impact sur l‟expression.
Enfin l‟épissage alternatif peut aussi créer des codons de terminaison de la traduction
prématurés chez les PPR, ces transcrits seront alors pris en charge par la voie de dégradation
NMD. Cet épissage alternatif s‟il est régulé va donc avoir un impact sur l‟expression des PPR.
III.5.2 Régulation post-traductionnelle :
Une autre voie de régulation peut avoir lieu au niveau de la protéine. En effet un certain
nombre d‟étapes au niveau post-traductionnel influencent l‟activité de la protéine. En plus des
phénomènes de glycosylation ou de myristoylation, des étapes de phosphorylation peuvent
avoir lieu. Ainsi, il est fréquent que l‟activité d‟une protéine soit dépendante de son état de
phosphorylation. Du fait de la faible expression générale des protéines PPR, peu de peptides
phosphorylés spécifiques de protéines PPR ont pu être détectés par des approches de
spectrométrie de masse systématiques. Cependant 7 protéines PPR sont décrites comme
phosphorylées dans la base de données PepBase (http://pepbase.iab.keio.ac.jp/phospho/msb/)
et 69 dans PhosPhat 3.0 (http://phosphat.mpimp-golm.mpg.de/db.html). La majorité de ces
PPR n‟a qu‟un seul site phosphorylé de type Serine, Threonine ou Tyrosine, mais il est
également possible de trouver de 2 à 4 sites pour certaines. Parmi les 69 protéines décrites, on
trouve CRR4, CRR21, PPR596, PPR2, DOT4 et OTP52, qui sont des protéines dont la
fonction dans l‟édition, l‟épissage ou la biogénèse des ribosomes a été décrite. Cette
phosphorylation pourrait réguler l‟activité de ces protéines importées dans les organites en
fonction des besoins et des demandes des organites et de la cellule.
L‟autre étape de régulation pour laquelle très peu d‟éléments sont connus est une
éventuelle implication des protéines HSP. Comme nous l‟avons montré par TAP-TAG, la
purification des protéines interagissant avec OTP43 est fortement enrichie en HSP60. Dans ce
type d‟expérience, ces protéines sont très souvent considérées comme des faux positifs, mais
vu la quantité trouvée dans notre extrait, il est possible que cette interaction soit réelle. De
plus, les premières données de double hybride montrent également des interactions entre des
156
protéines PPR et des HSP. Plusieurs hypothèses peuvent être proposées. Il est possible que
ces protéines soient nécessaires pour le repliement et la configuration finale des protéines
importées mais il est aussi envisageable qu‟elles aient un rôle de régulateur de la quantité
fonctionnelle des protéines actives. Il faut remarquer ici que les résultats obtenus concernant
les protéines HSP ouvrent également de nouvelles pistes quant à l‟expression de protéines
PPR en système bactérien. Par exemple, il serait intéressant de tester l‟effet d‟une coexpression de protéine chaperone et d‟OTP43 sur l‟efficacité d‟expression de cette PPR qui
n‟a jamais pu être obtenue en système bactérien.
Enfin, une dernière régulation peut être envisagée par l‟épissage alternatif des transcrits
PPR. En effet celui ci peut conduire à la synthèse de différentes isoformes caractérisées par la
délétion de motifs PPR plus ou moins importante selon le type d‟épissage. Cette modification
a certainement un impact sur les capacités physico-chimiques de ces protéines puisque c‟est
au niveau de ces motifs que la reconnaissance avec l‟ARN doit avoir lieu et il est possible que
par ce biais une régulation de la fonction soit mise en place, avec un effet potentiel de
compétition entre certaines isoformes (cf partie III.2). C‟est le cas par exemple chez l‟homme
où la protéine CD45 qui joue un rôle dans l‟activation des lymphocytes T lors d‟une réponse
immunitaire à une infection est active ou non selon l‟isoforme d‟épissage alternatif
(Oberdoerffer, Moita et al. 2008). Ainsi lorsque les lymphocytes T sont au repos, la forme la
plus longue est exprimée et comporte neuf exons, en revanche lorsque les lymphocytes T sont
activés, les ARNm CD45 sont épissés alternativement et les exons 4, 5 et 6 sont excisés. Cette
modification crée ainsi une protéine plus courte qui ne peut alors activer les lymphocytes T.
Ce phénomène de régulation empêche de déclencher une réponse immunitaire
disproportionnée, et l‟on peut imaginer qu‟une compétition puisse avoir lieu entre différentes
isoformes dites actives et non-actives dans le cas des PPR.
157
Depuis la découverte de la famille PPR il y a plus de dix ans, de nombreuses avancées ont
été faites dans l’élucidation du rôle de ces protéines. Aujourd’hui environ 1/10ieme de ces
protéines chez les plantes ont une fonction connue et joue un rôle majeur et très spécifique
dans la transcription, la maturation et la traduction des ARN dans les organites. Cependant,
même si de nombreux défauts ont été et seront certainement encore découverts chez des
mutants ppr, on ne connaît pas encore comment ces protéines interagissent.
Un enjeu clef de la compréhension de la famille PPR sera donc de connaître la structure
des protéines par cristallographie ainsi que la structure de l’interaction avec l’ARN afin de
comprendre comment cette interaction s’établit et pourquoi elle est spécifique de la séquence
de l’ARN.
La fonction de ces PPR codées par le génome nucléaire en fait des facteurs clefs pour le
fonctionnement des organites, et créant ainsi un lien étroit entre le noyau, cerveau central de
la cellule et les deux organites, moteurs énergétiques.
158
MATERIELS ET METHODES
CHAPITRE IV : MATERIELS ET METHODES
IV.1 Matériels
IV.1.1 Souches bactériennes
La souche DH5 a été utilisée pour tous les clonages de type GATEWAY ou pGEMT.
Afin de multiplier les vecteurs d‟entrée et de destination GATEWAY vides, la souche
DB3.1 résistante à la cassette suicide ccdb a été utilisée.
La transformation du mutant otp43 en vue de complémentation fonctionnelle avec les
différentes isoformes a été réalisée par l‟intermédiaire de la souche d‟agrobactérie
C58C1pMP90.
IV.1.2 Oligonucleotides utilisés au cours de ma thèse et non répertoriés dans les
articles.
Oligonucléotides utilisés pour le clonage Gateway :
Oligonucléotides utilisés pour la mutagénèse dirigée :
Oligonucléotides utilisés pour la PCR quantitative :
Oligonucléotides utilisés pour la PPE :
Oligonucléotides utilisés pour la sonde biotinilée pour le northern blot :
159
Oligonucléotides utilisés pour la détection d'isoformes d'épissage alternatif sur les 48 PPRs :
Oligonucléotides utilisés pour le Génotypage :
160
IV.1.2 Lignées d’insertion
161
IV.2 Méthodes
IV.2.1 Méthodes relatives à la culture d'Arabidopsis
IV.2.1.1 Culture en terre
A Perth, les plantes ont été cultivées sur terreau (3/5 terreau, 1/5 vermiculite, 1/5 perlite),
en chambre de culture confinée à 22°C et 60% d'humidité moyenne, 8H de jours 16H de nuit.
A Evry, les plantes ont été cultivées sur terreau et également en chambre de culture confinée à
21ºC et 45% d‟humidité moyenne, 8H de jours 16H de nuit.
IV.2.1.2 Culture in vitro
En condition in vitro, les plantes ont été cultivées sur un milieu Murashige et Skoog appelé
½ MS. Pour 1L : 2,2g de MS (Sigma Aldrich™M5519 Murashige and Skoog Basal Medium),
0 à 3% de sucrose (m/v) ou 0 à 3% de glucose (m/v) et 8% d'agar type E (m/v) pour les
cultures en milieu solide (A6674 sigma Aldrich©). Le pH est ajusté à 5,8 par ajout
d'hydroxyde de potassium (KOH). Les conditions de culture de la chambre sont 25°C, 8
heures d'obscurité, 16h de luminosité.
IV.2.1.3 Préparation des graines d’Arabidopsis
IV.2.1.3.1 Vernalisation
Avant chaque semis, une vernalisation des graines est faite au préalable, la quantité de
graines désirées est transférée dans un tube de 1,5 ml et 1 ml d‟eau est ajouté. Le tube est
alors conservé à 4ºC pendant 48 heures avant semis. Cette vernalisation est aussi faite sur des
graines venant d‟être stérilisées en ajoutant également de l‟eau mais stérile.
IV.2.1.3.2 Stérilisation des graines
Deux protocoles de stérilisation ont été employés selon le lieu où les expériences ont été
faites.
A Perth, le protocole suivant a été utilisé :
Les graines sont incubées dans 1 ml d‟éthanol 70 % (v/v) pendant 2 min, puis incubées
dans 1 ml de la solution suivante : 5 % Javel (v/v)/ 0,1 % Tween20 (v/v) pendant 15 min en
agitant toutes les 5 minutes. Les graines sont alors rincées 5 fois dans de l‟eau stérile puis
resuspendues une dernière fois dans 1 ml d‟eau stérile. Les graines sont alors prêtes pour la
vernalisation puis pour un semis en boite de culture in vitro.
A Evry, le protocole suivant a été utilisé :
Une pastille de chlore est dissoute dans 50ml d‟eau milliQ et 50 µl de tween 20 sont
ajoutés. 1 ml de cette solution est ajouté à 9 ml d‟éthanol technique 95 % (v/v). Les graines à
stériliser sont alors incubées sous agitation légère dans 1 ml de cette nouvelle préparation
pendant 7 min. 3 lavages à l‟éthanol 96% sont ensuite effectués, suivi soit d‟un séchage des
graines sous la hotte soit de plusieurs rinçages à l‟eau stérile en vue d‟une vernalisation.
162
IV.2.2 Protocoles relatifs à l'ADN
IV.2.2.1 Extraction rapide d'ADN génomique
Ce protocole est utilisé en tube de 1,5 ml pour le génotypage de plantes.
Tampon de Lyse :
SDS
NaCl
EDTA
Tris-HCl pH = 7,5
Concentration finale
0,5 % (m/v)
250 M
25 mM
200 mM
Une feuille est collectée et broyée dans de l‟azote liquide pour chaque échantillon à
génotyper. 400μl de Tampon de lyse sont alors ajoutés et le tout est mélangé sur un vortex
pendant 15 secondes. Les tubes sont alors incubés pendant 15 minutes à 50ºC puis centrifugés
pendant 15 minutes à 5000 G à 4°C. 150 μl de surnageant sont transférés dans de nouveaux
tubes de 1,5 ml et un volume de 150 µl d‟isopropanol est ajouté. Le tout est alors mélangé sur
un vortex pendant 15 secondes, puis incubé pendant 20 minutes à température ambiante et
centrifugé à 4°C pendant 10 minutes à 10000 G. Les surnageants sont alors éliminés par
renversement et les culots sont repris avec 125μl d‟éthanol à 70%. Les échantillons sont alors
centrifugés à 4°C pendant 5 minutes à 10000 G. Les surnageants sont de nouveau éliminés par
renversement des tubes et les culots sont séchés en incubant les tubes ouverts dans une étuve à
60ºC pendant 10 min. Une fois les culots secs, ceux ci sont repris dans 125μl de TE (10mM,
1mM pH 7.5) et 2μl de cette extraction seront utilisés pour une PCR.
IV.2.2.2 Extraction d'ADN génomique (Dneasy 96 Plant kit QIAGEN)
Ce protocole a été utilisé pour toutes les extractions d‟ADN génomique en plaque 96 et
toutes les centrifugations ont été faites à l‟aide d‟une centrifugeuse Eppendorf 5810 R.
Tampon AP1 (500 ml) :
Tris 1M pH8.0
50 ml
EDTA 0.5M
50 ml
NaCl 2,5M
100 ml
SDS 20%
31,5 ml
PVP 40.000
5g
Sodium Bisulfite 5g
Eau stérile
qsp 500 ml
Acétate de potassium (3M K, 5M Ac)
Acide acétique glacial
Eau
120 ml
23 ml
qsp 200 ml
Guanidium Chloride
Eau stérile
Ethanol 96%
37,25 g
qsp 50 ml
100 ml
163
Tampon AW (1 L) :
Tris 1M pH 8.0
22,5 ml
EDTA 0,5 M
200 µl
Potassium acétate 5M
32 ml
Eau stérile
qsp 1L
Le tampon AW/E est préparé en mélangeant 100 ml de solution AW et 170 ml d‟éthanol
96%.
Une feuille est prélevée et placée dans un puits d‟une plaque 96 contenant une bille d‟acier.
Apres le prélèvement, la plaque est fermée å l‟aide de bouchons et placée dans de l‟azote
liquide. Celle-ci est alors agitée dans un agitateur à peinture pendant 30 secondes puis
centrifugée pour culoter tous les débris. Les bouchons sont retirés délicatement et 300 µl de
tampon AP1 préchauffé à 65ºC, contenant 125 mg/L de RNase A sont ajoutés dans chaque
puit. Les bouchons replacés, la plaque est agitée énergétiquement et manuellement pendant 15
secondes de haut en bas, puis centrifugée pendant 5 secondes à 3000 rpm et à température
ambiante. Les bouchons sont de nouveau retirés pour ajouter 100 µl de tampon AP2 puis
refermés et la plaque est agitée énergétiquement pendant 15 secondes de haut en bas puis 5
secondes de retournement léger. La plaque, après avoir été centrifugé 5 secondes à 3000 rpm,
est placée pendant 10 minutes à -20ºC et est ensuite centrifugée pendant 10 minutes à 4100
rpm. 300 µl de surnageant sont ensuite transférés dans une nouvelle plaque et 1,5 volume de
AP3/E sont ajoutés dans chaque puits. Après fermeture de la plaque par de nouveaux
bouchons, celle ci est agitée énergétiquement pendant 15 secondes de haut en bas puis 5
secondes de retournement léger puis centrifugée 5 secondes à 3000 rpm. Une plaque de
colonnes Dneasy 96 est placée sur une plaque 96 800 µl et 600 µl des échantillons sont
transférés sur les colonnes. Ce montage est scellé avec une feuille « airpore tae sheet » et le
tout est centrifugé pendant 5 minutes à 4100 rpm. La plaque 96 de 800 µl est vidée par
retournement et la plaque de colonnes est replacée dessus. 600µl de tampon AW/E sont
ajoutés à chaque colonne, la plaque est de nouveau scellée avec une feuille airpore et le
montage est centrifugé 15 min à 4100 rpm. La plaque de colonnes est alors placée sur la
plaque d‟étude (nouvelle plaque 96 800µl), 100µl de tampon AE (10 mM TrisHCl ; 0,5mM
EDTA ; pH9.0) sont ajoutés à chaque colonne et le tout est incubé 1 min à température
ambiante. L‟élution s‟effectue en centrifugeant 3 minutes à 4100 rpm et la plaque de travail
est alors conservée à -20ºC et 2 µl seront utilisés pour la PCR de génotypage.
IV.2.2.3 Amplification d’ADN par PCR
IV.2.2.3.1 Méthode de PCR « classique »
Les réactions de PCR de type « classique » sont utilisées dans le cadre des réactions de test
des colonies ou de génotypage.
Les réactions sont réalisées en utilisant une Taq Polymérase préparée au laboratoire d‟Evry
ou de Perth, dans un tampon adapté (Composition du tampon 10X : Tris-HCl 100mM pH8,
MgCl2 25mM, KCl 500mM, Nonidet P40 0.5%) pour le test de colonies et une Taq
Polymérase commerciale (Biolabs) dans certaines situations pour le génotypage.
Les réactions PCR ont été réalisées à l‟aide d‟un programme dont la température
d‟hybridation est adaptée aux différents couples d‟oligonucléotides, et le temps d‟élongation
dépend de la taille du fragment à amplifier.
164
Protocole de PCR « classique »
Dans un volume final de 10 à 50 µl, 25 à 75 ng d‟ADN sont utilisés comme matrice et sont
mélangés avec du rouge de crésol 1X (solution 10 X : Rouge de crésol 2 mg/ml ; Saccharose
600 mg/ml), du tampon de Taq polymérase 1X, des dNTPs à 0,2 mM chacun, des
oligonucléotides à 1 µM et de la Taq polymérase entre 1 à 5 unités (ou 0,2 µl de Taq
polymérase produite dans le laboratoire).
La réaction d‟amplification s‟effectue dans un « thermocycler » en utilisant le programme
suivant : une incubation de 5 minutes à 94ºC permet une première dénaturation de la matrice ;
Puis une dénaturation de 30 secondes à 94ºC, suivie d‟une hybridation de 30 secondes entre
50ºC et 60ºC selon les oligonucléotides utilisés et d‟une élongation à 72ºC d‟une minute par
kb à amplifier sont ensuite répétés 35 fois. La réaction est terminée par une élongation de 5
minutes à 72ºC.
IV.2.2.3.2 Méthode de PCR « clonage »
Lorsque nous amplifions un fragment d‟ADN par PCR afin de le cloner, les réactions de
PCR sont réalisées comme décrit précédemment à la différence près que la Polymérase
utilisée est une enzyme dite « fidèle » (avec une activité de relecture).
Différentes enzymes ont été utilisées telles que la iProof (Biorad) au laboratoire d‟Evry et
la DNA polymerase (Takara) au laboratoire de Perth, en utilisant les protocoles recommandés
pour chaque Polymerase.
IV.2.2.3 PCR quantitative
Les réactions de PCR quantitatives ont été réalisées au laboratoire de Perth, dans la
machine LightCycler 480 Real-time PCR system (Roche) à l‟aide du master mix LightCycler
480 SYBR green 1 (Roche). Au laboratoire d‟Evry, ces réactions ont été réalisées dans la
machine Applied Biosystems 7900HT Sequence détection system à l‟aide du MESA green
qPCR Mastermix Plus for SYBR (Eurogentec). Les oligonucléotides utilisés figurent en
Annexes des articles sur OTP43 et OTP51
IV.2.2.3 Electrophorèse
Les molécules d'ADN sont séparées sur gel d'agarose (concentration 0,8 à 2%) contenant
du BET (Bromure d'éthidium) à une concentration de 0.5µg/ml dans un tampon de migration
(TBE 1X ou TAE 1X) par application d'un champ électrique d'une tension variant entre 50 à
200 V suivant la taille du gel (7 à 30 cm de longueur). Pour aider au dépôt sur gel des
échantillons d'ADN, du rouge de crésol est ajouté au mélange. La visualisation s'effectue sous
UV.
TBE 1X, pH8 :
• 89 mM TRIS,
• 89 mM Acide borique,
• 2 mM EDTA
TAE 1X, pH8 :
• 89 mM TRIS,
• 89 mM Acide acétique,
• 2 mM EDTA
165
IV.2.2.4 Purification de produits PCR en vue d’un clonage ou d’un séquençage
IV.2.2.4.1 Utilisation du kit QIAquick (Qiagen)
Les produits de PCR destinés à être clonés ou séquencés, peuvent être directement extraits
du gel d‟électrophorèse purifiés et concentrés en utilisant le kit QIAquick et en suivant les
indications du fournisseur.
IV.2.2.4.2 Purification au PEG
Alternativement, les produits PCR destinés à être clonés peuvent être précipités, purifiés et
concentrés, par ajout de 5 volumes d‟une solution de PEG/MgCl2/TE (solution PEG/MgCl2:
12mM MgCl2, 12% PEG 8000 m/v, 6mM Tris, 0,6mM EDTA pH 7,5). Après centrifugation
pendant 20 min à 14000 G à température ambiante, le culot est repris dans 20µL de TE
(10mM Tris, 1mM EDTA pH 7,5).
IV.2.2.5 Clonage de produit PCR
IV.2.2.5.1 Clonage dans le vecteur pGEMT-Easy (Promega)
Les produits PCR purifiés peuvent être directement clonés dans le vecteur pGEMT-Easy
en suivant les instructions du fournisseur (Promega), avant transformation de bactéries
compétentes.
IV.2.2.5.2 Technologie de clonage GatewayTM (Invitrogen)
IV.2.2.5.2.1Principe du clonage Gateway
Son principe repose sur les réactions de recombinaison permettant l‟intégration et
l‟excision du phage lambda dans le génome d‟E. coli. Les clonages sont réalisés en deux
étapes. La première (réaction BP) consiste en la recombinaison directionnelle d‟un gène
d‟intérêt avec un vecteur dit « donneur », dont le produit donne le vecteur dit «d‟entrée». Ce
dernier sert de matrice à une seconde réaction (réaction LR) de recombinaison avec un
vecteur de destination, aboutissant à un vecteur dit « d‟expression ».
Les vecteurs donneurs et de destination utilisés au cours de ma thèse figurent dans la table
en annexe tableau 2.
IV.2.2.5.2.2PCR de clonage
A l‟aide deux PCR successives, le fragment d‟ADN à insérer est amplifié et les sites de
recombinaisons attB1 et attB2 sont ajoutés. Les produits PCR obtenus sont purifiés par
précipitation au PEG (comme décrit dans le paragraphe « puification au PEG »)
Protocole de PCR1 en vue d‟un clonage Gateway
1 µl d‟ADN (~50 ng/µl) est utilisé comme matrice et mélangé avec 1 µl de chaque
oligonucléotides à 0,5 µM, de 0,2 µl de dNTP à 100mM, de 2 µl de tampon HF Biorad 5X, de
0,1 µl de Taq Iproof Biorad High Fidelity polymerase et complété avec de l‟eau pour un
volume final de 10 µl.
La réaction s‟effectue dans un « thermocycler » en utilisant le programme suivant: 2
minutes à 98ºC puis 10 cycles de 15 secondes à 98ºC, de 30 secondes à 55ºC et 30 secondes
par kb à amplifier à 68ºC et terminé par 5 minutes à 68ºC.
166
Protocole de PCR2 en vue d‟un clonage Gateway
Sur la réaction PCR1 sont ajoutés, 1 µl de l‟amorce attB1 et attB2 à 10 µM, 0,8 µl de
dNTP à 10 mM, 8 µl de tampon HF Biorad 5X, 0,2 µl de polymerase Iproof High Fidelity de
chez Biorad et complété avec de l‟eau pour un volume final de 40 µl.
La réaction s‟effectue dans un « thermocycler » en utilisant le programme suivant: 2
minutes à 98ºC puis 25 cycles de 15 secondes à 98ºC, de 30 secondes à 55ºC et 30 secondes
par kb à amplifier à 72ºC. La réaction est terminée par 5 minutes à 68ºC.
IV.2.2.5.2.3 Mutagenèse dirigée par PCR en vue d’un clonage dans un
vecteur d’entrée du système Gateway
Lors des expériences de complémentation du mutant otp43 avec les différents isoformes
d‟épissage alternatif, j‟ai voulu également complémenter avec une forme ne pouvant plus
épisser. Ainsi une mutagénèse ponctuelle sur les deux sites accepteurs AG a été réalisée par
PCR, ainsi que l‟ajout de sites de recombinaison Gateway.
Pour chaque site à muter, deux amorces en sens et antisens chevauchant le site ont été
générées et sont représentées sur la figure 41 : 1-antisens (OTP43_Acceptor1rev) ; 2-sens
(OTP43_Acceptor1Fw) ; 2-antisens (OTP43_Acceptor2rev) ; 3-sens (OTP43_Acceptor2Fw).
Ces amorces ont été dessinées de façon à changer la séquence des deux sites accepteurs en
AA au lieu de AG.
Figure 41 : Procédure de mutagénèse dirigée des sites accepteurs d‟épissage d‟OTP43.
Pour cela trois PCR indépendantes avec la Polymérase iProof de chez Biorad sont tout
d‟abord réalisées sur de l‟ADNg: la première avec les amorces « start » de PPR43 (OTP43S167
Fw) et OTP43_Acceptor1rev, la deuxième avec les amorces OTP43_Acceptor1Fw avec
OTP43_Acceptor2rev et la troisième en utilisant les amorces OTP43_Acceptor2Fw et
l‟amorce « stop » de PPR43 (OTP43stop_rev).
En parallèle, le clonage de la forme pleine longueur sans mutation est réalisé en utilisant
les amorces « start » et « stop » de PPR43.
Par la suite, après vérification sur gel des amplifications, 1 µl de chacune des trois
premières PCR est mélangé et utilisé comme matrice pour l‟amplification avec les amorces
attB1 et attB2, ces dernières permettant d‟ajouter les sites de recombinaison Gateway.
Après vérification sur un gel contenant 1,2 % d‟agarose dans du TAE, les produits PCR
sont alors purifiés par la méthode PEG et clonés dans une vecteur pDONR207 par une
réaction de BP clonasse expliquée dans le paragraphe suivant.
IV.2.2.5.2.4 Réaction de BP clonase
La réaction de BP permet de cloner la séquence encadrée par les sites attB1 et attB2 dans
un vecteur d‟entrée contenant les sites attP1 et attP2.
Protocole de réaction de BP clonase
2 µl de produit PCR purifié sont mélangés avec 100 ng de vecteur donneur (pDONR207 ou
pDONR221), 1 µl de tampon de BP 5X, 0,4 µl de Clonase BP (Invitrogen) et complété à 5µL
avec du TE pH8. Le mélange réactionnel est incubé sur la nuit à 25ºC. Puis la réaction est
stoppée en ajoutant 0,5 µl de protéinase K (2 µg/µl) et en incubant 15 minutes à 37ºC. La
totalité de la réaction est utilisée pour la transformation de bactéries compétentes par choc
thermique. Les colonies positives après PCR sont alors sélectionnées pour une
minipréparation d‟ADN. Les plasmides extraits, nommés vecteurs d‟ « entrée » seront utilisés
pour la réaction LR.
IV.2.2.5.2.5 Réaction de LR clonase
La réaction de LR clonase va permettre de transférer les inserts clonés dans les vecteurs d‟
« entrée » dans un vecteur de destination entre les sites de recombinaison attR1 et attR2
Protocole de réaction de LR clonase
100 ng de clone d‟entrée sont ajoutés à 100ng de vecteur destination, 1 µl de tampon LR
5X, 0,4 µl de Clonase LR (Invitrogen) et complété à 5 µl final par du TE pH8. Le mélange
réactionnel est incubé sur la nuit à 25ºC. Puis la réaction est stoppée en ajoutant 0,5 µl de
protéinase K (2 µg/µl) et en incubant 15 minutes à 37ºC. La totalité de la réaction est utilisée
pour la transformation de bactéries compétentes par choc thermique. Les colonies obtenues
après sélection sur l‟antibiotique adéquat sont testées par PCR.
IV.2.2.5.3 Transformation bactérienne, sélection et test des colonies
transformées
Des cellules bactériennes de la souche DH5α compétentes (de l‟ordre de 107-108
transformants par µg d‟ADN) pour la transformation par choc thermique sont utilisées.
IV.2.2.5.3.1Protocole de préparation de cellules DH5α Thermo-compétentes
Une colonie sur boite est inoculée dans 10 ml de milieu LB et incubée à 37ºC sous
agitation (200 rpm) sur la nuit. Les 10 ml de la préculture sont ensuite ensemencés dans 500
ml de milieu SOB. La culture est alors mise sous agitation (200 rpm) à 19 ºC jusqu‟à
l‟obtention d‟une DO à 600nm comprise entre 0,5 et 0,6, puis incubée 10 minutes dans la
glace. La culture est alors centrifugée à 5000 G pendant 10 minutes à 4ºC (en 2 flasques de
168
1L). Chaque culot est repris dans 80 ml de TB froid puis incubé 10 minutes dans la glace suivi
d‟une nouvelle centrifugation de 10 minutes à 5000 G à 4ºC. Chaque culot est alors repris
dans 20 ml de TB froid et 2,8 ml de DMSO sont ajoutés. Les bactéries sont alors aliquotées,
congelées et conservées à -80ºC.
Milieu SOB : 20g/L Bacto-tryptone, 5g/L Bacto-yeast extract, 10mM NaCl, 2,5mM KCl,
10mM MgCl2, 10mM MgSO4, pH ajusté à 7 avec du NaOH
TB : 10mM Pipes, 15mM CaCl2, 250mM KCl, ajusté à pH 6,7 avec du KOH, 55mM
MnCl2, stérilisé par filtration (pas d‟autoclave)
IV.2.2.5.3.2Protocole de transformation par choc thermique de cellules DH5α
compétentes
100µl de bactéries compétentes sont ajoutés à 10 pg de plasmide ou au mélange
réactionnel de réaction BP ou LR. Le mélange est incubé 20 minutes dans un mélange
glace/eau, puis une minute à 42ºC dans un bain-marie (lorsque la réaction s‟effectue en tube
eppendorf) et tout de suite transféré dans un mélange glace/eau pendant 5 minutes. 900 µl de
milieu SOC sont ensuite ajoutés et le mélange est incubé sous agitation pendant une heure à
37ºC. 150 µl sont alors étalés sur boite de milieu LB additionné de l‟antibiotique approprié.
Les boites sont incubées une nuit dans une étuve à 37ºC et les colonies sont testées par PCR.
Milieu SOC : SOB + 20mM glucose
IV.2.2.5.4 Tranformation d’Agrobactéries, sélection et test des colonies
transformées
Des cellules bactériennes de la souche C58C1 pMP90 compétentes (de l‟ordre de 102-103
transformants par µg d‟ADN) pour la transformation par choc thermique sont utilisées.
IV.2.2.5.4.1 Protocole de préparation d’agrobactéries thermocompétentes
Une colonie sur boite est inoculée dans 1,6 ml de milieu LB Agro et la préculture est
incubée sous agitation (200 rpm) sur la nuit à 28ºC. La préculture est ensuite ensemencée dans
40 ml de LB Agro et mise sous agitation (200 rpm) à 28ºC jusqu‟à l‟obtention d‟une DO à
600nm comprise entre 0,4 et 0,8. La culture est alors centrifugée à 5000 G pendant 15 minutes
à 4ºC. Le culot est repris dans 10mL 10 mM Tris-HCl pH 7,5 froid, puis de nouveau
centrifugée à 5000 G pendant 15 minutes à 4ºC. Le culot est enfin repris dans 10mL de TrisHCl 10 mM pH 7,5 froid. Les agrobactéries sont alors aliquotées, congelées et conservées à 80ºC.
LBAgro ; Bactotryptone : 10 g/l
Bacto Yeast Extract : 5 g/l
NaCl : 5 g/l
pH : 7,5
IV.2.2.5.4.2 Protocole de transformation par choc thermique de cellules
C58C1 compétentes
200µl de bactéries compétentes sont ajoutés à 1µg de plasmide et incubés 5 minutes dans
un mélange eau/glace, puis 5 minutes dans l‟azote liquide et 5 minutes dans un bain-marie à
37ºC. 800 µl de milieu LB Agro sont alors ajoutés et mis en incubation à 28ºC sous agitation
pendant deux heures. 300 µl sont ensuite étalés sur boite de milieu LBAgro additionné de
l‟antibiotique approprié. Les boites sont placées dans une étuve à 28ºC pendant deux jours et
les colonies sont testées par PCR.
169
IV.2.2.6 Extraction et purification de plasmides (miniprépration d’ADN)
Selon les laboratoires, différents kits commerciaux ont été utilisés tels que :
-le kit SV Miniprep (Promega) au laboratoire d‟Evry
-les kits : QIAprep Spin Miniprep Kit (Qiagen) et Plasmid Miniprep Kit (Invitrogen) au
laboratoire de Perth.
La quantité de plasmide obtenue est systématiquement vérifiée par spectrométrie (mesure
de la DO à 260nm).
IV.2.2.7 Séquençage d’ADN
Le séquençage des produits de PCR ou des ADN plasmidiques a été effectué par une
entreprise externe, Macrogen (Macrogen, 908 World Meridian Venture Center, #60-24,
Gasan-dong, Geumchun-gu, Seoul 153-781, Kore) ou GATC (GATC Biotech AG, JacobStadler-Platz 7 78467 Konstanz, Germany).
IV.2.3 Méthodes relatives à l’ARN
IV.2.3.1 Extraction d’ARN total
L‟ARN total est extrait à partir de quelques milligrammes d‟un échantillon végétal (une
feuille ou une plantule). L‟échantillon prélevé et transféré dans un tube eppendorf de 2ml et
est ensuite broyé après congélation dans l‟azote liquide à l‟aide d‟une bille en acier et d‟un
agitateur prévu à cet effet. L‟extraction en tant que telle est réalisée à l‟aide du kit RNeasy
plant minikit (Qiagen) en suivant les instructions du fournisseur.
IV.2.3.2 Traitement de décontamination de l’ADN contaminant
Les ARN totaux sont traités à la DNaseI (DNA-free™ DNase Treatment and Removal
Reagents AM1906) suivant les instructions du fournisseur (Ambion®). Les ARN totaux sont
quantifiés au spectrophotomètre par mesure de l'absorption à 260nm à l‟aide d‟un
« nanodrop » et visualisés sur gel d'agarose 2 %, dans du tampon TAE ou TBE.
IV.2.3.3 Réaction de transcription « inverse »
Les ARNm des organites ayant une queue polyA sont, contrairement aux ARNm
nucléaires, en phase de dégradation. C‟est donc pour cette raison que la synthèse du premier
brin d'ADN complémentaire d'ARN d'organites se fait à l'aide d'hexanucléotides aléatoires et
non avec des oligonucléotides dT. En revanche, la synthèse du premier brin d'ADN
complémentaire d'ARN nucléaires se fait à l‟aide d‟oligonucléotides dT. La synthèse d‟ADN
complémentaire est effectuée en utilisant la transcriptase inverse SuperscriptII™ (11904-018,
Invitrogen™) ou la reverse transcriptaseIII™ (18080-400, Invitrogen™) en suivant les
instructions du fournisseur. La synthèse s‟effectue à partir d‟1 µg à 3 µg d‟ARN décontaminé
à la DNaseI.
IV.2.3.4 Northern blot
Le protocole de northern blot utilisé pour regarder l‟accumulation des transcrits nad6 dans
les différents mutants de complexe 1 est le même que celui décrit dans l‟article 2 sur OTP51.
Les amorces utilisées pour fabriquer la sonde biotinilée sont décrites dans le paragraphe
IV.1.2.
170
IV.2.3.5 Protocole pour l’analyse PPE
Les ARN d‟une plante sauvage et mutante sont extraits et des ADNc sont synthétisés.
Alternativement, pour les témoins, 25pg d‟ADN plasmidique (contenant la séquence du
transcrit d‟intérêt édité ou non édité) servent de matrice. Une PCR est effectuée en utilisant un
couple d‟amorces flanquant le site d‟intérêt dans le transcrit. 2,5 l de PCR sont purifiés par
1µl d‟enzyme ExoSAP-IT (USB 78200) et incubés à 37°C pendant 20 minutes pour éliminer
les nucléotides et les oligonucléotides non incorporés. L‟enzyme est inactivée à 80°C pendant
15 minutes. La réaction de PPE s‟effectue par le biais d‟un kit Thermosequenase Cycle
Sequencing kit (USB 78500).
Pour la réaction de l‟extension PPE, 100ng de produit PCR purifié sont ajoutés à 2 l de
tampon 10X, 0,5pmol d‟amorce marquée en 5‟ à la 6-carboxyfluorescein (FAM), 1 unité de
ThermoSequenase DNA polymérase, 100 nM de chaque nucléotides (mélange contenant trois
dNTP+ un ddNTP) et complété à 20 µl avec de l‟eau.
La réaction d‟amplification est faite dans un « thermocycler » en utilisant le programme
suivant : 1 minute à 94ºC, suivie de 35 cycles de 30 secondes à 94ºC, 30 secondes à 55ºC et
de 10 secondes à 68ºC. La réaction est terminée par 3 minutes d‟élongation à 68ºC.
Le produit d‟amplification est alors déposé sur un gel de séquençage à 12% acrylamide
(Sequagel) et migré à 55W. Le gel est ensuite révélé sur un Typhoon Trio Imager (GE
Healthcare, ex-Amersham), avec un filtre d‟émission 520BP40. L‟acquisition du signal
fluorescent se fait à 488nm.
La quantification des bandes se fait grâce au logiciel ImageQuant TL 1D gel analysis
(Amersham Bioscience). Les bandes correspondant aux produits épissés et non épissés sont
manuellement déterminées, et le logiciel calcule un volume correspondant à l‟intensité de
fluorescence dans cette bande. Le bruit de fond est déterminé par la mesure d‟une bande
« absente » correspondant au produit épissé et non épissé, obtenu à partir des plasmides épissé
et non épissé, respectivement.
IV.2.4 Méthodes propres à Arabidopsis
IV.2.4.1 Transformation d’Arabidopsis par « floral deeping »
Les plantes d‟Arabidopsis sont transformées par trempage des boutons floraux dans une
solution d‟agrobactéries d‟intérêt, selon la méthode décrite par Clough et Bent, (Clough and
Bent 1998).
Protocole de transformation d‟Arabidopsis :
Une culture de la souche d‟agrobactérie d‟intérêt est réalisée dans du LB-Agro jusqu‟à une
DO à 600 nm comprise entre 0,8 et 1,0 (le volume dépend de la quantité de plantes que l‟on
souhaite transformer). Les cellules sont ensuite centrifugées à 4000 G pendant 30 minutes et
les culots sont resuspendus dans une solution 5% de sucrose, 0.02% de Silwet-L77 (volume
identique au volume de culture). Les boutons floraux sont alors trempés pendant deux minutes
dans la solution. Les plantes sont ensuite couvertes par un couvercle pendant 24 heures et
cultivées jusqu‟à l‟obtention de graines.
IV.2.4.2 Etude du phénotype
L‟analyse phénotypique des mutants consiste en l‟étude de plusieurs caractères comme : le
pourcentage de germination, la taille et l‟aspect des germinations et des plantes adultes.
171
REFERENCES
RÉFÉRENCES BIBLIOGRAPHIQUES
Asakura, Y. and A. Barkan (2006). "Arabidopsis orthologs of maize chloroplast splicing
factors promote splicing of orthologous and species-specific group II introns." Plant
Physiol 142(4): 1656-63.
Aubourg, S., N. Boudet, et al. (2000). "In Arabidopsis thaliana, 1% of the genome codes for a
novel protein family unique to plants." Plant Mol Biol 42(4): 603-13.
Baier, M., G. Hemmann, et al. (2004). "Characterization of mutants in Arabidopsis showing
increased sugar-specific gene expression, growth, and developmental responses."
Plant Physiol 134(1): 81-91.
Banihashemi, L., G. M. Wilson, et al. (2006). "Upf1/Upf2 regulation of 3' untranslated region
splice variants of AUF1 links nonsense-mediated and A+U-rich element-mediated
mRNA decay." Mol Cell Biol 26(23): 8743-54.
Barbazuk, W. B., Y. Fu, et al. (2008). "Genome-wide analyses of alternative splicing in
plants: opportunities and challenges." Genome Res 18(9): 1381-92.
Barkan, A., M. Walker, et al. (1994). "A nuclear mutation in maize blocks the processing and
translation of several chloroplast mRNAs and provides evidence for the differential
translation of alternative mRNA forms." Embo J 13(13): 3170-81.
Beick, S., C. Schmitz-Linneweber, et al. (2008). "The pentatricopeptide repeat protein PPR5
stabilizes a specific tRNA precursor in maize chloroplasts." Mol Cell Biol 28(17):
5337-47.
Bentolila, S., A. A. Alfonso, et al. (2002). "A pentatricopeptide repeat-containing gene
restores fertility to cytoplasmic male-sterile plants." Proc Natl Acad Sci U S A 99(16):
10887-92.
Bentolila, S., A. L. Chateigner-Boutin, et al. (2005). "Ecotype allelic variation in C-to-U
editing extent of a mitochondrial transcript identifies RNA-editing quantitative trait
loci in Arabidopsis." Plant Physiol 139(4): 2006-16.
Bentolila, S., L. E. Elliott, et al. (2008). "Genetic architecture of mitochondrial editing in
Arabidopsis thaliana." Genetics 178(3): 1693-708.
Blatch, G. L. and M. Lassle (1999). "The tetratricopeptide repeat: a structural motif mediating
protein-protein interactions." Bioessays 21(11): 932-9.
Brangeon, J., M. Sabar, et al. (2000). "Defective splicing of the first nad4 intron is associated
with lack of several complex I subunits in the Nicotiana sylvestris NMS1 nuclear
mutant." Plant J 21(3): 269-80.
Brown, G. G., N. Formanova, et al. (2003). "The radish Rfo restorer gene of Ogura
cytoplasmic male sterility encodes a protein with multiple pentatricopeptide repeats."
Plant J 35(2): 262-72.
Cai, W., D. Ji, et al. (2009). "LPA66 is required for editing psbF chloroplast transcripts in
Arabidopsis." Plant Physiol 150(3): 1260-71.
Chang, Y. F., J. S. Imam, et al. (2007). "The nonsense-mediated decay RNA surveillance
pathway." Annu Rev Biochem 76: 51-74.
Chase, C. D. (2007). "Cytoplasmic male sterility: a window to the world of plant
mitochondrial-nuclear interactions." Trends Genet 23(2): 81-90.
172
REFERENCES
Chateigner-Boutin, A. L., M. Ramos-Vega, et al. (2008). "CLB19, a pentatricopeptide repeat
protein required for editing of rpoA and clpP chloroplast transcripts." Plant J 56(4):
590-602.
Chateigner-Boutin, A. L. and I. Small (2007). "A rapid high-throughput method for the
detection and quantification of RNA editing based on high-resolution melting of
amplicons." Nucleic Acids Res 35(17): e114.
Chi, W., J. Ma, et al. (2008). "The pentratricopeptide repeat protein DELAYED
GREENING1 is involved in the regulation of early chloroplast development and
chloroplast gene expression in Arabidopsis." Plant Physiol 147(2): 573-84.
Clough, S. J. and A. F. Bent (1998). "Floral dip: a simplified method for Agrobacteriummediated transformation of Arabidopsis thaliana." Plant J 16(6): 735-43.
Coffin, J. W., R. Dhillon, et al. (1997). "The Neurospora crassa cya-5 nuclear gene encodes a
protein with a region of homology to the Saccharomyces cerevisiae PET309 protein
and is required in a post-transcriptional step for the expression of the mitochondrially
encoded COXI protein." Curr Genet 32(4): 273-80.
Cui, X., R. P. Wise, et al. (1996). "The rf2 nuclear restorer gene of male-sterile T-cytoplasm
maize." Science 272(5266): 1334-6.
Das, A. K., P. W. Cohen, et al. (1998). "The structure of the tetratricopeptide repeats of
protein phosphatase 5: implications for TPR-mediated protein-protein interactions."
EMBO J 17(5): 1192-9.
Davies, S. M., O. Rackham, et al. (2009). "Pentatricopeptide repeat domain protein 3
associates with the mitochondrial small ribosomal subunit and regulates translation."
FEBS Lett 583(12): 1853-8.
de Longevialle, A. F., L. Hendrickson, et al. (2008). "The pentatricopeptide repeat gene
OTP51 with two LAGLIDADG motifs is required for the cis-splicing of plastid ycf3
intron 2 in Arabidopsis thaliana." Plant J 56(1): 157-68.
de Longevialle, A. F., E. H. Meyer, et al. (2007). "The pentatricopeptide repeat gene OTP43
is required for trans-splicing of the mitochondrial nad1 Intron 1 in Arabidopsis
thaliana." Plant Cell 19(10): 3256-65.
Delannoy, E., W. A. Stanley, et al. (2007). "Pentatricopeptide repeat (PPR) proteins as
sequence-specificity factors in post-transcriptional processes in organelles." Biochem
Soc Trans 35(Pt 6): 1643-7.
Desloire, S., H. Gherbi, et al. (2003). "Identification of the fertility restoration locus, Rfo, in
radish, as a member of the pentatricopeptide-repeat protein family." EMBO Rep 4(6):
588-94.
Diercks, T., E. Ab, et al. (2008). "Solution structure and characterization of the DNA-binding
activity of the B3BP-Smr domain." J Mol Biol 383(5): 1156-70.
Ding, Y. H., N. Y. Liu, et al. (2006). "Arabidopsis GLUTAMINE-RICH PROTEIN23 is
essential for early embryogenesis and encodes a novel nuclear PPR motif protein that
interacts with RNA polymerase II subunit III." Plant Cell 18(4): 815-30.
Doolittle, W. F. and A. Stoltzfus (1993). "Molecular evolution. Genes-in-pieces revisited."
Nature 361(6411): 403.
173
REFERENCES
Dutilleul, C., S. Driscoll, et al. (2003). "Functional mitochondrial complex I is required by
tobacco leaves for optimal photosynthetic performance in photorespiratory conditions
and during transients." Plant Physiol 131(1): 264-75.
Dutilleul, C., C. Lelarge, et al. (2005). "Mitochondria-driven changes in leaf NAD status exert
a crucial influence on the control of nitrate assimilation and the integration of carbon
and nitrogen metabolism." Plant Physiol 139(1): 64-78.
Ellis, T. P., K. G. Helfenbein, et al. (2004). "Aep3p stabilizes the mitochondrial bicistronic
mRNA encoding subunits 6 and 8 of the H+-translocating ATP synthase of
Saccharomyces cerevisiae." J Biol Chem 279(16): 15728-33.
Fahlgren, N., M. D. Howell, et al. (2007). "High-throughput sequencing of Arabidopsis
microRNAs: evidence for frequent birth and death of MIRNA genes." PLoS One 2(2):
e219.
Filichkin, S. A., H. D. Priest, et al. (2010). "Genome-wide mapping of alternative splicing in
Arabidopsis thaliana." Genome Res 20(1): 45-58.
Fukui, K., H. Kosaka, et al. (2007). "Nuclease activity of the MutS homologue MutS2 from
Thermus thermophilus is confined to the Smr domain." Nucleic Acids Res 35(3): 85060.
Galtier, N. and M. Gouy (1995). "Inferring phylogenies from DNA sequences of unequal base
compositions." Proc Natl Acad Sci U S A 92(24): 11317-21.
Garmier, M., A. J. Carroll, et al. (2008). "Complex I dysfunction redirects cellular and
mitochondrial metabolism in Arabidopsis." Plant Physiol 148(3): 1324-41.
Giege, P. and A. Brennicke (1999). "RNA editing in Arabidopsis mitochondria effects 441 C
to U changes in ORFs." Proc Natl Acad Sci U S A 96(26): 15324-9.
Gilbert, W. (1978). "Why genes in pieces?" Nature 271(5645): 501.
Gillman, J. D., S. Bentolila, et al. (2007). "The petunia restorer of fertility protein is part of a
large mitochondrial complex that interacts with transcripts of the CMS-associated
locus." Plant J 49(2): 217-27.
Hajdukiewicz, P. T., L. A. Allison, et al. (1997). "The two RNA polymerases encoded by the
nuclear and the plastid compartments transcribe distinct groups of genes in tobacco
plastids." EMBO J 16(13): 4041-8.
Hammani, K., K. Okuda, et al. (2009). "A study of new Arabidopsis chloroplast RNA editing
mutants reveals general features of editing factors and their target sites." Plant Cell
21(11): 3686-99.
Hashimoto, M., T. Endo, et al. (2003). "A nucleus-encoded factor, CRR2, is essential for the
expression of chloroplast ndhB in Arabidopsis." Plant J 36(4): 541-9.
Hattori, M., H. Miyake, et al. (2007). "A Pentatricopeptide repeat protein is required for RNA
processing of clpP Pre-mRNA in moss chloroplasts." J Biol Chem 282(14): 10773-82.
Hattori, M. and M. Sugita (2009). "A moss pentatricopeptide repeat protein binds to the 3' end
of plastid clpP pre-mRNA and assists with mRNA maturation." Febs J 276(20): 58609.
Heazlewood, J. L., K. A. Howell, et al. (2003). "Mitochondrial complex I from Arabidopsis
and rice: orthologs of mammalian and fungal components coupled with plant-specific
subunits." Biochim Biophys Acta 1604(3): 159-69.
174
REFERENCES
Hilson, P., J. Allemeersch, et al. (2004). "Versatile gene-specific sequence tags for
Arabidopsis functional genomics: transcript profiling and reverse genetics
applications." Genome Res 14(10B): 2176-89.
Hilson, P., I. Small, et al. (2003). "European consortia building integrated resources for
Arabidopsis functional genomics." Curr Opin Plant Biol 6(5): 426-9.
Ikeda, T. M. and M. W. Gray (1999). "Characterization of a DNA-binding protein implicated
in transcription in wheat mitochondria." Mol Cell Biol 19(12): 8113-22.
Jenkins, B. D., D. J. Kulhanek, et al. (1997). "Nuclear mutations that block group II RNA
splicing in maize chloroplasts reveal several intron classes with distinct requirements
for splicing factors." Plant Cell 9(3): 283-96.
Johnson, X., K. Wostrikoff, et al. (2010). "MRL1, a conserved Pentatricopeptide repeat
protein, is required for stabilization of rbcL mRNA in Chlamydomonas and
Arabidopsis." Plant Cell 22(1): 234-48.
Jonietz, C., J. Forner, et al. (2010). "RNA PROCESSING FACTOR2 is required for 5' end
processing of nad9 and cox3 mRNAs in mitochondria of Arabidopsis thaliana." Plant
Cell 22(2): 443-53.
Kanamaru, K. and K. Tanaka (2004). "Roles of chloroplast RNA polymerase sigma factors in
chloroplast development and stress response in higher plants." Biosci Biotechnol
Biochem 68(11): 2215-23.
Kazama, T. and K. Toriyama (2003). "A pentatricopeptide repeat-containing gene that
promotes the processing of aberrant atp6 RNA of cytoplasmic male-sterile rice."
FEBS Lett 544(1-3): 99-102.
Keren, H., G. Lev-Maor, et al. (2010). "Alternative splicing and evolution: diversification,
exon definition and function." Nat Rev Genet 11(5): 345-55.
Kim, E., A. Magen, et al. (2007). "Different levels of alternative splicing among eukaryotes."
Nucleic Acids Res 35(1): 125-31.
Kim, S. R., J. I. Yang, et al. (2009). "Rice OGR1 encodes a pentatricopeptide repeat-DYW
protein and is essential for RNA editing in mitochondria." Plant J 59(5): 738-49.
Klein, R. R., P. E. Klein, et al. (2005). "Fertility restorer locus Rf1 [corrected] of sorghum
(Sorghum bicolor L.) encodes a pentatricopeptide repeat protein not present in the
colinear region of rice chromosome 12." Theor Appl Genet 111(6): 994-1012.
Klevebring, D., N. R. Street, et al. (2009). "Genome-wide profiling of populus small RNAs."
BMC Genomics 10: 620.
Kode, V., E. A. Mudd, et al. (2005). "The tobacco plastid accD gene is essential and is
required for leaf development." Plant J 44(2): 237-44.
Koizuka, N., R. Imai, et al. (2003). "Genetic characterization of a pentatricopeptide repeat
protein gene, orf687, that restores fertility in the cytoplasmic male-sterile Kosena
radish." Plant J 34(4): 407-15.
Konishi, T., K. Shinohara, et al. (1996). "Acetyl-CoA carboxylase in higher plants: most
plants other than gramineae have both the prokaryotic and the eukaryotic forms of this
enzyme." Plant Cell Physiol 37(2): 117-22.
Koonin, E. V. (2006). "The origin of introns and their role in eukaryogenesis: a compromise
solution to the introns-early versus introns-late debate?" Biol Direct 1: 22.
175
REFERENCES
Kotera, E., M. Tasaka, et al. (2005). "A pentatricopeptide repeat protein is essential for RNA
editing in chloroplasts." Nature 433(7023): 326-30.
Koussevitzky, S., A. Nott, et al. (2007). "Signals from chloroplasts converge to regulate
nuclear gene expression." Science 316(5825): 715-9.
Kurihara-Yonemoto, S. and H. Handa (2001). "Low temperature affects the processing
pattern and RNA editing status of the mitochondrial cox2 transcripts in wheat." Curr
Genet 40(3): 203-8.
Lahmy, S., F. Barneche, et al. (2000). "A chloroplastic RNA-binding protein is a new member
of the PPR family." FEBS Lett 480(2-3): 255-60.
Lareau, L. F., M. Inada, et al. (2007). "Unproductive splicing of SR genes associated with
highly conserved and ultraconserved DNA elements." Nature 446(7138): 926-9.
Lee, B. H., H. Lee, et al. (2002). "A mitochondrial complex I defect impairs cold-regulated
nuclear gene expression." Plant Cell 14(6): 1235-51.
Lee, C., A. S. Tibbetts, et al. (2009). "Yeast AEP3p is an accessory factor in initiation of
mitochondrial translation." J Biol Chem 284(49): 34116-25.
Li, Y., K. K. Lee, et al. (2006). "Establishing glucose- and ABA-regulated transcription
networks in Arabidopsis by microarray analysis and promoter classification using a
Relevance Vector Machine." Genome Res 16(3): 414-27.
Li, Y., C. Smith, et al. (2007). "Signaling from an altered cell wall to the nucleus mediates
sugar-responsive growth and development in Arabidopsis thaliana." Plant Cell 19(8):
2500-15.
Liere, K. and P. Maliga (1999). "In vitro characterization of the tobacco rpoB promoter
reveals a core sequence motif conserved between phage-type plastid and plant
mitochondrial promoters." EMBO J 18(1): 249-57.
Lightowlers, R. N. and Z. M. Chrzanowska-Lightowlers (2008). "PPR (pentatricopeptide
repeat) proteins in mammals: important aids to mitochondrial gene expression."
Biochem J 416(1): e5-6.
Loiselay, C., N. J. Gumpel, et al. (2008). "Molecular identification and function of cis- and
trans-acting determinants for petA transcript stability in Chlamydomonas reinhardtii
chloroplasts." Mol Cell Biol 28(17): 5529-42.
Lurin, C., C. Andres, et al. (2004). "Genome-wide analysis of Arabidopsis pentatricopeptide
repeat proteins reveals their essential role in organelle biogenesis." Plant Cell 16(8):
2089-103.
Lynch, M., B. Koskella, et al. (2006). "Mutation pressure and the evolution of organelle
genomic architecture." Science 311(5768): 1727-30.
Maier, U. G., A. Bozarth, et al. (2008). "Complex chloroplast RNA metabolism: just
debugging the genetic programme?" BMC Biol 6: 36.
Malek, O. and V. Knoop (1998). "Trans-splicing group II introns in plant mitochondria: the
complete set of cis-arranged homologs in ferns, fern allies, and a hornwort." Rna
4(12): 1599-609.
Malik, H. S. and S. Henikoff (2000). "Dual recognition-incision enzymes might be involved
in mismatch repair and meiosis." Trends Biochem Sci 25(9): 414-8.
176
REFERENCES
Mancebo, R., X. Zhou, et al. (2001). "BSF binds specifically to the bicoid mRNA 3'
untranslated region and contributes to stabilization of bicoid mRNA." Mol Cell Biol
21(10): 3462-71.
Manthey, G. M. and J. E. McEwen (1995). "The product of the nuclear gene PET309 is
required for translation of mature mRNA and stability or production of introncontaining RNAs derived from the mitochondrial COX1 locus of Saccharomyces
cerevisiae." Embo J 14(16): 4031-43.
Meierhoff, K., S. Felder, et al. (2003). "HCF152, an Arabidopsis RNA binding
pentatricopeptide repeat protein involved in the processing of chloroplast psbB-psbTpsbH-petB-petD RNAs." Plant Cell 15(6): 1480-95.
Meyer, E. H., T. Tomaz, et al. (2009). "Remodeled respiration in ndufs4 with low
phosphorylation efficiency suppresses Arabidopsis germination and growth and alters
control of metabolism at night." Plant Physiol 151(2): 603-19.
Mili, S. and S. Pinol-Roma (2003). "LRP130, a pentatricopeptide motif protein with a
noncanonical RNA-binding domain, is bound in vivo to mitochondrial and nuclear
RNAs." Mol Cell Biol 23(14): 4972-82.
Mita, S., K. Suzuki-Fujii, et al. (1995). "Sugar-inducible expression of a gene for betaamylase in Arabidopsis thaliana." Plant Physiol 107(3): 895-904.
Modrek, B. and C. Lee (2002). "A genomic view of alternative splicing." Nat Genet 30(1):
13-9.
Moore, B., L. Zhou, et al. (2003). "Role of the Arabidopsis glucose sensor HXK1 in nutrient,
light, and hormonal signaling." Science 300(5617): 332-6.
Mootha, V. K., P. Lepage, et al. (2003). "Identification of a gene causing human cytochrome
c oxidase deficiency by integrative genomics." Proc Natl Acad Sci U S A 100(2): 60510.
Moreira, D. and H. Philippe (1999). "Smr: a bacterial and eukaryotic homologue of the Cterminal region of the MutS2 family." Trends Biochem Sci 24(8): 298-300.
Moreno, J. I., K. S. Buie, et al. (2009). "Ccm1p/Ygr150cp, a pentatricopeptide repeat protein,
is essential to remove the fourth intron of both COB and COX1 pre-mRNAs in
Saccharomyces cerevisiae." Curr Genet 55(4): 475-84.
Naithani, S., S. A. Saracco, et al. (2003). "Interactions among COX1, COX2, and COX3
mRNA-specific translational activator proteins on the inner surface of the
mitochondrial inner membrane of Saccharomyces cerevisiae." Mol Biol Cell 14(1):
324-33.
Nakagawa, N. and N. Sakurai (2006). "A mutation in At-nMat1a, which encodes a nuclear
gene having high similarity to group II intron maturase, causes impaired splicing of
mitochondrial NAD4 transcript and altered carbon metabolism in Arabidopsis
thaliana." Plant Cell Physiol 47(6): 772-83.
Nakamura, T., K. Meierhoff, et al. (2003). "RNA-binding properties of HCF152, an
Arabidopsis PPR protein involved in the processing of chloroplast RNA." Eur J
Biochem 270(20): 4070-81.
Nakamura, T. and M. Sugita (2008). "A conserved DYW domain of the pentatricopeptide
repeat protein possesses a novel endoribonuclease activity." FEBS Lett 582(30): 41638.
177
REFERENCES
Narsai, R., K. A. Howell, et al. (2007). "Genome-wide analysis of mRNA decay rates and
their determinants in Arabidopsis thaliana." Plant Cell 19(11): 3418-36.
O'Toole, N., M. Hattori, et al. (2008). "On the expansion of the pentatricopeptide repeat gene
family in plants." Mol Biol Evol 25(6): 1120-8.
Oberdoerffer, S., L. F. Moita, et al. (2008). "Regulation of CD45 alternative splicing by
heterogeneous ribonucleoprotein, hnRNPLL." Science 321(5889): 686-91.
Ohta, H., A. Ogino, et al. (2010). "Fertility restoration by Ifr1 in rice with BT-type
cytoplasmic male sterility is associated with a reduced level, but not processing, of
atp6-orf79 co-transcribed RNA." Plant Cell Rep 29(4): 359-69.
Okuda, K., A. L. Chateigner-Boutin, et al. (2009). "Pentatricopeptide repeat proteins with the
DYW motif have distinct molecular functions in RNA editing and RNA cleavage in
Arabidopsis chloroplasts." Plant Cell 21(1): 146-56.
Okuda, K., K. Hammani, et al. (2010). "The pentatricopeptide repeat protein OTP82 is
required for RNA editing of plastid ndhB and ndhG transcripts." Plant J 61(2): 339-49.
Okuda, K., F. Myouga, et al. (2007). "Conserved domain structure of pentatricopeptide repeat
proteins involved in chloroplast RNA editing." Proc Natl Acad Sci U S A 104(19):
8178-83.
Okuda, K., T. Nakamura, et al. (2006). "A pentatricopeptide repeat protein is a site
recognition factor in chloroplast RNA editing." J Biol Chem 281(49): 37661-7.
Pfalz, J., O. A. Bayraktar, et al. (2009). "Site-specific binding of a PPR protein defines and
stabilizes 5' and 3' mRNA termini in chloroplasts." EMBO J 28(14): 2042-52.
Pfalz, J., K. Liere, et al. (2006). "pTAC2, -6, and -12 are components of the transcriptionally
active plastid chromosome that are required for plastid gene expression." Plant Cell
18(1): 176-97.
Prikryl, J., K. P. Watkins, et al. (2008). "A member of the Whirly family is a multifunctional
RNA- and DNA-binding protein that is essential for chloroplast biogenesis." Nucleic
Acids Res 36(16): 5152-65.
Puchta, O., M. Lubas, et al. (2010). "DMR1 (CCM1/YGR150C) of Saccharomyces cerevisiae
encodes an RNA-binding protein from the pentatricopeptide repeat family required for
the maintenance of the mitochondrial 15S ribosomal RNA." Genetics 184(4): 959-73.
Rackham, O., S. M. Davies, et al. (2009). "Pentatricopeptide repeat domain protein 1 lowers
the levels of mitochondrial leucine tRNAs in cells." Nucleic Acids Res 37(17): 585967.
Reddy, A. S. (2007). "Alternative splicing of pre-messenger RNAs in plants in the genomic
era." Annu Rev Plant Biol 58: 267-94.
Rhoades, M. W., B. J. Reinhart, et al. (2002). "Prediction of plant microRNA targets." Cell
110(4): 513-20.
Robbins, J. C., W. P. Heller, et al. (2009). "A comparative genomics approach identifies a
PPR-DYW protein that is essential for C-to-U editing of the Arabidopsis chloroplast
accD transcript." RNA 15(6): 1142-53.
Rook, F., F. Corke, et al. (2001). "Impaired sucrose-induction mutants reveal the modulation
of sugar-induced starch biosynthetic gene expression by abscisic acid signalling."
Plant J 26(4): 421-33.
178
REFERENCES
Salone, V., M. Rudinger, et al. (2007). "A hypothesis on the identification of the editing
enzyme in plant organelles." FEBS Lett 581(22): 4132-8.
Samson, F., V. Brunaud, et al. (2004). "FLAGdb++: a database for the functional analysis of
the Arabidopsis genome." Nucleic Acids Res 32(Database issue): D347-50.
Schmitz-Linneweber, C. and I. Small (2008). "Pentatricopeptide repeat proteins: a socket set
for organelle gene expression." Trends Plant Sci 13(12): 663-70.
Schmitz-Linneweber, C., R. Williams-Carrier, et al. (2005). "RNA immunoprecipitation and
microarray analysis show a chloroplast Pentatricopeptide repeat protein to be
associated with the 5' region of mRNAs whose translation it activates." Plant Cell
17(10): 2791-804.
Schmitz-Linneweber, C., R. E. Williams-Carrier, et al. (2006). "A pentatricopeptide repeat
protein facilitates the trans-splicing of the maize chloroplast rps12 pre-mRNA." Plant
Cell 18(10): 2650-63.
Shadel, G. S. (2004). "Coupling the mitochondrial transcription machinery to human disease."
Trends Genet 20(10): 513-9.
Sheen, J., L. Zhou, et al. (1999). "Sugars as signaling molecules." Curr Opin Plant Biol 2(5):
410-8.
Small, I., N. Peeters, et al. (2004). "Predotar: A tool for rapidly screening proteomes for Nterminal targeting sequences." Proteomics 4(6): 1581-90.
Small, I. D. and N. Peeters (2000). "The PPR motif - a TPR-related motif prevalent in plant
organellar proteins." Trends Biochem Sci 25(2): 46-7.
Sterky, F. H. and N. G. Larsson (2008). "Complex I: a complex gateway to the powerhouse."
Cell Metab 7(4): 278-9.
Sung, T. Y., C. C. Tseng, et al. (2010). "The SLO1 PPR protein is required for RNA editing at
multiple sites with similar upstream sequences in Arabidopsis mitochondria." Plant J.
Sunkar, R. and J. K. Zhu (2004). "Novel and stress-regulated microRNAs and other small
RNAs from Arabidopsis." Plant Cell 16(8): 2001-19.
Takenaka, M., D. Verbitskiy, et al. (2010). "Reverse genetic screening identifies five E-class
PPR-proteins involved in RNA editing in mitochondria of Arabidopsis Thaliana." J
Biol Chem.
Tasaki, E., M. Hattori, et al. (2010). "The moss pentatricopeptide repeat protein with a DYW
domain is responsible for RNA editing of mitochondrial ccmFc transcript." Plant J.
Tavares-Carreon, F., Y. Camacho-Villasana, et al. (2008). "The pentatricopeptide repeats
present in Pet309 are necessary for translation but not for stability of the mitochondrial
COX1 mRNA in yeast." J Biol Chem 283(3): 1472-9.
Till, B., C. Schmitz-Linneweber, et al. (2001). "CRS1 is a novel group II intron splicing factor
that was derived from a domain of ancient origin." RNA 7(9): 1227-38.
Tillich, M., H. T. Funk, et al. (2005). "Editing of plastid RNA in Arabidopsis thaliana
ecotypes." Plant J 43(5): 708-15.
Tseng, C. C., T. Y. Sung, et al. (2010). "Editing of accD and ndhF chloroplast transcripts is
partially affected in the Arabidopsis vanilla cream1 mutant." Plant Mol Biol 73(3):
309-23.
179
REFERENCES
Uyttewaal, M., N. Arnal, et al. (2008). "Characterization of Raphanus sativus
pentatricopeptide repeat proteins encoded by the fertility restorer locus for Ogura
cytoplasmic male sterility." Plant Cell 20(12): 3331-45.
Uyttewaal, M., H. Mireau, et al. (2008). "PPR336 is associated with polysomes in plant
mitochondria." J Mol Biol 375(3): 626-36.
Van Leene, J., E. Witters, et al. (2008). "Boosting tandem affinity purification of plant protein
complexes." Trends Plant Sci 13(10): 517-20.
Verbitskiy, D., A. Zehrmann, et al. (2010). "The PPR protein encoded by the LOVASTATIN
INSENSITIVE 1 gene is involved in RNA editing at three sites in mitochondria of
Arabidopsis thaliana." Plant J 61(3): 446-55.
Vidal, G., M. Ribas-Carbo, et al. (2007). "Lack of respiratory chain complex I impairs
alternative oxidase engagement and modulates redox signaling during elicitor-induced
cell death in tobacco." Plant Cell 19(2): 640-55.
Wakasugi, T., T. Tsudzuki, et al. (2001). "The genomics of land plant chloroplasts: Gene
content and alteration of genomic information by RNA editing." Photosynth Res
70(1): 107-18.
Wang, E. T., R. Sandberg, et al. (2008). "Alternative isoform regulation in human tissue
transcriptomes." Nature 456(7221): 470-6.
Wang, Z., Y. Zou, et al. (2006). "Cytoplasmic male sterility of rice with boro II cytoplasm is
caused by a cytotoxic peptide and is restored by two related PPR motif genes via
distinct modes of mRNA silencing." Plant Cell 18(3): 676-87.
Weisshaar, B. and G. I. Jenkins (1998). "Phenylpropanoid biosynthesis and its regulation."
Curr Opin Plant Biol 1(3): 251-7.
Wiebauer, K., J. J. Herrero, et al. (1988). "Nuclear pre-mRNA processing in plants: distinct
modes of 3'-splice-site selection in plants and animals." Mol Cell Biol 8(5): 2042-51.
Williams, P. M. and A. Barkan (2003). "A chloroplast-localized PPR protein required for
plastid ribosome accumulation." Plant J 36(5): 675-86.
Williams-Carrier, R., T. Kroeger, et al. (2008). "Sequence-specific binding of a chloroplast
pentatricopeptide repeat protein to its native group II intron ligand." Rna 14(9): 193041.
Xu, F., C. Ackerley, et al. (2008). "Disruption of a mitochondrial RNA-binding protein gene
results in decreased cytochrome b expression and a marked reduction in ubiquinolcytochrome c reductase activity in mouse heart mitochondria." Biochem J 416(1): 1526.
Xu, F., C. Morin, et al. (2004). "The role of the LRPPRC (leucine-rich pentatricopeptide
repeat cassette) gene in cytochrome oxidase assembly: mutation causes lowered levels
of COX (cytochrome c oxidase) I and COX III mRNA." Biochem J 382(Pt 1): 331-6.
Yamazaki, H., M. Tasaka, et al. (2004). "PPR motifs of the nucleus-encoded factor, PGR3,
function in the selective and distinct steps of chloroplast gene expression in
Arabidopsis." Plant J 38(1): 152-63.
Yu, Q. B., Y. Jiang, et al. (2009). "AtECB2, a pentatricopeptide repeat protein, is required for
chloroplast transcript accD RNA editing and early chloroplast biogenesis in
Arabidopsis thaliana." Plant J 59(6): 1011-23.
180
REFERENCES
Zehrmann, A., J. A. van der Merwe, et al. (2008). "Seven large variations in the extent of
RNA editing in plant mitochondria between three ecotypes of Arabidopsis thaliana."
Mitochondrion 8(4): 319-27.
Zehrmann, A., D. Verbitskiy, et al. (2009). "A DYW domain-containing pentatricopeptide
repeat protein is required for RNA editing at multiple sites in mitochondria of
Arabidopsis thaliana." Plant Cell 21(2): 558-67.
Zhou, W., Y. Cheng, et al. (2008). "The Arabidopsis gene YS1 encoding a DYW protein is
required for editing of rpoB transcripts and the rapid development of chloroplasts
during early growth." Plant J.
Zoschke, R., M. Nakamura, et al. (2010). "An organellar maturase associates with multiple
group II introns." Proc Natl Acad Sci U S A 107(7): 3245-50.
Zsigmond, L., G. Rigo, et al. (2008). "Arabidopsis PPR40 connects abiotic stress responses to
mitochondrial electron transport." Plant Physiol 146(4): 1721-37.
181
ANNEXES
ANNEXES :
Tableau 1 : Sondes affymetrix pour chaque gène PPR
AGI code
Probe set id
AGI code
Probe set id
AGI code
Probe set id
At1g01970
At1g02060
At1g02150
At1g02370
At1g02420
At1g03100
At1g03510
At1g03540
At1g03560
At1g04840
At1g05600
At1g05670
At1g05750
At1g06140
At1g06150
At1g06270
At1g06580
At1g06710
At1g07590
At1g07740
At1g08070
At1g08610
At1g09190
At1g09220
At1g09410
At1g09680
At1g09820
At1g09900
At1g10270
At1g10330
At1g10910
At1g11290
At1g11630
At1g11710
At1g11900
At1g12620
At1g12700
At1g12770
At1g13040
At1g13630
At1g13800
At1g14470
At1g15480
At1g15510
At1g16830
At1g17630
At1g18485
At1g18900
At1g19290
At1g19520
261622_at
264167_at
264177_at
259444_at
259414_at
263143_at
264819_at
264817_at
264816_at
261172_at
263200_at
263230_at
261310_at
260952_at
260951_at
260792_at
262627_at
260826_at
261088_at
261463_at
260620_at
264806_at
264251_at
264258_at
264503_at
264666_at
264713_at
264689_at
264452_at
264455_at
260465_at
262509_at
262822_at
262810_at
264392_at
255938_at
255935_at
261194_at
257465_at
256095_at
259449_at
261472_at
262586_at
261762_at
256107_at
260736_at
261715_at
259461_at
260654_at
260663_at
At2g02750
At2g02980
At2g03380
At2g03880
At2g04860
At2g06000
At2g13600
At2g15630
At2g15690
At2g15820
At2g16880
At2g17033
At2g17210
At2g17670
At2g18520
At2g18940
At2g19280
At2g20540
At2g20710
At2g21090
At2g22070
At2g22410
At2g25580
At2g26790
At2g27610
At2g27800
At2g28050
At2g29760
At2g30780
At2g31400
At2g32630
At2g33680
At2g33760
At2g34370
At2g34400
At2g35030
At2g36240
At2g36730
At2g36980
At2g37310
At2g37320
At2g38420
At2g39230
At2g39620
At2g40240
At2g40720
At2g41080
At2g42920
At2g44880
At2g45350
267473_at
266794_at
265708_at
263362_at
263623_at
266028_at
263719_at
257395_at
265474_at
265484_at
266529_at
263550_at
263418_at
264591_at
265931_at
266951_at
267331_at
263364_at
265429_at
264011_at
263353_at
264047_at
265901_at
266853_at
266255_at
266241_s_at
266164_at
266668_at
267568_at
263242_at
267086_at
267445_at
267455_at
267047_at
266998_at
267420_at
263958_at
265195_at
263887_at
266002_at
266003_at
267031_at
267011_at
266973_at
263822_at
266102_at
267065_at
265267_at
266810_at
245129_at
At3g62540
At4g01030
At4g01570
At4g01990
At4g02750
At4g02820
At4g04370
At4g08210
At4g11690
At4g13650
At4g14170
At4g14190
At4g14820
At4g14850
At4g15720
At4g16390
At4g16470
At4g18750
At4g18840
At4g19195
At4g19220
At4g19440
At4g19900
At4g20090
At4g20740
At4g20770
At4g21170
At4g21300
At4g25270
At4g26680
At4g26800
At4g28010
At4g30700
At4g30825
At4g31070
At4g31850
At4g32430
At4g32450
At4g33170
At4g33990
At4g35130
At4g35850
At4g36680
At4g37170
At4g37380
At4g38010
At4g38150
At4g39530
At5g01110
At5g02860
251211_s_at
255601_at
255588_at
255557_at
255446_at
255449_at
255329_at
255153_at
254880_at
254725_at
245595_at
245597_at
245580_at
245582_at
245508_at
245494_at
245498_at
254639_at
254588_at
254614_at
254556_at
254581_at
254552_at
254498_at
254483_at
254486_at
254457_at
254401_at
254051_at
253979_at
253932_at
253847_at
253584_at
253589_at
253576_at
253495_at
253430_at
253432_at
253365_at
253319_at
253170_at
253116_at
246249_at
246246_at
253092_at
253019_at
253027_at
252899_at
251128_at
250987_at
182
ANNEXES
At1g19520
At1g20230
At1g20300
At1g22830
At1g22960
At1g25360
At1g26460
At1g26500
At1g26900
At1g28690
At1g29710
At1g30610
At1g31430
At1g31790
At1g31840
At1g31920
At1g33350
At1g43010
At1g50270
At1g52620
At1g52640
At1g55630
At1g55890
At1g56570
At1g56690
At1g59720
At1g60770
At1g61870
At1g62260
At1g62350
At1g62590
At1g62670
At1g62680
At1g62720
At1g62915
At1g63070
At1g63080
At1g63130
At1g63150
At1g63330
At1g63400
At1g64100
At1g64310
At1g64580
At1g68930
At1g68980
At1g69350
At1g71060
At1g71210
At1g71420
At1g71460
At1g71490
At1g73400
At1g73710
At1g74400
260670_at
261277_at
255888_at
264749_at
264723_at
245630_at
261014_at
261003_at
263684_at
262763_at
246632_at
263220_at
256484_at
246262_at
246258_at
246313_at
256532_at
259622_at
262465_at
262144_at
262142_at
264540_at
260595_at
245680_at
245673_at
262907_at
264913_at
264286_at
264739_at
260631_at
265106_s_at
262687_at
262688_at
262690_at
261104_at
259684_at
259692_at
259689_x_at
259696_at
265106_s_at
261554_at
262328_at
259798_at
262007_at
259698_at
259700_at
260348_at
259746_at
259899_at
259949_at
259945_at
259951_at
245723_at
260062_at
260224_at
At2g46050
At3g01580
At3g02010
At3g02330
At3g02490
At3g02650
At3g03580
At3g04130
At3g04750
At3g04760
At3g05240
At3g08820
At3g09040
At3g09060
At3g09650
At3g11460
At3g12770
At3g13150
At3g13160
At3g13770
At3g13880
At3g14330
At3g14580
At3g14730
At3g15130
At3g15200
At3g15590
At3g15930
At3g16010
At3g16610
At3g16710
At3g16890
At3g18110
At3g18970
At3g20730
At3g21470
At3g22150
At3g22670
At3g23020
At3g23330
At3g24000
At3g25060
At3g25210
At3g25970
At3g26540
At3g26630
At3g26780
At3g28640
At3g28660
At3g29230
At3g29290
At3g42630
At3g46610
At3g46790
At3g47530
183
266602_at
259183_at
259003_at
256325_at
258502_at
258474_at
259218_at
258592_at
258817_at
258804_at
259355_at
258991_at
259206_at
259208_at
258696_at
259285_at
257685_at
257188_at
257193_at
256775_at
257607_at
258355_at
258088_at
258120_at
256886_at
256884_at
257291_at
257796_at
258334_at
258428_at
258422_at
257928_at
258149_at
256919_at
257979_at
258174_at
256792_at
258317_at
257765_at
258292_at
256906_at
257103_at
257838_at
258066_at
257616_at
257827_at
258254_at
257042_s_at
257042_s_at
257744_at
256613_at
252759_at
252473_s_at
252496_at
252420_at
At5g04810
At5g06400
At5g06540
At5g08310
At5g08490
At5g08510
At5g09450
At5g09950
At5g11310
At5g12100
At5g13230
At5g13270
At5g13770
At5g14080
At5g14770
At5g14820
At5g15010
At5g15280
At5g15300
At5g15340
At5g15980
At5g16420
At5g16640
At5g16860
At5g18390
At5g18475
At5g18950
At5g19020
At5g24830
At5g25630
At5g27110
At5g27270
At5g27460
At5g28460
At5g37570
At5g38730
At5g39350
At5g39680
At5g39710
At5g39980
At5g40415
At5g41170
At5g42310
At5g42450
At5g43790
At5g44230
At5g46100
At5g46460
At5g46580
At5g46680
At5g47360
At5g47460
At5g48730
At5g48910
At5g50280
250856_at
250725_at
250678_at
246052_at
250521_at
250523_at
245888_at
250508_at
250388_at
250303_at
250280_at
250283_at
250257_at
250215_at
246586_at
251211_s_at
246572_at
250164_at
250166_at
250169_at
246478_at
250115_at
250106_at
246458_at
250040_at
250011_at
249952_at
249965_at
246964_at
246901_at
246808_at
246818_at
246770_at
246173_s_at
249624_at
249529_at
249470_at
249462_at
249464_at
249436_at
249412_at
249341_at
249247_at
249222_at
249113_at
249088_at
248935_at
248874_at
248854_at
248871_at
248783_at
248803_at
248669_at
248640_at
248547_at
ANNEXES
At1g74580
At1g74600
At1g74630
At1g74750
At1g74850
At1g74900
At1g77010
At1g77170
At1g77360
At1g77405
At1g79080
At1g79490
At1g79540
At1g80270
At1g80550
At1g80880
At2g01360
At2g01390
At2g01510
At2g01740
At2g01860
260216_at
260217_at
260219_at
262219_at
262207_at
262224_at
264946_at
264475_s_at
246383_at
246388_at
264133_at
262941_at
262938_at
260331_at
260273_at
257475_at
266339_s_at
266339_s_at
266341_at
265865_at
263593_at
At3g47840
At3g48250
At3g48810
At3g49240
At3g49710
At3g49740
At3g50420
At3g51320
At3g53170
At3g53360
At3g53700
At3g54980
At3g56550
At3g57430
At3g58590
At3g59040
At3g60050
At3g60980
At3g61360
At3g61520
At3g62470
252386_at
252355_at
252332_at
252305_at
252245_at
252247_at
252216_at
252151_at
251972_at
251965_at
251936_at
251841_at
251693_at
251631_at
251583_at
251496_at
251451_s_at
251346_at
251313_at
246173_s_at
251211_s_at
Tableau 2 : Vecteurs Gateway utilisés pour les clonages.
184
At5g50390
At5g50990
At5g52630
At5g52850
At5g55740
At5g56310
At5g57260
At5g59200
At5g59600
At5g59900
At5g60960
At5g61370
At5g61400
At5g61800
At5g61990
At5g65560
At5g65570
At5g65820
At5g66500
At5g66520
At5g67570
248498_at
248483_at
248315_at
248307_at
248075_at
248012_at
247952_at
247737_at
247732_at
247701_at
247607_at
247550_at
247548_at
247518_at
247504_at
247141_at
247142_at
247160_at
247099_at
247100_at
247004_at

Identification des protéines PPR impliquées dans l`épissage des

Transcription

Documents pareils

Communiqué de Monsieur François Pinault et Monsieur François

Alexandre Bompard est nommé Président-directeur général

Friday May 11th,2007

La pseudo polyarthrite rhizomélique

SECURITE AUTO

annexe de l`arrêté du 21 mars 2011 - format : PDF

ROBERT PLANT wm i \ I *fîî?MH LOUIS BERTIGNAC SENSATION

Diapositive 1

gucci, la fnac - Girard

Untitled - Wirtgen Group