Cours partie 2 - M2 Expression Génique et Protéines Recombinantes

Transcription

Cours partie 2 - M2 Expression Génique et Protéines Recombinantes
24/10/2011
Biotechnologie
1
Protéines
Master
Recombinantes
Master Professionnel
Expression Génique et
Protéines Recombinantes
e-mail : [email protected] / Tel : +33 (0) 5 61 17 58 59
http://www.m2p-egpr.ups-tlse.fr/
Techniques et Stratégies en Biologie Moléculaire
Deuxième partie
Octobre 2011
Vincent Ecochard
Didier Fournier
Laurence Nieto
Laurent Paquereau
24/10/2011
2
ANALYSE DE LA FONCTION D’UN GENE ..................................................................................................................6
STRATEGIE BASEES SUR L’HYBRIDATION D’ARN ...............................................................................................................6
L’interférence d’ARN (RNAi) .........................................................................................................................................6
LE KNOCK-OUT OU L’INVALIDATION D’UN GENE PAR RECOMBINAISON HOMOLOGUE ......................................................10
La recombinaison homologue : un mécanisme à l’origine de la technologie de Knock-out ........................................10
Les souris KO ...............................................................................................................................................................11
Les cellules ES .............................................................................................................................................................11
Fabrication de souris transgéniques ............................................................................................................................12
L’interruption d’un exon : knock-out de gène ..............................................................................................................12
Création de mutation ponctuelle ..................................................................................................................................13
Le système Cre/Lox ......................................................................................................................................................14
Exemple d’application .................................................................................................................................................15
Mutation propre ...........................................................................................................................................................15
Large délétion ou translocation ...................................................................................................................................15
Les possibilités d’induction de la cre recombinase ......................................................................................................16
Le système tet-on ..........................................................................................................................................................16
DETECTION DES MUTATIONS / POLYMORPHISMES ...........................................................................................17
I) DETECTION DES MUTATIONS .........................................................................................................................................17
Méthodes basées sur la séquence .................................................................................................................................17
Méthodes basées sur l’hybridation ..............................................................................................................................19
Méthodes basées sur la PCR ........................................................................................................................................24
Ligation ........................................................................................................................................................................26
RFLP ............................................................................................................................................................................27
Méthodes basées sur la conformation de l’ADN ..........................................................................................................28
Hétéroduplex sensibilité à une coupure .......................................................................................................................29
II ) ANALYSE DU POLYMORPHISME ...................................................................................................................................32
Protéines ......................................................................................................................................................................32
Analyse des fragments de restriction ...........................................................................................................................32
Génotypage et cartographie génétique ........................................................................................................................34
Les micro et minisatellites ............................................................................................................................................35
MAAP (Multiple Arbitrary Amplification profiling) ....................................................................................................37
III) DETECTION D'UNE SEQUENCE .....................................................................................................................................38
EXPRESSION DES PROTEINES RECOMBINANTES ..............................................................................................39
INTRODUCTION .................................................................................................................................................................39
RAPPELS SUR LA TRADUCTION ..........................................................................................................................................39
Les événements de la traduction ..................................................................................................................................39
Régulation de la traduction ..........................................................................................................................................44
Compartimentalisation et modifications post-traductionelles .....................................................................................48
EXPRESSION TRANSITOIRE A PARTIR D'UN ARNM OU D'UN ARN IN VITRO (CRNA) .........................................................50
Obtention d'un cRNA....................................................................................................................................................50
Traduction en milieu cellulaire. L’ovocyte de Xénope .................................................................................................54
EXPRESSION EN SYSTEME PROCARYOTE ...........................................................................................................................55
I) Escherichia coli ........................................................................................................................................................55
II) Autres bactéries utilisées en production de protéines .............................................................................................66
EXPRESSION EN SYSTEME EUCARYOTE : LES CHAMPIGNONS .............................................................................................70
les levures.....................................................................................................................................................................70
Les champignons filamenteux ......................................................................................................................................76
24/10/2011
3
Dictyostelium discoideum ............................................................................................................................................76
LES CELLULES VEGETALES ...............................................................................................................................................78
LES CELLULES D'INSECTES ................................................................................................................................................80
a) Baculovirus. .............................................................................................................................................................80
b) Cellules d’insecte ayant intégré le gène d’intérêt dans leur génome .......................................................................85
LES CELLULES DE VERTEBRES ...........................................................................................................................................87
1) L'ovocyte de Xénope ................................................................................................................................................87
2) Cellules de mammifère.............................................................................................................................................87
EXPRESSION DANS DES EUCARYOTES UNICELLULAIRES ..................................................................................................103
LES CAUSES D'ECHECS DE LA PRODUCTION DE PROTEINES. .............................................................................................104
1) Il n’y a pas ou peu de protéine...............................................................................................................................104
2) La protéine est produite mais est toxique ..............................................................................................................108
3) La protéine est surexprimée mais est mal repliée ..................................................................................................110
4) La protéine est produite mais est protéolysée ........................................................................................................112
5) Les maturations post-traductionelles ne sont pas correctes ..................................................................................113
6) La protéine est produite mais on ne sait pas la détecter ........................................................................................115
7) La protéine est produite mais on ne sait pas la purifier ........................................................................................116
8) La protéine est produite mais il existe aussi des protéines proches produites par la cellule, des endogènes .......117
9) Problème particulier lié à l'utilisation de la protéine chez l'homme .....................................................................117
TAG, PROTEASES ET ACIDES AMINES MODIFIES .............................................................................................118
LES TAG ........................................................................................................................................................................118
LES PROTEASES ...............................................................................................................................................................124
INTEIN.............................................................................................................................................................................125
LES ACIDES AMINES MODIFIES ........................................................................................................................................127
PURIFICATION DES PROTEINES RECOMBINANTES ..........................................................................................129
DETERMINATION DE LA CONCENTRATION EN PROTEINE..................................................................................................129
La spectrophotométrie UV .........................................................................................................................................129
La fluorimétrie ...........................................................................................................................................................129
Les méthodes colorimétriques ....................................................................................................................................130
SOLUBILISATION DES PROTEINES ....................................................................................................................................131
Extraction des protéines cellulaires ...........................................................................................................................131
Solubilisation et renaturation des corps d’inclusion..................................................................................................133
LA CONCENTRATION DES PROTEINES ..............................................................................................................................136
LES DIFFERENTES METHODES DE SEPARATION DES PROTEINES .......................................................................................137
La chromatographie ...................................................................................................................................................137
L’électrophorèse ........................................................................................................................................................138
Séparation selon la taille ...........................................................................................................................................139
Séparation selon la charge.........................................................................................................................................140
Séparation selon la taille et la charge........................................................................................................................141
Séparation selon l’hydrophobicité .............................................................................................................................141
Séparation selon l’affinité ..........................................................................................................................................142
Séparation par des colorants .....................................................................................................................................144
EVALUATION DE LA PURETE ...........................................................................................................................................144
CARACTERISATION DES PROTEINES.................................................................................................................................145
STABILISATION DES PROTEINES ......................................................................................................................................147
Stabilisation des protéines par l’utilisation d’additifs. ..............................................................................................148
Stabilisation des protéines par mutagenèse dirigée ...................................................................................................149
ANALYSE DES INTERACTIONS ENTRE MACROMOLECULES ........................................................................153
INTERACTIONS ACIDES NUCLEIQUE-PROTEINE ................................................................................................................153
Criblage de banque d’expression : ......................................................................................Erreur ! Signet non défini.
Simple Hybride .....................................................................................................................Erreur ! Signet non défini.
Triple hybride .......................................................................................................................Erreur ! Signet non défini.
South-Western ......................................................................................................................Erreur ! Signet non défini.
24/10/2011
4
SELEX ..................................................................................................................................Erreur ! Signet non défini.
Immunoprécipitation de chromatine ....................................................................................Erreur ! Signet non défini.
Electrophoretic Mobility Shift Assay (EMSA) - gel retard ...................................................Erreur ! Signet non défini.
Footprint – empreinte sur l’ADN .........................................................................................Erreur ! Signet non défini.
BIAcore ................................................................................................................................Erreur ! Signet non défini.
INTERACTIONS PROTEINE - PROTEINE ..............................................................................................................................183
Introduction ................................................................................................................................................................183
Démarche expérimentale permettant de mettre en œuvre puis de caractériser une interaction protéine – protéine
.............................................................................................................................................Erreur ! Signet non défini.
Méthodes permettant s’assurer que la protéine appartient à un complexe et de déterminer la taille de ce complexe
.............................................................................................................................................Erreur ! Signet non défini.
Méthodes permettant d’isoler un complexe protéique .........................................................Erreur ! Signet non défini.
Cross-linking (association par des agents pontants .............................................................Erreur ! Signet non défini.
Identification des protéines du complexe .............................................................................Erreur ! Signet non défini.
Vérification de l’interaction in vivo .....................................................................................Erreur ! Signet non défini.
Méthodes permettant d’identifier un partenaire protéique tout en isolant son ADNc .........Erreur ! Signet non défini.
REFERENCES ...................................................................................................................................................................212
FOURNISSEURS ............................................................................................................................................................221
INDEX ...............................................................................................................................................................................222
24/10/2011
5
24/10/2011
6
Analyse de la fonction d’un gène
Plusieurs approches peuvent être envisagées pour aborder la fonction d’un gène. Les
techniques de biologie moléculaire et de biochimie permettant par exemple de localiser l’expression
d’un gène ou son produit (Northern, western, hybridation in situ, immunofluorescence …), de
déterminer la structure de la protéine (RMN, cristallographie …) ou de trouver des partenaires
protéiques (double hybride, immunoprécipitation …) donnent des informations importantes sur la
fonction d’un gène. D’autres stratégies basées sur des modifications de l’expression d’un gène ou sur
une modification de l’activité de la protéine permettent d’approfondir cette étude.
Un gène dans une cellule ou un organisme peut être soit surexprimé soit supprimé et, dans ce
dernier cas, on regroupe les stratégies sous le nom d’interruption de gène. L’analyse (difficile
certaines fois) du phénotype qu’engendrent ces modifications devrait permettre d’accéder à la (ou
les) fonction(s) du gène.
Stratégie basées sur l’hybridation d’ARN
L’interférence d’ARN (RNAi)
Le phénomène d’interférence d’ARN (RNAi) découvert par Fire et al. (1998) chez le nématode
Caenorhabditis elegans désigne l’inhibition
génique post-transcriptionnelle induite par de
Conservartion de l’interférence chez les eucaryotes
l’ARN double brins (ARNdb). C’est à dire
que la présence dans une cellule d’un ARN
db conduit dans certaines conditions à la
dégradation spécifique de l’ARN messager
de séquence identique (à l’un des brins). Ce
mécanisme, qui semble être un moyen de
résistance
vis-à-vis
de
virus
et
des
transposons chez les eucaryotes (hormis la levure), est à la base d’une stratégie actuellement
largement utilisé pour cibler la dégradation d’un ARNm dont on cherche la fonction. De par sa
24/10/2011
7
grande spécificité d’action et sa relativement bonne efficacité d’inhibition la stratégie de RNAi a
supplanté l’utilisation d’ARN antisens.
Le RNAi est un processus en 2 étapes qui commence à être caractérisé. Dans la première
étape les longues molécules d’ARNdb sont clivées par la protéine Dicer (une nucléase de la famille
des RNases-III) en petits fragments d’ARNdb de 21 à 25
nucléotides de long : les siRNA (small interfering
Complexe enzymatique Dicer
RNAs). Dans la seconde étape, les siRNA sont
Clivage de l ’ARNdb
incorporés dans un complexe ribonucléasique, le
siRNA
complexe RISC (RNA-induced silencing complex), qui
Ciblage de l ’ARNm
va guider les siRNA sur l’ARNm de séquence
homologue. Le brin antisens des siRNA s’apparie à
Clivage de l ’ARNm
l’ARNm cible ce qui provoque son clivage (par Dicer)
au
milieu
de
la
zone
d’appariement,
et
Complexe RISC
Brin antisens du siRNA
Poly(A)
donc
ARNm dégradé
l’impossibilité de traduire la protéine.
Amplification des siRNA
Chez C. elegans, il n’y a besoin d’une très faible quantité de siRNA pour oberver une
inhibition de la traduction d’un gène. Par exemple, on peut inhiber un gène du nématode en le
nourissant avec des bactéries qui expriment des RNAdb, et 2 molécules d’ARNdb suffisent à éteindre
un gène fortement exprimé tel que unc-22 gène codant pour une protéine musculaire. Cette puissance
d’action est retrouvée chez les plantes et le champignon Neurospora mais pas chez la drosophile ni
les cellules de mammifères. Ce faible besoin en siRNA pour observer un effet, rend leur action
transmissible à la descendance, les siRNA se retrouve dans les cellules germinales.
Pour isoler la protéine responsable de
Dicer
l’amplification des siRNA, une approche génétique a
ARNdb
été faite chez Neurospora par une une analyse de
mutants déficients. Ceci a permis d’identifier un
gène codant pour une enzyme responsable du
Synthèse d ’ARN
par une RdRP
RISC
Complexe siRNA actif
phénomène d’amplification observé. Il s’agit d’une
RNA polymérase RNA dépendante (RdRP) présente
chez les plantes et chez le nématode mais absente
siRNA secondaire
Clivage de la cible
24/10/2011
8
chez la drosophile ou les vertébrés. Cette enzyme est capable de synthétiser un ARN complémentaire
à partir d’un ARN matrice et d’une amorce provenant d’un siRNA. Ceci entraîne la production
d’ARNdb qui sera à son tour clivé par l’enzyme dicer pour donner des siRNA secondaires qui eux
même pouront servir d’amorce à une nouvelle polymérisation d’ARNdb. Ce système d’amplification
rends l’utilisation d’ARNdb très efficace pour inhiber un gène chez C. elegans.
Les longs ARNdb sont aussi couramment utilisés aussi chez la drosophile ou dans les cellules
de drosophile en culture (cellule S2). Cependant, chez les mammifères, l’utilisation de longs ARNdb
entraîne des effets non spécifiques tels que l’activation de la production d’interferon avec l’induction
d’une protéine kinase ARN dépendante (PKR) conduisant à la dégradation non spécifique de tous les
ARNm, puis à l’apoptose des cellules. Pour remédier à ce problème, le groupe de T. Tuschl en 1999,
a montré que l’on pouvait l’utiliser directement des siRNA et non de longs ARNdb.
Pratiquement, les siRNA peuvent être obtenus de différentes manières :
-
par synthèse chimique
-
par clivage in vitro de long ARNdb (à l’aide de l’enzyme Dicer recombinante)
-
par l’utilisation de vecteurs codant des ARN tige boucle
Synthèse de siRNA
Les siRNA peuvent s’acheter chez de nombreux fournisseurs ; il suffit de donner les
séquences sens et antisens. La figure montre la
5’
structure d’un siRNA synthétique, composé de 21
nucléotides de longueur hybridant sur 19 nucléotides
avec 2 U sortant en 3’. Generallement on remplace les
3’
U U
U U
(N19)
(N’19)
3’
5’
2 U par 2 T ce qui permet une meilleure stabilité des siRNA pour un coup moindre.
Il a été montré de façon empirique que le choix de la séquence cible était très important pour
l’efficacité de l’inhibition. Le siRNA doit être choisi dans l’ORF (cadre ouvert de lecture)
préférentiellement au milieu de la séquence codante, 100 nucléotides après l’AUG et 100 avant le
stop. Actuellement il se développe des logiciels pour dessiner les siRNA à partir de la séquence d’un
ARNm.
Les paramètres à prendre en compte lors du choix d’un siRNA
- Pourcentage en GC
24/10/2011
-
Recherche dans les banques de données afin de s’assurer de la spécificité d’inhibition
-
Choix d’une méthode de transfection efficace en fonction du type cellulaire.
Clivage in vitro de longs ARNdb :
Une stratégie utilisée avec succès permet de synthétiser in vitro
des siRNA en ultilisant l’enzyme Dicer qui est produite par
génie génetique (protéine recombinante).
Principe : l’ADNc du gène à éteindre (ou uniquement son
ORF) est cloné dans un vecteur comprenant deux promoteurs
phagiques. Les ARN sens et antisens sont transcrits in vitro et
hybridés en solution. L’enzyme Dicer est rajoutée à l’ARN
puis le siRNA sont purifiés et transfectés.
L’avantage de cette approche est que l’on synthétise en
quelque sorte des siRNA correspondant à toute la séquence de
l’ARN.
9
24/10/2011
10
Le Knock-out ou l’invalidation d’un gène par
recombinaison homologue
Le knock-out d’un gène (ou K.O.) signifie la perte physique de la séquence (ou d’une partie
de la séquence) de ce gène conduisant à l’absence de l’ARN messager et donc de la protéine. Le KO
est donc transmissible à la descendance. Attention cependant : chez les eucaryotes, le KO d’un gène
signifie que la séquence des deux allèles est affectée, la descendance respecte les lois de Mendel.
Le KO revient à réaliser de la mutagenèse dirigée (par délétion). Ceci est rendu possible par
l’existence d’un mécanisme fondamental d’échange de séquence d’ADN homologue au niveau
chromosomique : la recombinaison homologue.
La recombinaison homologue : un mécanisme à l’origine de la technologie de Knockout
La recombinaison homologue est un échange de fragments d’ADN entre deux molécules
(d’ADN) au niveau des séquences nucléotidiques homologues. C’est ce qu’il se passe lors de
crossing over à la méiose entre les chromatides des paires de chromosomes. Le KO est basé sur de la
recombinaison homologue entre de l’ADN exogène et de l’ADN génomique. Ce mécanisme connu
depuis longtemps chez la levure a été mis en évidence en 1980 chez les mammifères par injection
directe d’ADN dans des cellules de mammifères.
Lorsque de l’ADN (plasmidique par exemple) est transfecté dans des cellules eukaryotes, il
peut : - soit rester à l’état épisomique (transfection transitoire)
- soit s’intégrer dans le génome (transfection stable)
Dans ce dernier cas, l’ADN s’intègre au hasard (généralement en plusieurs copies inversées),
mais dans un nombre de cas rares, il peut
s’intégrer par recombinaison homologue (RH)
si une séquence identique existe dans le
Insertion au hasard
génome.
Les facteurs qui favorisent la recombinaison homologue :
- La taille de la région homologue (de 4 à 9 kb, on multiplie par 20 la RH)
- Le fort pourcentage d’homologie
Recombinaison homologue
24/10/2011
11
- L’ADN sous forme linéaire (par rapport à circulaire)
- Le mode de transfection
Il semble en revanche que ni le nombre de copies présentes dans la cellule, ni la localisation
chromosomique du gène à invalider, n’influe sur la RH.
En tout état de cause, il est indispensable de sélectionner les événements de recombinaison.
Les différents types de sélection utilisés chez les eucaryotes supérieurs ( pour l’établissement de
lignées stables) reposent sur l’utilisation de gènes de résistance à des drogues telles que la néomycine
(ou G418), la bléomycine, l’hygromycine, la puromycine.
D’autres marqueurs de sélection sont également utilisés :
Le gène codant pour la DHFR (dihydrofolate réductase) résiste au méthotrexate.
Le gène HPRT : Hypoxantine phosphoribosyl transferase. Ce gène permet une double sélection,
positive et négative. Les cellules possédant ce gène poussent en milieu HAT (hypoxanthine,
aminoptérine, thymidine) mais sont sensible au 6-thioguanine, inversement l’absence de ce gène rend
les cellules sensibles au milieu HAT et résistantes à la 6-thioguanine.
Le gène HSV-TK : la thymidine kinase du virus herpès simplex. Cette enzyme est capable de
phosphoryler le gencyclovir qui devient ainsi toxique pour les cellules.
Les souris KO
Nous venons de voir qu’il est possible de créer et sélectionner des cellules stables déficientes
pour un gène. Nous allons voir comment il est possible de créer à partir de ces cellules un organisme
entier KO. Ceci est devenu possible grâce à l’isolement de cellules souches embryonnaires de souris,
les cellules ES (embryonic stem cell)
Les cellules ES
Ce sont des cellules isolées à partir d’embryons de souris et possédant des propriétés
remarquables :
- Elles sont totipotentes, c’est-à-dire que ce sont des cellules indifférenciées possédant le
potentiel de devenir n’importe quel type cellulaire
- Leur croissance est illimitée en culture
- Elles sont facilement transfectables (et sélectionnables)
- Il est possible de les réimplanter (après modification génétique) dans un blastocyste de
souris et elles pourront alors coloniser tous les types cellulaires (donc aussi la lignée germinale) et,
24/10/2011
12
dans ce cas, donneront naissance à des souris chimères pouvant donner des descendants
hétérozygotes pour la modification génétique.
Fabrication de souris transgéniques
Une fois les cellules ES sélectionnées,
elles vont être injectées dans le blastocoele
(cavité) d’embryons au stade blastocyste prélevé
sur une femelle donneuse (dont la couleur du
pelage est plus claire que la femelle donneuse de
cellules
ES).
Quelques
blastocystes
ainsi
modifiés vont alors être réimplantés dans une
femelle receveuse. Les souriceaux dérivant des
blastocystes
modifiés
seront
mosaïques :
certains tissus proviennent des cellules ES et
d’autres dérivent du blastocyste hôte. En
fonction de l’étendu du pelage foncé provenant
des cellules ES modifiées, on peut se rendre
compte de l’importance de la colonisation
tissulaire de ces cellules, l’espoir étant que les
cellules modifiées aient colonisé la lignée germinale. Seuls ces individus seront capables de
transmettre le gène invalidé à leur descendance. Le croisement de ces souris avec des souris sauvages
donnera 50% d’hétérozygotes (+/-) pour la mutation et 50% de souris sauvages (+/+) . Le croisement
des hétérozygotes entre eux permet d’obtenir 25% d’homozygotes possédant les deux allèles mutés (/-) : ce sont les souris KO pour le gène considéré.
Les différentes constructions utilisées
L’interruption d’un exon : knock-out de gène
La figure ci-contre montre un exemple de construction simple aboutissant, après
recombinaison homologue, à la perte de
Néo
2
3
l’expression d’un gène. Le gène de
HSV-TK
Vecteur
3
4
Stop
ATG
résistance à la néomycine a été introduit
dans la séquence de l’exon 3 d’un gène
Exons :
1
ATG
2
4
3
Néo
Chromosome
5
Stop
Néo R
Ganc R
24/10/2011
13
quelconque. Le gène de la thymidine kinase du virus de l’herpes est introduit en aval de la séquence
du gène. Les événements de recombinaison homologue sont sélectionnés par la double sélection :
positive par le néomycine et négative par la thymidine kinase. Les cellules recombinées au niveau du
gène sont néomycine résistantes et gancyclovir résistantes, alors que les intégrations au hasard seront
néomycine résistantes et gancyclovir sensibles.
Création de mutation ponctuelle
Si maintenant le gène de résistance
*
Néo
HSV-TK
à la néomycine se situe dans un intron et
que l’on a créé une mutation dans l’exon
*
ATG
Stop
3 du gène, la recombinaison homologue
de
cette
construction
aboutira
à
l’introduction de la mutation au niveau
du génome. La présence de la cassette
Néo
*
ATG
Néo R
Ganc R
Stop
Transcription - Epissage
*
ATG
Stop
de résistance dans un intron n’empêche pas la traduction ni l’épissage, les modifications qu’entraîne
cette construction sont théoriquement dues uniquement à la mutation. Il à cependant été montré que
dans certains cas la présence d’une cassette de sélection dans un intron peut avoir un effet sur le
niveau de transcription du gène. Ce qui a conduit le chercheurs à imaginer des stratégies pour
éliminer le gène de sélection afin d’aboutir à des mutations « propres »
Mutation propre par double remplacement
Dans cette exemple on se base sur la
hprt
1er évènement de recombinaison
propriété du gène HPRT permettant une double
Stop
ATG
sélection (voir plus haut). Le premier événement
de recombinaison apporte gène hprt dans l’intron
hprt
ATG
Stop
HAT R
6-TG S
(cellules HAT résistantes et 6-thioguanine
2ème évènement de recombinaison
*
sensibles). La seconde RH amène la mutation et
élimine le gène hprt, les cellules deviennent
S
R
HAT et 6-TG .
ATG
*
Stop
HAT S
6-TG R
24/10/2011
14
Le Knock-in
Cette stratégie permet de créer un KO, et en
même temps de remplacer le gène par un autre gène
qui s’exprimera ainsi comme le gène interrompu. Si
le nouveau gène est un gène rapporteur, type LacZ
ou GFP, ceci permet de localiser l’expression du
gène délété dans la souris au cours du
développement ou chez l’adulte (ce qui n’est pas
toujours facile autrement).
Cette stratégie peut aussi être utilisée pour montrer qu’un autre gène peut remplacer la fonction de
celui qui est interrompu. Par exemple, la cycline E peut sauver le phénotype du KO de la cycline D.
Les systèmes inductibles
Il se peut que des souris KO pour un gène ne soient jamais obtenues. C’est le cas lorsque la
mutation est lethale embryonnaire ; les homozygotes mutants ne sont jamais mis au monde, ou
bien l’expression du gène étudié est très large, donc le phénotype mutant très complexe. Dans
ces cas, on va vouloir contrôler la mutation dans le temps et dans l’espace.
Le système Cre/Lox
La Cre est une recombinase (de la famille des intégrases) du bactériophage P1. C’est une
protéine de 38 KDa qui catalyse la recombinaison entre
deux site de reconnaissance, les sites LoxP. LoxP est une
séquence d’ADN de 34 pb comprenant aux extrémités 13
nucléotides palindromiques (il est donc impossible de
trouver cette séquence dans un gènome eucaryote). Les deux
sites peuvent être très éloignés l’un de l’autre et être quand
même recombinés par la Cre. Cette recombinase fonctionne
dans les cellules eucaryotes génétiquement modifiées
comportant deux sites loxP.
En fonction de l’orientation des sites loxP, il peut se
produire une délétion ou une inversion. Il est à noter que ce
mécanisme est réversible.
Dans les exemples qui suivent la RH permet d’apporter les
24/10/2011
15
sites loxP sans altérer le gène étudié. La cre recombinase permettra d’éliminer la région entre les
deux sites. L’induction de la cre entraîne l’induction de la déletion.
Exemple d’application
La délétion d’exon
Deux sites loxP sont insérés de part et d’autre d’un exon du gène à invalider. On dit que
l’exon est « floxé ». Cette construction peut être
utilisée pour remplacer le gène sauvage par
recombinaison homologue dans des cellules ES. On
vérifie que des souris transgéniques homozygotes
(pour l’exon floxé) sont parfaitement saines. Ces
souris peuvent alors être croisées avec des souris
transgéniques exprimant la Cre recombinase dans un
tissu particulier (le génome de ces souris contient le
gène Cre sous la dépendance d’un promoteur tissu spécifique).
Mutation propre
Il a été montré que la présence d’un gène de résistance dans un intron, par exemple dans le cas
de mutations ponctuelles, pouvait influer sur la régulation de l’expression du gène (voir plus haut). Et
donc que le phénotype observé n’était pas seulement dû à la mutation. Dans ce cas, on peut utiliser le
système Cre/lox pour éliminer le gène de
Néo
*
HSV-TK
résistance. Il suffit, dans la construction, de floxer
+ Cre
la cassette de résistance qui sera éliminée par la
*
ATG
Stop
cre.
Large délétion ou translocation
Certaines maladies génétiques sont dues à
Hyg
Néo
de grandes délétions dans le génome (ou à
des translocations). Il est possible de créer
Puro
Hyg
ro
Néo
Néo R
des souris porteuses de ce type de maladie
(afin par exemple d’analyser l’effet de
Hyg
Néo
Puro
ro
+ Cre
Hyg
ro
Hygro R
24/10/2011
16
certaines thérapies). La figure montre une stratégie basée sur le système cre/lox qui à été utilisée avec
succès. Deux événements de recombinaison homologue sont nécessaires pour introduire les deux
sites lox P et deux parties de la cassette hygromycine. Le premier événement est sélectionné par la
cassette néomycine et le second par puromycine. La cre recombinase permet de rapprocher les deux
parties non fonctionnelles de l’hygromycine devenant ainsi fonctionnelle. Si les deux sites loxP sont
sur le même chromosome il s’en suit une large délétion (plusieurs centaines de Kb). Si ils sont sur
deux chromosomes différents cela conduit à une translocation.
Les possibilités d’induction de la cre recombinase
Un système très sophistiqué d’induction de la cre recombinase à été utilisé récemment (ref). Il
repose sur l’expression d’une protéine de fusion entre la cre et un récepteur tronqué aux
glucocorticoïdes. L’expression de cette
Cre
Cre
fusion peut être contrôlée par un
promoteur quelconque (ubiquitaire ou
Active
Agoniste
(tamoxifène, RU486)
Inactive
Domaine de fixation au ligand
(récepteur des stéroïdes)
tissu spécifique). La cre ainsi fusionnée
Injection de l’agoniste
à un temps donné
est inactive et ne devient active qu’en
présence
d’un
glucocorticoïde
(et
agoniste
de
non
de
pas
glucorticoïdes endogènes) comme le
tamoxifène et le RU486. La figure
Séquence « floxée »
Cre
X
Cre
Cre
Cre
Cre-ind
Cre-ind
P (ubiquitaire ou spécifique)
montre que le croisement de souris transgénique pour la cre inactive (commerciale) avec de souris
floxé pour un gène donné permet d’obtenir des souris contenant à la fois la cre inactive et un gène
floxé. L’injection de l’agoniste dans un tissu quelconque provoquera la délétion du gène (ou d’une
partie du gène) au moment et au lieu choisi.
Le système tet-on
24/10/2011
17
Détection des mutations / polymorphismes
I) Détection des mutations
Les mutations ponctuelles affectent un seul nucléotide et sont souvent appelées SNP (single
nucléotide polymorphism). Elles peuvent être silencieuses, mais peuvent aussi causer des mutations
non-sens, modifier la séquence en acide aminé d’une protéine ou interférer avec l’épissage de l’ARN.
Ces modifications peuvent alors être responsables de maladies génétiques, ou modifier le phénotype
du porteur.
Méthodes basées sur la séquence
La méthode de séquencage de Sanger permet
d'identifier la mutation d'une manière sûre.
Toutefois cette méthode est lourde et génère plus
d’information qu’il n’en faut. Aussi elle n'est
souvent utilisée que pour la mise en évidence
Exemple de mise en évidence d’une mutation ponctuelle par séquençage
pour la première fois d'une mutation.
Une fois la séquence connue ce n'est pas la peine de séquencer toutes les pistes. Ce n'est pas non plus
la peine de séquencer en aval de la mutation. On peut
utiliser la méthode de séquençage de Sanger en
utilisant uniquement trois desoxynucléotides et un
didesoxynucléotide et une amorce proche de la
mutation de telle sorte que la polymérisation soit plus
ou moins longue en fonction de la présence de la
Mutation à détecter
A
NNNNNNNNTGC GCANNNNNNN
G
Produits de la réaction en présence de ddATP
32P
32P
NNNNNNNNNNNNNNNNNTGCAdd
NNNNNNNNNNNNNNNNNTCGGGCAdd
mutation. Les produits de la réaction sont séparés sur
gel et la présence d'un produit permet de connaître la présence de la mutation.
24/10/2011
18
Cette méthode présente un avantage, si la mutation est présente dans une partie de la population de
départ, en quantifiant la présence des deux produits on peut estimer sa fréquence. Elle a par exemple
été utilisée pour estimer le taux d'édition de certains ARN messagers (Schiffer et Heinemann, 1999).
On peut aussi faire une extension d’amorce en utilisant uniquement le nucléotide à détecter. Dans de
cas le nucléotide sera marqué de façon à déterminer l’incorporation. On peut par exemple utiliser
uniquement un didesoxynuclétotide fluorescent et détecter l’incorporation par electrophorèse
capillaire. Dans ce cas on fait les deux réactions, avec l’extension sauvage et l’extension mutée, et on
fait migrer les produits de la réaction. Pour éviter la migration des nucléotides non incorporés on les
dégrade à l’aide d’une phosphatase alcaline.
A
G
Hybridation
A
G
Polymérisation en présence
de dTTP lié à un antigène reconnu par un anticoprs
lié à une phosphatase alcaline
de dCTP lié à un antigène reconnu un anticoprs
lié à une péroxidase
A
T
G
C
a
b
A
T
AP
a
G
C
HRP
b
La révélation peut aussi se faire à l’aide d’anticorps.
Différentes étapes :
-
on amplifie la région de la mutation,
-
on fixe l’amorce à un support,
-
on hybride le produit de l’amplification avec l’amorce,
24/10/2011
-
19
on polymérise en présence des deux oligonuclétides correspondant au type sauvage et au
type mutant,
-
on lave pour éliminer les nucléotides non incorporés
-
et on révèle le nucléotide incorporé à l’aide d’un anticorps associé à une activité
enzymatique.
Pour améliorer l’hybridation on peut détruire un des deux brins de l’amplification en le digérant par
une exonucléase, le brin à hybrider sera alors protégé en utilisant un oligonucléotide modifié non
sensible à l’exonucléase.
Cette méthode est commercialisée par Invitrogen.
La méthode de séquence en utilisant le pyroséquençage peut être utilisée pour détecter des mutations
(Ahmadian et al., 2000). L’avantage de cette méthode est de faire passer le nucléotide « sauvage » et
« mutant » l’un après l’autre la hauteur relative des deux pics permet d’estimer la proportion de
mutants dans une population.
Méthodes basées sur l’hybridation
Southern
L'hybridation de deux chaînes d'ADN est due à l'appariement de bases complémentaires A-T et G-C.
Elle est donc diminuée lors de mésappariement. Le Tm d'un oligonucléotide de 10 à 20 bases sera
donc abaissé s'il y a un mésappariement.
24/10/2011
20
La méthode de Southern (1975) est particulièrement adaptée pour détecter les grandes altérations
telles que les insertions, les délétions ou les
réarrangements. Mais cette méthode peut aussi être
utilisée pour détecter les mutations ponctuelles si on
utilise un oligonucléotide comme sonde.
ADN
mutant témoin mutant témoin
Il n’est pas toujours nécessaire de digérer l’ADN par
une enzyme de restriction et de séparer les fragments
par electrophorèse. On peut directement spotter
l’ADN à analyser sur une feuille de nitrocellulose
(« dot-blot »).
Dans certains cas si l'altération se retrouve dans
oligonucléotide
sonde
cDNA
Exemple de mise en évidence d’une
mutation ponctuelle par Southern avec
un oligonucléotide portant la mutation
l'ARN, un northern peut être employé pour la
détecter.
Il existe plusieurs méthodes pour détecter l’hybridation. La plus ancienne est l’utilisation d’un
marquage radioactif. On utilise comme sonde un oligonucléotide marqué en 5' par une kinase et du
α-32P ATP. Comme contrôle, on peut utiliser une sonde plus grande dont l’hybridation n’est pas
sensible à la présence de la mutation (ADNc sur la figure) pour vérifier que la cible était bien en
quantité égale dans les différentes pistes.
L’hybridation peut se faire sur puce à ADN. Un premier spot contient un oligonucléotide sauvage et
un deuxième spot contient un oligonucléotide muté. L’ADN de la région à analyser est amplifié et
marqué avec un fluorophore. Il est hybridé avec les oligonucléotides fixés à la puce, s’il y a
hyburidation il y aura fluorescence, si la mutation diminue le Tm, il n’y aura pas de fluorescence.
Comme on peut disposer d’autant de spots qu’on le désire, on peut cribler en une seule fois la
présence de nombreuses mutations.
24/10/2011
21
On peut suivre l’hybridation en FRET en utilisant deux oligonucléotides, chacun sera porteur d’un
fluorophore. Lorsque l’oligonucléotide n’est pas hybridé, on n’a pas de fluorescence, par contre
lorsqu’il est hybridé on obtient une fluorescence.
excitation
émission
Si on augmente peu à peu la température, à faible
ADN
température, l’oligonucléotide se fixera d’une
manière non spécifique et on aura pas de
fluorescence. Lorsque la température atteindra le
mutation
Tm, on observera une fluorescence. Au dessus de
Principe
Tm on perdra la fluorescence. Comme la
présence d’une mutation modifie le Tm, les
courbes de fluorescence en fonction de la température permettent de détecter la présence d’une
mutation.
Hybridation partielle
Dans cette technique on va détecter le fait que
l’oligonucléotide
soit
ou
ne
soit
pas
complètement hybridé lorsque l’hybridation est
O
totale ou lorsque l’hybridation présente un
mésappariement.
O
O
cible
fluorescence
oligonucléotides
Le fragment portant la mutation est amplifiée
P P
pas de fluorescence
par PCR, puis on hybride deux oligonuléotides
P
qui portent à leurs extrémités des fluorophores
P
tels que le pyrène. Un pyrène est positionné en
3' d'un oligonucléotide et un autre en 5' de
l'autre
oligonucléotide.
Lorsque
les
deux
pyrènes sont proches l'un de l'autre, lorsque les
deux oligonucléotides s'hybrident parfaitement
on obtient une émission de fluorescence
(excitation à 350 nm et émission à 490 nm) par
émission dans
le rouge
fluoresceine
24/10/2011
22
contre lorsqu'il y a un mésappariement, dans le cas d'une mutation, les deux pyrènes ne sont plus
proches l'un de l'autre et on n'obtient pas de fluorescence (Paris et al., 1998).
Comme amélioration de la méthode on a l'utilisation de d'appareil PCR permettant de suivre
l'émission de la fluorescence au cours des amplifications successives.
Utilisation d’un anticorps
On peut suivre l’hybridation en utilisant un anticorps qui reconnaît l’ADN double brin (Viazov et al.,
1994) Cette méthode est souvent appelée « DNA enzyme immunoassay » (DEIA). Dans une
première étape, une région contenant la mutation à détecter est amplifiée par PCR. Ce produit
d’amplification est alors hybridé à un nucléotide spécifique fixé sur un support solide via un pont
streptavidine-biotine. S’il y a hybridation, elle est détectée par ELISA en utilisant un anticorps se
fixant sur l’ADN double brin.
DGGE = Denaturing Gradient Gel Electrophoresis
Principe : Le Tm dépend de la séquence, de la température, de la
concentration en certaines molécules telles que l'urée ou la
sauvage
mutant
*
*
formamide. La dénaturation est un phénomène coopératif. La
migration d'un fragment d'ADN change avec la dénaturation, un
ADN double brin partiellement ouvert migre moins vite qu'un
gel
fragment double brin (Myers et coll. 1985)
Dans cette technique, on fait migrer un fragment d'ADN dans un
gel gradient allant de conditions natives ou l'ADN est sous
forme double brin à des conditions dénaturantes ou l'ADN est
sauvage
mutant
sous forme simple brin (7M urée, 40% formamide). La
température est maintenue constante.
L'ADN est extrait puis digéré par une enzyme de restriction qui coupe souvent, tous les 200-400 pb.
Le produit de la digestion est chargé sur un gel gradient linéaire, il migre sous la forme de double
brin mais à un moment il atteint son Tm, est partiellement dénaturé et migre moins vite. Ainsi des
fragments de séquences différentes, même d'une seule base sur 100 pb migrent à des endroits
24/10/2011
23
différents. Pour détecter les bandes, L'ADN est transféré et hybridé avec une sonde spécifique d'une
région ou on analyse des fragments de PCR après les avoir marqués
Au lieu d’effectuer un Southern, on peut amplifier la région de la mutation par PCR, faire migrer les
deux produits de PCR dans un gel à concentration croissante d’un agent dénaturant.
Un des problèmes rencontrés avec cette technique : les fragments se séparent trop tôt dans le gel.
Pour remédier à de problème, on effectue la PCR avec des amorces riches en GC dans la région 5'
(non importante pour la réaction de PCR). Ces extrémités GC stabilisent le duplex et permettent une
meilleure séparation des homoduplex et des hétéroduplex.
DHPLC: Denaturing high-performance liquid chromatography
Cette méthode est proche de la DGGE mais ici la détection des hétéroduplex se fait par HPLC en
utilisant une colonne de paire d’ions en phase reverse dans les condition partiellement dénaturantes
(Oefner et Underhill, 1995).
24/10/2011
24
Méthodes basées sur la PCR
Les altérations du génome peuvent être détectées par PCR en utilisant plusieurs amorces, ce qui
permet l'amplification simultanée de plusieurs régions (multiplex PCR). Cette méthode a été
employée pour la première fois par Chamberlain et coll. (1988) pour détecter les mutations de la
dystrophine responsable de la maladie de Duchenne.
PCR oligonucléotide allèle spécifique, PASA (PCR Amplification of Specific Alleles)
En PCR, la polymérase ne peut polymériser que si la dernière base en 3' est stabilisée par des liaisons
hydrogènes, si la dernière base est hybridée. La plupart des polymérases ont une activité 3'5'exonucléase, mais certaines d'entre elles comme l’ADN polymérase Taq en est dépourvue. En
prenant deux oligonucléotides, un spécifique de la mutation et un autre spécifique du témoin
(sauvage) on peut faire deux PCR à l'aide d'un troisième oligonucléotide situé en 3' (en aval) à
environ 1 kb. On aura amplification uniquement qu’avec un des deux couples (Sommer. 1992)
L'absence de bande ne signifie pas toujours l'absence d'hybridation en 3' mais peut résulter d'un
défaut lors de PCR, d'une erreur de manipulation. Un témoin peut être ajouté, c'est un oligonucléotide
qui hybride sur tous les allèles (connus) en amont de l'hybridation permettant de voir la mutation. On
obtient donc deux bandes, une bande haute permettant de voir si la polymérisation a bien eu lieu et
une bande basse permettant de voir la présence ou non de la mutation, suivant l'oligonucléotide qui a
été utilisé.
amorces
discriminantes
amorce amont
ou
matrice
amorce aval
Les deux réactions de PCR (entre l'amorce amont et l'amorce aval et entre l'amorce discriminante et
l'amorce aval) entrent en compétition, et l'amplification la plus petite est favorisée, d'une part parce
24/10/2011
25
qu'elle est plus petite et d'autre part parce que le produit de la réaction la plus longue peut servir de
matrice à la réaction la plus petite et non inversement. Aussi si la réaction de PCR discriminante a
lieu, l'amplification témoin est faible.
RR RS RS RR RS RR RS RR SS SS RR RR RS SS
C
S
R
Exemple de PASA permettant de distinguer des individus avec une mutation sur les deux allèles
(RR) des individus sauvages (SS) et des hétérozygotes (RS)
Ce système a un deuxième avantage. En effet, dans de rares cas, l'amplification avec l'amorce
discriminante peut avoir lieu. Plus il y a de cycle de PCR, plus elle a de chance d'avoir lieu, cette
erreur est due à la probabilité qu'a la dernière base de l'oligonucléotide d'être bien positionnée en
l'absence d'hybridation. Le fait d'utiliser une amorce amont, permet d'utiliser dès les premiers cycles
les substrats (dNTP) et de fabriquer une grande quantité de matrice.
24/10/2011
26
Ligation
Les ADN ligases catalysent l'estérification entre un nucléotide 5' phosphate et un nucléotide 3' OH. Il
faut toutefois que ces deux fonctions soient maintenues proches l'une de l'autre.
Pour détecter l'événement de mutation, on peut marquer un oligonucléotide. Une méthode pour
augmenter le signal consiste à répéter plusieurs fois l'expérience en faisant des cycles successifs de
dénaturation et de ligation. Dans ce dernier cas on utilisera de préférence une ligase thermostable
(dans ce cas l'amplification ne suit pas une progression exponentielle).
Hybridation
Ligation
Gel, conditions
dénaturantes
autoradiographie
24/10/2011
27
RFLP
Dans certains cas la mutation recherchée coïncide avec un site de restriction, toutefois c'est assez
rare. Dans d'autre cas, la mutation est proche d'une autre mutation qui, elle, coïncide avec un site de
restriction. La coupure est alors détectée par Southern ou par coupure d'un fragment de PCR.
Sandwich: L'ADN cible est fixé sur une membrane de nitrocellulose puis hybridé avec une sonde.
Après formation du duplex il y a coupure avec une enzyme de restriction. S'il y a homoduplex
l'enzyme coupe et l'oligonucléotide est deshybridé, s'il n'y a pas coupure l'hétéroduplex reste sur la
membrane.
24/10/2011
28
Méthodes basées sur la conformation de l’ADN
SSCP (Single Strand Conformation Polymorphism)
Cette méthode est basée sur l'influence de la séquence primaire sur la migration en gel natif de
fragment d'ADN simple brin (Orita et coll., 1989). En condition non dénaturante, les brins d'ADN
forment des structures secondaires en tiges/boucles qui sont uniquement dépendantes de la séquence
primaire, de plus il existe une structure tertiaire provenant de liaisons entre les sucres et les bases.
Donc une variation dans une séquence primaire s'accompagne d'une différence de conformation de
l’ADN simple brin correspondant.
Le fragment obtenu par PCR ou le génome entier est coupé par une enzyme de restriction. L'ADN
est dénaturé soit par la soude soit par la chaleur et déposé sur un gel d'acrylamide. L’ADN est ensuite
mis dans des conditions permettant la formation de structures secondaires en abaissant la
températurure ou en neutralisant le pH. La migration est détectée soit par coloration à l'argent
SS SS RS SS RS RS SS SS RR RS RR SS
S
R
Exemple de SSCP pour determiner le génotype des individus d’une population pour une
mutation conférant la résistance : homozygote sensible (SS), homozygote resistant (RR) et
hétérozygotes (RS).
(produit de PCR) soit par Southern (ADN génomique), soit après marquage du produit PCR
(radioactif ou fluorescent).
Cette méthode permet de repérer des mutations dans une région, même si elles ne sont pas connues.
24/10/2011
29
ddF (Dideoxyfingerprinting)
Cette méthode (Sakar et coll. 1992) est un hybride
entre la séquence selon la méthode de séquençage à
types
11213333434
l'aide des dideoxynucléotides et la SSCP. Le fragment
d'ADN où se trouve la mutation est amplifiée puis une
réaction de séquence est faite en employant un seul
dideoxynucléotide et une amorce marquée en 5'. Le
produit de la réaction est dénaturée puis chargée sur un
exemple de ddF
(Langemeier et coll., 1994)
gel d'acrylamide non dénaturant.
Hétéroduplex sensibilité à une coupure
Dans cette technique les deux fragments d'acide nucléique sont hybridés et on détecte les
mésappariements en les coupant avec des enzymes ou chimiquement.
Utilisation de la nucléase S1
Cette nucléase d'Aspergillus oryzae est spécifique de
l'ADN simple brin et ne digère pas l'ADN double brin. On
fait une sonde ADN simple brin marqué radioactivement
ADN 1
ADN 2
PCR
et on hybride avec les différentes populations. On fait
ensuite un gel en condition dénaturante pour voir la taille.
Une autre possibilité est d'amplifier la région portant la
mutation
avec
des
oligonucléotides
portants
dénaturation / hybridation
des
fluorophores. Les fragments amplifiés de l'ADN témoin et
de l'ADN testé sont réunis dans le même tube, dénaturés et
digestion par une nucléase
dénaturation
hybridés. La présence d'une mutation est ensuite mise en
évidence en incubant le produit de l'hybridation avec la
nucléase puis en faisant migrer les produits de la digestion sur un gel en conditions dénaturantes.
24/10/2011
30
D'autres nucléases peuvent être employées, la nucléase P1 de Penicillium citrinum ou la mung bean
nucléase de Vigna radiata ou la nucléase CEL 1 du céleri. Les trois premières nucléases sont des
protéines à Zinc et sont principalement actives à pH 5. Cette action à pH acide pose quelques
problèmes pour les régions riches en AT en effet à ce pH on peut avoir une dénaturation partielle de
l'ADN. Dans ce cas on peut utiliser une nucléase de plante comme la nucléase CEL 1 du céleri qui
coupe l'ADN simple aux pH neutres (Oleykowski et coll. 1998)
Certaines nucléases comme la nucléase S1 digèrent très difficilement lorsque le mésappariement est
limité à une seule base, mais au-dessus de deux bases la vitesse de réaction augmente énormément.
Dans ce cas, la technique n'est donc valable pour détecter des délétions de petites tailles.
Utilisation des RNAse (Myers et coll., 1985)
Les RNAse A, T1 ou T2 coupent les ARN sous forme
simple brin et non lorsqu'ils sont hybridés. Lors d'une
ARN messager
ARN marqué
hybridation entre deux clones de deux individus
différents, les mésappariements seront digérés et seuls
Hybridation
les régions hybridées resteront. La technique est donc
équivalente à la digestion par la nucléase S1 mais ici
on utilise une sonde ARN.
coupure à la RNAse A + T1
Cependant les RNAse ne digèrent pas tous les
mésappariements, elles digèrent uniquement C-A, CC, C-T et U-T, c'est à dire 4 sur les 12 possibles.
gel
sauvage
mutant
Pour augmenter ce nombre on peut faire deux ARNs
marqués pour les deux espèces et dans ce cas on voit
60% des mésappariements.
Un fragment de PCR est synthétisé, une des deux amorces comporte la séquence du promoteur de la
T7 et l'autre la séquence SP6.
Utilisation de la nucléase ABC
Cette nucléase ne reconnaît pas les mésappariements à moins qu'ils n’aient auparavant réagi avec la
carbodiimide. L'hétéroduplex est modifié par la carbodiimide et ensuite digéré par la nucléase ABC.
24/10/2011
31
Cette méthode permet de voir toutes les mutations mais la nucléase ABC n'est pas actuellement
disponible.
Coupure par les méthodes chimiques (CCM= Chemical Cleavage of Mismatch)
Les méthodes chimiques ont été développées par les auteurs qui ont étudié les structures secondaires
des ARN. Les produits chimiques présentent un certain nombre d'avantage sur les enzymes, ils
agissent sur une gamme de pH et de force ionique beaucoup plus large, il n'y a pas de problème
d'instabilité et ils ne nécessitent pas d'avoir un acide nucléique purifié.
De nombreux produits chimiques réagissent avec les bases des acides nucléiques, ils produisent des
lésions qui peuvent être ensuite coupées par un traitement alcalin, c'est le principe de base de la
méthode de séquence de Maxam et Gilbert.
Parmi ces produits l'hydroxylamine (H) réagit avec les C mésappariés, le tetraoxide d'osmium réagit
avec les T mésappariés (OT). La combinaison des deux (HOT) permet de détecter les C et T. (Cotton
et coll., 1988).
24/10/2011
32
II ) Analyse du polymorphisme
On peut analyser le polymorphisme en analysant plusieurs mutations mais souvent on s'intéresse à
plusieurs locus.
Protéines
Les premières méthodes d’analyse du polymorphisme utilisaient les différences de migration des
protéines d’un individu sur gel à l’état natif. Quelques protéines telles que les estérases étaient
révélées par leurs activités.
Ces méthodes ont été très utilisées par les généticiens des populations mais le nombre de variants
était assez faible et pouvait résulter d’un effet transcriptionnel.
Analyse des fragments de restriction
RFLP
Hae III EcoRI
On peut déterminer l'identité d'un plasmide en effectuant sa carte de
restriction. Cette méthode peut s'appliquer à tous les fragments d'ADN
à la condition qu'ils ne soient pas trop grand, à condition que la
digestion ne génère qu'un nombre limité de fragment. Chez les
eucaryotes, les petits génomes sont représentés par les génomes
mitochondriaux et chloroplastiques. On purifie donc les mitochondries
ou les chloroplastes puis on isole leur ADN. La carte de restriction
permet ainsi de les identifier et en conséquence d'identifier leur porteur.
Cette méthode n'ayant pas besoin d'information de départ, elle a été une
des premières utilisées pour différentier des individus ou des
populations.
RFLP sur l’ADN
chloroplasmique de
trois individus
(Mariac et coll. 2000)
On peut aussi analyser les sites de coupures par des enzymes de restriction sur l’ADN génomique.
Cependant la digestion donne trop de fragments pour pouvoir être analysé. Pour rféduire le nombre
de fragment on peut soit faire un Southern avec un mélange de sonde, soit amplifié certaines régions
24/10/2011
33
du génome par PCR puis ensuite analyser le polymorphisme de restriction sur les fragments
amplifiés.
AFLP (Amplified Fragment Length Polymorphism)
On digère l'ADN avec deux enzymes, une qui coupe
rarement comme par exemple Eco RI (G/AATTC) et une
qui coupe souvent comme par exemple Mse I (T/TAA).
On ajoute deux adaptateurs aux deux extrémités à l'aide
Adaptateur MSE I (T/TAA)
TANNNNNNNNNNN
NNNNNNNNNNN
d'une ligase. Un adapteur différent est utilisé pour chaque
Adaptateur Eco RI (G/AATTC)
site et l'enzyme de restriction ne coupe pas le produit de la
AATTNNNNNNNNNNNNNN
NNNNNNNNNNNNNN-biotine
ligation. Les adaptateurs sont à une concentration
supérieure à celle des fragments d'ADN si bien que la
ligation se fait préférentiellement avec l'adaptateur.
L'adaptateur de site rare (Eco RI) est lié à la biotine ce qui permet de sélectionner les fragments
EcoRI/ MseI et Eco RI / Eco RI sur une colonne de streptavidine agarose.
Ces fragments sont amplifiés par PCR avec des oligonucléotides spécifiques des deux adaptateurs
utilisés, celui hybridant sur l'adaptateur du site rare (Eco RI) est marqué radioactivement pour ne pas
voir les amplifications des fragments Mse I/ MseI qui n’auraient pas été éliminés lors de la sélection
par la biotine.
Le résultat de la PCR est analysé sur gel de séquence par radioautographie. S’il y a trop de bandes,
un site coupant plus rarement est utilisé.
24/10/2011
34
Génotypage et cartographie génétique
Parmi les variations de séquences entre individus, l'identification d'une mutation ponctuelle (SNP,
single-Nucleotide Polymorphism) est une information utile dans de nombreux domaines et plus
particulièrement comme marqueur de maladie génétique.
Il existe plusieurs techniques permettant de détecter une mutation ponctuelle, mais récemment une
équipe a développé une méthode qui permet de mettre en évidence des milliers de mutations
ponctuelles dans le génome humain en une seule expérience (Wang et al., 1998).
Il fallait au préalable identifier les SNP, ils ont donc séquencé un grand nombre de STS (SequenceTagged Site) qui sont des séquences réparties au hasard sur l'ensemble du génome. Mais cette
méthode est laborieuse. Une deuxième méthode a alors été mise en œuvre, à l'aide de puces à ADN.
Des oligonucléotides correspondant à des STS ou des EST ont été synthétisés sur une puce, et des
oligonucléotides comportant des mutations ont été synthétisées sur les spots voisins. En hybridant
l'ADN d'individus différents sur ces puces, ils ont pu détecter des différences d'hybridation et donc
mette en évidence des SNP. Ils ont ainsi utilisé 149 puces comportant chacune 15000 à 30000
oligonucléotides. Ce qui a permis de mettre en évidence environ 3000 SNP.
La position des SNP sur la carte génomique a pu ensuite être déterminé en utilisant une série de
lignées cellulaires comportant chacune une fraction du génome humain (radiation-hybrid mapping).
Une fois les SNP déterminés et éventuellement cartographiés, il a suffit de synthétiser des petits
oligonucléotides variants hybridant sur un allèle ou sur l'autre puis à les déposer sur une puce à ADN.
24/10/2011
35
Les micro et minisatellites
Les différentes parties du génome sont plus ou moins variables, les parties codantes et les promoteurs
présentent des séquences très conservées par contre, les parties non codantes sont plus variables.
Mais il existe des éléments qui sont encore plus variables, ce sont les micro et minisatellites. Ce sont
des éléments hautement répétés qui forment des répétitions de 1000 ou de million de copies
similaires. Leur nom vient du fait qu'au départ ils ont été identifiés parce qu'ils étaient présents dans
une bande différentiée en centrifugation isopycnique (en gradient de CsCl). Cela est du au fait que
certains d’entre eux avaient une composition en base différente de l'ADN total. Ils sont généralement
présents dans l'hétérochromatine des chromosomes, région ou la fréquence de recombinaison est
faible comme par exemple le centromère.
Ils ont la propriété d'être très variables, ceci étant du
- à des mutations, comme pour le reste de l'ADN
- à des crossing over inégaux
- à un glissement de polymérase
- à une réplication en "rolling circle".
La variabilité est fonction du satellite analysé, le plus variable dans l'individu ne sera pas utilisable,
un moins variable permettra de voir des différences entre les individus d'une même population
(utilisable par exemple en criminologie), un moins variable permettra de voir des différences entre les
populations.
Microsatellites ou STR (Short Tandem Repeat) : répétitions de 2 à 4 bases, ils sont très variables,
On les clone en criblant une banque génomique avec un oligonucléotide composé de la répétition. On
séquence les clones pour connaître les séquences adjacentes, qui elles sont présentes en simples
copies dans le génome. On synthétise des oligonucléotides spécifiques qui hybrident de chaque coté
de la répétition. On amplifie par PCR en présence de nucléotides marqués et on fait un gel dénaturant
de type séquence. On peut ainsi déterminer la taille de la répétition.
24/10/2011
36
Minisatellites (ou VNTR : Variable Number Tandem Repeat) répétitions de 8-15 bases, variabilité
qui proviendrait de crossing over inégaux.
Comment les clone t’on? En prenant une sonde au hasard, au début on prenait M13 comme sonde et
on criblait une banque d'ADN génomique. L'hybridation se fait mal mais comme elle se fait
fréquemment on obtient une hybridation décelable. Une autre méthode fait appel au hasard, en
criblant des banques avec un oligonucléotide pour trouver un gène, par le même effet, on clone des
minisatellites. Le clone est séquencé et on obtient la séquence du minisatellite qui peut servir pour
l'espèce et pour des espèces proches.
Une troisième méthode consiste à digérer l'ADN avec une ou plusieurs enzymes en qui coupent
fréquemment (tous les 400 pb) comme Sau3A, GATC. Puis à faire un gel qui est coloré au bromure
d'éthidium. On voit des bandes de haut poids moléculaire. Ces bandes sont extraites du gel et clonées,
au besoin après coupure au hasard (ultrason), puis séquencées.
Utilisation des minisatellites : L'ADN des populations analysées est digéré par une enzyme de
restriction qui coupe souvent mais pas dans la répétition. On obtient ainsi des fragments qui
correspondent à la taille des répétitions. Ces fragments sont séparés sur un gel d'agarose, transférés
sur nitrocellulose ou nylon et hybridés avec le minisatellite. On obtient un fingerprint.
Utilisation: typage au niveau de l'individu : criminologie, recherche de paternité
Détection du nombre de répétition d’un élément répété
Il existe plusieurs méthodes pour quantifier le nombre de répétitions :
-
On peut faire une PCR quantitative en utilisant deux amorces hybridant dans l’unité
répétée. On estime ainsi le nombre de répétition dans le génome.
-
On peut faire un Southern pour estimer la longueur de chaque répétition.
-
On peut faire une PCR avec des amorces externes. Dans ce cas on estime le nombre de
répétitions à un seul locus.
-
Une méthode de détection a été développée par Schalling et al. (1993). On utilise un
oligonucléotide complémentaire à la séquence répétée. Correspondant par exemple à 5
répétitions. On incube l’ADN à analyser avec l’oligonuléotide et une ADN ligase
thermostable. A chaque cycle, il y a hybridation puis ligation jusqu’à ce que le produit de
la ligation corresponde à la taille de la répétition. Le produit de la réaction est ensuite
24/10/2011
37
chargé sur un gel dénaturant et la taille des produits de la ligation est déterminé, soit par
Southern, soit en ayant marqué les oligonucléotides au préalable.
MAAP (Multiple Arbitrary Amplification profiling)
Cette méthode inclus (Caetano-Anollis, 1994) :
DAF: DNA amplification fingerprinting
RAPD : random amplified polymorphism DNA
AP-PCR : Arbitrary primed PCR
Ces trois méthodes impliquent une amplification entre des amorces prises au hasard pour obtenir un
pattern variant.
La principale différence entre les trois
Espèce 1
Espèce 2
techniques est principalement la longueur des
amorces utilisées par la PCR (5-15 nt pour le
DAF, 9-10 pour le RAPD et 18-32 pour le
AP-PCR)
Dans les deux premiers la température
d'hybridation est proche du Tm de chaque
oligonucléotide de telle façon que les sites
d'hybridation correspondent à la séquence.
Dans
le
dernier
cas
la
température
d'hybridation est en dessous de Tm de telle
Distinction de deux espèces d’insectes par RAPD
(les deux espèces ne sont que très difficilement
différentiables par des critères morphologiques)
sorte que des oligonucléotides de 11-15 hybrident. L'AP-PCR revient en fait à utiliser un mélange de
différents oligonucléotides plus petit. Cette méthode présente l’avantage de ne pas nécessiter
d’informations au préalable, on peut l’appliquer sur des espèces dont on ne connaît aucune séquence.
Dans les MAAP on peut inclure l’IMA (Inter Microsatellite Amplification). On amplifie l’ADN
génomique avec des amorces microsatellites (Zietkievwicz et al., 1994) comportant en 3’ quelques
nucléotides au hasard pour diminuer le nombre de bandes.
24/10/2011
38
III) Détection d'une séquence
Dans ce cas on veut détecter une séquence particulière par exemple pour détecter un parasite dans un
organisme. La technique la plus sensible est le PCR associé à une technique de détection de
l'amplification (voir chapitre sur la PCR) ou le NASBA si on veut détecter un ARN.
Dans certains cas on veut détecter la fréquence d’une séquence, par exemple dans l’union
européenne, la proportion d’organisme génétiquement modifié ne doit pas dépasser 3% dans la
nourriture. On utilise alors la PCR quantitative en prenant comme témoin un gène de l’organisme qui
est donc présent aussi bien dans les organismes modifiés que dans les organismes sauvages. Le
rapport des deux amplifications donne la proportion d’OGM dans l’échantillon.
24/10/2011
39
Expression des protéines recombinantes
Introduction
Une fois qu'un gène a été cloné, on désire souvent obtenir une protéine à partir d'un fragment
d'ADN. La technique utilisée dépendra tout d'abord de l'objectif final. Par exemple, si on a besoin de
la protéine pour faire un anticorps polyclonal, on n'a généralement pas besoin d'avoir une protéine
active mais par contre la protéine doit être facilement purifiable. Dans ce cas on s'orientera vers la
production en bactérie, en fabriquant des protéines de fusion ou la protéine d'intérêt est fusionnée
avec une autre protéine facilement purifiable. Si le but est d'obtenir une protéine pour des études de
biochimie ou de biologie cellulaire, la purification n'est pas toujours le problème prédominant par
contre l'activité de la protéine (enzyme, récepteur) devient plus important. Enfin, pour des études de
biochimie ou de biophysique, on peut avoir besoin de grande quantité de protéines purifiées comme
par exemple pour les études de biochimie structurale.
On va pouvoir exprimer des protéines soit dans des systèmes procaryotes, soit dans des systèmes
eucaryotes. Il faudra donc tenir compte des différences entre ces deux systèmes. Par exemple chez les
procaryotes, l'initiation s'effectue par reconnaissance d'une séquence particulière (RBS). Donc, si on
veut exprimer un clone provenant d'une cellule eucaryote dans une bactérie, il faudra incorporer cette
séquence en amont de l'ATG d'initiation.
Rappels sur la traduction
Les événements de la traduction
Couplage de l'acide aminé sur l'ARNt
L'acide aminé se fixe à l'extrémité 3' OH ou en 2'OH des ARN de transfert par une liaison ester. Cette
réaction est catalysée par une enzyme, l'aminoacyl-tRNA synthétase. Il y a tout d’abord accrochage
de l'acide aminé sur l'ATP (aa + ATP ----> aa-AMP + 2 Pi). Le pyrophosphate est hydrolysé, la
24/10/2011
40
réaction est donc irréversible. Il y ensuite transfert de l'acide aminé sur l’ARNt (aa - AMP + ARNt --> aa - ARNt + AMP). Sur l'enzyme il y a donc trois sites (ARNt, acide aminé et ATP) et toutes les
réactions se passent sur l'enzyme sans que les constituants intermédiaires quittent l'enzyme.
La liaison ester est riche en énergie (provenant de l’énergie de la liaison anhydride aa-AMP). Cette
énergie sera utilisée pour la formation des liaisons peptidiques, pour l’accrochage des acides aminés
les uns aux autres.
La réaction est spécifique, à un ARNt correspond un seul
acide aminé (le code génétique est du à cette spécificité de
Site
ATP
Site acide
aminé
O
site
tRNA
l'aminoacyl-tRNA synthétase). Pour le vérifier on peut
H C
0
NH
2
0
O
-
-
faire l’expérience suivante : une cystéine liée à son ARNt
O
-O P O
O
Adénosine
protéine, les cystéines seront remplacées par des alanines.
L'aminoacyl tRNA synthétase reconnaît l’ARNt et l’acide
R
H C
OH
0
NH
2
O
possibilités de correction.
P
O
Adénosine
Mais la reconnaissance de l'ARN de transfert et de l'acide
avec un mauvais partenaire, et il y a dans ce cas des
O
O
reconnaissances présentent une très bonne affinité.
aminé n'est pas parfaite. La réaction se fait quelquefois
P O
O
est chimiquement transformée en alanine. Dans la
aminé, pour que la réaction soit spécifique, il faut que les
-
-O P O
R
R
H C NH2
C
O O
24/10/2011
41
L'initiation
Il y a 3 phases de lecture possibles: l'initiation permet de déterminer l'endroit exact où commence la
traduction. L’initiation s’effectue pour ainsi dire toujours au niveau d’un codon AUG qui code pour
une méthionine. Comme il y a plusieurs AUG dans une séquence, Il faut que le bon AUG soit
reconnu comme codon de départ.
Chez les procaryotes:
Dans la bactérie il y a équilibre entre les formes 70S et
+
30S + 50 S. Au 30S se lie le facteur d'initiation IF3 ce qui
70 S
50 S
30 S
+
déplace l'équilibre précédent. Il y a liaison de l'ARN
30 S
IF3
messager avec la sous unité 30S. La liaison s'effectue à
+
une séquence particulière sur l'ARN (Shine Dalgarno, site
IF3
30 S
de liaison du ribosome) juste en amont, en 5' de l'ATG
initiateur. Cette liaison s'effectue par hybridation avec une
+
IF2
methionyl tRNA
met
met
est donc interne à l’ARN, il peut y avoir plusieurs sites
+
met
IF3 a deux fonctions : une fonction d’anti-association des
deux sous unités 30S et 50S contrôlant ainsi le nombre de
met
met
séquence complémentaire en 3' de l'ARN 16S. l’initiation
d’initiation sur l’ARN.
mRNA
met
+
met
30S disponibles pour la traduction et une fonction de
met
+
+
liaison de l'ARNm sur le 30S.
Un autre facteur d'initiation (IF1) se lie sur le complexe, il
aide à la dissociation entre les deux sous unités du ribosome en stabilisant le complexe IF3-30S.
Un autre complexe se forme entre IF2 et l'ARN de transfert d'initiation portant une
formylméthionine.
Les deux complexes se reconnaissent au niveau d'un site appelé P. Ce nouveau complexe est capable
de se lier au 50S, il y a hydrolyse du GTP en GDP + pi (probablement par une protéine du ribosome
activée par IF2 et relargage des facteurs d'initiation (IF1, IF2 et IF3).
24/10/2011
42
Chez les eucaryotes, l'initiation est différente
Le ribosome reconnaît le cap à l’extrémité 5’ de l’ARNm. De ce fait l'ARN ne peut pas être
polycistronique. Il n’y a pas comme chez les
particulière en amont de l'ATG.
met
met
procaryotes de reconnaissance d'une séquence
+
eIF2
methionyl tRNA
met
La reconnaissance de l’ARNm par le ribosome est
presque identique. Un complexe contenant une
met
+
40 S
met
met
protéine eIF2, du GTP et l’ARNt se lie au 40S libre,
+
c'est ce nouveau complexe qui reconnaît l’ARNm :
la différence par rapport aux bactéries est que
l’ARNt doit être présent. Comme pour les
met
met
+
procaryotes, la traduction nécessite des facteurs
d'initiation et d'élongation.
Dans certains cas particuliers, il existe des initiations internes chez les eucaryotes : des séquences
appelées IRES sont reconnues par le ribosome et permettent également l’initiation de la traduction.
24/10/2011
43
L’élongation
Il y a ensuite reconnaissance d'un aminoacyl tRNA sur le site A
a.a2
met
Il y a transfert de la formylméthionine de l'aminoacyl tRNA
d'initiation sur l'aminoacyl tRNA du site A. Il y a alors dans le
site A, un peptidyl tRNA et sur le site A un ARNt deacétylé
L’ARNt désacetylé va dans un autre site, le site E, le peptidyl
tRNA va dans le site P (avec l'ARN messager). L’ARNt
désacetylé part du site E ce qui permet l'accessibilité du site A à
AUG N1N1N1
site P
site A
met - a.a2
un autre aminoacyl tRNA Cette élongation nécessite la présence
de plusieurs facteurs appelés EF (facteurs d’élongation)
Bilan énergétique de l'élongation : l'addition d'un acide aminé à la
chaîne nécessite l'hydrolyse d'une molécule d'ATP et de deux
molécules de GTP. L'ATP permet l'accrochage de l'acide aminé
sur l’ARNt, une molécule de GTP permet le positionnement de
AUG N1N1N1
site P
site A
a.a3
met - a.a2
l'aminoacyl-tRNA sur le site A, une deuxième molécule de GTP
permet la translocation du peptidyl tRNA du site A vers le site P.
Si on regarde le nombre de liaisons riches en énergie, il en a fallu
AUG N1N1N1 N2N2N2
site P
site A
4 (1ATP en AMP et 2 GTP en GDP), ce qui est important pour
faire juste une liaison amide. Mais ici, l'énergie est surtout
employée pour assurer la fidélité de la traduction.
La terminaison
Il y a trois codons STOP = UAA, UAG et UGA. Des protéines de libération se lient aux
codons STOP au niveau du site A. On les appelle RF (Releasing Factor). Ces protéines modifient
l'activité de la peptidyl transférase: il y a addition d'une molécule d'eau à la place d'un acide aminé. Il
y a trois releasing factors chez les procaryotes (RF1 reconnaît UAA et UAG; RF2 reconnaît UAA et
UGA, RF3 permet la dissociation de RF1 ou de RF2 du site A en hydrolysant une molécule de GTP)
et une seule chez les eucaryotes. Il y a ensuite libération de la chaîne polypeptidique en croissance du
ribosome, dissociation des deux sous-unités ribosomales et libération de l'ARNm. Ainsi, au codon
24/10/2011
44
stop, le ribosome se dissocie, et en aucun cas ne continu à traduire l’ARN, même s’il y a une phase
de lecture ouverte en 3’.
Régulation de la traduction
Elle peut se faire à deux niveaux, au niveau transcriptionnel ou au niveau traductionnel.
Exemples de régulation au niveau transcriptionnel
L'opéron lactose chez E. coli
En l'absence de lactose, la bactérie ne
fabrique pas les enzymes nécessaires à
répresseur
pas de transcription
sa métabolisation
(β-galactosidase,
galactoside perméase et galactoside
acétylase). L'expression de ces gènes est
opérateur
lactose
allolactose
gouvernée par le même système de
régulation, ils sont sous la dépendance
du même promoteur. En présence de
transcription
répresseur
β−galactosidase
acetylase
ARN
lactose, l'allolactose se forme dans la
cellule grâce au peu de β-galactosidase
perméase
opérateur
présente dans la cellule, l'allolactose se
fixe à un répresseur, induit un changement allostérique de la protéine qui se détache de l'opérateur,
l'ARN polymérase peut se fixer sur le promoteur qui synthétise un ARN polycistronique codant pour
les trois protéines.
C'est une régulation négative, le répresseur fixé empêche la transcription Le répresseur est codé par le
gène i qui est transcrit sans arrêt à un taux faible.
24/10/2011
45
La protéine d'activation catabolique (CAP).
A coté de la régulation négative, il existe aussi des régulations positives, dues à des activateurs :
l'activateur favorise localement l'action de
l'ARN
polymérase.
La
CAP
(protéine
d’activation catabolique) est un activateur qui
permet de n'utiliser d'autres sources de
carbone qu'en l'absence de glucose chez E.
coli. En l'absence de glucose, l'AMP cyclique
- glucose
+ lactose
- glucose
- lactose
CAP
répresseur
+ glucose
+ lactose
induit un changement de conformation, la
CAP se fixe sur l'ADN, l'opéron lactose est
transcription
CAP
répresseur
+ glucose
- lactose
transcrit. Ce phénomène est connu sous le
nom de répression catabolique
Régulation du métabolisme du galactose chez la levure Saccharomyces cerevisiae
La régulation des gènes utilisés pour la métabolisation du galactose a été très étudiée chez la
levure comme source de promoteurs inductibles dans les systèmes d’expression de protéines. Il y a
deux protéines régulatrices principales (GAL4 et GAL80) qui contrôlent l'expression des gènes :
GAL1 (une kinase), GAL2 (une perméase) GAL7 (une transférase), GAL10 (une epimérase) et MEL1
(une galactosidase). Lorsque le galactose est présent dans le milieu, GAL4 s'accroche sur un UAS
(Upstream Activation Site, équivalent d'un enhancer pour les autres eucaryotes) et, ainsi, favorise la
transcription du gène en aval. En l'absence de galactose, GAL80 s'accroche sur l'extrémité C
terminale de GAL4, l'empêchant de s'accrocher sur l'UAS. A coté de ce système il y a comme pour E.
Coli un système de répression en présence de glucose dans le milieu.
24/10/2011
46
L'opéron tryptophane chez E. coli
La
synthèse
du
tryptophane
transcription
nécessite plusieurs étapes qui sont
catalysées par 5 enzymes codées par
les gènes TrpA, TrpB, TrpC, TrpD,
leader TrpE
TrpD
TrpC
Trp B
TrpA
ARN
promoteur
opérateur
et TrpE. Cet opéron contient en
+ tryptophane
outre un promoteur, un opérateur et
une séquence leader qui joue un rôle
de
régulation
au
niveau
répresseur
pas de transcription
traductionnel (voir plus loin). En
l'absence de Trp, les 5 gènes sont
opérateur
transcrits, traduits et le Tryptophane
est synthétisé. En présence de Trp, l'acide aminé se fixe sur le répresseur qui lui-même se fixe sur
l'opérateur et l'opéron n'est plus transcrit.
Il s'agit encore ici d'une régulation négative, le répresseur fixé empêche la transcription mais ici la
fixation du ligand permet à la protéine de se fixer à l'ADN.
L'opéron arabinose chez E. coli.
AraC
est
une
protéine
dimérique
qui
O2
s'accroche sur deux sites distants de 210 pb en
C
AraC
N N
l'absence d'arabinose. Les deux protéines
C
interagissent si bien que l'ADN forme une
I1
boucle qui réprime la transcription. Lorsqu'il y
I2
+ arabinose
a de l'arabinose, il se fixe sur AraC. Il s'ensuit
NN
un changement conformationnel. Le site distal
n'est plus utilisé et AraC se fixe sur un autre
site proximal. Dans cette configuration, AraC
agit en tant qu'activateur transcriptionnel.
O2
CAP
AraC
C
C
I1
I2
transcription
24/10/2011
47
Exemple de régulation au niveau traductionnel : l’opéron tryptophane chez E. coli.
En parallèle à la régulation au niveau transcriptionelle, il existe une régulation au niveau de la
traduction, appelée atténuation
rappel:
- chez les procaryotes la transcription et la traduction sont simultanées
- les ARNs sont polycistroniques
- l'arrêt de la transcription : l’ARN polymérase s'arrête quand elle synthétise une série de résidus U
dans la mesure où elle a d'abord synthétisé une séquence auto-complémentaire capable de se replier.
L'ARN, dans la région du leader-attenuateur, peut prendre deux structures secondaires distinctes:
1) Dans le cas ou la partie codante ne
forme pas de structure secondaire, les
tryptophane
répresseur
transcription
parties 2 et 3 suivantes forment une
structure secondaire. Il y a continuation
leader TrpE
TrpD
TrpC
Trp B
TrpA
ARN
promoteur
opérateur
de la transcription.
2) Dans le cas ou la partie codante forme
1
une structure secondaire avec la partie
2
UUUUU
3
transcription
4
suivante (2), il se forme une deuxième
1
arrêt de la transcription
2
3
boucle
présentant
une
structure
4
ribosome bloqué
sur la séquence leader
secondaire d'arrêt de la transcription.
Ainsi, selon les structures secondaires au niveau de la séquence d’atténuation, il y a soit transcription
des 5 phases de lecture soit arrêt prématuré de la transcription et donc pas de traduction des 5
protéines nécessaires à la synthèse du tryptophane.
La séquence leader est traduite en un peptide de 14 acides aminés comportant du tryptophane dans sa
séquence, lorsqu'il y a du trp dans le milieu le ribosome passe à travers et on a la structure 1 et donc
arrêt de la transcription.
En absence de Trp, le ribosome reste bloqué, la transcription continu, la partie 1 ne peut pas
s'hybrider avec la partie 2 du fait de la présence du ribosome, la transcription continue.
24/10/2011
48
Ainsi en l’absence de tryptophane, le ribosome reste bloqué sur l’ARN en cours d’élongation et
provoque un changement conformationnel de l’ARN induisant un arrêt de transcription.
Exemple de régulation au niveau traductionnel : contrôle de la traduction du gène ompF.
La régulation est due à la synthèse d'un petit ARN contrôlant directement la traduction du gène
ompF.
Lorsque la pression osmotique augmente,
il y a activation de la protéine ompR qui
OmpR
active la transcription de micF. Il y a
gene micF
synthèse d’un petit ARN de 174 bases
appelé
micRNA
(mRNA
interfering
3’
ARN micF
ARN de ompF
transcription
5’
5’
traduction
complementary RNA). Cet ARN est
antisens complémentaire d'une région de
ompF qui inclue le site de liaison au
3’
hybridation
OmpF
inhibition de la traduction
ribosome : il empêche la traduction de
ompF et il devient sensible à des RNases qui digèrent l’ARN double brin. OmpF code pour une
protéine de la membrane externe de E. Coli qui ne doit plus être traduite lorsque la pression
osmotique augmente.
Utilisation de ce système : cet exemple a servi de modèle pour étudier l'expression de certains gènes.
On peut soit transcrire un ARN complémentaire à celui du gène à éteindre soit utiliser des
oligonucléotides qui s'hybrident au niveau de l'AUG. Le problème est qu'il faut une grande quantité
d'antisens.
Compartimentalisation et modifications post-traductionelles
Chez les procaryotes, transcription et traduction sont simultanées, il n ‘y a pas de modification posttranscriptionelle. Il y a un seul compartiment, et il existe peu de modifications des protéines après
leurs synthèses (modifications post-traductionelles). Par exemple, les protéines ne sont pas
glycosylées.
24/10/2011
49
Chez les eucaryotes, transcription et traduction ont lieu dans deux compartiments différents, le noyau
et le cytoplasme. Les ARN sont maturés avant leur exportation dans le cytoplasme, ils sont cappés en
5’, épissés et pourvus d’une queue polyA à l’extrémité 3’. Une fois dans le cytoplasme, ils sont
traduits. Il y a alors deux possibilités. Soit la protéine se replie dans le cytoplasme dans un milieu
réducteur soit la protéine est exportée dans le réticulum endoplasmique, cet événement est
cotraductionel. L’exportation dans le réticulum endoplasmique est due à un peptide signal en Nterminal de la protéine, ce peptide est reconnu par la particule de reconnaissance du signal, et le
peptide en cours de synthèse est dirigé à l’intérieur du réticulum endoplasmique. Le milieu est
oxydant, il va y avoir formation de ponts disulfure, la protéine peut être glycosylée et son repliement
est aidé par des protéines spécialisées, les foldases. Ces protéines passent ensuite dans les différents
compartiments de l’appreil de Golgi et sont soit secrétées soit insérées dans la membrane.
24/10/2011
50
Expression transitoire à partir d'un ARNm ou d'un ARN in vitro (cRNA)
Il est possible de fabriquer un ARN in vitro à partir d'un gène et ensuite de le faire traduire
soit in vitro dans un lysat cellulaire, soit dans des cellules. Dans ce dernier cas on utilise par
exemple l'ovocyte de Xénope.
Obtention d'un cRNA.
La méthode classique consiste à cloner le fragment à exprimer dans un plasmide en aval
d'un promoteur reconnu par ARN polymérase puis à polymériser l’ARN in vitro avec l’ARN
polymérase. On utilise généralement les ARN polymérases des phages SP6, T3 ou T7. Le
plasmide est ensuite coupé avec une enzyme de restriction dont le site se situe en aval de la
séquence codante pour éviter des brins 3' trop longs qui peuvent affecter la traduction. Le
produit de cette digestion, une fois purifié, est incubé avec l’ARN polymérase correspondante
au promoteur et des ribonucléotides.
On peut faire directement une réaction de RT-PCR sur des ARN extraits de cellules
exprimant le gène d’intérêt. L’amorce sens (en 5’) comportera en amont de la séquence
hybridant sur le gène, la séquence reconnue par la RNA polymérase et éventuellement les
séquences nécessaires à la traduction.
Enfin si le clone n’est pas disponible, si on ne dispose pas de cellule exprimant la protéine,
on peut toujours faire un gène syntétique par assembalage d’oligonucléotides.
L’initiation de la traduction dans les systèmes eucaryotes nécessite la reconnaissance d’un
Cap, puis le démarrage de la traduction au premier ATG. L’ARN néoformé est dépourvu de
Cap. Les réactions de capping étant difficiles à faire car elles nécessitent plusieurs étapes, on
utilise des astuces. Une astuce consiste à remplacer 90% du GTP fourni à la cellule par du
diguanosine triphosphate (m7G5'ppp5'G). Ce produit doit être enlevé avant la traduction in
vitro, il est en effet un inhibiteur fort de la traduction (il rentre en compétition avec l’ARNc).
Une deuxième astuce vient d’une observation, la traduction du gène de la globine ne dépend
pas de la présence du cap, on peut donc utiliser le leader de la globine en fusion avec le gène
destiné à être traduit. De plus il est important que l'ATG initiateur soit le premier ATG suivant
l’initiation de la transcription.
24/10/2011
51
Traduction in vitro
Des extraits de nombreuses cellules peuvent être utilisés pour traduire des ARNm. Il faut
que tous les éléments de la machinerie nécessaires à la traduction (ribosome, ARNt, acide
aminé, aminoacyl-tRNA synthetase, facteurs d'initiation, d'élongation et de terminaison) soient
présents. Par contre le noyau, les polysomes et les inhibiteurs de la traduction doivent être
enlevés pour éviter la transcription (noyau) et la traduction d’ARNm endogènes (polysomes).
De plus l'extrait doit avoir peu d'activité RNAsique pour ne pas dégrader les ARNm.
La préparation d'un tel extrait cellulaire consiste le plus souvent à lyser les cellules par
choc osmotique, et à retirer les polysomes et les noyaux par centrifugation. Le plus souvent les
acides aminés sont aussi retirés par tamisage moléculaire par exemple sur G25. Les acides
aminés froids et un acide aminé marqué sont rajoutés.
La synthèse est simple il suffit de rajouter l’ARNc au lysat cellulaire. Quelquefois une
étape de digestion des ARN par une nucléase a été rajoutée en fin d'incubation mais
généralement cette digestion n'est pas utile.
Plusieurs extraits sont utilisés en système eucaryote mais le lysat de réticulocyte et l'extrait
de germe de blé sont les plus populaires car ils sont les plus efficaces et sont actuellement
commercialement disponibles. Mais on peut effectuer des traductions in vitro avec un d'autres
d'extraits cellulaires tels que :
- les ascites. Ces cellules sont prélevées à partir de la peau abdominale de souris, lysées par
choc osmotique et les ribosomes sont préparés par centrifugation.
- la levure : l'avantage de ce système est qu'on dispose d'un grand nombre de mutants de
régulation de la traduction.
Un système est utilisé pour les procaryotes, un lysat d'E. coli S30 (par exemple
commercialisé par Promega). L'avantage de ce système est qu'il peut être couplé à la
transcription in vitro: pendant la transcription l'extrémité 5' devient disponible pour la
traduction. Le système de trascription comporte tous les éléments nécessaires aux deux étapes :
NTPs, RNA polymérase, tRNAs, acides aminés, un système de régénération de l’ATP, des
ribosomes…
24/10/2011
52
Dans l'utilisation de systèmes couplés, il faudra faire attention au promoteur utilisé, certain
promoteur de E. Coli tel que lac ne sont efficaces que si l'ADN est surenroulé alors que d'autres
ne sont pas sensibles au surenroulement (lacUV5, tac, λPL ou λPL ). Seuls ces derniers seront
efficaces sur un fragment linéaire.
La traduction in vitro synthétise des protéines pendant environ 30 minutes à température
ambiante. Mais des systèmes en flux continu ont été développés. Les composants de la
traduction sont maintenus dans un boudin de dialyse dans lequel on injecte des acides aminés,
la protéine synthétisée sort du boudin de dialyse alors que les composants de la traduction
formant des complexes ARN-protéines sont trop gros pour passer à travers la membrane de
dialyse. De tels systèmes peuvent fonctionner jusqu'à 45 heures.
Marquage de la protéine : les extraits sont riches en protéine, la protéine néosynthétisée
n'est donc pas biochimiquement pure
Lysine
mais comme on traduit un seul ARN, on
la marquer. Le plus communément on
utilise un acide aminé radioactif. La [35S]
méthionine est le plus souvent utilisée,
Mais d’autre marquage sont possibles en
l’absence de méthionine tel que la [35S]
cystéine ou la [14C] leucine ou l’[3H]
leucine.
Dans
ce
cas
la
protéine
néosynthétisée est radiochimiquement
pure. Pour éviter l’utilisation d’éléments
Fluorophore
peut
CH 3
O
H
A O
N
C
C
NH
O
O
2
O O
O O
O O
O O
O O
O O
O O
O
O O
OO OO
O
O
OO O O O O O O
O
OO OO
O
O
O
O
O
O
OOOOOO O
O
O
O
OOO
O
O
O
O
O
O
O
O
OO
O
O O O
O O OO
O O
O O
O O
O
O
O
O
O
O
O
O
OO
N
F
B
N
F
CH 3
radioactifs on peut utiliser des marquages froids.
On peut utiliser des Lysinyl-tRNA modifiés avec une lysine marquée à la position epsilon
par de la biotine ou par un fluorophore. L’ARNt est ajouté à la solution de traduction et la
lysine modifiée est incorporée à la protéine. Dans le cas du marquage à la biotine, la protéine
est révélée à l’aide de streptavidine conjuguée à une enzyme (péroxydase ou phosphatase
alcaline), dans le cas d’un marquage par un fluorophore, la protéine est révélée directement par
fluorescence.
24/10/2011
53
Avantage de la méthode
La traduction in vitro présente principalement l'avantage de permettre l'expression de
protéines très toxiques pour la cellule. De plus, lors de la traduction d'un ARNc, on obtient une
protéine marquée. On n'a donc pas besoin de purifier la protéine. Dans les systèmes à flux
continu, la protéine qui sort de la dialyse est pure et non uniquement marquée, les acteurs de la
traduction restant dans le compartiment intérieur.
Inconvénients de la méthode
Les protéines exprimées in vitro ne sont généralement pas actives. Toutefois, on peut dans
certains cas obtenir des protéines actives. Ce sera le plus souvent le cas des protéines exprimées
dans le cytosol. Par contre les protéines exprimées dans le réticulum endoplasmique puis
maturées dans le golgi seront le plus souvent inactives.
Utilisation
- Cette méthode est utilisée pour vérifier qu'un ARN messager est bien présent. Par
exemple si on veut cloner un gène et qu'on a choisi comme moyen le criblage avec un
anticorps. On commence par purifier les ARN messagers pour faire une banque d’ADNc,
l'anticorps servira alors à cribler la banque. Mais on ne sait pas toujours si l'ARN est présent au
départ si le gène n'a pas encore été cloné, on ne connaît dans le meilleur des cas que la
répartition spatio-temporelle de la protéine. Un des moyens de vérification consiste à traduire in
vitro les ARN messagers puis à sélectionner les protéines réagissant avec l'anticorps, si on
sélectionne une protéine de taille attendue, l'ARN est bien présent dans le pool de départ.
- Cette méthode permet d'incorporer des acides aminés modifiés contenant par exemple des
groupes photoactivables ou fluorescents. De même on peut incorporer des acides aminés
modifiés tels que de la lysine biotinylée, on obtient alors une protéine biotinylée sur les lysines.
- Cette méthode permet d’obtenir des précurseurs utiles par exemple pour étudier
l'adressage des protéines dans la mitochondrie. Lors de la translocation dans la mitochondrie, la
protéine est dépliée, puis à nouveau repliée à l'intérieur de la mitochondrie. Pour étudier le
24/10/2011
54
passage, on utilise une protéine fabriquée in vitro et marquée radioactivement. De même si on
étudie le repliement des protéines in vitro à partir du précurseur néosynthétisé et non à partir
d’une protéine dénaturée, la traduction in vitro permet de suivre les différentes étapes.
L’obtention du précurseur permet d’étudier certaines étapes de maturation des protéines comme
la N-glycosylation en ajoutant une source de réticulum endoplasmique au lysat de réticulocyte
sous forme de microsomes.
Traduction en milieu cellulaire. L’ovocyte de Xénope
Les ovocytes de Xénope sont des grosses cellules dans lesquelles on peut injecter une
solution d’ARN. Le Xénope est un batracien anoure aquatique vivant en Afrique du Sud et qui
se maintient aisément en aquarium. Il pond plusieurs centaines d’œufs. Si on traite les femelles
par des hormones, on peut synchroniser la maturation des ovocytes. Environ deux mois après
on dissèque les femelles et on prélève les ovaires après avoir anesthésié la femelle en la mettant
au froid, sur de la glace. Le Xénope est relativement robuste et on peut facilement recoudre la
femelle et la réutiliser après. On traite les fragments d’ovaire à la collagènase pour retirer les
cellules folliculaires et on obtient des ovocytes qui font quelques millimètres de diamètre. La
solution d’ARNc, de l'ordre de 100 nl, est injectée dans le cytoplasme. Les ovocytes sont mis à
incuber dans un tampon contenant au besoin un acide aminé marqué. Un à deux jours après, la
protéine a été synthétisée.
Ce système est particulièrement performant pour étudier les récepteurs situés sur la
membrane externe de l'ovocyte. Il est alors facile de faire les expériences d'électrophysiologie
pour étudier le récepteur. L'avantage est que l'ovocyte est dépourvu de récepteur. Plus
rarement, ce système est utilisé pour étudier d'autres protéines. Mais il s'est avéré très utile pour
étudier des protéines sécrétées. En effet l'ovocyte de Xénope ne secrète pas de protéines, si bien
que la seule protéine sortant dans le tampon d’incubation des ovocytes est la protéine dont
l’ARNc a été injecté. On obtient donc directement une protéine pure. L'inconvénient du
système est qu'on en n'obtient que très peu.
24/10/2011
55
Expression en système procaryote
I) Escherichia coli
Escherichia coli a été très étudié depuis les années 60 si bien que c'est un des organismes
actuellement les mieux connus. L'ensemble de ces connaissances en biochimie, génétique et
biologie moléculaire a été exploitée pour exprimer des protéines en grande quantité. Cette
bactérie a plusieurs propriétés intéressantes lui permettant d’être utilisée pour exprimer des
protéines : elle est facile à manipuler, elle pousse vite dans des milieux relativement peu cher et
les souches de laboratoires sont inoffensives. De plus, tous les laboratoires de biologie
moléculaire utilisent E. coli pour d’autres expériences (clonage, séquence…). Cette facilité en a
fait le système d'expression le plus populaire.
Ce qui est indispensable pour produire une protéine dans E. coli.
Pour exprimer un gène dans E. coli, il doit être inséré dans un vecteur qui contient
plusieurs éléments : 1) une origine de réplication, un marqueur sélectionnable pour trier et
maintenir les bactéries ayant incorporé le vecteur et un polylinker, comme tous les plasmides
servant de vecteur, 2) un promoteur, si possible contrôlable, dont l'induction produira une
grande quantité d’ARNm à partir du gène cloné, 3) les séquences responsables de la traduction
telle qu'une séquence de liaison au ribosome, ces séquences doivent être bien positionnées.
a) L’origine de réplication
Le gène doit être répliqué dans la bactérie, autrement, on va le perdre très rapidement. La
méthode générale consiste à l’insérer dans un plasmide qui porte une origine de réplication.
Il existe plusieurs origines de réplication (ori) disponibles. Celle de bluescript (500-700
copies par chromosomes), celle de pBR322 (15-20 copies) et celle de P15A (10-12 copies). Si
le produit du gène est toxique on utilisera une origine de réplication qui donne peut de copies,
au contraire si le gène n’est pas toxique et s’il est bien régulé, on utilisera une origine à fort
nombre de copies
24/10/2011
56
On peut positionner l’origine de réplication pour favoriser la production de protéines.
-
Si on veut exprimer un gène non toxique pour la bactérie, l'expression sera simultanée
à la croissance de la population bactérienne. La fourche de réplication doit alors plutôt
progresser dans le même sens que la transcription du gène de sélection, ainsi la
transcription ne gênera pas la réplication du plasmide. Ce phénomène est le même que
celui qui gouverne réplication et transcription dans le chromosome bactérien.
-
Si on veut exprimer un gène toxique pour la bactérie, l'expression s'effectuera en phase
stationnaire, lorsqu'il n'y a plus de réplication. La fourche de réplication doit progresser
en sens inverse de la transcription pour avorter toute transcription non désirée.
L’origine de réplication la plus utilisée est ColE1, elle donne de 15 à 20 copies par cellule.
L’origine M15 est parfois utilisée (10-15 copies). Elle est plus particulièrement utilisée avec
ColE1 lorsqu’on veut produire deux protéines simultanément dans la même bactérie (Kholod et
Mustelin, 2001). En effet ColE1 et M15 sont compatibles.
L’utilisation de plasmides pour exprimer un gène dans E. coli est breveté, ceci a amené
l’utilisation d’une autre origine de réplication (Olson et al., 1998). Le gène d’intérêt est ici
incorporé au chromosome bactérien. Pour ce faire, on transforme les bactéries avec un ADN
comportant le site d’attachement du phage λ, aatP, mais ne comportant pas d’origine de
réplication. En présence d’une intégrase codée par un plasmide, l’ADN va s’intégrer dans le
site attB du chromosome bactérien. Pour sélectionner les intégrants, on ajoute un gène de
résistance à la kanamycine à l’ADN. Dans un tel système, on n’obtient qu’une copie du gène
d’intérêt. Pour en avoir plusieurs copies et ainsi augmenter la quantité de protéine produite, on
peut ajouter à l’ADN des séquences permettant la duplication médiée par rec-A et un gène de
résistance à la tétracycline pour sélectionner les bactéries contenant un grand nombre de copies
du gène en tandem. Une augmentation progressive de la dose de tétracycline permettra
d’augmenter le nombre de copies.
24/10/2011
57
tetR
promoteur
kanR
gène d’intéret
attP
intégration dans le chromosome bactérien
attBP
attPB
amplification génique
(sélection pour la résistance à la tétracycline)
attBP
b. Les promoteurs
Deux domaines en amont du site d'initiation de la transcription sont importants dans les
promoteurs procaryotes. Le domaine à -10 (Pribnow box, 5' T-A-T-A-A 3') et un domaine à -35
(5' T-T-G-A-C-A 3'). Ces deux domaines sont en contact avec l’ARN polymérase lors de
l'initiation de la transcription.
Deux caractéristiques des promoteurs sont importantes pour l’expression des protéines, la
force du promoteur et son inductibilité.
-
La force du promoteur : les promoteurs bactériens sont relativement faibles du moins
pour les besoins de production. Pour les améliorer, des mutations ponctuelles ou des
petites délétions ont été effectuées au sein de ces promoteurs, ce qui a permis
d'augmenter la transcription.
-
L’inductibilité, c’est à dire son contrôle : le plus souvent on désire utiliser un
promoteur inductible par exemple lorsque la protéine est très toxique pour la bactérie.
Dans ce cas, la protéine est produite en début de la culture et inhibe la croissance
24/10/2011
58
cellulaire. En utilisant un promoteur inductible, on cherchera à inhiber la production au
début de la phase de croissance des bactéries puis à l’approche de la phase stationnaire,
on induira la production.
La force des promoteurs :
Plusieurs techniques ont été utilisées pour augmenter la force des promoteurs. On peut
éliminer des répresseurs. Ainsi Le promoteur Plac du gène lacZ dépends de l'activation par la
CRP/cAMP. Pour pouvoir être utilisé, ce promoteur doit être muté (mutation UV5) afin que la
répression catabolique ne puisse pas s'exercer (le rôle de la répression catabolique est de ne pas
utiliser le galactose en présence d'autres sources de carbone, principalement en présence de
glucose). Ainsi on pourra avoir une transcription en présence de glucose (Hirshel et al., 1980).
Le remplacement des séquences du promoteur du gène lacZ en amont de la position -20
par les séquences du promoteur de l'opéron tryptophane a permis de faire un promoteur hybride
(Ptac). Cette construction donne une augmentation de la transcription de 10 fois (De Boer et al.,
1983).
Boite – 35
Boite de Pribnow
Ptrp
GAGCTGTTGACAATTAATCATCGAACTAGTTAACTAGTACGCA
PlacUV5
CCAGGCTTTACACTTTATGCTTCCGGCTCGTATAATGTGTGGA
Ptac
GAGCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGA
La technique de choix pour augmenter la force d’un promoteur est d’utiliser un promoteur
spécifique d’une ARN polymérase qu’on surproduit dans la cellule. Le plus utilisé est le promoteur
de la protéine 10 du phage T7 (Studier et Moffatt, 1986). La transcription utilisant l’ARN polymérase
T7 est très efficace. En effet,
-
La polymérase utilise la plupart des nucléotides triphosphate de la cellule ce qui inhibe
la transcription des gènes de l'hôte. Elle est 5 fois plus rapide que les polymérases
bactériennes. Cette polymérase reste la plupart du temps sur l'ADN. Il n'y a que peu
24/10/2011
59
d'arrêt prématuré de la transcription. La transcription peut en fait, faire plusieurs fois le
tour du plasmide donnant un ARN très grand.
- L’ARN polymérase T7 est très spécifique, elle ne reconnaît pas les promoteurs de la
bactérie, si bien qu'elle ne transcrit que le gène d'intérêt.
- L’ARN polymérase T7 n’est pas sensible aux inhibiteurs des ARN polymérases bactériennes
tels que la rifampicine. Ainsi, l'ajout de rifampicine dans le milieu bloque toutes les
polymérases sauf celle de T7, seul le plasmide est transcrit, tous les ribonucléotides sont utilisés
pour la transcription du gène d’intérêt.
L’ARN
polymérase
T7
n'est
pas
présente dans la bactérie, il faut donc
AmpR
l'ajouter par exemple sur un plasmide. Ce
deuxième plasmide doit avoir une autre
origine de réplication compatible avec celle
utilisée dans le vecteur portant le gène
Col E1
origine de
réplication
site de clonage
ATG
RBS
Promoteur P10
d'intérêt. Il doit contenir un gène de
résistance à un autre antibiotique et enfin il
doit contenir le gène de l’ARN polymérase
T7 lui-même inductible. On peut aussi
PL
T7 RNA
polymérase
Plac
cI-857
produire l’ARN polymérase T7 à partir du
génome de la bactérie. On utilise alors une
KanR
souche qui a intégré le gène de l’ARN
polymérase T7 sur le chromosome via un lambda lysogène (DE3).
p15A (origine de réplication)
24/10/2011
60
L’inductibilité des promoteurs :
-> On peut utiliser des répresseurs :
Le promoteur/opérateur du gène lac Z. Une des inductions les plus utilisées est celle du
gène lacZ. (Plac). La protéine LacI est un répresseur qui se positionne en aval du promoteur et
inhibe la transcription. La transcription est déréprimée (ou induite) par un analogue du
galactose, l'isopropyl β-D thiogalactoside (IPTG) qui se fixe sur lacI, induit un changement de
conformation de lacI qui ne se fixe plus sur l’opérateur. Pour augmenter l’efficacité du
répresseur, on peut d’une part surproduire le répresseur en ajoutant un gène le codant dans le
plasmide et d’autre part augmenter le nombre d’opérateurs (lacO) en aval du promoteur du
gène d’intérêt.
Séquence de l’opérateur LacO reconnue par le répresseur LacI
.....GTGAGCGGATAAC....
.....CACTCGCCTATTG....
Pour que la régulation soit bonne il faut utiliser un souche qui surproduit LacI (lacIq),
L’induction peut se faire par l’IPTG ou en utilisant un LacI thermosensible (LacIts), Dand ce
dernier cas à basse température (30°C) lac I est actif et réprime l’expression du gène d’intérêt
alors qu’à haute température (37 – 42°C) lac I est inactif, et le gène d’intérêt est exprimé
(Hasan et Szybalski, 1995).
Le systéme de régulation LacI/LacO peut être utilisé pour agir directement sur la
transcription du gène d’intérêt ou indirectement en contrôlant la transcription de l’ARN
polymérase T7.
-> On peut utiliser des inhibiteurs de l’ARN polymérase. L’ARN polymérase T7 est
inhibée par le lysozyme. Si on introduit le gène codant pour le lysozyme sur un plasmide, la
24/10/2011
61
production de lysozyme inhibera le peu d’ARN polymérase T7 produite en l’absence
d’induction. Par contre, en présence d’induction, l’inhibiteur sera en trop faible quantité
comparativement à l’ARN polymérase T7 qui est surproduite.
On peut ajouter l’ARN polymérase au moment de la production. Dans certains cas la
protéine à exprimer est toxique pour la bactérie. Or tous les promoteurs inductibles ont une
activité basale, même faible, si bien que la protéine est produite en faible quantité en l'absence
d'induction (on dit que le promoteur fuit). Si la protéine est très toxique, on peut utiliser une
autre stratégie pour produire l’ARN polymérase T7 en utilisant un phage M13 la produisant.
On fait pousser les bactéries puis, avant de produire, on infecte les bactéries par le virus. Le
virus produit l’ARN polymérase T7 puis le gène d'intérêt est transcrit.
Le promoteur PL du bactériophage λ: Ce promoteur est fort et peut être presque
complètement éteint par le répresseur cI du phage. Ce répresseur est présent dans le génome
des bactéries appelées "lysogènes défectives", ce qui revient à dire que le génome de ces
bactéries contient une partie du phage λ intégrée. Cette partie du génome de λ produit la
protéine CI réprimant la synthèse de l'ARN en aval de PL. Une telle bactérie peut donc pousser
à haute densité sans produire l'ARN sous la dépendance du promoteur PL. Pour pouvoir induire
une synthèse de protéine, on utilise un répresseur mutant (cI 857), thermosensible. Dans ce cas,
on cultive les bactéries à 32°C, le répresseur est produit, il n'y a pas de production de l'ARN
sous la dépendance du promoteur PL. Lorsqu'elles sont arrivées à haute densité, on élève la
température à 42°C, le répresseur n'est plus produit, l'ARN est transcrit et donc la protéine est
traduite.
L'induction peut aussi se faire chimiquement avec un répresseur sauvage en induisant une
protéase qui dégrade le répresseur CI. Pour produire la protéase, on ajoute de l'acide nalidixique
dans le milieu ce qui inhibe la DNA gyrase, cette inhibition amène des lésions sur l'ADN et il y
a donc déclenchement la réponse SOS qui induit la RecA protéase. Cette protéase coupe le
répresseur CI et le gène est transcrit.
Le promoteur tétracycline. Ce promoteur est inductible par l'anhydrotétracycline. Pour
obtenir une bonne régulation de ce promoteur, on inclu souvent dans le vecteur un gène codant
24/10/2011
62
pour un répresseur (TetR) (Skerra et al., 1994). C'est donc un promoteur qui d’une part doit être
activé et d’autre part peut être réprimé.
Le promoteur arabinose.
Ara C est une protéine dimérique
qui,
en
l’absence
O2
C
d'arabinose,
AraC
N N
s'accroche sur deux sites distants
de 210 pb (I1 et O2) par leurs
C
CAP
I1
I2
+ arabinose
extrémités C-terminales. L'opéron
forme alors une boucle qui réprime
NN
la transcription du gène.
En présence d'arabinose, la
CAP
O2
AraC
C
C
I1
I2
transcription
liaison sur Ara C induit un
changement conformationnel du dimère qui s'accroche alors sur un deuxième site (I2). Dans
cette configuration, Ara C agit comme un activateur de transcription.
De plus on trouve un site de liaison de la CAP (protéine d'activation catabolique) si bien
qu'en l'absence de glucose, la transcription est stimulée.
Source de carbone
Facteur d'induction
glucose
1
glucose + arabinose
70
glycérol + arabinose
820
Les promoteurs hybrides
Lorsqu’un répresseur interfère directement avec la liaison de l’ARN polymérase, le
paramètre important pour une répression efficace du promoteur est la vitesse de formation du
complexe ARN polymérase*promoteur (kON). Ainsi, d'une manière générale, les promoteurs
24/10/2011
63
qui lient l’ARN polymérase à faible vitesse sont bien réprimés mais ils restent faibles après
l'induction. A l'inverse, les promoteurs qui lient l’ARN polymérase rapidement, sont mal
réprimés. Plusieurs promoteurs hybrides ont été fabriqués pour obtenir d'une part une
transcription forte et d'autre part une bonne régulation (Lutz et Bujard, 1997).
Par exemple, le promoteur PL est un promoteur fort et on peut remplacer la répression CI
dépendante par une régulation par l'opérateur de l'opéron tétracycline. On obtient un promoteur
PLtetO-1 qui est éteint par le répresseur tetR et qui peut être activé jusqu'à 5000 fois par
l'anhydrotétracycline. Ainsi on peut combiner différents éléments provenant de différents
promoteurs pour obtenir la régualtion souhaitée.
- On peut rajouter d'autres éléments pour éteindre la transcription du gène, on peut en
particulier adopter une stratégie antisens. Dans la stratégie antisens, on clone un gène à
proximité d'un promoteur fort de E. coli de telle sorte que c'est l'antisens qui est produit. Cet
antisens inhibe la traduction du gène pendant la croissance de la cellule. L'ajout de rifampicine
dans le milieu arrête la synthèse de l'antisens lorsque le gène d’intérêt est en aval d’un
promoteur de l’ARN polymérase T7. Pour la même raison, la transcription du gène de
résistance doit se faire dans l'autre sens de transcription du gène d'intérêt. Ainsi lorsqu'il n'y a
pas d'arrêt de transcription ou lorsque l'arrêt n'est pas total, le gène d'intérêt n'est pas lui-même
transcrit en l'absence d'induction. On aura un effet d'antisens, le transcrit initié au niveau du
gène de résistance s'hybridera avec les quelques transcrits du gène d'intérêt présent en l'absence
d'induction.
c. Les séquences responsables de la traduction
Chez les procaryotes, l'initiation s'effectue par reconnaissance d'une séquence particulière
(RBS, ribosome binding site). Cette séquence est composée d’une séquence riche en purine
(Shine-Dalgarno, SD, AGGAGG) et du codon d'initiation qui doit être proche, idéalement,
l'extrémité 3' de la boite de Shine-Dalgarno doit être à 6 bases de l'ATG.
Il y a plusieurs possibilité de boite de Shine-Dalgarno : UAAGGAGG donne une meilleure
traduction que AAGGA (Ringquist et coll. 1992)
24/10/2011
64
Donc, si on veut exprimer un clone provenant d'une cellule eucaryote dans une bactérie, il
faudra incorporer cette séquence en amont de l'ATG d'initiation. Généralement, on mutagenise
la séquence du gène d'intérêt au niveau de l'ATG en y incorporant un site de restriction tel que
NdeI (CATATG). Ce site est présent sur le vecteur 8 nucléotides en aval d'un site de liaison au
ribosome.
d. Les séquences responsables de l’arrêt de la transcription
On peut dans certains cas ajouter en 3' du gène des séquences responsables de l'arrêt de la
transcription. Au niveau d'un signal de terminaison, la polymérase libère la matrice et l'ARN
monocaténaire néosynthétisé.
Chez E. coli, il y a deux sortes de terminaison, une
terminaison
intrinsèque
et
une
terminaison
dépendante d’une protéine, la protéine ρ. Dans la
terminaison intrinsèque, la polymérase s'arrête
extrémité 3’ de
l’ARN
arrêt de la transcription
quand elle synthétise une série de résidus U dans
la mesure où elle a d'abord synthétisée une
UUUUUU
séquence autocomplémentaire capable de se
replier. C'est le repliement, l'hélice en épingle à cheveux, qui se forme rapidement dans cette région,
qui est crucial pour l'arrêt de la transcription. La séquence de la région autocomplémentaire peut
varier. Lors de la terminaison ρ dépendante, la protéine ρ reconnaît une séquence sur l’ARN
néosynthétisé et catalyse l’arrêt de la transcription.
Dans certains cas, on ajoute une séquence de terminaison ρ indépendante en 3’ du gène, il y a
formation d’une boucle qui termine la transcription. Cette arrêt de la transcription a peu d’avantage
pour la production de protéines recombinantes si ce n’est qu’elle stabilise l’ARN en inhibant
l’activité des 3’ 5’ exonucléases qui ne dégradent que l’ARN simple brin.
Toutefois ces séquences ne sont indispensables et sont inefficaces pour l’arrêt de transcription dans
le cas d’une production utilisant l’ARN polymérase T7.
24/10/2011
65
Il peut y avoir des signaux de terminaison dans le gène à traduire. Dans ce cas on peut utiliser une
bactérie qui produit la protéine N du phage λ qui a une fonction d'antiterminaison. On utilise des
bactéries lysogènes défectives qui produisent la protéine N ce qui permet d'éviter une terminaison
précoce du message en interagissant avec l’ARN polymérase seulement au site Nut. On utilisera alors
cette séquence Nut (terminateur) en aval du gène cloné pour terminer la transcription au bon endroit.
Les signaux de terminaison de la transcription sont parfois utilisés en aval du promoteurs pour éviter
une transcription venant du gène recombinant. Dans ce cas, la transcription en sens inverse pourrait
inhiber l’initiation de la transcription du gène d’intérêt. De même, on peut utiliser un arrêt de
transcription en amont du promoteur pour diminuer le bruit de fond, due à une transcription initiée
par un promoteur plus en amont.
e. Les séquences responsables de l’arrêt de la traduction
La présence d’un codon stop est indispensable pour assurer la terminaison de la traduction. Il en
existe trois UAA, UAG et UGA. Le plus souvent on met plusieurs codons stop à la suite à la fin de la
séquence codante pour éviter les dérapages et donc les protéines plus longues.
Il faut éviter de produire les protéines dans des bactéries comportant des supprésseurs qui comportent
des tRNA reconnaissant les codons stop. Toutefois cette stratégie est quelquefois utilisée pour obtenir
des protéines de fusion d’une manière conditionelle. Lorsqu’on veut la protéine de fusion on
transforme des bactéries ayant le suppresseur, par contre lorsqu’on veut la protéine seule, on
transforme des bactéries dépourvues de répresseur.
La base suivante le codon stop a une importance sur l’efficacité de la terminaison qui peut descendre
à 7% pour le cas de UGAC. Pour éviter ce problème, on utilise UAAU qui est le plus efficace chez E.
coli.
f. Les séquences permettant l’inversion
Un des moyens de controler l’expression du gène est de le cloner à l’envers puis à le retourner au
dernier moment lorsque la culture arrive à la phase stationaire. Deux systèmes ont été utilisés, le
système Int/att et le système Flp/FRT. Les recombinases sont présentes dans la bactéries et leur
24/10/2011
66
expression est régulée. Suite à l’induction, elles tournent le gène d’intérêt qui est traduit (Sektas et
al., 2001).
II) Autres bactéries utilisées en production de protéines
D'autres protéines Gram négatives ont été
utilisées pour exprimer des protéines. les techniques
Exemple de vecteur utilisé pour exprimer une
protéine chez Caulobacter crescentus.
et concepts ne sont pas différents de ceux développés
pour E. Coli. Caulobacter crescentus est une bactérie
gram négative non toxique qui est très répendue dans
l’environnement principalement dans les biofilms. C.
crescentus est couverte à sa surface par une proteine
qui s’arrange selon un réseau en deux dimensions
régulièrement
structuré.
Cette
protéine
sert
vraissemblablement à se protéger contre les virus, les
bactéries pathogènes ou les enzymes lytiques
susceptibles d’attaquer la protéine. Le système de secrétion de cette protéine (RsaA) a été utilisée
pour produire des protéines recombinantes en faisant une fusion entre la protéine RsaA et la protéine
recherchée. Les protéines secrétées se retrouvene tà la surface de la bactérie ou sur des liposomes. Le
vecteur doit comporter deux origines de réplication, une pour E. coli et une pour C. crescentus, le
signal de sécrétion en C terminal de la protéine produite et un promoteur pour l’expression.
Les Bacillus
Parmi les protéines Gram positives, les Bacillus ont été et sont toujours très utilisés pour
produire des protéines pour plusieurs raisons :
-
Ils sont depuis longtemps utilisés par l'industrie pour produire des protéines. La
subtilisine, protéase incorporée aux lessives, est produite à partir de Bacillus. Il existe
donc de nombreuses souches modifiées pour les contingences industrielles. Toutefois
ces souches ne sont généralement pas disponibles.
24/10/2011
-
67
On les connaît bien au niveau génétique et leur manipulation par les techniques de
biologie moléculaire est bien développée. En effet, si à priori on peut prendre n'importe
qu'elle bactérie, il faut quand même que l'on ai isolé une origine de réplication efficace,
un promoteur, etc. De plus on doit avoir mis au point un système de transformation
efficace. Des promoteurs forts sont connus et des peptides signaux responsables de la
sécrétion sont disponibles. Par exemple le peptide signal d'une subtilisine de Bacillus
amyloliquefasciens de 30 acides aminés a été utilisé avec succès.
-
Le Bacillus ne sont pas pathogènes et ne produisent pas d'endotoxine.
-
Ils sécrètent un grand nombre de protéines, leur système de sécrétion est donc bien
développé. Ce sont des bactéries Gram-positives, si bien que les protéines n'ont que la
membrane cytoplasmique à traverser.
Un cas intéressant est l'expression avec Bacillus brevis. La souche 47 produit de 12 à 25
grammes de deux protéines sécrétées appelées MWP et OWP par litre de milieu. Durant la phase
logarithmique, les deux protéines sont insérées dans la membrane mais elles continuent d'être
produites pendant la phase stationnaire et elles sont alors sécrétées dans le milieu. Les deux protéines
appartiennent au même opéron (cpw), elles sont donc sous la dépendance d'un seul promoteur, et
présentent un peptide signal. La production est énorme, on a donc à faire à un promoteur très fort
qu'on peut utiliser pour la surproduction de la protéine recombinante (cette notion d'utiliser des
promoteurs extrêmement forts est la même que celle qui a donné lieu à l'utilisation de certains
promoteurs en système eucaryote comme par exemple le promoteur de la polyédrine du Baculovirus).
Un plasmide contenant ce promoteur, un site de liaison au ribosome et le peptide signal a donc été
construit. La production d'EGF humain (epidermal growth factor) ou d'α-amylase a donné des
productions de plusieurs centaines de mg de protéine par litre de milieu.
Bacillus megaterium. Un des éléments régulateurs de l’utilisation du carbone est l’opéron xylose
ce qui permet une inductibilité de 350 fois. L’expression des protéines est relativemnt stable du fait
de l’absence de protéases alkaline qui sont par exemple présentes chez B. subtilis.
Ralstonia eutropha
24/10/2011
68
Cette bactérie n’utilise pas la même voie de métblisation des hexoses que E. coli ou que les Bacillus
et synthétisent moins d’acides organiques losque l’oxygène devient limitant ce qui affecte la
fermentation. De ce fait Ralstonia peut pousser à haute densité, jusqu’à 230 g par litre et il semble
que les protéines qui font des corps d’inclusion chez E. coli reste solubles. Un promoteur fort,
inductible par une limitation en phosphate a été isolé en comparant les protéomes de cellules
cultivées en milieu pauvre en phosphate, du protéome de cellules cultivées en milieu riche en
phosphate (Srinivasan et al., 2002).
Le système qui a été développé utilise une souche qui produit la T7 RNA polymérase sous le control
du promoteur fort et inductible phaP. Le gène d’intérêt est cloné en aval du promoteur T7 puis
introduit dans le génome de la bactérie (Barnard et al., 2004)
La production d’une protéine eucaryote dans un système bactérien n'est souvent
envisageable que
-
Pour des protéines dont l'activité n'est pas requise (pour faire un anticorps par
exemple),
-
Pour les protéines dont les modifications post-traductionnelle ne sont pas importantes.
En effet, les procaryotes sont incapables de réaliser la plupart des modifications
catalysées par des enzymes.
-
Pour les protéines dont le repliement n'est pas dû à des protéines comme c'est le cas
pour la plupart des protéines synthétisées dans le réticulum endoplasmique.
Dans les autres cas on utilisera un système eucaryote
24/10/2011
69
24/10/2011
70
Expression en système eucaryote : les champignons
les levures
Plusieurs levures sont utilisées pour exprimer les protéines recombinantes. Les plus
souvent utilisées sont Saccharomyces cerivisiae et Pichia pastoris.
a) Saccharomyces cerevisiae (levure de boulangerie)
Cette levure présente deux avantages : d'une part, on dispose de vecteurs qui peuvent se
maintenir dans les cellules comme des plasmides bactériens, et, d'autre part, on peut facilement
intégrer un gène par recombinaison dans le chromosome.
Origine de réplication ou ARS
L'origine de réplication de l'épisome 2-μm est le plus souvent utilisé, il permet d'avoir
entre 10 et 40 copies du plasmide par cellule. Ce nombre est très variable et on peut perdre le
plasmide au cours des divisions cellulaires. Aussi, pour obtenir des copies plus nombreuses, on
utilise un marqueur de sélection faible et on augmente la sélection. Toutefois il n'est pas aussi
évident que l'augmentation du nombre de copies augmente la production de protéine. En effet
on a souvent remarqué qu'un grand nombre de copies affecte la croissance des levures et donc
la production. Les levures utilisables avec cette origine de réplication doivent être dépourvues
de l'épisome 2-μm.
Le problème est que ces vecteurs sont peu stables et, lorsqu'ils contiennent uniquement une
origine de réplication, ils sont vite perdus en l'absence de sélection, ce qui est différent des
plasmides d'E. coli. En effet, il n'y a pas comme dans la bactérie de découplage entre la
réplication du plasmide et du chromosome. Pour palier à cette perte on peut ajouter une
séquence centromérique (CEN) qui permet la ségrégation des plasmides dans les cellules filles.
L'inconvénient est que dans ce cas, si on gagne en stabilité on perd en nombre de copies, il y a
en effet 1 ou 2 copies du plasmide par cellule.
24/10/2011
71
Un autre moyen pour augmenter la stabilité consiste à intégrer le plasmide dans le génome,
on profite alors de la séquence centromérique du chromosome. On transforme alors un ADN
linéaire contenant le gène d'intérêt et un marqueur de sélection flanqué des séquences d'un gène
non essentiel. Il y a intégration dans ce gène non essentiel.
Les marqueurs de sélection
De nombreuses souches de laboratoire sont auxotrophes pour des acides aminés ou des
nucléotides, c'est à dire qu'elles ne peuvent pas pousser en l'absence du composé dans le milieu.
On peut donc utiliser la complémentation des enzymes entrant dans les voies de biosynthèse.
Les plus utilisés sont les gènes URA3 ou LEU2 responsables de la synthèse de l'uracile ou de la
leucine. Mais il existe d'autres systèmes de complémentation. L'inconvénient de ce système est
qu'il faut utiliser des milieux biochimiquement définis or, dans ces milieux, les levures
poussent moins bien et, de ce fait, la production de protéine est moins bonne. De plus, les
milieux définis sont plus chers à fabriquer que les milieux non définis comportant par exemple
de l'extrait de levure, de la bactone peptone comme les milieux bactériens.
Aussi, on préfère souvent utiliser des marqueurs de sélection qui donnent la résistance à
des drogues, la tunicamycine (TUN) ou l'hygromycine (Hgm), mais il y a toujours un risque
d'apparition de résistances spontanées dans la souche utilisée et donc de perte du plasmide.
Le promoteur
On peut utiliser des promoteurs "constitutifs". Les gènes codant pour l'alcool
déshydrogénase (ADH1) ou pour 3-phosphoglycerate kinase (PGK) sont exprimés à très haut
niveau, en présence de glucose dans le milieu, leurs ARNm représentent jusqu’à 1% des ARN
totaux. Ils ne sont pas tout à fait constitutifs, en effet l'ADH1 est transcrit 2 à 10 fois moins en
absence de glucose et la PGK 20 à 30 fois moins. Mais ces différences sont faibles par rapport
à celles observées pour d'autres promoteurs tels que GAL1 ou PHO5.
La régulation des gènes utilisés pour la métabolisation du galactose est très utilisée pour
réguler la production de protéines recombinantes. Ce promoteur est en effet très fort : en
24/10/2011
72
présence de galactose, la production de la kinase GAL1 est augmentée de 1000 fois et
représente 0.8% des protéines totales de la levure.
Un autre gène inductible très utilisé est celui codant pour la phosphatase acide (PHO5).
Cette phosphatase acide a pour rôle de déphosphoryler les protéines du milieu extérieur et ainsi
de procurer une source de phosphate à la cellule. Lorsque le phosphate inorganique dans le
milieu est faible, le gène est transcrit, la phosphatase acide est sécrétée, elle déphosphoryle des
protéines, le phosphate libéré est incorporé dans la levure. A l'inverse, quand il y a du
phosphate inorganique dans le milieu, la phosphatase devient inutile, le gène la codant n'est pas
transcrit. On peut utiliser ce système en employant un milieu riche en phosphate inorganique
pour éviter la transcription et un milieu dépourvu pour l'augmenter. Toute une série de
répresseurs et d'activateurs ont été mis en évidence comme pour le système de la galactosidase.
Parmi ceux-ci, PHO2 est nécessaire pour l'activation et PHO80 a un rôle dans la répression. On
utilise une souche qui a une mutation de perte de fonction du répresseur PHO80, il n'y a donc
pas de répression par PHO80. De plus on utilise une mutation thermosensible de l'activateur
PHO2 de façon à contrôler l’activation par des changements de température.
Les deux exemples précédents viennent des études de génétique de la levure, mais on peut
emprunter des systèmes chez les autres eucaryotes. Les récepteurs des stéroïdes de mammifères
gardent leurs activités en tant que régulateurs conditionnels de la transcription chez la levure.
Dans ce cas, en amont d'un promoteur de levure on clone plusieurs éléments de réponse aux
glucocorticoïdes (GRE, Glucocorticoïdes Response Elements) qui sont des éléments de 26 pb.
Le récepteur est lui cloné dans un deuxième plasmide. L'addition de glucocorticoïdes favorise
la liaison du récepteur sur les GRE et le gène est transcrit.
Sécrétion des protéines
Les peptides signaux hétérologues fonctionnent pour la plupart dans la levure, il n'est donc
pas nécessaire d'en changer lorsqu'on veut exprimer une protéine habituellement sécrétée. Dans
le cas où on désirerait faire secréter une protéine cytoplasmique, il suffirait de faire une fusion
avec un peptide signal d'une protéine de la levure tel que celui de l'invertase.
Toutefois, il est difficile de produire des protéines sécrétées dans Saccharomyces
cerevisiae.
24/10/2011
73
- En étudiant la glycosylation des protéines, il est apparu qu'il existe une étape limitante
dans cette maturation quelque part entre le réticulum endoplasmique et le golgi. Une première
technique consiste à changer d'espèce et utiliser Pichia pastoris. Cette dernière permet
l'expression de protéines membranaires qui sont difficiles à obtenir avec S. cerevisiae.
- La sécrétion ne s'effectue que pendant la phase de croissance exponentielle, pour une
protéine sécrétée, il est donc préférable d'utiliser un promoteur constitutif.
- La plupart des modifications post-traductionnelle sont effectuées par S. cerevisiae.
Toutefois la N-glycosylation est très différente de celle observée pour les autres eucaryotes. Les
sites sont les mêmes (N-X-S/T), mais les sucres ajoutés sont différents et présents en très grand
nombre. On compte par exemple de 50 à 150 résidus mannose dans chaque chaîne.
Transformation
On dispose de plusieurs méthodes pour faire rentrer un ADN dans la levure. On peut
utiliser soit une transformation chimique avec le l'acétate de lithium, soit une transformation
avec du CaCl2 sur des sphéroblastes (les sphéroblastes sont obtenus par une lyse de la paroi des
levures par une lyticase), soit par électroporation.
Avantage de la levure. On a quelques millénaires d’expérience et on sait qu’il n'y a pas de
toxicité pour l'homme si bien qu'on peut produire dans la levure des protéines destinées à être
utilisées comme vaccin. Par exemple, le vaccin contre l'hépatite B a été fait dans la levure.
b) Schizosaccharomyces pombe
L'expression dans cette levure est similaire à l'expression dans S. cerevisiae. Le vecteur
peut se répliquer d’une manière autonome et peut être sélectionné par auxotrophie en utilisant
Leu2p. Parmi les promoteurs utilisés on peut citer nmt1 qui est inductible par la thiamine, en
présence de thiamine nmt1 est réprimé et l’induction se fait en retirant las thiamine du milieu.
La TATA box de ce promoteur a été modifiée pour avoir des promoteurs plus ou moins fort et
donc avoir des quantités de protéines produites plus ou moins importantes.
24/10/2011
74
c) Pichia pastoris
P. pastoris est une levure qui a été développée dans les années 70 pour utiliser le méthanol
qui était alors un sous produit de l'industrie pétrolière. Elle est en effet capable de se développer
sur du méthanol comme seule source de carbone. Ce méthanol était converti par P. pastoris en
protéines et donc en aliment pour bétail. Avec la crise pétrolière, la difficulté de concurrencer
les aliments tels que le soja a amené à l'abandon de P. pastoris. De plus d'autres utilisations du
méthanol ont été trouvées si bien que l'utilisation de P. pastoris a été arrêtée au début des
années 80.
La première étape de la métabolisation du méthanol est une oxydation par le produit du
gène AOX1 (le produit d'un deuxième gène, AOX2 est aussi impliqué, mais AOX1 est
responsable de la majeure part de l’oxydation). L'expression de AOX1 est régulée au niveau
transcriptionnel, en présence de méthanol dans le milieu de culture, l'ARN codant pour
l'oxydase représente 5% des ARN polyA+.
Le vecteur typique contient un gène de
Vecteur d’expression dans Pichia pastoris
résistance à un antibiotique et une origine de
réplication pour la propagation dans E. coli.
Il contient, en outre, le promoteur de AOX1
et la partie terminale (3') de AOX1. Ces deux
parties sont interrompues par un site de
clonage multiple suivi au besoin d'une
séquence codant pour un peptide signal pour
insérer le gène d'intérêt. Comme moyen de
sélection, on utilise soit un gène codant pour
une histidinol déshydrogénase permettant la
synthèse d'histidine (HIS4) soit un gène
bactérien procurant la résistance à la kanamycine et procurant chez la levure la résistance au
G418, soit un gène de résistance à la zéocine.
Ce plasmide est introduit dans P. Pastoris soit par électroporation soit par transformation
de sphéroblastes comme pour S. Cerivisae.
24/10/2011
75
Il y a plusieurs possibilités d'intégration dans le chromosome:
Le remplacement de gène ou
insertion oméga. Dans ce cas il y a
deux crossing over entre les
gène
d’intérêt
5’AOX1
promoteurs de AOX1 et la partie 3'
de AOX1, les recombinants ont le
phénotype Muts. (Muts signifie que
la
levure
n'est
plus
3’AOX1
gène AOX1
5’
3’
PAOX1
capable
gène de
sélection
gène
d’intérêt
3’AOX1
plasmide linéarisé
génome de Pichia
plasmide intégré
dans le génome de pichia
d'oxyder le méthanol et donc plus
capable d'utiliser cet alcool comme seule source de carbone). Dans ce cas, le plasmide est
coupé en deux endroits avant la transformation.
L'insertion de gène s'effectue
par un seul crossing over entre le
ori
locus AOX1 du chromosome et
une
des
séquences
gène d’intérêt
gène de
sélection
d'AOX1
présente sur le vecteur (région 5'
5’ AOX1
(promoteur)
3’AOX1
ou région 3'). On a dans ce cas
insertion d'un plasmide en amont
ou en aval de AOX1 qui peut
demeurer
fonctionnel.
5’
gène AOX1
3’
génome de pichia
Le
phénotype de tels transformant est
Mut+.
Plusieurs copies peuvent ainsi s'intégrer en tandem. De telles insertions multiples peuvent
être sélectionnées en utilisant la résistance au G418 ou à la zéomycine. Chaque gène entraîne
une faible résistance, en augmentant la dose d‘antibiotique, on sélectionne les recombinants qui
ont le plus de copies.
24/10/2011
76
L'insertion de gène peut aussi se faire au locus his4. Dans ce cas, le phénotype devient
His+ et Mut+ comme précédemment. Ici aussi on peut avoir des insertions multiples. Dans ce
cas, on utilise un mutant his portant une mutation ponctuelle pour pouvoir avoir un sauvetage
dans une des deux copies générées par la recombinaison.
Avantages de la production de protéines dans P. pastoris
- La production de protéine est de 10 à 100 fois plus importante qu'avec S. cerevisiae
- Elle permet l'expression de protéines membranaires qui sont difficiles à obtenir avec S.
cerivisiae
- Comparé à S. Cerevisiae, les protéines sécrétées sont moins glycosylées, il y a en effet
moins de résidus mannose ajoutés dans chaque N glycosylation (8 à 14 par chaîne alors que S.
cerevisiae en comporte de 50 à 150).
- On peut utiliser un marquage des protéines au
13
13
C, utile pour les études en RMN. On
13
utilise du C méthanol qui est métabolisé et le C est incorporé dans les protéines.
Les champignons filamenteux
On utilise principalement deux espèces, Trichoderma reesei et Aspergillus niger. Les
productions sont très importantes, la cellulase est produite à 30 g/l, l'interleukine à 300 mg/l, la
chymosine bovine à 1 g/l et la lactoferrine humaine à 3 g/l. Cette production au stade industriel
est due à des mutagenèses aléatoires visant à obtenir des superproducteurs.
Généralement on effectue une fusion avec une protéine du champignon pour obtenir la
sécrétion de la protéine d'intérêt.
Il y a toutefois plusieurs problèmes :
- Les souches surproductrices sont industrielles et donc ne sont pas disponibles.
- Comme pour Saccharomyces cerevisiae, il y a une hyperglycosylation des protéines.
- Les méthodes de transformations sont difficiles.
Dictyostelium discoideum
24/10/2011
77
Eucaryote monocellulaire qui forme des agrégats et, en condition défavorable, il y a
formation d'un sporocarpe. Cet eucaryote a l'avantage de posséder des plasmides et donc un
vecteur potentiel de transformation.
Plasmide utilisable chez Dictyostelium discoideum
MCS
Pact15
terminateur
Dpd2
géne de sélection
(G418)
(Manstein et al., 1995)
Pact15: promoteur constitutif
Dpd2 : origine de réplication
AmpR et ori : résistance à l’ampicilline et origine
AmpR
ori
de réplication pour les constructions dans E. coli.
Ce système est peu utilisé mais il a été montré qu'une protéine recombinante pouvait représenter 1%
des protéines totales de la cellule.
24/10/2011
78
Les cellules végétales
Cette technologie vient de la transformation des plantes, la seule différence est qu’au lieu
de régénérer une plante entière, on cultive les cellules. Pour transformer une cellule végétale, le
plus facile est d’utiliser Agrobacterium tumefasciens. Cette bactérie infecte certaines plantes, et
les cellules infectées ont acquis la capacité de croître de façon indépendante et non régulées
(elles sont transformées). Ces cellules sont capables de se développer en culture même sans
hormone et même en l'absence de la bactérie.
Les plasmides Ti sont grands 200 kb, une partie (ADN-T) porte les gènes responsables de
la synthèse d'acide aminés peu courants appelé les opines qui ne peuvent pas être utilisés par la
plante. Elles sont utilisées uniquement par la bactérie qui a sur le plasmide Ti des gènes dont
les produits sont capables de dégrader les opines comme source énergétique. Cette utilisation
des opines est vraisemblablement un moyen de se maintenir. Une autre partie de l'ADN-T code
pour des hormones qui induisent la prolifération cellulaire. Enfin le plasmide Ti porte aussi des
gènes de virulence.
Les cellules végétales endommagées produisent des substances chimiques qui déclenchent
l’expression des gènes de virulence (vir) situé sur le plasmide Ti. L'élément T est excisé de
l'ADN plasmidique au niveau de séquence répétée de 25 bp sous la forme simple brin (un seul
des deux brins est excisé comme dans le cas de la conjugaison bactérienne). Cet ADN-T simple
brin est transféré à la cellule végétale, rentre dans le noyau et s'intègre dans l'ADN.
Ce système a été utilisé pour introduire des gènes via l'ADN-T. Comme le plasmide Ti est
trop grand (200 kb) pour pouvoir être utilisé in vitro, L'ADN-T a été introduit dans un petit
plasmide utilisé couramment en biologie moléculaire. Il a été raccourci, les gènes codant pour
les hormones ont été éliminés pour éviter la croissance incontrôlée des cellules infectées. Dans
cet ADN-T on introduit le gène à exprimer, un gène de sélection dans l'agrobactérium et un
gène de sélection dans la plante.
Le plasmide est ensuite introduit dans agrobactérium par conjugaison. Il y a alors des
événements de recombinaison et ceux là seul sont sélectionnés car le plasmide venant de E. coli
n'est pas capable de se répliquer dans Agrobactérium. La sélection des recombinant (par rapport
au Ti sauvage s'effectue par un gène de résistance). Le plasmide Ti recombinant est alors
transféré dans les cellules végétale en les infectant avec l'agrobactérium recombinant.
24/10/2011
79
Un deuxième système a été mis au point. Le plasmide propagé dans E. Coli ne contient que
les deux séquences répétées bordant l'ADN-T (LB et RB). Entre ces deux fragments, on a un
site de clonage et un gène de sélection pour sélectionner les recombinants dans la plante (NPTII
qui confère la résistance à la kanamycine). On dispose par ailleurs d'un plasmide Ti modifié qui
ne contient plus l'ADN-T mais toujours les genes vir. Le plasmide de E.coli est transféré dans
agrobactérium par conjugaison mais ici il n'y a pas de recombinaison. La bactérie contenant les
deux plasmides est utilisée pour infecter des cellules végétales. Il y a intégration de l'insert
entre les deux extrémités répétés du plasmide construit dans E. coli.
Les cellules les plus utilisées sont les cellules de tabac et en particulier la souche BY2
(Bright Yellow 2) qui se multiplie rapidement.
Avantage de l’expression dans les cellules végétales. Ces cellules se multiplient
facilement.
24/10/2011
80
Les cellules d'insectes
a) Baculovirus.
Les Baculovirus sont responsables de polyédroses nucléaires des insectes en particulier des
lépidoptères. Ce sont de gros virus dont le génome est constitué d'un ADN d'environ 100 kb. A
la fin de l'infection, ces virus forment des corps d'inclusion (appelés polyèdres) dans la cellule.
Ces polyèdres sont principalement constitués d'une protéine d'environ 30 kDa, la polyédrine,
qui protège les virions. Dans la nature, ces polyèdres sont ingérés par les insectes, dégradés par
les protéases du tube digestif, les virions sont libérés et vont se fixer sur les microvillosités des
cellules épithéliales de l'intestin moyen et ils traversent les cellules intestinales. Ils se
multiplient dans les hémocytes et dans le tissu adipeux. Les virions sont transmis de cellules à
cellules par exocytose. En fin de cycle, les noyaux renferment de très nombreux polyèdres, ces
polyèdres constituent donc le mode de transmission d'insecte à insecte.
Depuis quelques années on sait utiliser le Baculovirus pour produire des protéines in vitro.
En fin de cycle le virus produit une très grande quantité de polyédrine. L'astuce a donc été de
remplacer la partie codante du gène codant
pour la polyédrine par celui qui nous intéresse.
On transfecte des cellules. Le virus, au lieu de
produire
une
très
grande
quantité
Exemple de vecteur de transfert à deux promoteurs :
p10 et polyédrine
de
AmpR
polyédrine, produit la protéine voulue. A coté
de ce promoteur, il existe un autre promoteur
tardif qui est très fort, le promoteur de P10.
promoteur
polyédrine
promoteur P10
ori
On peut cloner notre gène derrière ce
promoteur. Dans ce cas, la lyse des cellules est retardée ce qui a pour effet d'augmenter la
production. L'utilisation des deux promoteurs, P10 et polyédrine permet en outre de coproduire
deux protéines, une protéine exprimée à partir du promoteur de la polyédrine et une autre
24/10/2011
81
exprimée à partir de P10. En utilisant un vecteur comportant deux promoteurs P10 tête-bèche,
on peut même produire trois protéines simultanément.
Comment remplacer le gène de la polyédrine par le gène d'intérêt ? Comme il n'est pas aisé
de manipuler de grands fragments d'ADN (100 kb) in vitro on peut utiliser deux méthodes,
utilisant soit la recombinaison dans la cellule d’insecte, soit la transposition dans la bactérie.
La recombinaison consiste à utiliser la "plasticité" du génome des Baculovirus qui est très
importante. En effet il arrive qu'ils échangent une partie de leur information génétique. Les
recombinants peuvent donc acquérir des propriétés nouvelles, en associant dans le même virus
des propriétés des deux "parents". On profite donc de la facilité d'obtention de recombinant en
manipulant en bactérie une petite partie du génome du Baculovirus comportant le promoteur de
la polyédrine, une région d'ADN en amont du promoteur et une région en aval pour avoir des
régions ou peuvent s'effectuer les recombinaisons. Ce plasmide bactérien est appelé vecteur de
transfert. On co-transfecte ensuite des cellules avec le virus sauvage et le plasmide bactérien
comportant une petite partie de l'ADN viral et on cherche les événements de recombinaison, les
plages de lyse qui ne produisent pas de polyédrine.
Il existe une solution pour éviter de passer par le vecteur de transfert. Le gène d'intérêt est
amplifié avec des amorces spécifiques, mais en amont de ces amorces, on ajoute 50 nucléotides
correspondant aux séquences amont et aval de la polydédrine sur la séquence du virus. Ces
nucléotides vont permettre la recombinaison comme dans le cas des séquences présentes sur le
vecteur de transfert (Gritsun et al., 1997).
La recombinaison est un phénomène relativement rare et l'isolement des recombinant était
jusqu'à récemment relativement fastidieux.
Une technique améliorant ce processus a été
DNA viral (100 kb)
p10
polyédrine
développée. Elle consiste à couper l'ADN
viral dans la région qui doit être remplacée
Bsu36I
ORF 603
Bsu36I
LacZ
Bsu36I
ORF1629
promoteur polyédrine
par le gène d’intérêt. Pour ce faire, on coupe
le virus par une enzyme de restriction qui ne
24/10/2011
82
coupe qu'à cet endroit (Bsu36I). On cotransfecte l'ADN viral et le vecteur de transfert et on
attend la recombinaison sur les ORF 603 et 1629. Seuls les recombinants vont se développer, il
restera toutefois quelques virus sauvages si la coupure n'a pas été totale.
Enfin on peut fabriquer les recombinants directement dans la bactérie si on arrive à cloner
directement le gène d'intérêt derrière le promoteur de la polyédrine en bactérie. Il faudra alors
simplement extraire l'ADN et transfecter des cellules et la recombinaison dans les cellules
d'insecte sera alors évitée. Cette construction est difficile à effectuer in vitro, en effet les sites
de restriction uniques sur
100 kb sont rares et la
pSC101 ts ori
manipulation de grand
ampiciline R
fragments d'ADN sans
donneur
LacZα
les casser est difficile.
Mais on peut effectuer la
Tn7R
5000 bps
Ppol
gentamicine R
Tn7L
gène
tnsA-E
construction
bactérie
dans
soit
la
Helper
par
tetracycline R
mini-att Tn7
recombinaison soit par
ori
LacZa
transposition. C'est cette
dernière méthode qui est
mini-F-ori
bacmide
100 kb
la plus utilisée. L'ADN
viral a été cloné dans son
kanamycine R
ensemble dans E. coli.
Pour ce faire, l'origine de réplication du facteur F et un gène de résistance à un antibiotique ont
été ajoutés au génome de baculovirus. On a ainsi obtenu un génome du baculovirus capable de
se répliquer à faible nombre de copies chez E. coli. Cette construction a pris le nom de bacmide
(Luckow et al., 1993).
Dans le bacmide, on a rajouté un site cible du transposon bactérien Tn7 (mini-att Tn7) en
phase avec le gène codant pour le peptide α de la β-galactosidase (LacZY). Ainsi un événement
de transposition peut se repérer par l’arrêt de synthèse de la β-galactosidase dans une souche
déficiente en peptide α. Le transposon vient du plasmide donneur. Il contient, entre les deux
24/10/2011
83
LTR de Tn7, le promoteur de la polyédrine cloné en amont du gène d’intérêt et un gène de
sélection.
On fabrique donc in vitro le plasmide donneur, avec le gène d’intérêt en aval de son
promoteur. Ce plasmide est alors utilisé pour transformer des bactéries contenant le bacmide et
un plasmide helper. Ce dernier fourni les différents composants nécessaires à la transposition
comme la transposase. Les colonies où un évènement de transposition a eu lieu sont blanches et
sensibles à l’antibiotique présent dans le plasmide donneur en dehors du transposon. Il faut
alors éliminer le plasmide donneur et, pour ce faire, on a plusieurs moyens : utiliser le lacZα en
dehors du transposon, les bactéries exprimant la β-galactosidase ne seront pas prises, ou utiliser
une origine de réplication thermosensible. Après la transposition, les bactéries seront incubées à
42°C (Leush et al., 1995).
Pour isoler le virus on a deux méthodes. La première ("plaque assay") consiste à étaler des
cellules sur une boite puis à les infecter avec la population de virus. On coule ensuite de
l'agarose pour limiter le passage des virus aux cellules voisines. On utilise de l'agarose à bas
point de fusion pour éviter de cuire les cellules. On obtient ainsi des plaques de lyse comme
losqu'on isole des clones de lambda recombinants dans une banque. La deuxième méthode est
appelée "end point dilution". On utilise une plaque de microtitration de 96 puits qui sont
inoculés par des cellules. Dans chacun des puits d'une rangée, on infecte les cellules par 1
microlitre de la solution virale, dans la seconde par 100 nl soit 10 fois moins, dans la troisième
par 10 nl, etc... Cette quantité est obtenue par dilution successive de la solution primordiale. A
partir d'une certaine dilution, les virus sont isolés. Par exemple si la solution virale au début est
de 1 virus par nl, à la dilution de 1 nl et de 0.1 nl par puits on aura des clones isolés. Cette
méthode permet donc d'une part d'isoler des virus d'une solution et d'autre part de la titrer. Dans
les deux méthodes, il faut ensuite reconnaître les virus "sauvages" des virus recombinants. Les
premiers essais utilisaient un virus sauvage produisant la polyhédrine. Ces virus étaient
reconnaissables au polyèdre présent dans le noyau des cellules infectées. Maintenant on utilise
plutôt comme virus "sauvage" un virus exprimant la β-galactosidase, repérable par une réaction
enzymatique avec le X-gal donnant une couleur bleue, les recombinants ne donnant pas de
réaction colorée avec le X-gal.
24/10/2011
84
La production de protéine est le plus souvent effectuée à l’aide de culture de cellule
d’insectes. Quelques cellules d'insectes ont été immortalisées d'une manière assez empirique,
généralement en dissociant des cellules non différentiées et en les mettant en culture (les larves
d'insectes hétérométaboles possèdent des amas de cellules non différentiées qui seront utilisées
pour générer les tissus spécifiques de l'adulte). Des cellules dissociées ont été mises en culture,
certaines d'entre elles se sont maintenues. On dispose ainsi de trois souches de cellules, des Sf9
et Sf21 provenant d'ovaires de Spodoptera frugiperda et Tn5 provenant de Trichoplusia ni. Les
cellules sont infectées avec un virus recombinant, le virus se développe, produit la protéine et
lyse les cellules.
Une autre possibilité est d’infecter des larves de lépidoptère avec le virus recombinant. Les
chrysalide du vers à soie (Bombyx mori) sont actuellement utilisé en Asie, parce que c’est un
élevage mis au point depuis longtemps pour fabriquer de la soie naturelle, parce que c’est un
insecte assez gros et parce que l’insecte est « non toxique » en effet les chrysalides sont
consommées en chine. La technique consiste à injecter une solution virale dans les chrysalides
et à les récolter 4-5 jours après.
Avantage de l'expression en baculovirus:
Ce système de production en infectant soit des insectes soit des cellules d'insecte présente
plusieurs avantages:
Fonctionnalité des protéines recombinantes : Les insectes sont des eucaryotes et ils sont
capables d'effectuer tous les repliements des protéines avec réalisation des bons ponts
disulfures et les bonnes oligomérisations, ce qui n'est pas le cas des bactéries ou des levures.
Cependant, lorsque la protéine fonctionne sous la forme d’hétérodimère, elle ne sera pas
fonctionnelle à moins que la deuxième protéine ne soit co-exprimée.
Modifications post-traductionnelles : La plupart des modifications post-traductionelles sont
effectuées en baculovirus et ce aux sites où on les trouve dans les protéines natives. Toutefois,
24/10/2011
85
ce système produit une très grande quantité de protéine et on observe parfois une saturation du
système. Par exemple on observe parfois un plus faible niveau de glycosylation, de
phosphorylation ou de glypiation (ajout d’un ancrage GPI) de la protéine. Dans certains cas, la
modification post-traductionnelle est espèce ou tissus spécifique, cette modification posttraductionnelle est due à des enzymes particuliers et on ne les observe pas chez les cellules
d'insectes à moins que ces enzymes ne soient coexprimées.
Haut niveau d'expression : Le record de l'expression mentionnée avec baculovirus est de 1
gramme de protéine recombinante pour 109 cellules soit plus d'un gramme de protéine par litre
de culture. Cependant il s'agit d'un record et il est difficile de prévoir la quantité de protéine que
l'on obtiendra. Par exemple une protéine cytotoxique tuera précocement la cellule et la
production sera plutôt de l'ordre du microgramme par litre.
Capacité de grande insertion : jusqu'à maintenant on ne connaît pas de taille maximale
pouvant être intégré dans le baculovirus. La seule limitation est donc la manipulation de grands
fragments d'ADN dans le vecteur de transfert.
Capacité d'épisser les gènes : La plupart des sites d'épissage seront utilisés par la cellule.
Cependant l'épissage des sites alternatifs, qui sont tissus spécifiques seront plus aléatoires.
Expression simultanée de plusieurs gènes : Des vecteurs comportant jusqu'à trois
promoteurs (deux P10 et un polyédrine) sont actuellement disponibles. La seule limitation est
simplement la difficulté de construire les vecteurs de transfert très grands, comportant plusieurs
inserts.
b) Cellules d’insecte ayant intégré le gène d’intérêt dans leur génome
Toutes les lignées cellulaires ont la propriété intéressante de pouvoir intégrer de l'ADN
dans leurs chromosomes. Si on transfecte une cellule avec un plasmide on a tout d'abord
expression transitoire à partir du plasmide puis dans un deuxième temps établissement d'une
24/10/2011
86
culture cellulaire exprimant la protéine d'une manière stable puisque le plasmide s'est intégré
dans le génome. Des centaines de copies du plasmide se retrouvent dans le génome.
Le promoteur. Pour obtenir ces lignées stables on a besoin d’un promoteur reconnu par la
machinerie transcriptionnelle de la cellule et d’un agent de sélection. On connaît un très grand
nombre de promoteurs chez les insectes. On utilise soit un promoteur constitutif soit un
promoteur inductible. Dans ce dernier cas, on peut utiliser le promoteur de la metallotionéine
qui est inductible par le sulfate de cuivre. Une autre alternative est d'utiliser un promoteur viral
précoce. Ainsi le promoteur OpIE2 du baculovirus de Orgyia pseudotsugata est utilisé car il est
fonctionnel dans un grand nombre de cellules d'insecte différentes.
La sélection : le facteur limitant est la transfection, si une cellule incorpore de l'ADN, elle
incorpore un grand nombre de molécules présentes dans le milieu. Une première technique
consiste à faire une cotransfection avec un plasmide comportant un gène de résistance. Les
cellules ayant incorporé des plasmides dans leur génome seront hygromycine résistante, les
autres seront sensibles et seront éliminées. Une deuxième technique consiste à intégrer le gène
de sélection au plasmide. On augmente la pression de sélection pour sélectionner les cellules
qui sont les plus résistantes, ces cellules comportent plus de plasmide, ainsi plus de copies du
gène d’intérêt et donc produiront plus de protéines. En augmentant graduellement la sélection,
on peut espérer sélectionner des lignées produisant un grand nombre de copies par
recombinaison.
Ce système offre l’avantage de pouvoir utiliser un grand nombre de cellules différentes, et
donc de choisir celle qui sera le plus adaptée à produire la protéine d’intérêt. En effet, les
capacités à effectuer les différentes modifications post-traductionnellles varient en fonction des
cellules.
Par contre de système est peu efficace si on veut exprimer une protéine présentant une
toxicité pour la cellule. En effet, plus on exprime la protéine toxique, moins on a de chance de
pouvoir établir la lignée stable.
24/10/2011
87
Les cellules de vertébrés
1) L'ovocyte de Xénope
On peut faire exprimer une protéine par l'ovocyte de Xénope en injectant de l’ADN dans le
noyau. Le noyau est situé au 2/3 du pôle animal et n'est pas visible sur l'ovocyte vivant. Pour
pouvoir injecter l'ADN on centrifuge doucement (200-400 g pendant 5 min. Le noyau plus
dense que le cytoplasme se déplace vers le pôle animal jusqu'à le toucher. On observe alors une
décoloration au pôle animal qui nous permet de le localiser. On injecte environ 10 nl d'ADN.
Le gène d'intérêt est cloné derrière un promoteur eucaryote fort. Il y a alors transcription puis
traduction.
Les avantages et inconvénients du système sont les mêmes que ceux énoncés pour
l'injection d'un ARNc, c'est à dire peu de protéines sont produites mais cette protéine est active.
On va donc l'utiliser principalement pour exprimer des récepteurs.
Par rapport à l'injection d'un ARNc, il y a plusieurs avantages: c'est plus facile à réaliser
puisque la transcription in vitro n'est plus nécessaire de plus, on obtient généralement plus de
protéines. Toutefois il y a aussi des désavantages : la production est très variable selon les
ovocytes, certains produisent beaucoup de protéines alors que d'autres n'en produisent que très
peu. Cette variabilité est sans doute due au moins en partie à la centrifugation et à l'injection
dans les noyaux qui peut les abîmer.
2) Cellules de mammifère
On peut distinguer trois grands types d'expression, l'expression à partir d'une infection
virale, l'expression transitoire et l'établissement d’une lignée stable. Dans les deux premiers cas,
les cellules sont infectées ou transfectées et analysées quelques jours après, dans le troisième
cas l'ADN injecté est incorporé au chromosome.
24/10/2011
88
a) Expression à l'aide d'un virus
De nombreux virus qui infectent les cellules de mammifère ont développé des mécanismes
pour détourner la machinerie de synthèse des protéines. Il a alors été tentant d'utiliser ces virus
pour produire des protéines.
Les premiers vecteurs viraux ont été fabriqués à partir du virus tumorigène simien SV40.
Ce virus est petit (5 kb) et ne peut pas s'accommoder de séquence supplémentaire importante. Il
faut donc remplacer quelques gènes viraux par le gène d'intérêt. Mais ces gènes sont
indispensables pour la viabilité du virus. On transfecte donc la cellule avec deux virus SV40 :
le virus recombinant portant le gène d'intérêt et un virus muté à un autre endroit du génome.
Les deux virus se complémentent et on obtient un stock viral comportant les deux virus. (N.B.
ce système d'helper suit la même stratégie que la formation de simple brin en utilisant un
plasmide portant l'origine de réplication des phages f1 ou M13).
Le BPV (Bovine Papilloma Virus) est un papovavirus de 8 kb, ADN double brin circulaire.
In vitro, il peut infecter un faible nombre de cellules et 30% de son génome peut être remplacé
par un ADN étranger ce qui permet d'insérer des séquences de plasmide permettant la
propagation dans E. coli ainsi que le gène d'intérêt. Son avantage est d'être présent en grande
quantité dans les cellules (50 à 200 copies), la transfection des cellules de souris (C127 ou 3T3)
est aisée et on peut même établir des lignées stables où le virus se maintient comme un épisome
(équivalent d'un plasmide).
Les lentivirus ont l’avantage de pouvoir infecter toutes les lignées cellulaires. Un système
de production est commercialisé par Invitrogen sous le nom de ViraPower®. On transforme le
plasmide contenant le gène d’intérêt avec deux autres plasmides dans une souche de cellules
pour reconstituer le virus portant le gène en aval d’un promoteur eucaryote fort. Le surnageant
de culture contient les virus et peut être utilisé pour infecter d’autres types cellulaires.
Le virus de la vaccine est un poxvirus contenant un ADN de grande taille (185 kb) dont la
réplication s'effectue entièrement dans le cytoplasme. Le gène d'intérêt est placé en aval d'un
24/10/2011
89
promoteur de poxvirus, les promoteurs eucaryotes n'étant pas reconnus par la machinerie
transcriptionnelle du virus. Comme pour Baculovirus, l'ADN du virus est trop grand pour être
manipulé aisément in vitro. La construction sera donc effectuée par recombinaison homologue
avec un vecteur navette portant des séquences du virus. Ici aussi, la recombinaison est assez
rare, on obtient environ un recombinant pour 1000 parents. Pour améliorer ce pourcentage et
ainsi faciliter la sélection des recombinants plusieurs systèmes ont été mis au point:
-
On utilise le gène viral codant pour la thymidine kinase (TK) comme séquence
flanquante permettant la recombinaison, de telle façon que la recombinaison l'inactive.
On utilise des cellules mutées sur leur gène cellulaire de la thymidine kinase donc TK-.
Lorsqu’il y a le virus, les cellules sont TK+ du fait de la présence d’une thymidine
kinase virale. Les recombinant seront TK- due à l’inactivation de la thymidine kinase
virale. Or, on sait trier les cellules TK- des cellules TK+ : les cellules TK- sont
résistantes à la 5-bromodésoxyuridine. En effet, pour être active, cette drogue doit être
phosphorylée par la thymidine kinase.
-
Le problème est que la mutation de TK+ vers TK- a une fréquence de 10-4, aussi on
associe souvent cette sélection à une autre méthode. Cette deuxième méthode utilise la
co-expression d'un gène de résistance à un antibiotique codant pour la guanine
phosphorybosyltransférase (gpt) qui procure la résistance au G418.
-
Une troisième méthode utilise, comme pour le Baculovirus, un virus parent exprimant
la β-galactosidase pour pouvoir trier visuellement les virus recombinés des virus
parents. L'avantage du virus de la vaccine est qu'il éteint les productions d'ARNm de
l'hôte si bien que l'ARN du gène cloné peut représenter jusqu'à 30% de l'ARN de la
cellule.
Les adenovirus sont des virus à ADN double brins linéaires de 36 kb. Ils causent chez
l'homme des infections des voies respiratoires ou des conjonctivites. On peut utiliser des virus
atténués comme vecteur en clonant l'ADN d'intérêt derrière un promoteur fort. L'introduction
de l'ADN se fait par un premier clonage dans un plasmide puis par une recombinaison in vivo
comme pour le cas du baculovirus ou du virus de la vaccine. L'avantage de ce virus est que
l'expression peut se faire dans un grand nombre de cellules humaines telles que la lignée 293.
24/10/2011
90
Ainsi, les modifications post-traductionnelles caractéristiques des cellules humaines sont
respectées. L'expression est souvent élevée, jusqu'à 10-20% des protéines cellulaires.
Une autre catégorie de virus peut être utilisée : les rétrovirus. Ce sont des virus à ARN, une
fois l'ARN entré dans le cytoplasme, il est rétrotranscrit en ADN et cet ADN est intégré dans le
génome avec à chaque extrémité les LTR (Long Terminal Repeat). Il produit de l'ARN viral à
partir d'une séquence proche de l'extrémité du virus. Cet ARN sert à produire les protéines
virales et donc à la création de nouveaux virus. Ces virus sont assemblés dans le cytoplasme et
sortent de la cellule par bourgeonnement. Ainsi tout gène inséré dans un virus recombinant sera
intégré dans le génome.
Pour utiliser un tel système
-
on fabrique un plasmide dans lequel on a ajouté le gène d’intérêt derrière son
promoteur et le signal d’empaquetage de l’ARN (ψ+), le tout est inséré entre les deux
LTR. Ce virus est incapable de s'intégrer dans le génome et est dépourvu de gag
(protéine de structure), de pol (reverse transcriptase, intégrase) et d’env (protéine de
l’enveloppe).
-
Dans un deuxième plasmide (ou intégré dans le génome), on a un virus complet mais
qui manque de séquences nécessaires à l'encapsidation de l’ARN. Le plasmide portant
le gène d’intérêt est transfecté dans la cellule qui produit les protéines virales (gag, pol,
env), ce qui permet d'obtenir un virus à ARN. Ce système a simplement permis de
passer d’un plasmide à un virus, incapable de se répliquer mais pouvant s’intégrer dans
un génome.
Ces virus sont purifiés et infectent d'autres cellules qui ne comportent pas de virus. L'ARN
est rétrotranscrit en ADN, circularisé et intégré dans le génome. Le nouveau virus est incapable
de s'encapsider, l'intégration est stable.
24/10/2011
91
1) Transfection
vecteur retroviral
génome
2) intégration
3) transcription
traduction
gene X, Ψ, resistance
ARN
gag, pol, env
4) Reconnaissance de Ψ
par les protéines virales
5) Empaquetage
6) Virus infectants
mais incapables de se répliquer
Les alfavirus tels que le SFV (Semliki Forest Virus) sont des petits virus à ARN simple
brin qui peuvent se répliquer dans toutes les cellules animales. A la suite de l'infection, l'ARN
code pour quatre protéines qui produisent l'autre brin appelé brin -. Ces derniers servent alors
de matrice pour produire des brins + et des petits génomes qui servent à faire les protéines de
structure. Plusieurs alfavirus ont été clonés sous la forme d’ADNc pour produire des ARN in
vitro, infectieux dans lesquels les gènes codant pour les protéines de structures ont été
remplacés par le gène d'intérêt.
Ce système a plusieurs avantages : on obtient une grande quantité de protéine, la
construction du virus s'effectue entièrement dans E. coli, il n'y a pas besoin d'helper. La
principale difficulté provient de la transfection de l'ARN dans les cellules qui est faite par
électroporation. Ce système est proche de l'injection d’ARN dans l'ovocyte de Xénope mais,
ici, il y a réplication de l'ARN par une réplicase.
24/10/2011
92
Il y a quelques dangers à utiliser des virus pour exprimer des protéines. Par exemple, le
virus de la vaccine n'est pas toxique et on s'en sert pour les vaccinations contre la variole.
Toutefois, il faut faire attention, il est en effet capable d'attaquer les cellules humaines.
24/10/2011
93
b) Expression transitoire
Les vecteurs
Les vecteurs utilisés ici sont constitués de deux parties, une permettant la manipulation
dans les bactéries, avec au minimum une origine de réplication (pBR322 ori ou pUC ori ou col
E1 ori) et un gène de résistance aux antibiotiques. A ces deux parties, on peut ajouter des
parties accessoires : une origine d'un phage à ADN simple brin (M13 ou f1) pour faire certains
protocoles de mutagenèse ou pour séquencer, les promoteurs des phages T3, T7 ou Sp6 si on
veut faire de l'ARN in vitro. Une deuxième partie servira à la manipulation dans les cellules
eucaryotes. Ces deux parties ne sont pas forcement spatialement séparées et on peut ajouter ou
retirer les parties que l'on souhaite.
Les marqueurs de sélection
Un des principes de base des techniques de biologie moléculaire est d'utiliser un marqueur
biologique pour identifier ou sélectionner les cellules contenant des molécules d'ADN
recombinant. Le gène de sélection doit lui-même être en aval d'un promoteur fonctionnant dans
la cellule transfectée
Une première technique consiste à complémenter une déficience de la cellule. Exemple de
la thymidine kinase déjà vue dans l'utilisation du virus de la vaccine. Cette enzyme est codée
par le gène tk qui a été isolé chez le virus de l'herpès simplex (HSV). Elle est impliquée dans
une des voies de synthèse de la thymidine monophosphate à partir de la thymidine et donc de la
thymidine triphosphate, nucléotide indispensable pour la synthèse de l'ADN et donc pour la
réplication et la viabilité de la cellule.
Une deuxième méthode consiste à utiliser des enzymes résistants à une drogue comme par
exemple :
24/10/2011
94
- Une dihydrofolate réductase (DHFR) résistante au méthotrexate qui peut alors être ajouté
au milieu de culture (la DHFR résistante a été trouvée dans les cellules cancéreuses
résistante au méthotrexate).
- Une hygromycine phosphotransférase (HPH) inactive l'hygromycine qui inhibe aussi la
synthèse protéique.
- Une aminoglycosyl phosphotransférase (APH) donne la résistance au G418, proche de la
néomycine. Le G418 bloque la synthèse protéique et est détruit par l'APH. C'est le
marqueur le plus utilisé car le gène bactérien de résistance à la kanamycine procure la
résistance au G418 chez les eucaryotes. Dans ce cas, le même gène marqueur peut être
utilisé pour les étapes de construction dans E. coli comme pour les étapes d’expression
dans les cellules eucaryotes.
RBS
promoteur
procaryote
promoteur
eucaryote
neomyciner
signal de
polyadénylation
Il faudra alors que le gène soit fonctionnel dans les deux systèmes. Il faudra deux
promoteurs en amont du gène, un procaryote et un eucaryote, un site de liaison au
ribosome en amont de l’ATG d’initiation de la traduction pour l’expression en procaryote
et un site de polyadénylation en 3’ pour l’expression en eucaryote.
Il est aussi possible de trier les cellules transfectées par coexpression d'un anticorps sur la
surface externe de la cellule. Les cellules transfectées expriment l'anticorps à leur surface, ainsi
que la protéine d'intérêt, ces anticorps réagissent avec un haptène liée à une bille magnétique,
ces billes peuvent être triées avec un aimant.
Une autre méthode consiste à exprimer une protéine qui colore les cellules. On utilise le
plus souvent la GFP (green fluorescent protein) qui colore les cellules en vert. Les cellules
24/10/2011
95
transfectées sont vertes. Cette méthode peut être en plus employée en combinaison avec la
sélection à une drogue. On peut en effet fabriquer une protéine de fusion entre la GFP et
l’hygromycine phosphotransférase. Les cellules qui se développent en présence d’hygromycine
doivent être vertes. On peut ainsi vérifier que la sélection à l’hygromycine est efficace.
Les promoteurs
Les promoteurs et enhancers consistent en des séquences qui interagissent avec les
protéines impliquées dans la transcription. La combinaison de ces séquences détermine
l'efficacité avec laquelle un gène donné est transcrit dans une cellule donnée.
On distingue grossièrement deux types de séquence dans un promoteur, la "TATA box" et
les éléments en amont. La "TATA box" est localisée 25 à 30 bp en amont du site d'initiation de
la transcription. Ce site est directement impliqué dans le positionnement de l’ARN polymérase
II qui commencera la synthèse au bon site. Les éléments en amont, eux, sont responsables de la
vitesse de l'initiation de la transcription. L'action de ces éléments est indépendante de leurs
orientations, ils sont localisés 100 à 200 bp en amont de la TATA box.
Les enhancers stimulent la transcription, même à grande distance du promoteur (plus d'un
kb), ils peuvent se situer en amont ou en aval du promoteur. La plupart d'entre eux fonctionnent
uniquement dans un type de cellule et, de plus, sont actifs seulement dans des conditions
spécifiques telles que la présence d'un inducteur comme une hormone ou un ion métallique.
Ainsi le choix d'un promoteur et d'un enhancer va principalement dépendre de la lignée
cellulaire utilisée.
Les promoteurs et enhancer les plus utilisés proviennent de virus qui ont une faible
spécificité cellulaire. Par exemple l'enhancer précoce de SV40 est actif dans presque toutes les
cellules. De même, le promoteur précoce du cytomégalovirus (CMV) humain permet
l'expression dans un grand nombre de lignées cellulaires. Mais on peut aussi utiliser des
promoteurs de gène codant pour des protéines ubiquitaires. Ainsi, UbC le promoteur de
l’ubiquitine qui est une protéine très conservée chez les eucaryotes est utilisé parce qu’il
fonctionne dans un très grand nombre de cellules et que la transcription est équivalente à celle
obtenue avec le promoteur CMV.
24/10/2011
96
Un système hybride utilise le virus de la vaccine et l’ARN polymérase T7. On infecte des
cellules avec un virus recombinant codant pour l’ARN polymérase T7. On transfecte ensuite les
cellules avec un plasmide où le gène d'intérêt est sous le contrôle d'un promoteur de T7. Ce
système permet d'avoir une grande quantité de protéine en profitant d'une part de la forte
transcription et traduction de la polymérase puis de sa forte capacité de synthèse de l'ARN
d'intérêt.
Pour avoir un bon contrôle de l'expression, on peut utiliser des promoteurs inductibles par
exemple par les métaux lourds, un choc thermique ou une hormone stéroïdienne. Toutefois tous
ces systèmes fuient, il y a toujours une expression faible en absence d’induction. De plus les
inducteurs sont souvent toxiques et l’induction n’est généralement pas spécifique.
Pour résoudre ce problème, on utilise une régulation hétérologue.
Par exemple, on peut utiliser une séquence régulatrice d'insecte dans le promoteur.
L’ecdysone est une hormone de mue des insectes, absente chez les vertébrés. On fabrique des
cellules (CHO ou 3T3) qui synthétisent d'une manière constitutive un récepteur
hétérodimérique de l'ecdysone. On utilise dans le plasmide, un promoteur minimal comportant
en amont la séquence de réponse à l'ecdysone. On induit alors l'expression avec de la
muristerone A, un analogue de l'ecdysone qui n'a aucun effet sur les cellules de mammifère, et
qui n'induit aucun autre gène.
Un deuxième exemple est l’utilisation d’un système de régulation bactérien comme
l’opéron tetracycline de E. coli (Gossen et Bujard, 1992 ; Gossen et al., 1995). Le gène
d’intérêt est cloné en aval d’un promoteur minimal du cytomegalovirus (PminCMV) en aval d’un
élément de réponse à la tétracycline (TRE) qui contient plusieurs copies de l’opérateur. Le
plasmide doit coder pour le répresseur qui n’existe pas dans la cellule eucaryote (TetR). En
l’absence de tetracycline, TetR se fixe sur l’opérateur (TRE). Pour convertir TetR, un
répresseur procaryote en transactivateur eucaryote, il a été fusionné avec un domaine
24/10/2011
97
d’activation du virus de l’herpes (VP16). En présence de tétracycline, il n’y a pas transcription
alors que l’induction se fait en retirant la tétracycline.
VP16
TetR
+ Tetracycline
-Tetracycline
VP16
TetR
Psv40
tetR
VP16
gène d’intérêt
Pcmv
TRE
Régulation de l’expression d’un gène dans une cellule eucaryote par système de régulation procaryote.
Mais il n’est pas toujours simple d'éliminer la tétracycline du milieu pour avoir une
induction. TetR a été muté par mutagenèse au hasard et le mutant appelé rTetR, pour reverse
TetR se lie à l’ADN en présence de tétracycline uniquement. Comme la tétracycline a des effets
indésirables, des effecteurs plus efficaces et donc moins toxiques ont été recherchés, la
doxycycline est le plus utilisé actuellement.
Le polylinker
Noté soit avec tous les sites d'enzymes de restriction, soit MCS (multiple cloning site), il
est généralement optimisé pour éviter les structures secondaires de l'ARN pouvant gêner la
traduction. Il y a généralement plusieurs sites de coupures avec différentes localisations ce qui
permet d'orienter l'insert, en utilisant des enzymes qui ne coupent pas à l'intérieur de la
séquence codante. Comme dans le cas des procaryotes, un site de restriction est souvent
positionné sur l'insert par mutagenèse dirigée.
La terminaison
24/10/2011
98
Lors de la transcription, l’ARN polymérase II passe à travers le site de polyadenylation.
L'extrémité 3' est donc formée lors de la maturation de l'ARN par clivage et ajout de la queue
poly-A. On ne connaît pas bien les arrêts de la transcription chez les eucaryotes. La maturation
est due à deux sites : une séquence riche en GU ou en U située en aval du site de coupure et une
séquence très conservée AAUAA située 11 à 30 nucléotides en amont du site de coupure.
Pratiquement ces séquences doivent être présentes pour assurer une bonne maturation de
l'ARN. Ces éléments sont présents lorsqu'on veut exprimer un ADNc complet mais souvent ils
ne sont pas suffisant pour assurer une bonne maturation. Aussi, on en rajoute une dans la
plupart des vecteurs. Le plus souvent on utilise les sites de polyadenylation des transcrits de
SV40.
Un intron
Chez les eucaryotes l'ARN prémessager (hnRNA) est souvent épissé. Après la
polyadénylation, les introns sont retirés pour générer l'ARN mature. Les séquences consensus
de l'épissage ont été déterminées en comparant un grand nombre de séquences d’ADNc et
d’ADN génomique. On a AG/GU(A)AGU....(UC)nN11CAG/G, le GU au site donneur et le AG
au site accepteur étant invariable. Or, des séquences proches de la séquence consensus peuvent
se trouver dans la séquence codante de l’ADNc et ces sites peuvent être utilisés quand il n’y a
pas d’intron à épisser. Pour éviter ce problème, un intron est généralement ajouté en aval du
site de clonage. De plus, il semble que l'épissage augmente l'efficacité du transport de l'ARN
vers le cytoplasme où il est traduit.
On a remarqué que l’expression chez les mammifères était augmentée lorsqu’un intron est
inclus dans la séquence (Brenner et al., 1994). Comme la présence d’un intron n’est par ailleurs
généralement pas préjudiciable, on préfère l'ajouter.
Une séquence responsable de la traduction
L'ATG d'initiation doit être dans un environnement favorable et respecter la séquence
consensus de Kozac pour une bonne traduction. Cette séquence est (G/A)NNATGG. Bien que
24/10/2011
99
d'autres séquences soient possibles, il est préférable d'avoir une purine en position -3 et une
guanine en position +4.
Des séquences d'adressage
Lorsqu'on souhaite que la protéine soit adressée dans un région particulière, on ajoute en
fusion une séquence codante permettant son adressage. Le plus courant est la sécrétion en
ajoutant un peptide signal, la protéine sera dirigée dans le réticulum endoplasmique puis
sécrétée. Mais on peut aussi utiliser un signal de sécrétion dans les mitochondries ou un signal
de sécrétion dans le noyau.
Dans ce dernier cas, on peut utiliser une fusion avec VP22. Cette protéine de 38 kDa du
virus de l’herpès a la particularité d’être transloquée dans le noyau d’une cellule à l’autre.
Après la traduction dans le cytoplasme, VP22 est importée dans le noyau des cellules
adjacentes, non transfectées et cette faculté de translocation est en même temps conférée aux
protéines de fusion (O’Hare et Elliot, 1997). Un des avantage de cette fusion est de pouvoir
utiliser cette fusion en expression transitoire, dans ce cas, l’efficacité de la transfection n’a plus
grande importance puisque toute les cellules auront la protéine.
Des sites interne d'initiation de la traduction.
Bien que les ARN eucaryotes soient monocistroniques, il existe une exception : le virus de
la polio (picornaviridae) produit un ARN polycistronique pour lequel il existe des sites
d'initiation internes (Peletier et Sonenberg, 1988). Ces sites de liaison du ribosome (IRES,
Internal ribosomal entry site) peuvent être utilisés en amont du gène d’intérêt, ils ont alors la
même fonction que le RBS. Ces IRES seront donc utilisés lorsqu'on veut avoir deux protéines
différentes provenant du même ARN. Une protéine peut ainsi servir de marqueur de
transcription pour la protéine d'intérêt.
c) L'établissement de lignées stable
24/10/2011
100
Même dans les meilleurs cas, 5% à 50% des cellules seulement sont transfectées, on
analyse donc des cellules transfectées et des cellules non transfectées. L'origine de réplication
de E. coli ne fonctionne pas dans les cellules eucaryotes , on a donc trois solutions : soit en
ajouter une, soit intégrer le gène dans le génome et, dans ce cas, on a établissement d'une lignée
stable soit ne pas en rajouter, dans ce dernier cas, on a une expression transitoire, uniquement
dans les cellules transfectées.
Le problème de l'établissement de lignées stables est que l'on ne connaît pas d'origine de
réplication chez les eucaryotes utilisables pour faire répliquer un plasmide.
Utilisation d'un virus
On s'est donc tout d'abord adressé au virus. La méthode utilisant le virus SV40 a peu à peu
évolué, uniquement l'origine de réplication de SV40 a été introduite dans le plasmide et le virus
auxiliaire (helper) a été introduit dans le génome de certaines cellules. Ainsi les cellules COS
ont un virus intégré dans le génome, cette séquence produit l'antigène viral T qui déclenche la
réplication du plasmide. L'antigène T se fixe sur l'origine de SV40, écarte les deux brins d'ADN
et joue le rôle d'une hélicase. De plus l'antigène T se lie à des protooncogènes tels que P53 ce
qui favorise la multiplication des cellules. Après transfection, le plasmide est répliqué en un
grand nombre de copies (entre 10.000 et 100.000 par cellules) 48 heures après l'infection. Il est
possible de transfecter plusieurs plasmides simultanément, et donc d'obtenir plusieurs protéines
ou des complexes multiprotéiques. Ce système a servi au clonage d'un grand nombre de
protéines par expression comme par exemple le clonage de récepteurs.
Il existe certaines limitations à l'utilisation de ce système : ce système ne marche qu'avec
des cellules de singe et il y a souvent des remaniements dans le génome. D'autre part la
production est souvent trop importante si bien que la cellule occupée à faire la protéine au lieu
de ses propres protéines meurt au bout d'une semaine et on se retrouve dans une situation
proche d'une expression transitoire.
24/10/2011
101
Intégration aléatoire
Lorsqu'on introduit un fragment d'ADN dans une cellule, il y a toujours une chance que cet
ADN s'intègre dans le génome. L'intégration se fait de manière aléatoire et on observe assez
souvent une intégration de plusieurs copies en tandem au même locus.
La sélection peut dans certains cas s'effectuer sur un grand nombre de copies. C'est le cas
de la sélection avec la DHFR. Dans les cellules cancéreuses résistante au méthotrexate, le gène
est amplifié. L'amplification n'est pas limitée au gène seul mais les séquences situées à
proximité sont aussi amplifiées. Ce phénomène a été exploité en clonant le gène d'intérêt près
du gène de la DHFR. Après la transfection, les cellules sont soumises à une sélection au
méthotrexate pour sélectionner les cellules ayant incorporé l'ADN puis, progressivement, au
cours de générations, la dose de méthotrexate est augmentée jusqu'à arriver à 80 µM,
concentration pour laquelle l'entrée du méthotrexate dans la cellule devient limitante. A cette
concentration, on a entre 500 et 2000 copies du gène dans le génome. L'inconvénient de cette
méthode est qu'elle peut prendre une durée d’un an.
Un autre méthode de sélection utilise l'amplification de la glutamine synthétase. Ce gène
confère une faible résistance à la methionine sulfoximine (MSX).
Intégration par recombinaison
On peut utiliser la recombinase
Flp si on a les sites FRP dans le
plasmide et dans le génome de la
cellule. On effectue donc une
première transfection stable du site
gène d’intérêt
gène de
sélection 2
FRT
FRP, sélectionnée avec un gène de
résistance. Puis on transfecte les
génome
FRT
cellules avec deux plasmides, un
gène de
sélection 1
plasmide portant le gène d'intérêt,
un site FRP et un gène de sélection
et un plasmide codant pour la
FRT
gène de
sélection 2
gène d’intérêt
FRT
gène de
sélection 1
24/10/2011
102
recombinase. La recombinaison est alors sélectionnée avec la résistance provenant du plasmide
portant le gène d'intérêt.
L'avantage de ce système est l'absence d'effet de position puisque le plasmide s'intègre
toujours au même endroit.
Choix du système cellulaire.
- Il ne faut pas qu'il y ait de protéine endogène correspondant à celle que l’on recherche ou
d'antigène cross-réagissant avec les anticorps qui seront utilisés pour voir la protéine.
- La température de culture peut avoir une importance.
- Le choix peut avoir des conséquences sur les modifications post-traductionnelles. Les
différents organismes ont une spécificité, par exemple les sucres ajoutés par les levures sont
différents des sucres ajoutés par les cellules de mammifères. A l'intérieur des mammifères
toutes les cellules ne font pas exactement les mêmes modifications post-traductionnelles, par
exemple les cellules CHO (provenant d'ovaire de hamster) ajoutent plus d'acide sialique que les
cellules CV-1 (de singe) ou NIH-3T3 (de souris).
Mais certaines modifications sont tissus spécifique. Uniquement certaines cellules sont
capables d'effectuer certaines modifications post-traductionnelles. Par exemple pour le facteur
IX de coagulation, il y a une γ-carboxylation de certains acides glutamiques qui ne peut être
effectuée que par les cellules du foie. Le problème est d'autant moins facilement résolu qu'une
des caractéristiques des cellules eucaryotes différenciées est de ne pouvoir être cultivées.
Les systèmes hybrides
On ne sait souvent pas quel système choisir au départ et il est souvent nécessaire de faire des
essais en procaryote et en eucaryote. Pour alléger les travaux de construction, on peut cloner le
gène d'intérêt directement dans un vecteur en aval de deux promoteurs, un eucaryote et un
procaryote. L'ensemble des séquences nécessaires aux deux systèmes sera alors présent dans le
vecteur (site de liaison au ribosome procaryote, site de polyadénylation, gène de sélection...).
24/10/2011
103
Expression dans des eucaryotes unicellulaires
Exemple de l’utilisation de Leishmania tarentolae, un Kinetoplastidae non pathogène. Ce système a
été développé par une compagnie, JenaBioScience.
Le gène est introduit par transfection et maintenu soit sous forme épisomale soit par intégration
dans le génome. Les protéines sont produites avec les maturations post-traductionnelles des
eucaryotes.
Avantage du système : la culture est facile dans un milieu peu cher.
24/10/2011
104
Les causes d'échecs de la production de protéines.
Dans de nombreux cas, on n’obtient pas ou très peu de protéine désirée. Les problèmes peuvent
venir de le séquence du gène ou de la séquence de la protéine.
1) Il n’y a pas ou peu de protéine
Le problème peut provenir de la séquence du gène
Dans ce cas il n’y a pas ou peu de traduction du fait de l'hétérogénéité des systèmes : différence
procaryotes/eucaryotes ou eucaryotes/ virus
Les codons
La vitesse de traduction est fonction des codons utilisés. Le code génétique est dégénéré, un
même acide aminé peut être codé par plusieurs codons, mais les concentrations des différents
ARNt ne sont pas identiques selon les espèces. Ils peuvent donc devenir un facteur limitant
dans la vitesse de traduction simplement en la ralentissant. Par exemple le glutamate est codé
par GAG ou GAA mais GAG est utilisé dans 60 % des cas chez les mammifères (et donc GAA
dans 40% des cas) alors que c'est l'inverse chez les bactéries gram- GAG est utilisé dans
uniquement 35% des cas. De même, l'arginine est codé par AGPu ou CGN. Les codons AGPu
sont les plus utilisé chez les mammifères (21% chacun) mais rarement utilisé chez E. coli (4%
chacun).
Comme chez E. coli, la transcription et la traduction sont couplés, un ralentissement de la
traduction affecte la stabilité de l'ARN messager. Si le ribosome est ralenti sur plusieurs codons
rares, l'extrémité 3' du messager est exposée aux RNAses. De plus on observe une terminaison
prématurée de la transcription et donc pas de production de la protéine.
Dans ce cas là, il existe deux solutions : une mutagenèse de certains codons peut être envisagée
pour améliorer la traduction. Si un codon est peu utilisé, c'est généralement parce que l'ARN de
24/10/2011
105
transfert corespondant est rare. Une autre solution consiste alors à coexprimer les ARNt rares
(Sauge-Merle et al., 1999).
Comme il y a généralement de nombreux codons à modifier, un gène synthétique
correspondant à une optimisation des codons peut être construit (Feng et al., 2001). Les codons
choisis correspondent alors à ceux qui sont les plus utilisés pour les protéines qui sont très
exprimées dans l’organisme. Des tables ont été établies pour donner la fréquence relative
d’utilisation des codons,
RCUij =
Xij
1
ni
ni
∑ Xij
j =1
RCU : relative codon usage ; Xij : nombre de rencontre du codon j pour l’acide aminé i, ni :
nombre de codon pour l’acide aminé i. Un logiciel permet de faire la traduction inverse d’une
séquence
de
protéine
(http://www.entelechon.com/eng/backtranslation.html)
pour
être
optimisée selon l’organisme.
L’initiation
Chez E. coli, la séquence de liaison du ribosome doit être optimisée lors de l'expression. En
dehors de la séquence de Shine Dalgarno, plusieurs éléments doivent être pris en compte : la
séquence du premier acide aminé après la methionine est importante. On a par exemple 10 fois
plus de protéine produite si on remplace un tryptophane (UGG) par une alanine (GCU)
(Looman et al., 1987). Les codons AGG, CGG, UGG et GGG sont associés à une faible
expression s’il sont localisés entre les positions +2 à +5. Il semble que la présence de ces
codons au début de la traduction entraîne un détachement du peptidyl tRNA (Valdivia et
Isaksson, 2005).
La présence de structures secondaires impliquant des régions amont et aval au site de liaison du
ribosome est défavorable à la traductibilité, (Schauder et McCarthy, 1989), plus ces structures
sont stables, moins on obtient de protéine. Ainsi, si on augmente la proportion de AT dans les
premiers nucléotides en aval de l’ATG, on augmente la production.
24/10/2011
106
Il peut y avoir des initiations internes (séquences de Shine Dalgarno pour les bactéries). Chez
les procaryotes, les ARN sont polycistroniques, si bien qu'il faudra faire attention lors de
l'expression d'un gène eucaryote, qu'il n'y ait pas à l'intérieur de la séquence codante une
séquence susceptible d'être reconnue par un ribosome procaryote.
Il peut y avoir un promoteur procaryote à l’intérieur de la séquence. Ce promoteur peut géner la
production de la protéine soit en initiant la synthèse d’un ARN antisens soit en étant un site de
liaison de la polymérase qui gène le déroulement de la traduction.
5’ TTGACA
17 +/- 1 bp
TATAAT
Séquence consensus d’un promoteur chez E. coli
(Hawley et MacClure, 1983)
Il peut y avoir une initiation prématurée. Chez les eucaryotes, de nombreux gènes comportent
de courtes phases de lecture ouverte en amont de l’ATG initiateur de la protéine d’intérêt. Ces
phases de lecture ont souvent un rôle de régulation de la traduction. Pour obtenir une bonne
surexpression dans un système eucaryote, on enlèvera ces phases de lecture ouverte avant le
codon initiateur.
La terminaison de la transcription
La polymérase bactérienne s'arrête quand elle synthétise une série de résidus U dans la mesure
où elle a d'abord synthétisé une séquence autocomplémentaire capable de se replier.
L'élimination de telles structures par mutagenèse permet une meilleure traduction.
On a le même problème avec l'expression dans le virus de la vaccine, les signaux d'arrêt de
transcription du virus (TTTTTNT) éventuellement présents dans le gène seront enlevés de la
séquence ajoutée par mutagenèse dirigée.
Si on veut exprimer un gène mitochondrial dans une cellule eucaryote, il faudra faire attention
qu’il n’y ait pas de signaux de polyadenylation dans la séquence. En effet les transcrits
24/10/2011
107
mitochondriaux ne sont pas polyadénylés, si bien que la séquence consensus peut être présente
en amont ou dans la phase de lecture du gène à exprimer.
Les structures secondaires de l'ARN empêchent la traduction
On a montré qu'il existait une corrélation inverse entre le pourcentage de structure secondaire
sur l'ARN messager et l'efficacité de traduction.
Ces structures secondaires sont relativement importantes en 5' où elles ont un rôle dans le
contrôle de la traduction. Pour surexprimer une protéine, il faudra donc éliminer les séquences
inhibitrices de la traduction existant dans la partie non codante en 5' des ARNm, phénomène
connu sous le terme d'atténuation (comme par exemple dans le cas de l'opéron tryptophane
chez E. coli).
Pour l'expression dans le virus de la vaccine, les séquences non traduites en 3' et en 5' seront
courtes pour mimer les ARNm des poxvirus.
Stabilité de l'ARN
Chez les procaryotes, les ARN peuvent être stabilisés en ajoutant en 3’ une structure
secondaire pour inhiber la dégradation par des exonucléases 3’-5’. Bien qu’il n’existe pas de
RNAse 5’-3’ la présence d’une structure secondaire en 5’ stabilise le transcrit en inhibant
l’action d’endonucléases telle que la RNAse E.
Chez les eucaryotes, il y a de grandes différences de stabilité des ARNm. La stabilité peut
dépendre de l’ARN synthétisé. Généralement, les protéines régulatrices dont le taux varie
rapidement dans la cellule sont codées par des ARNs instables. Ainsi, l'ARN de la β-globine a
une durée de demi-vie de plus de 10 heures, alors que l'ARN d'un facteur de croissance a une
durée de demi-vie d'environ 30 min. Cette stabilité dépend souvent des séquences non traduites
en 3'. Pour analyser ce phénomène on transfère les séquences du gène analysé sur un gène
rapporteur. Si on transfère l'extrémité du gène codant la β-globine l'ARN de fusion devient plus
24/10/2011
108
stable. Par contre si on ajoute une séquence riche en A et U présente dans les ARN instables
comme ceux codant pour un facteur de croissance, l'ARN de fusion devient instable.
Lorsqu’on efffectue une surproduction d’une protéine peu synthétisée, on enlève souvent
les séquences en 3' de l’ADNc et, au besoin, on rajoute en 3’ des séquences favorisant la
stabilité de l’ARN. Pour ce faire, on ajoute les séquences 3’ non codantes d’un gène dont
l’ARN est stable. Par exemple, la séquence du gène codant pour l’hormone de croissance
bovine est souvent rajoutée pour les expressions en cellules de mammifère.
Problème inconnu, mutagenèse au hasard
Dans certains cas plutôt que de chercher à mutagenéiser les codons et les structures
secondaires par mutagenèse dirigée, on mutageneise au hasard le plasmide, on transforme des
bactéries et on trie celles qui produisent le plus. Cette expérience a par exemple été réalisée
avec l'α-antitrypsin. Ils ont obtenu une production augmentée de 100 fois. L'analyse de la
séquence exprimant le plus n'a pas permis de comprendre les mutations responsables de cette
surproduction (la surproduction n'a pas été expliquée par une élimination des codons rares ou
des structures secondaires).
Dans de nombreux cas on ne sait pas pourquoi la protéine n’est pas produite. La solution
est alors de changer de système. Si on n’a pas d’expression lors d’une traduction in vitro dans
le système du lysat de réticulocyte, on peut obtenir une bonne expression dans le système du
germe de blé et inversement. Ce phénomène est assez général, la production d’une protéine
dans un système ne permet pas de le valider, la comparaison de deux systèmes de production
ou de deux cellules avec un même système de production ne permet pas de dire qu’un système
est meilleur qu’un autre.
2) La protéine est produite mais est toxique
De nombreuses protéines sont toxiques pour la cellule. La culture ne se développe pas et on
obtient pas ou peu de protéine. Dans certains cas, la toxicité est prévisible. C'est par exemple le
24/10/2011
109
cas des protéines impliquées dans le cycle cellulaire ou la surexpression d’une ADN
polymérase. Par contre, dans certains cas, on ne s'y attend pas. Par exemple l'expression de la
transposase d’un élément transposable de la mouche des fruits est toxique pour E. coli.
Cette toxicité a plusieurs conséquences, elle s'accompagne
- de mutations qui diminuent la transcription et la traduction de la protéine.
- de perte du vecteur (plasmide chez E. coli)
- d'accumulation de mutations dans la protéine la rendant moins toxique.
Il existe plusieurs solutions :
-
Utiliser des promoteurs fortement inductibles comme par exemple le promoteur arabinose
avec AraC et un site de liaison de la CAP. Dans ce cas on a une induction de 800 fois dans
un milieu sans glucose et contenant de l'arabinose.
-
Augmenter l’inductibilité du promoteur. On peut surexprimer un répresseur tel que LacI et
ajouter des opérateurs tels que LacO en amont du gène d’intérêt. Dans le cas du promoteur
LacZ, le réprimer par le glucose. C’est la répression catabolique qui, bien quelle soit
diminuée en utilisant un mutant (LacUV5), n’est pas totalement abolie. La technique
consiste donc à faire pousser la bactérie dans un milieu riche en glucose puis lors de
l’induction à changer le milieu pour un milieu pauvre (Pan et Malcolm, 2000).
-
Produire un inhibiteur de la polymérase. Cette stratégie est utilisée lorsque le gène d’intérêt
est placé en aval d’un promoteur reconnu par une polymérase exogène, produite par la
cellule. C’est le cas de l’utilisation de l’ARN polymérase T7 dans les expressions chez E.
coli. Dans ce cas on coproduit le lysozyme du phage T7 qui est un inhibiteur de l’ARN
polymérase T7 et qui inhibe l’enzyme exprimée à bas niveau avant l’induction (Studier,
1991). Lors de l’induction, l’ARN polymérase T7 est produite en grande quantité, le
lysozyme est en trop faible quantité pour l’inhiber.
-
Ajouter l’ARN polymérase au moment de la production par exemple en infectant les
bactéries avec un M13 portant le gène de l’ARN polymérase T7.
-
Utiliser une stratégie antisens, en absence d'induction, la fuite du promoteur est contrôlée
par un ARN antisens produit par un promoteur constitutif en aval du gène.
-
Utiliser un système de sécrétion de la protéine dans le milieu cellulaire.
24/10/2011
110
Dans le cas ou la protéine est très toxique, on peut toujours se replier sur les systèmes de
traduction in vitro.
3) La protéine est surexprimée mais est mal repliée
Lorsque les protéines sont exprimées en grande quantité dans E. coli, (jusqu'à 50% des
protéines totales), elles sont agglomérées dans des "corps d'inclusion" visibles en microscopie à
contraste de phase aux extrémités de la bactérie. Les protéines ainsi incluses sont généralement
inactives et ne peuvent pas être purifiées par chromatographie. Ces corps d’inclusion sont
fréquents lors des productions dans E. coli.
Plusieurs techniques ont été mises en place pour éviter ou diminuer cette agglomération
-
Utilisation de souches particulières. Il n'existe pas de souche éliminant complètement les
corps d'inclusion, mais parfois en changeant de souche on obtient souvent moins de
protéine.
-
Diminution de la vitesse de production en faisant varier les conditions de température. On
peut faire varier les températures de 10 à 43°C sans altérer E. coli. Par exemple la
production de subtilisine active est augmentée de 14 fois lorsque la culture est faite à 23°C
au lieu de 37°C. Pour l'interféron, 5% de la protéine est active à 37°C et 73% à 30°C ce qui
a donné une augmentation de 7 fois de protéine active en passant à 30°C. De même, l’ajout
de chloramphénicol au milieu permet d’obtenir plus de protéines solubles. La quantité
d'inducteur a aussi de l'importance pour éviter la formation des corps d'inclusion, il faut
diminuer au maximum la quantité d'inducteur pour obtenir une protéine active. Toutefois,
toutes ces techniques visent à diminuer la production, aussi on observe souvent une baisse
du rendement.
-
Utilisation de stabilisants. L’addition de sucres non métabolisables par la bactérie
(saccharose, raffinose ou sorbitol) permet souvent de diminuer le pourcentage de protéine
insoluble. Ce résultat est attribué à l’effet stabilisateur des sucres sur la conformation des
protéines. D’autres méthodes de stabilisation particulières peuvent être efficaces, c'est par
24/10/2011
111
exemple le cas des protéines qui contiennent un métal comme cofacteur soit structural soit
catalytique. Si la protéine est fabriquée plus vite que le métal n'est transporté dans la
cellule, l'apoprotéine sans le métal s'accumulera et ne se repliera pas correctement. Un autre
facteur qui influence la présence d'agrégat est le pH.
-
Faire sécréter la protéine dans le milieu extérieur ou dans le périplasme chez E. coli. Le
cytoplasme des bactéries est un milieu réducteur dans lequel les ponts disulfures ne peuvent
pas se former. Par contre le périplasme est un milieu oxydant. Plusieurs protéines de E. coli
sont sécrétées dans le périplasme, par exemple, les β-lactamases conférant la résistance à
certains antibiotiques tels que l'ampicilline ou la pénicilline sont sécrétées dans le
périplasme. L'adressage de ces protéines est dû à un peptide signal qui est coupé lors de la
translocation. Le peptide signal actuellement le plus utilisé est celui du OmpA, la coupure
s'effectue juste au niveau de la jonction si bien que la protéine exprimée se retrouve dans le
périplasme avec son extrémité N-terminale. Problème: la sécrétion est souvent relativement
peu efficace. Il est aussi possible de faire sécréter la protéine dans le milieu extracellulaire
en coexprimant une protéine, la BRP (Bacteriocin Release Protein), qui perméabilise la
membrane externe de la bactérie en activant une phospholipase.
A l’inverse, l’adressage au périplasme peut empêcher le bon repliement de la protéine, c'est
pas exemple le cas de la GFP qui n’est pas fonctionnelle si on essaye de l’exprimer dans le
périplasme.
-
Utilisation de foldases. Il y a de nombreuses protéines telles que la thiorédoxine, la protéine
disulfide isomérase ou la prolyl cis-trans isomérase ou les chaperonines, qui aident au
repliement des protéines dans les cellules eucaryotes. Toutes ces protéines n’ont pas le
même rôle, par exemple il semble que la protéine disulfide isomérase participe au
repliement alors que les chaperones maintiennent la protéine bien repliée dans son état. Par
exemple la coexpression de la chaperonine GroEL en même temps que la RuBisCo
(ribulose 1,5 bisphosphate carboxylase/oxygenase) a augmenté le taux de RuBisCo soluble
par 10. Comme autre exemple, on peut citer l’exemple de la thioredoxine qui est une petite
protéine de 11,7 kDa restant soluble même quand elle est exprimée à des taux de 40% dans
la cellule. Une fusion du gène d'intérêt et du gène codant pour la thioredoxine permet de
diminuer la formation de corps d'inclusion.
24/10/2011
-
112
Utilisation d’une fusion avec une protéine soluble en amont. Les partenaires les plus
souvent utilisés pour l’expression chez E. coli sont la glutathion-S transférase, la maltosebinding protein et la thioredoxin. Mais d’autres partenaires ont été décrits tels que Nus An
grpE, la bacterioferritine, la kinase du phage T7 ou une chaperone de E. coli, Skp
(Chatterjee et Esposito, 2005).
Le fait que la protéine s'agrège en corps d'inclusion a toutefois quelques avantages, elle est
protégée de la protéolyse et elle est facile à purifier. Il suffit en effet de purifier les corps
d'inclusion simplement par des séries de centrifugations et de lavage du culot. Il faut ensuite
dénaturer la protéine puis la renaturer en faisant varier les proportions d'agent dénaturant.
Techniquement, on ajoute des agents dénaturants, typiquement de l'urée ou des sel de
guanidinium, des détergents et un agent réducteur pour couper les ponts disulfures (βmercaptoethanol ou DTT). Ces agents sont ensuite éliminés soit par dialyse dans une solution
diluée pour éviter les interactions entre les protéines soit en bloquant la protéine sur un gel
d'affinité.
4) La protéine est produite mais est protéolysée
La plupart des protéines hétérologues que l'on fait synthétiser dans la bactérie sont protéolysées
très rapidement (en deux minutes par exemple pour l'insuline humaine). Plusieurs solutions ont
été utilisées pour résoudre ce problème :
- Faire une protéine de fusion constituée de la protéine désirée et en amont une autre
protéine. Cette stratégie n'est valable que si la protéolyse est due à la faible stabilité des
petites protéines ou peptides.
- Utiliser des bactéries mutantes, déficientes pour certaines protéases. Cette stratégies a été
adoptée pour les protéines secrétées dans le périplasme (pour permettre les ponts
disulfures) qui sont souvent peu stables. Une série de souches portant des mutations de
déficience en protéases et une mutation sur le gène rpoH codant pour le facteur sigma de
l’ARN polymérase qui contrôle la transcription de certaines protéases ont été fabriquées
24/10/2011
113
(Meerman et Georghiou, 1994). Ces souches permettent une meilleure expression des
protéines, mais on ne peut pas éliminer toutes les protéases, soit parce qu’elles sont
toujours inconnues, soit parce qu’elles sont indispensables au fonctionnement de la cellule.
- Utiliser des inhibiteurs de protéases, mais comme précédemment, ces inhibiteurs sont
souvent toxiques pour la cellule.
Cette protéolyse existe aussi dans les systèmes eucaryotes. Par exemple, en traduction in vitro
dans le lysat de réticulocyte, on a remarqué que la traduction des protéines de petit poids
moléculaire (< 30 kDa) est souvent difficile. Ceci est du en partie au fait qu’elles sont instables
dans les réticulocytes. Pour palier à ce problème, le plus simple est de changer de système de
traduction et de choisir par exemple le lysat de germe de blé qui traduit aussi bien les petites
que les grosses molécules.
Chez les procaryotes comme chez les eucaryotes, des protéines à longue durée de vie coexistent
avec des protéines à courte durée de vie. Chez les eucaryotes, la dégradation des protéines à
courte durée de vie est sous la dépendance de l’ubiquitination. Dans ce système, les protéines
qui seront dégradées sont tout d’abord liées covalement à l’ubiquitine, une petite protéine de 76
acide aminés. C’est une liaison peptidique entre la fonction carboxilique terminale de
l’ubiquitine et, soit une fonction amine d’une lysine interne, soit l’amine présente à l’extrémité
N-terminale de la protéine. Dans ce dernier cas l’acide aminé présent en N-terminal est
important. Ainsi, les acides aminés M, S, A, G, T et V sont stabilisant (Bachmair et al., 1986).
5) Les maturations post-traductionelles ne sont pas correctes
Ce problème est évident lors de l'expression dans des systèmes hétérologues. La cellule hôte
n'est pas capable de faire une modification post-traductionelle qui normalement se produit dans
le système homologue.
Lorsque la modification post-traductionelle existe dans la cellule pour les protéines endogène,
il arrive que la séquence signal ne soit pas reconnue. C’est le cas par exemple de
24/10/2011
114
l'acétylcholinestérase d'insecte : un peptide hydrophobe en C-terminal est normalement
échangé contre un glycolipide. Cette maturation est co-traductionnelle et a lieu dans le
réticulum endoplasmique. Si on exprime cette enzyme dans l'ovocyte de Xénope, on obtient
une protéine avec le peptide hydrophobe et non le glycolipide à l'extrémité C-terminale.
L'ovocyte est capable de faire cette maturation avec d'autres protéines mais n'est pas capable de
la faire avec le peptide de l'acétylcholinestérase de drosophile. Un moyen d'obtention de la
protéine proche de la protéine native, naturelle, trouvée chez l'insecte, est de modifier la
séquence primaire du peptide hydrophobe pour qu'il soit reconnu.
A l'inverse, la cellule hôte peut faire une modification post-traductionnelle qui n'existe pas dans
la cellule. Par exemple, la MCP-1 humaine (Monocyte Chemoattractant Protein-1) est non Nglycosylée. Si on l'exprime dans Pichia pastoris ou dans Saccharomyces cerevisiae, on observe
une N-glycosylation. Cette N-glycosylation augmente la masse apparente de la protéine
d'environ 12 kDa et peut être identifiée à l'aide de la reconnaissance de la protéine par une
lectine, la concanavaline-A. Dans ce cas la glycosylation peut être retirée en digérant la
protéine par l'endoglycosidase F qui coupe la liaison asparagine/N-acetylglucosamine.
Toutefois cette solution ne peut être envisagée que pour les protéines qui ne sont normalement
pas glycosylées en effet, si la protéine est normalement glycosylée et si la cellule hôte rajoute
une glycosylation, celle-ci ne pourra pas être spécifiquement retirée.
Le problème peut aussi provenir de la surproduction. Il y a saturation d'un système de
maturation qui ne peut pas fonctionner sur toutes les protéines synthétisées. On obtient alors
une hétérogénéité dans les protéines produites, certaines présentent la maturation et d'autres
non.
-
La MCP-1 humaine (Monocyte Chemoattractant Protein-1) présente une modification à
l'extrémité N-terminal, qui est bloquée du fait de la présence d'un pyroglutamate. La
surproduction dans Pichia pastoris donne les deux protéines, une avec un pyroglutatmate et
une autre avec une glutamine.
-
L'acétylcholinestérase humaine est glycosylée, mais sa surproduction en cellule de
mammifère entraîne une acetylcholinestérase mal glycosylée, qui manque d'acide syalique.
Ce problème a été résolu en coexprimant l'enzyme limitant, une syalictransférase.
24/10/2011
-
115
Le codon d'initiation (ATG) code chez les bactéries pour une N-formyl méthionine. Le
groupe formyl est toujours retiré mais la méthionine reste la plupart du temps. Dans le cas
d'une expression faible, elle est enlevée lorsque le premier acide aminé est par exemple une
glycine, une sérine, mais il n'est jamais enlevé avec d'autres acides aminés tels que
l'arginine. De plus lorsque la surproduction est trop importante il y a saturation de l'enzyme
de maturation (méthionine aminopeptidase) et il n'y a pas de coupure. Ce n'est souvent pas
important mais si ça l'est, on a deux possibilités: soit traiter la protéine avec la méthionine
aminopeptidase, soit coexprimer cette enzyme dans la bactérie.
Par ailleurs, le fait de rester dans un système proche du système homologue ne garanti pas
d’obtenir toutes les modifications post-traductionnelles. Par exemple, certaines maturations de
la protéine observées chez Pseudomonas ne se retrouvent pas ou peu chez E. coli alors qu’il
s’agit de deux bactéries.
Parmi les maturations de la protéine, il y a l'oligomérisation. Lorsqu'on ajoute un tag pour
faciliter la détection ou la purification (voir plus loin), ce tag peut favoriser des
oligomerisations non attendues. C'est le cas par exemple avec les queues d'histidines rajoutées
en N ou C terminal de la protéine. Ces histidines favorisent la formation d'oligomères (Hom et
Volkman, 1998).
6) La protéine est produite mais on ne sait pas la détecter
Dans certains cas on n’a pas d’anticorps, on ne connaît pas l’activité de la protéine. On a donc
des difficultés à contrôler la production ou à sélectionner les cellules qui produisent le plus.
Une première solution est de produire simultanément une protéine marqueur.
On peut lors d’une production en bactérie placer le gène marqueur en aval du gène d’intérêt
avec son propre RBS. Les deux protéines seront traduites à partir du même ARN. La même
stratégie peut se faire dans les systèmes eucaryotes, bien que les ARN eucaryotes soient
24/10/2011
116
monocistroniques, on peut ajouter un IRES qui fait office de RBS chez les eucaryotes.
Une autre technique est de cloner le gène
derrière un promoteur bidirectionnel. D’un
gène marqueur
Pcmv TRE
Pcmv
gène d’intérêt
Contrôle de l’expression du gène d’intérêt par un promoteur bidirectionnel
coté le promoteur régule la production d’une
protéine marqueur et de l’autre le promoteur
régule la production de la protéine d’intérêt.
Un tel promoteur bidirectionnel peut être
fabriqué autour de l’élément de réponse à la tétracycline.
Une autre technique est d’utiliser un vecteur avec plusieurs promoteurs, le même promoteur
peut être utilisé deux fois dans le même vecteur mais dans ce cas on positionne les deux copies
tête-bêche pour éviter les recombinaisons.
Une deuxième solution est d’utiliser une protéine de fusion, un « tag » (voir chapitre sur les
tag)
7) La protéine est produite mais on ne sait pas la purifier
On peut utiliser une fusion avec une protéine dont on possède un anticorps. Après la
production, la protéine fusionnée sera purifiée par immunoaffinité. Les anticorps sont
accrochés sur une phase fixe et la protéine de fusion se trouve dans la phase mobile. Il y a
accrochage de la protéine de fusion par réaction antigène-anticorps puis la protéine de fusion
est décrochée soit en faisant passer un tampon acide (pH 2.6) soit un tampon comprenant un
agent dénaturant si la protéine n'a pas besoin d'être active. Parmi les anticorps disponibles, on
peut citer ceux dirigés contre la β-galactosidase.
Plusieurs protéines sont facilement purifiables et peuvent donc être utilisées en fusion pour
faciliter la purification. Cette séquence (tag) va permettre à la protéine de fusion de s'attacher
sur un ligand. De plus, comme les protéines utilisées comme tag sont des protéines qui
s'expriment bien in vitro, la fusion permet souvent d'augmenter l'expression de protéines qui
sont faiblement produites.
24/10/2011
117
8) La protéine est produite mais il existe aussi des protéines proches produites par la
cellule, des endogènes
Plus le système de production est proche du système naturel, plus on a de chance que la
protéine soit bien produite. Mais parallèlement, plus on a de chance qu’il y ait des endogènes
dans la production. La première solution consiste à s’éloigner du système naturel, la deuxième
solution est d’utiliser un tag pour purifier la protéine recombinante de l’endogène.
9) Problème particulier lié à l'utilisation de la protéine chez l'homme
Dans certains cas, la protéine est destinée à être injecté à l'homme. Il est alors important que ces
cellules ne soient pas infectées par un virus. C'est arrivé dans le cas de la production de vaccin
contre la polyomélyte préparé dans des cellules de singe. On s'est aperçu plus tard qu'elles
étaient infectées par SV40.
24/10/2011
118
TAG, protéases et acides aminés modifiés
Les TAG
Ce sont des protéines ou des peptides qui permettent la production, la détection, la
stabilité et la purification aisée des protéines recombinantes lorsqu'elles sont ajoutées en
fusion à la protéine d'intérêt.
Elles permettent souvent une meilleure production, en effet l'expression d'ARN messager
eucaryote dans E. coli se heurte à de nombreux problèmes dus en particulier à la
mauvaise initiation de la traduction. Si la protéine de fusion est placée en amont de la
protéine d'intérêt, on aura normalement une bonne initiation de la traduction. La surexpression de protéines dans E. coli s'accompagne souvent de formation de corps
d'inclusion dans lesquels la protéine surexprimée est mal repliée. La fusion avec une autre
protéine qui se replie correctement aide souvent à avoir une protéine bien repliée. La
protéine de fusion joue alors le rôle de chaperonne intramoléculaire.
Elles permettent la détection de la protéine de fusion. En effet on dispose d'anticorps pour
les protéines de fusion mais de plus certaines d'entre elles sont des enzymes qui peuvent
être détectées par leur activité.
Elles permettent une stabilisation de la protéine. Les petits peptides sont rapidement
dégradés chez E. coli. Un des moyens pour éviter cette dégradation est donc de les
produire en fusion.
Les TAG les plus utilisés :
- Epitopes: Des petites séquences, d'une dizaine d'acides aminé, sont ajoutées
généralement à l’une des deux extrémités de la protéine, plus rarement à l’intérieur. Ces
séquences sont reconnues par des anticorps monoclonaux. Ceci permet de localiser la
protéine sur des filtres, de la quantifier par ELISA ou de la purifier après immunoaffinité
24/10/2011
119
avec un anticorps spécifique. On utilise des épitopes pour lesquels on dispose d'anticorps
très efficaces et très spécifiques qui n'ont pas de crossréactivité dans le système utilisé. Il
existe plusieurs séquences et les anticorps correspondants commercialisés
- Xpress : DLYDDDDK (invitrogen)
- c-myc : EQKLISEEDL (invitrogen). L’anticorps a une très bonne affinité pour ce
tag, il est donc principalement utilisé pour la détection de la protéine de fusion.
- FLAG : DYDDDDK (sigma). L’anticorps n’a pas une très bonne affinité, il est
principalement utilisé pour la purification de la protéine de fusion, en effet la liaison
anticorps-antigène peut facilement se dissocier (Hopp et al., 1988). Pour certains
anticoprs, la liaison tag-anticops peut être rompue par l’ajout d’EDTA ce qui est
assez pratique pour les purifications.
- V5 : GKPIPNPLLGLDST (In vitrogen)
- HA : YPYDVPDYA de l'hémagglutinine d'Influenza : (Roche Molecular
Biochemicals)
- épitope de la protéine C : 12 acides aminés (Roche Molecular Biochemicals)
L'anticorps présente l'avantage de ne se fixer qu'en présence de calcium, ce
qui permet d'éluer la protéine de fusion en présence d'EDTA.
- T7 : MASMTGGQQMG, anticorps disponible chez Abcam (http://www.abcam.com)
-
Staphylococcus protein A (Nilsson et Abrahmsen, 1990).
-
S-tag : KETAAAKFERQHMDS ce peptide a une forte interaction avec la protéine S qui
dérive de la RNAse A (Karpeisky et al. 1994). La liaison est très forte et généralement
l’élution est obtenue soit à pH2 ou en coupant la jonction entre les deux proteines.
- Lac Z : Si la séquence est insérée en amont de LacZ en fusion. LacZ garde son activité. Il
est donc possible de faire une protéine bifonctionelle, ayant les deux activités, en amont
la protéine d'intérêt et en C-terminal l'activité β-galactosidase. La fusion dans l'autre sens
n'est pas possible, il faut que l'extrémité C-terminale de la β-galactosidase soit libre pour
garder son activité. Cette fusion permet en outre de suivre la protéine lors de la
purification.
24/10/2011
120
- La calmoduline-binding peptide (Stofko-Hahn et al., 1992). Cette protéine très acide
présente une forte affinité pour certains peptides en présence de calcium.
- La maltose binding protéine (MBP) de E. coli peut être purifiable sur une colonne
d'amylose et éluée avec du maltose. La fusion est généralement effectuée en C-terminal
de la MBP, si bien que le peptide signal de la MBP permet de plus d'adresser la protéine
de fusion dans le périplasme (Guan et al., 1988).
- Les interaction streptavidine-biotine sont très utilisées en biologie. Un peptide de 10
acides-aminés qui interagit fortement avec le site de liaison de la biotine de la
strptavidine a été sélectionné à partir d'une banque de peptides, le "strep-tag" (Schmidt et
Skerra, 1993). Ce peptide a été amélioré pour donner le strep-tag II (WSHPNFEK). La
strpetavidine a une affinité de 3,5 µM pour ce peptide. Pour améliorer cette affinité, un
peptide
plus
long,
le
SBP
(Streptavidin
Binding
Peptide,
MDEKTTGWRGGHVVEGLAGELEQLRARLEHHPQGQREP) a été isolé. L’affinité de la
streptavidine pour ce peptide est de 2,5 nM (Keefe et al., 2001). Une deuxième stratégie
a consisté à sélectionner un peptide de 13 acides aminés qui est facilement biotinylé dans
E. coli par BirA, l'enzyme endogène de biotinylation chez E. coli. (Schatz, 1993). Dans
les deux cas les protéines comportant le peptide mimant la biotine ou le peptide biotinylé
peuvent être purifiées par affinité sur la streptavidine.
- La glutathion S-transférase de shistosome. Cette protéine catalyse la réaction entre un
tripeptide, le glutathion (γGlu-Cys-Gly) et un substrat électrophile. Si on utilise un seul
substrat, on n'a pas de métabolisation mais uniquement fixation du glutathion sur la
glutathion S-transférase. Cette propriété a été exploitée pour fabriquer des
chromatographies d'affinité en bloquant du glutathion sur la phase fixe. La glutathion
transférase s'accroche sur le glutathion fixé sur la colonne et est décrochée en ajoutant du
glutathion au tampon. L'avantage de cette protéine est son activité enzymatique qu’il est
possible de suivre. Ainsi, on peut connaître au cours de la production la quantité de
protéine produite, sans avoir besoin de faire de gel (Smith et Jonhson, 1988).
24/10/2011
121
- Thioredoxine de E. coli (LaVallie et al., 1993). La purification des protéines de fusions
avec la thioredoxine utilisent les propriétés de la thiorédoxine qui peut être extraite des
bactéries par choc osmotique et qui est résistante à la chaleur. De plus, un mutant
présentant une série d'histidine à sa surface a été construit ce qui permet une purification
sur colonne de nickel.
- Les queues homopolymériques. Plusieurs essais ont été effectués, une queue polyarginine permet la purification de la protéine sur une résine d'échange de cation
(Saasenfeld et Brewer, 1984). Une polyarginine permet en outre d’accrocher la protéine
sur le verre, toutefois ce tag est moins performatnt que le Si-tag. Une queue polyaspartate permet la purification sur résine échangeuse d'anions, une queue de
phénylalanine permet la purification sur colonne d'hydrophobicité de type phényl
sépaharose et une queue poly-cystéine permet la purification sur thiopropyl-sépharose.
Dans ce dernier cas, on accroche la protéine par une liaison covalente et on l'élue soit à
l'aide de cystéine soit en ajoutant un agent réducteur tel que le dithiotreitol (Persson et al.,
1988). La queue homopolymérique actuellement la plus populaire est une queue histidine
ou HIS-tag, ce qui crée un site de haute affinité pour les cations divalents tel que le nickel
ou le cobalt. La protéine qui a un tel site s'accroche sur colonne d'affinité de Ni et se
décroche spécifiquement en ajoutant de l'imidazole à la phase mobile. Cette séquence de
6 histidines peut se fusionner aux extrémités N ou C terminal de la protéine ou être
incorporée dans une protéine de fusion. Par exemple dans le cas d'une fusion avec la
thioredoxine, protéine servant à solubiliser les protéines recombinantes produites dans E.
coli, la mutagenèse de deux résidus (acide glutamique et glutamine) en histidine produit
un amas d'histidine conférant à la protéine une bonne affinité pour le nickel. L’avantage
de cette fusion est que la séquence rajoutée est petite. Cette technique est actuellement la
plus populaire principalement parce que ce tag est petit et à priori va moins perturber la
fonction de la protéine (Van Dyke et al., 1992). Les histidines ne sont pas nécessairement
à la suite l’une de l’autre, il faut simplement qu’elles soient à proximité. Le tag peut donc
se modéliser sur la structure tridimentionelle de la protéine. Par ailleurs certains
24/10/2011
122
commerçants proposent des tags hybrides comme le HQ tag (HQHQHQ) qui a les mêmes
propriété qu’un tag HHH, une affinité pour le nickel.
- Le Si-Tag : En sélectionnant les protéines batériennes qui s’accrochent sur le verre puis
en les identifiant par spectrographie de masse, on a trouvé que la protéine ribosomale L2
de E. coli a une forte affinité pour les silicates. Une analyse par deletion a ensuite permis
d’identifier deux domaines non structurés de la protéine qui intérragissent avec le verre,
un domaine N terminal correspondant aux acides aminés 1-60 et un domaine C-terminal
correspondant à la séquence 203-273. En fusion avec la protéine d’intérêt, ce tag permet
de fixer la protéine sur des lames de verres utilisées par exemple lors de l’élaboration de
puces à protéines (Taniguchi et al. 2006).
- Le domaine de liaison à la cellulose, domaine de la cellulase de la bactérie clmostridium
cellulovorans peut être utilisé comme Tag (Shpigel et al., 1998). La protéine de fusion est
purifiée sur colonne de cellulose. Le principal avantage par rapport aux autres protéines
est le faible coût de la colonne d’affinité utilisée.
-
Les protéines fluorescentes :
La Green fluorescent protein (GFP) a été isolée de la méduse Aequorea victoria, elle
émet de la lumière verte lorsqu'elle est excitée en UV (Prasher et al., 1992). Différents
variants plus efficace ou émettant à différentes longueur d’onde ont été générés par
mutagenèse.
-
GFPuv se replie plus facilement que la GFP et a un rendement de fluorescence
16 fois plus importante que la GFP (Crameri et al., 1996).
-
GFPmut1 contient deux mutations (F64L et S65T) son rendement de
fluorescence est 35 fois supérieur à celui de la GFP (Cormack et al., 1996).
-
GFP+ combine les mutations de GFPuv et de GFPmut1 ce qui lui donne une
augmentation de 130 fois par rapport à la GFP (Scholz et al., 2000).
-
L’EGFP est un variant optimisée pour l’expression en cellules eucaryotes.
24/10/2011
123
La HcRed a été générée par mutagenèse à partir d’une protéine non fluorescente du
corail, Heteractis crispa. Elle émet dans le rouge. Ces protéines gardent leurs propriétés
de fluorescence en fusion N ou C terminale. En fusion, elle permet donc la détection et
la localisation de la protéine dans les cellules.
La DsRed a été isolée de Discosoma sp. (Baird et al., 2000), elle peut être excitée à 488
nm comme la GFP mais émet dans le rouge à 583 nm (la GFP émêt à 500 nm. Son
expression a été améliorée par optimisation des codons pour donner la DsRed1. Elle
présentait un défaut important, sa maturation prenait trop longtemps elle avait une
demie vie supérieure à 24 heures. La vitesse de maturation a été améliorée et la
DsRedT4 ainsi obtenu a une demie vie de maturation inférieure à 45 minutes (Bevis et
Click, 2002)
Les protéines fluorescences sont principalement utilisées pour localiser les protéines de
fusion dans les cellules ou dans les tissus.
- Les protéines colorées : La « Coulour-Tag-protein » absorbe dans le jaune parce qu’elle
contient du FAD. C’est une proteine petite (100 acide aminés) soluble et stable (produit
par X-Zyme).
- Le domaine de liaison de la chitine (Chitin-binding domain, CBD) de la chitinase A1 de
Bacillus citrulans. La forte affinité du domaine de liaison à la chitine pour les billes de
chitine permet de bien purifier la protéine de fusion, en effet la colonne peut être lavée
avec un tampon de forte force ionique (1M NaCl) pour retirer les liaisons non
spécifiques. On décroche la protéine avec des agents dénaturants tels que du SDS
(>0.5%) ou des sels de guanidium (6M).
- Tetracystéine : Les protéines portant le motif CCXXCC à l’intérieur d’une hélice α où
XX est n’importe quel acide aminé peuvent être coloré par un dérivé arsénique de la
fluoresceine (FlAsH-EDT2, 4’,5’-bis(1,3,2-dithioarsolan-2-yl)fluoresceine). Ce composé
rentre facilement dans les cellules et se lie au Tag avec une forte affinité (10 pM) donnant
24/10/2011
124
une fluorescence verte (Griffin et al., 1998). On peut aussi utiliser un dérivé arsenique de
la resorufine (ReAsH-EDT2). Ce composé présente l’avantage d’émettre dans le rouge ce
qui permet de faire des expériences de pulse-chase avec la FlAsH-EDT2. De plus le
ReAsH-EDT2 peut être utilisée pour photoconvertir la diaminobenzidine en un composé
insoluble permetttant de détecter la protéine en microscopie électronique (Graham et
Karnovsky, 1966).
Les protéases
Souvent on veut enlever des fusions entre deux protéines après une expression in vitro et
purification. Dans ce cas, on intercale entre les deux protéines une séquence qui va coder
pour un site de coupure.
La coupure peut être chimique par exemple en utilisant le bromure de cyanogène qui
coupe au niveau des méthionines ou l'acide iodosobenzoique qui oxide les tryptophane.
Ces méthodes marchent bien mais on obtient des coupures à des endroits autres que la
jonction, problème qui empire avec la taille de la protéine exprimée.
On peut utiliser une méthode enzymatique, des protéases spécifiques d'une séquence.
- L'enterokinase reconnaît et coupe la séquence Asp-Asp-Asp-Asp-Lys/
- La thrombine reconnaît et coupe la séquence Leu-Val-Pro-Arg-/-Gly-Ser. Selon le
positionnement de la fusion à l'extrémité N ou en C terminale, on obtiendra deux ou
quatre acide aminés.
- Le facteur Xa coupe en C-terminal de la séquence de reconnaissance Ile-Glu-Gly-Arg/
- Les TEV protéinase (Tobacco Each Virus Proteinase) reconnaît la séquence Glu-X-XTyr-Gln/ avec X symbolisant n'importe quel acide aminé. Cette protéase a l'avantage
d'être très spécifique de son site de coupure et de ne pas être inhibée par les inhibiteurs de
protéase à sérine (Parks et al., 1994).
24/10/2011
125
Il y a plusieurs désavantages à l'utilisation de protéases.
la coupure n'est pas toujours spécifique et on peut couper la protéine d'intérêt.
La température assez haute nécessaire à la coupure peut affecter la stabilité de la protéine
d'intérêt.
La coupure est souvent inefficace du fait de l'inaccessibilité du site de coupure dans la
protéine de fusion.
Après la coupure, il faut retirer la protéine de fusion, qui va s'accrocher sur la colonne
d'affinité ayant permis la purification. La protéase est retirée par exemple en utilisant une
protéase biotinylée qui va s'accrocher sur une colonne de streptavidine agarose.
Intein
On peut utiliser des protéines qui sont capables
SH
d'autocoupure. C'est le cas par exemple des sites
cys
SH
cys
O
H N
2
d'épissages des protéines pour lesquelles on
NH
N-extein
intein
O
trouve des inteins (équivalent aux introns) et des
exteins (équivalent aux exons). Ces épissages
CO
2
NH
2
Asn
O
H N
2
C -extein
NH
N-S échange
S
N-extein
SH
O
O
NH
2
ont été trouvés chez des bactéries mésophyles et
intein
NH
C -extein
CO
2
NH
2
thermophyles ainsi que chez la levure. Chez
O
Transestérification
cette dernière, les différentes étapes de l'épissage
H N
2
O
N-extein
SH
ont été décrites.
S
O
NH
2
intein
NH
On trouve une cystéine au site donneur et une
SH
NH
2
cystéines. Il y a ensuite coupure petidique
associée
à
la
formation
d'un
O
N-extein
H N
2
O
S
intein
+
liaison peptidique et le soufre de la cystéine
suivi d'une transestérification entre les deux
NH
C -extein
NH
2
CO
2
O
N-S échange
SH
O
NH
2
intein
H N
2
SH
O
N-extein
NH
C -extein
NH
2
O
dérivé
O
succinimidique et enfin un nouvel échange entre
l'azote et le soufre (Chong et al., 1996).
CO
2
O
Clivage
asparagine et une cystéine au site accepteur. Il y
a tout d'abord un échange entre l'azote de la
C-extein
NH
2
Exemple de mécanisme d’épissage d’une intéine.
CO
2
24/10/2011
126
Ce mécanisme a été décrit pour les levure, chez les archéobactéries, il est à peu près équivalent, la
cystéine est seulement remplacé par un autre nucléophile, une sérine.
SH
Pour obtenir une coupure, on peut utiliser une
intéine mutée au site accepteur. La cystéine du
HN
2
NH
protéine d'intérêt
site accepteur est alors remplacée par un
nucléophile présent dans le milieu (DTT, β-
Tag
intein
O
N-S échange
HN
2
S
protéine d'intérêt
O
NH
2
mercaptoethanol, cystéine...).
Tag
intein
HSCH CH OH
2 2
la protéine d'intérêt est alors placée en N du site
donneur
et
la
coupure
par
addition
du
HS
HN
2
1997)
+
O
nucléophile sur la colonne d'affinité on obtient
une élution de la protéine désirée. (Chong et al.,
S
protéine d'intérêt
CH OH
2
H O
2
HN
2
OH
protéine d'intérêt
O
NH
2
intein
Tag
24/10/2011
127
De la même façon, on peut utiliser le clivage en N et C terminal de l'intéine en mutant le site
accepteur (Chong et al., 1998). En mutant le site
SH
accepteur
His-Asn/Cys
en
Gln-Asn/Ala,
tag
H N
2
NH
proteine 1
O
intéine
NH
l’induction de la coupure en N-terminal par des
O
O
thiols induit le clivage en C-terminal. Dans un tel
système le tag est positionné dans une boucle de
CO
2
protéine d'intérêt
NH
2
H N
2
S
proteine 1
tag
O
NH
2
l’inteine.
protéine d'intérêt
NH
CO
2
NH
2
OH
SHS
Lors de la production on obtient une fusion
O
intéine
O
OH
DTT
protéine 1 - N terminus de l’intéine - tag - C
O
SH
OH
H N
2
terminus de l’intéine - protéine d’intérêt. Après
proteine 1
S
HS
tag
+
OH
NH
2
NH
induction la protéine de fusion est accrochée sur
une colonne d’affinité. L’action de thiols
O
intéine
O
protéine d'intérêt
NH2
CO
2
(cystéine, DTT ou b-mercaptoethanol) relarge la
protéine 1 et la protéine dans le milieu. Ce système a principalement pour avantage de profiter de
la haute traductibilité de la protéine 1. Si cette protéine 1 est assez petite, elle peut être ensuite
éliminée par dialyse.
Les acides aminés modifiés
Comment introduire une sonde dans les protéines à un site spécifique ?
-
Une première technique consiste à muter l’acide aminé par une cystéine puis à modifier
cette cystéine une fois incorporée dans la protéine.
-
On peut substituer un acide aminé par un analogue structural en utilisant une souche
auxotrophe (van Hest et al., 2000).
-
On peut utiliser une stratégie « non sens ». Le but est ici d’avoir dans la cellule un
aminoacyl tRNA non sens couplé à l’acide aminé non naturel. Un codon ambre est ajouté à
l’emplacement désirée. Il y a deux possibilités pour fabriquer un aminoacyl-tRNA : on peut
aminoacétylé un tRNA suppresseur in vitro (Noren et al., 1989) ou on peut ajouter dans la
bactérie une aminoacyl tRNA synthetase modifiée qui ajoute un aminoacid non naturel
(Wang et al., 2001).
24/10/2011
128
24/10/2011
129
Purification des protéines recombinantes
Détermination de la concentration en protéine
Pour suivre une purification, on a besoin de connaître la concentration des protéines dans
l’échantillon et d’évaluer la pureté. Toutes les méthodes de détermination de la concentration d’une
solution en protéine sont relatives, en effet elles dépendent de la composition en acide aminé qui
n’est pas connue dans le cas d’un mélange de protéines. Traditionellement, on utilise comme
référence l’albumine de serum de veau (BSA), on fait une courbe étalon avec cette protéine puis on
évalue la concentration de la solution. La BSA sera préparée dans le même solvant, le même tampon
que l’échantillon pour détecter d’éventuelles interférences.
Les méthodes les plus utilisées sont l’absorption en UV et l’absorption dans le visible après réaction
avec un colorant.
La spectrophotométrie UV
Mesure à 280 nm.
Les tryptophanes et la tyrosine absorbent à 280. La mesure est donc fortement dépendante de la
présence de ces deux acides aminés dans la protéine.
Mesure à 205 nm.
La liaison peptidique absorbe à 181-194 nm, mais cette longueur d’onde ne peut pas être utilisée du
fait de l’aborption de l’oxygène. Aussi, on effectue les mesures à 205 nm mais cette méthode est
assez délicate à utiliser, il faut en effet avoir des cuvettes de quartz très propres.
La fluorimétrie
On peut utiliser la fluorescence intrinséque de la protéine en utilisant la fluorescence des
tryptophanes avec une excitation à 280 nm et une émission à 340 nm.
24/10/2011
130
Les méthodes colorimétriques
Le cuivre
Dans des conditions alcalines, les ions cuivre (II) se lient à l’azote des protéines pour donner une
coloration qui absorbe à 540-560 nm (violet). La première méthode dite Biuret est peu spécifique et
peu sensible (on détecte des concentrations de l’ordre de 1mg/ml). Elle a été améliorée en y ajoutant
le réactif de Folin-Ciocalteau (méthode de Lowry) qui colore la protéine en bleu. La sensibilité est de
l’ordre de 100µg/ml. Un autre additif a été l’acide bicinchoninic.
Les colorants
Le coomassie (colorant de Bradford) est le plus utilisé, la liaison du colorant sur les arginines et les
acides aminés aromatiques entraîne un déplacement de l’absorption de 465 nm (rouge) vers 595
(bleu). Ce colorant est un des plus populaire du fait de la facilité de sa mise en œuvre. D’autres
colorants peuvent être utilisés, le rouge ponceau, l’orange G ou l’amino black principalement parce
leur liaison est peu forte.
L’argent
Les protéines se lient à l’argent, cet essai est très sensible mais en parallèle est aussi très sensible à de
nombreux autres composés (les anions, l’EDTA, le SDS, les agents réducteurs tels que le βmercapéthanol) aussi, il n’est utilisé que lorsque la protéine est en très faible quantité et qu’il ne faut
pas la « gâcher » uniquement pour déterminer sa concentration.
24/10/2011
131
Solubilisation des protéines
Extraction des protéines cellulaires
Pour aboutir à la purification d'une protéine, il faut tout d'abord préparer l'extrait qui contient cette
protéine. Si la protéine est intracellulaire, on doit passer par une étape de solubilisation : on casse les
cellules et on libère les protéines en solution. Pour casser les cellules, on a à notre disposition
différentes méthodes :
-
choc osmotique
-
lyse des parois par méthode enzymatique, on utilise par exemple le lysosyme pour
dissoudre la paroi des bactéries Gram+.
-
broyage à l’aide d’un homogénéiseur à lames ou d’un potter.
-
choc par pression (French Press)
-
ultrasons
-
billes de verre (pour les levures)
Après séparation par ultrafiltration ou centrifugation, on obtient un extrait clarifié. Parfois les
protéines sont membranaires et il est difficile de les solubiliser. On peut alors utiliser un détergent
qui, par interactions hydrophobes, va solubiliser la protéine. Mais il faut faire attention car un
détergeant trop fort peut inactiver la protéine
Le solvant
Les protéines ne sont solubles que dans une gamme de pH plus ou moins grande selon les protéines.
De même les protéines ne sont souvent pas solubles à faible force ionique. Aussi, le pH et la force
ionique doivent être maintenus constants en utilisant une solution tamponnée. On caractérise un
tampon par son pKa (pKa = -log Ka)
AH+ <-->A- + H+ Ka = [A-][H+] / [AH]
BH+ <--> B + H+ Ka = [B][H+] / [BH+]
24/10/2011
132
Relation Handerson - Hassenbach
pH = pKa + log [base] / [acide]
Le pouvoir tampon d'une solution est maximum au pKa. Le tampon est efficace dans la zone pKa-1/
pKa+1.
Quelques pKa : Acétate : 4,76; Succinate : 5,64; Glycine : 9,8.
Les protéines s'inactivent rapidement par dénaturation (perte de stucture tertiaire) par réaction
chimique (oxydation)ou par protéolyse (coupure des liaisons peptidiques).
Pour résoudre cela :
-
on travaille à basse température,
-
on élimine les catalyseurs permettant l'oxydation en ajoutant de l'EDTA qui complexe les
métaux qui sont nécessaires à l'oxydation et on peut ajouter un agent inhibiteur comme le ß
Mercaptoéthanol (s’il n’y a pas de ponts disulfures dans la protéine)
-
on ajoute des inhibiteurs des protéases
-
on ajoute des stabilisants comme le polyol.
-
On travaille loin du pI de la protéine
Cas particulier des protéines thermostables :
Les protéines thermostables comme par exemple la taq DNA polymérase sont stables à haute
température, au dessus de 80°C. Si on exprime une protéine thermostable dans un organisme
mésophyle comme E. coli, la protéine thermostable se trouve mélangée à des protéines
thermosensibles. Pour purifier la protéine thermostable il suffit de chauffer l’extrait à 80°C, les
protéines thermosensibles se dénaturent et précipitent. A la suite d’une centrifugation, on obtient la
protéine thermostable pure.
On peut utiliser cette technique pour purifier des petites protéines recombinantes en les fusionnant à
une protéine thermostable. Comme elles sont petites, la fusion n’affecte pas la stabilité thermique de
la protéine thermostable et la fusion peut se purifier en dénaturant les autres protéines.
24/10/2011
133
Solubilisation et renaturation des corps d’inclusion
Un cas particulier est la purification des corps d’inclusion lors de la production de protéine dans E.
coli. En effet dans certains cas, on observe l’accumulation de protéine dans des corps non solubles.
Ces agrégats sont visibles en morphologie, leur réfringence permet de les voir en microscopie de
contraste e phase. Ils ont été appelés corps d’inclusion.
Les protéines composant les corps d’inclusion sont généralement mal repliées et présentent un excès
de feuillet β. Ce sont généralement des intermédiaires de repliements qui se sont agrégés avant que le
repliement soit fini (Mitraki et King, 1989). Lorsqu’il y a des cystéines, des ponts disulfure non
correct se sont formés entre les chaînes peptidiques.
La technique de purification consiste alors à purifier ces corps d’inclusion par centrifugation ou par
filtration sur filtre de 0,45 µm. Les corps d’inclusions sont alors lavés en ajoutant de l’EDTA, des
détergents non dénaturants tels que le Triton X-100 ou le desoxycholate ou des détergents
dénaturants à faible concentration. Cette opération de lavage des corps d’inclusion a pour but
d’éliminer les protéines solubles, présentes dans le surnageant qui sont éliminées par centrifugation
ou filtration.
Les corps d’inclusion sont alors solubilisés en utilisant généralement soit l’urée soit le chlorure de
guanidinium, cette solubilisation correspond à leur dénaturation.
-
On peut utiliser une concentration de dénaturant qui dénature que partiellement la protéine,
la renaturation sera souvent plus facile. Dans ce dernier cas, on recherche la concentration
minimale qui permet la solubilisation.
-
Pour purifier la protéine d’intérêt on peut effectuer une solubilisation différentielle des
protéines. En effet, une première solubilisation à une faible concentration d’agent
dénaturant ne solubilisant pas la protéine recombinante permet d’éliminer les protéines non
désirées.
-
Il faut le plus souvent ajouter un agent réducteur tel que le dithiotreitol (DTT) ou le βmercaptoethanol pour réduire les ponts disulfures non natifs ou éviter qu’ils ne se forment
lors de la solubilisation.
24/10/2011
-
134
Dans certains cas on peut remplacer la solubilisation par l’urée ou les sels de guanidium
par une solubilisation à l’aide pH extrêmes. Ainsi des protéines de fusion de la maltose
binding protein peuvent être dissous à l’aide de 20% acide acétique (Reddy et al., 1998).
Cependant, les pH extrêmes peuvent entraîner des coupures de la protéine ou des
modifications chimiques des résidus. Les détergents comme le sodium dodecylsulfate
(SDS) ou le bromure de n-cetyl trimetylammonium (CTAB) peuvent parfois être utilisés à
faible concentration. L’avantage dans ce cas est que le plus souvent, la solubilisation ne
s’accompagne pas de dénaturation de la protéine et donc d’une perte de son activité. Les
ultrasons sont parfois efficaces pour solubiliser les corps d’inclusion, ici encore, la protéine
n’est pas dénaturée.
Le repliement de la protéine est ensuite effectué par élimination de l’agent dénaturant soit par
dialyse, par diafiltration soit en accrochant la protéine sur une colonne d’affinité. Ce repliement de la
protéine s’avère souvent difficile voir impossible.
Il y a plusieurs recettes pour réussir la renaturation.
-
Il faut diluer la solution pour éviter les relations entre les protéines partiellement non
renaturées et donc exposant des surfaces hydrophobes.
-
On ajoute généralement du glutathion pour échanger les oxydo-réductions à une
concentration avoisinant les 10 mM. Il est utilisé sous forme réduite (GSH) et oxydé (GSSG). Le glutathion a pour rôle de favoriser les échanges de ponts disulfures et ainsi d’éviter
la stabilisation de ponts disulfures mal placés.
-
l’ajout de ligand (cofacteurs, métaux, hèmes, inhibiteurs…) dans certains cas favorise la
renaturation
-
De nombreux additifs sont utilisés pour faciliter la renaturation sans toujours savoir leur
mode d’action. Ainsi la L-arginine (0,5-1 M) est souvent utilisée. Des détergents (SDS,
CTAB, Triton X-100) amèliorent parfois le repliement des protéines. On peut ajouter des
molécules qui vont favoriser le repliement tels que des molécules switterioniques portant
un groupement sulfobetaine comme groupement hydrophile et un groupement hydrophobe
(Chong et Chen, 20000). Des chaperones et des foldases sont parfois utilisées, elles sont
24/10/2011
135
dans ce cas utilisées sous forme insolubles, liées à des billes d’agarose pour pouvoir les
éliminer facilement à la fin de la renaturation.
24/10/2011
136
La concentration des protéines
Par précipitation :
Pour concentrer les protéines on utilise souvent la précipitation par augmentation de la force
ionique (salting out). Les protéines sont solubles dans l'eau car leurs surfaces hydrophiles présentent
des interactions avec les molécules d'eau. Le sel interagit avec l'eau, si la concentration en sels
augmente, on pompe l'eau de la solution et il y a moins d'eau disponible pour les protéines. Elles
forment des agrégats en interagissant par leur partie hydrophobe. Quand la taille de l'agrégat est
suffisante, il y a précipitation. Le sel le plus utilisé est le sulfate d’ammonium. A 70% de la
saturation, on précipite pour ainsi dire toutes les protéines (La saturation est la solubilité dans l'eau à
20°C. 100% correspond environ à une concentration de 4 moles/litre). D’une manière générale, les
protéines ne sont pas dénaturées par cette précipitation.
Comme toutes les protéines ne précipitent pas avec la même facilité, on peut faire des
précipitations avec différentes concentrations de sulfate d’ammonium. Toutefois comme cette
méthode délicate et peu résolutive n’est plus que rarement utilisée.
Pour quelques protéines, on peut utiliser des solvants organiques tels que l’acétone ou
l’éthanol. Mais l’utilisation de ces solvants organiques est limitée, en effet ils occasionnent souvent
une dénaturation irréversible de la protéine.
Par filtration :
Pour réduire le volume de la solution, la méthode la plus utilisée est l'ultrafiltration. On
soumet la solution protéique à l'action d'une filtration; la taille des pores du filtre doit être telle que
les protéines doivent être retenues. Il existe plusieurs systèmes, le plus simple utilise un boudin de
dialyse, la solution est à l’intérieur du boudin et à l’extérieur on place un polymère absorbant tel que
l’ « aquacide ». L’eau comme les petites molécules passent par les pores du boudin, les protéines
restent à l’intérieur.
On utilise souvent des filtres pour concentrer les protéines, pour les volumes importants, on
crée un courant sur le filtre pour éviter les colmatages, on parle alors d’ultrafiltration tangentielle.
24/10/2011
137
Ajout de
tampon
(pour la diafiltration)
échantillon
Pince
serrée
pompe
membrane porée de 10 kDa
Ultrafiltration tangentielle
Les différentes méthodes de séparation des protéines
On peut utiliser deux grands types de méthodes pour séparer les protéines, la chromatographie et
l’électrophorèse. Certaines méthodes seront utilisées pour purifier alors que d’autres seront plutôt
utiliser pour vérifier la pureté de la solution.
La chromatographie
La chromatographie est une technique de séparation qui utilise une colonne contenant un support qui
possède plusieurs propriétés.
On distingue plusieurs étapes
1 Régénération et équilibrage de la colonne avec le tampon.
2 Charge de la solution protéique
3 Lavage avec le tampon. On utilise tout d’abord le tampon de charge et au besoin successivement
plusieurs tampons qui vont décrocher des protéines contaminantes.
24/10/2011
138
4 Elution : elle peut se faire en ajoutant directement le tampon d’élution, en faisant un gradient entre
le tampon de lavage et le tampon d’élution. Ce gradient peut être continu ou discret.
Types de matrice et de pression
Il existe différents types de supports : cellulose, sephadex.
Si on applique une pression élevée on augmente la résolution. On effectue alors une
Chromatographie Liquide Haute Performance (HPLC).
L’électrophorèse
La technique consiste à faire migrer les protéines dans un gel. Le gel le plus utilisé est un gel
d’acrylamide.
CH2
L'acrylamide est un monomère, en présence de
C
radicaux libres (en général persulfate d'ammonium
C
O
polymère.
NH
Si la réaction est faite en présence de N.
CH2
NH
N'méthylenebisacrylamide,
C
CH
2
en chaîne est initialisée et on obtient un
CH
CH
Bisacrylamide
O
on
a
formation d'un réseau de mailles plus
ou moins serrées en fonction de la
O
NH2
stabilisé par le TEMED), une réaction
CH2
CH
+ persulfate d'ammonium
+ temed
CH2
CH CH2 CH CH2 CH
C O
C O
C O
NH2
NH
2
NH
2
concentration de l'acrylamide.
On obtient donc un gel dont les largeur des mailles dépend des concentrations en acrylamide et
bisacrylamide de départ.
24/10/2011
139
Séparation selon la taille
Dialyse
Son principe est de mettre la solution dans un boudin de dialyse qui lui-même se trouve dans un
tampon dépourvu de sels. Le boudin de dialyse est constitué d’une membrane qui laisse passer les
petites molécules. Les boudins les plus couramment utilisés laissent passer les molécules qui
présentent un poids moléculaire inférieur à 10 kDa, mais il existe des boudins avec d’autres seuils de
coupure, soit plus faibles (3 kDa) soit plus importants (30, 50 ou 100 kDa). Par un phénomène de
diffusion, les sels vont sortir du boudin jusqu'à atteindre l'équilibre entre la concentration dans le
boyau et la concentration dans le tampon. On effectue plutôt plusieurs dialyses successives qu’une
dialyse dans un grand volume.
Filtration sur gel
Le principe est de faire passer la solution de protéine dans un gel constitué de billes creuses, les
petites molécules passent par l’intérieur des billes et font donc un chemin plus long que les grosses
molécules qui ne passent pas par l’intérieur des billes.
Cette méthode est aussi utilisée comme dessalage pour éliminer les sels d’une solution ou pour
changer le tampon.
Ultrafiltration
La solution est filtrée sur une membrane ayant un seuil de coupure correspondant à des poids
moléculaires de 1 à 100 kDa. Le filtrat ne contient donc que des petites molécules et, si la solution ne
passant pas par la membrane est diluée plusieurs fois avec le tampon, elle ne contient que des
molécules de grande taille. Cette méthode est plutôt utilisée pour les grands volumes.
Ultracentrifugation
Les protéines sont séparées en fonction de leur vitesse de sédimentation dans un milieu visqueux,
généralement une solution concentrée de saccharose. Les protéines les plus grosses sédimentent plus
24/10/2011
140
vite que les molécules plus petites. L’ultracentrifugation ne permet de séparer que de petits
échantillons, c’est donc une méthode analytique.
Séparation selon la charge
On sépare les protéines selon leur charge. Les protéines sont des polyélectrolytes, ainsi, à un pH
donné, chacun des groupements ionisables sera dans un état d'ionisation donné (en fonction du pKa).
Le pI est le pH auquel la charge globale de la protéine est nulle. Si pH < pI, la molécule est positive.
Si pH › pI, la molécule est négative. Ainsi, selon la charge du support et sa propre charge, la protéine
va interagir ou pas avec le support.
On utilise la chromatographie d’échange d’ion.
Types de groupements échangeurs d’ions
Echangeurs d’anions -
Echanges de cations
Carboxy-méthyl (CM)
C COOH2
-
Phosphate (P)
O PO3H2-
-
Sulfoéthyl (SE)
C C SO3H2 H2
-
Sulfopropyl (SP)
CH2 C C SO3H 2 H2
-
Diéthyl-amino-éthyl (DEAE)
(CH2)2
N
-
Triéthyl-amino-éthyl (TEAE)
(CH2)2
N
Quaternary-amino-éthyl (DEAE)
(CH2)2
N
-
(C2H5)2
+
+
(C2H5)3
(C2H5)3
CH2. CH. CH3
OH
Si on est à pH 7, les protéines dont le pI > 7 ne seront par retenues sur une échangeuse d’anion
mais seront retenues par une résine échangeuse de cation
24/10/2011
141
L’élution s’effectue généralement en augmentant la force ionique, à l’aide d’un gradient de sel. Elle
peut aussi se faire en faisant varier le pH de la solution, mais dans ce cas on passe souvent par un pH
dénaturant pour la protéine.
On peut utiliser l’électrofocalisation. Il s’agit d’une électrophorèse qui permet de focaliser les
protéines dans une région du gel qui correspond à leurs points isoélectriques. Pour avoir un gel avec
un gradient de pH, on ajoute des ampholines qui sont des polymères avec des groupements
ionisables. La protéine va migrer jusqu'au niveau de pH qui correspond à son pI.
Cette méthode est très utilisée car elle est très résolutive : elle sépare les isoenzymes qui sont très
proches en séquence d'acides aminés.
L’électrofocalisation ne permet pas de séparer une grande quantité de protéine. Cette méthode a été
adaptée à la chromatographie et a pris le nom de chromatofocalisation.
Séparation selon la taille et la charge
On utilise une électrophorèse sur gel de polyacrylamide en condition native. Etant donné que l'on
applique un courant électrique sur le gel, les protéines vont migrer en fonction de leur taille et de leur
charge. Le gel agit comme un tamis qui va plus retenir les grosses molécules que les petites.
La majorité des protéines est chargée négativement et vont donc migrer vers le pôle positif. Ces
gels sont appelés natifs car la protéine garde son activité.
Séparation selon l’hydrophobicité
Chromatographie: On utilise un support qui contient un greffage hydrophobe et qui peut donc
interagir avec les protéines hydrophobes. On connaît deux types de support :
- groupement aliphatique, la longueur des chaînes amine peut varier (C4->C10). Ex : le butyl
sepharose est un greffage en C4.
- noyau aromatique : phenyl sepharose.
24/10/2011
142
Ces supports retiennent les protéines par interaction hydrophobe. On charge la colonne en
présence de sel car il favorise les interactions hydrophobes ((NH4)2 SO4 à 1M). L'élution peut se
faire soit en diminuant la concentration en sels soit en ajoutant un détergent qui solubilise les
interactions hydrophobes.
Séparation de phase. Le triton X-114 est soluble dans l’eau à basse température (4°C) mais la
solubilité est fortement diminuée à plus haute température (35°C). Les protéines hydrophobes ayant
plus d’affinité pour le détergent que pour l’eau, on les retrouvera préférentiellement dans la phase
détergente. La méthode consiste donc à préparer une solution de TX-114 saturée en eau à haute
température, à ajouter l’échantillon, abaisser la température pour favoriser les contacts entre les
protéines et le TX-114. La solution est alors chauffée à 37°C, et centrifugé pour séparer les deux
phases.
Séparation selon l’affinité
Site actif
On fixe sur le support un ligand dont on sait qu'il a une forte interaction avec la protéine que l'on
cherche à purifier.
L'élution peut être non spécifique (augmentation de la force ionique) ou spécifique (élution avec le
ligand libre - il y a alors compétition et fixation de la protéine sur ce ligand libre; le ligand libre est
enfin éliminé par dialyse). L'avantage de cette dernière méthode est qu'elle ne fait pas appel aux
propriétés physico-chimiques qui peuvent être communes à plusieurs protéines mais à la spécificité :
en une seule étape, on a une meilleure purification qu'avec l'échange d'ions ou la chromatographie
hydrophobe. Il faut évidemment avoir une certaine connaissance de l'enzyme.
Exemple de chromatographie d’affinité avec des tag :
-
Glutathion-S-transférase : l’élution se fait en rajoutant du glutathion dans le tampon
-
Strep-tag : l’élution est obtenue en ajoutant de la desthiobiotine
Modification post traductionnelle.
24/10/2011
143
On peut trier des protéines glycosylées des protéines non glycosylées en utilisant une lectine fixée sur
une colonne. Une lectine est une protéine qui a une forte affinité pour les sucres. En utilisant une
lectine qui reconnaît un sucre composant les structures glycosylées des protéines, on peut accrocher
les protéines glycosylées sur la colonne et les éluer en utilisant le sucre dans la phase mobile.
Une des lectines les plus utilisée est la concanavaline A qui reconnaît le mannose.
Séquence primaire
Certaines
séquences
peuvent
être
reconnues par des ligands. Par exemple,
les
queues
homopolymériques
d’histidine peuvent être purifiées avec
des colonnes de Nickel ou de Cobalt.
L’élution est obtenue avec une solution
contenant de l’imidazole ou avec une
solution
d’EDTA.
Cette
méthode
proposée en 1975 par Porath et al., est
Protéine
Nickel
Matrice
actuellement une la méthode de purification la plus populaire. Le cobalt est quelquefois préféré au
nickel, parce que la liaison est moins sensible au β-mercaptoethanol et parce que le cobalt forme
quatre liaisons avec les histidines au lieu de deux pour le Nickel ce qui rend l’affinité plus spécifique.
Structure tertiaire
On peut immobiliser un anticorps spécifique de la protéine à purifier sur une colonne en utilisant soit
la protéine A soit un ligand composé de sulfone thioeher (thiophilic resin). Lorsque l’on fait passer
un extrait sur cette colonne, les autres protéines ne seront pas retenues : cette technique est donc
spécifique. Cependant, l'interaction antigène/anticorps est tellement forte qu'il est ensuite difficile de
les séparer : les constantes de dissociation sont comprises entre 10-6 à 10-12. L'élution est donc
problématique. La seule manière de les dissocier serait de baisser fortement le pH (jusqu'à 2) mais à
ce pH là, l'enzyme peut être dénaturée.
A faible pH on dissocie la liaison Anticorps/protéine A si bien qu’on obtient les anticorps avec la
protéine désirée. Pour éviter cette coélution de l’anticorps, il faut fixer de manière covalente
l’anticorps sur la protéine A.
24/10/2011
144
Séparation par des colorants
Elles ressemblent à une chromatographie d'affinité mais sont moins spécifiques.
Bleu de cybacron : on l’a tout d’abord utilisé comme chromatographie d’affinité pour purifier les
protéines ayant un site de reconnaissance du NAD. Comme de nombreuses protéines sont retenues
par le bleu de cybacron, on s’en est servi pour purifier un grand nombre de protéines. L'élution
s'effectue grâce à un gradient de sels.
Evaluation de la pureté
Si la protéine à purifier a une activité enzymatique, on peut la suivre dans les étapes de purification
grâce à cette activité, et quantifier le rendement de chaque étape en calculant l’activité spécifique,
activité observée/ concentration en protéine.
Mais ce n’est généralement pas possible, et on estime le plus souvent la pureté d’une protéine par un
gel dénaturant. On utilise les propriétés du sodium duodecyl sulfate (SDS), c’est un détergent
anionique qui dénature les protéines en se fixant sur les zones hydrophobes. Il se fixe en moyenne 1.4
g de SDS par gramme de protéine. Les protéines sont dénaturées. Etant donné que les protéines
deviennent toutes chargées positivement à cause de cette interaction, elles ne vont plus migrer en
fonction de leur quantité de charge mais seulement en fonction de leur taille.
Il existe deux types de gel :
-
Le gel de séparation qui permet la séparation selon la masse moléculaire.
-
Le gel de concentration qui a une teneur plus faible en polyacrylamide, ce qui va permettre
une migration plus rapide. On aura donc des bandes plus fines et donc une meilleure
résolution. Le gel de concentration est généralement coulé au-dessus du gel de séparation.
Avant d’être chargé sur le gel les protéines sont dénaturées en rajoutant du SDS à 1% avec du ß
Mercaptoéthanol (10mM pour couper les ponts disulfure), puis par chauffage 1 à 3 minutes à 100°C.
C'est le test de pureté le plus utilisé car il est fiable et simple.
24/10/2011
145
Comme plusieurs protéines peuvent migrer à la même place dans un gel SDS, on peut augmenter la
séparation en effectuant une électrophorèse bidimensionnelle. C'est une association des méthodes
d'électrofocalisation et d'électrophorèse en conditions dénaturantes. On réalise une première étape
d'électrofocalisation, puis, à 90°, une étape en gel SDS, ainsi, deux protéines qui ont le même pI vont
pouvoir être séparées selon leur poids moléculaire.
Pour colorer les protéines sur le gel, il faut les fixer sur le gel. Pour cela on les traite à l'acide
acétique. La coloration se fait ensuite par :
le bleu de Coomassie : seuil de détection : 1 à 10 µg;
le nitrate d'argent : seuil de détection : 10 à 100 ng.
Caractérisation des protéines
Taille et masse :
Il existe plusieurs méthodes pour estimer la taille ou la masse d’une protéine, ces deux notions sont
souvent prises l’une pour l’autre puisqu’il existe une relation linéaire entre la masse moléculaire
d’une protéine et sa taille, du moins pour les protéines globulaires. .
- Electrophorèse en condition dénaturante : La solution contenant la protéine est chauffée en présence
de SDS ce qui a pour effet de dénaturer la protéine et en présence de 2-mercaptoethanol pour réduire
les ponts disulfures. On effectue ensuite un électrophorèse en présence de SDS, a coté de marqueurs,
c’est à dire de protéines dont on connaît la masse. Cette méthode permet de séparer des peptides de 5
à 200 kDa.
- Electrophorèse en grandient d’acrylamide en condition native. On prépare un gel d’acrylamide à
concentration variable, par exemple de 4 à 40%.. dans un tampon éloigné du point isoélectrique de la
protéine de façon à ce qu’elle soit chargée. En appliquant le courrant électrique, la protéine migre
jusqu’à ce que la maille du gel soit petite. La migration est donc longue, de l’ordre de 16 heures et la
protéine n’est pas dénaturée. Comme pour l’electrophorèse en condition dénaturante, des marqueurs
sont déposés en parallèle pour avoir un calibration. Cette méthode permet de séparer des protéines de
50 kDa à 1000 kDa.
- La centrifugation zonale utilise le fait qu’un protéine de gros poids moléculaire sédimente plus
rapidement qu’une protéine de petit poids moléculaire. On dépose la solution de protéine sur solution
de saccharose puis on centrifuge plusieurs heures a grande vitesse pour avoir une acceleration de
l’ordre de 100 000 g. On récupère ensuite les fractions le long du tube de centrifugation. La
migration correspond à une vitesse de sédimentation et est exprimé en Svedberg (S). La calibration
24/10/2011
146
est effectuée en ajoutant dans l’échantillon des protéines qui sont révélées par leurs activités
enzymatiques. La centrifugation analytique est une amélioration de la centrifugation zonale en effet,
la migration de la protéine dans le tube est suivie au cours de la centrifugation grâce à leur absorbtion
à 280 nm.
- La chromatographie d’exclusion (SEC, size exclusion chromatographie) utilise le fait qu’une
protéine de grosse taille ne passe pas à travers les pores d’une bille, alors qu’une protéine de petite
taille passe par les pores et est donc ralentie. Les grosses molécules passent les premières et les
petites sont chromatographiées. Il existe plusieurs tailles de pores pour pouvoir analyser des protéines
de 10 kDa à 1000 kDa. Selon la pression utilisée en tant que vecteur de migration, on parlera de
chromatographie basse pression de FPLC ou d’HPLC. Plus la pression est importante, moins il y ade
diffusion et plus la résolution est bonne. .
- Diffusion de la lumière statique (Static light scattering, classical light scattering, total intensity
scattering) : La lumière reçue par un objet est diffusé selon un angle qui dépend de sa taille. Pour
cette technique, on envoie un faisceau lumineux sur un écahntillon et on mesure sa diffusion à
plusieurs angles.
- Diffusion de la lumière dynanique (Dynamic Light Scattering, DLS ; Correlation photon
spectroscopy). Plus un objet est petit plus sa vitesse de diffusion est importante. Si on mesure la
diffusion de la lumière au cours du temps on peut estimer la vitesse de diffusion d’un objet et ainsi
estimer sa taille ou plus exactement son rayon hydrodyanique.
- La microspcopie permet de « voir » des objers de tailles supérieurs à 10 nm. Pour les grosses
protéines ou pour les complexes de protéines, on peut utiliser la microspcopie électronique ou la
microscopie de champ proche (AFM, atomic force microspcopy)
- La spectrométrie de masse permet d’estimer la masse de la protéine. Cette technique est utilisée
pour des protéines jusqu’à 50 kDa.
- La structure trimentionelle des protéines peut être résolue par diffraction des rayons X dans un
cristal ou par RMN en solution. Cette structure, lorsquelle est entièrement résolue nous donne la taille
et la masse de la protéine.
24/10/2011
147
Stabilisation des protéines
Trois raisons principales sont généralement mises en avant pour expliquer la dénaturation des
protéines :
1- La protéine perd son activité via un mécanisme monomoléculaire de dénaturation physique. Des
interactions non-covalentes qui la maintiennent sous sa forme native sont remplacées par les
liaisons non covalentes qui la maintiennent sous une forme dénaturée. Une chaîne polypeptidique
peut prendre de nombreuses conformations et une seule d’entre elle correspond à l’état natif.
Dans certains, la conformation native est la seule, la dénaturation est alors réversible, par contre
dans les autres cas, il existe plusieurs conformations possibles qui correspondent à des états
inactifs, la dénaturation est alors irréversible.
2- Cette mauvaise conformation expose des régions hydrophobes à la surface de la protéine. Les
régions hydrophobes de différentes molécules réagissent entre elles et forment des agrégats.
Environ la moitié des résidus présents dans une protéine ne sont pas polaires, ils sont soit enfouis
dans le cœur de la protéine ou alors ils forment à la surface de la protéine des régions qui jouent
un rôle dans les interactions avec les autres protéines, avec les lipides constituants les membranes
ou avec les polysaccharides. Cependant, le contact des résidus hydrophobes avec les molécules
d’eau est thermodinamiquement désavantageux et est préjudiciable pour la stabilité des protéines
in vitro.
3- De nombreux groupes fonctionnels sur les protéines sont réactifs et donc susceptibles
chimiquement modifiés. L’oxidation est la voie majeure de dénaturation des protéines lors de leur
stockage. Les sites d’oxidation potentiels dans les protéines sont les chaînes latérales des
méthionines, cystéines, histidines, tryptophane et tyrosines. De plus il peut y avoir hydrolyse des
liaisons peptidiques Asp-X, destruction des ponts disulfures, et désamidation (Ahern et klibanov,
1986).
24/10/2011
148
Stabilisation des protéines par l’utilisation d’additifs.
L’ajout de stabilisateurs dans les formulations de protéines est la méthode la plus commune pour
augmenter la demi-vie des protéines. Ces composés sont souvent choisis d’une manière empirique,
l’effet obtenu est variable et dépend des caractéristiques de chaque protéine.
-
On peut augmenter la différence d’énergie libre entre l’état natif et l’état dénaturé. Pour
cela on utilise des osmolytes. Les osmolytes agiraient en augmentant plus le potentiel
chimique de la forme dénaturée que celui de la forme native, Ainsi les osmolytes
augmentent la différence d’énergie de Gibbs (ΔG) entre les formes natives et dénaturées
(Arakawa et al., 1990). Dans le diagramme
Uos
d’énergie, ΔG1 est la différence d’énergie entre
la forme native (Naq) et la forme dénaturée
ΔG2
(Uaq) en solution aqueuse et ΔG3 est la même
différence
en
présence
osmolytes
augmentent
d’osmolyte.
plus
le
Les
potentiel
ΔG3
Uaq
Nos
ΔG1
Naq
ΔG4
chimique de la forme dénaturée (ΔG2) que celui
de la forme native ((ΔG4). Il y a trois grande classes d’osmolytes, i) les polyols tels que le
sucrose, ii) les methylamines telles que la sarcosine iii) certains acides aminés tels que la
proline. On utilise par exemple la L-arginine (Lin et al., 2001), la L-proline, la L-serine, la
glycine, l’acide gamma amino-butyrique, la bétaine. La trimethylamine N-oxide (TMAO)
est un osmolyte naturel qui compense l’effet délétère de l’urée qui est présent à la
concentration de 400 à 600 nM dans les cellules des élasmobranches (Baskakov et al.,
1998).
-
On peut stabiliser la conformation des protéines par un mécanisme d’exclusion préférentiel
ou d’hydratation préférentielle due au réseau de liaisons hydrogènes dans la couche
d’hydratation de la protéine. Les molécules génèrent une cage autour de la protéine en
excluant la couche d’hydratation et ainsi en éliminant les molécules d’eau actives à
proximité de la protéine. On utilise des polymères comme la BSA (albumine), le Poly-LHistidine, le Poly-L-Arginine, le dextran, le Ficoll et polyethylene glycol. Des sucres tels
que le saccharose, le trehalose (dimère de glucose liés en alpha 1.1) ou le glucose (Krest et
24/10/2011
149
al., 1999 ; Felix et al., 1999). Des composé naturel comme l’ectoine qu’on trouve souvent
dans les bactéries halophyles (Lippert et Galinski, 1992). Les sels peuvent être caractérisés
par leur pouvoir de structuration de l’eau, effet Hofmeister. Les sels kosmotropes qui
strucurent l’eau, stablisent les protéines en favorisant une structure plus compacte. Ainsi, le
chlorure de sodium, le phosphate de sodium, le borate de sodium ou le formate de sodium
ou Na2SO4 sont stabilisant du fait de leur pouvoir d’hydratation des protéines (Bowie et
Sauver, 1989 ; Weijers et Van’t Riet, 1992 ; Ahmad et al., 2001 ; Ebel et al. 1999). D’un
autre coté, les sels chaotropes tels que KSCN, CaCl2 ou MgCl2 augmentent la tension de
surface et ainsi déstabilisent la structure des protéines (Arakawa et Timasheff, 1982).
-
On peut stabiliser les protéines en diminuant les modifications chimiques des résidus. Le
saccharose peut diminuer la vitesse d’oxydation des résidus méthionine. Si la méthionine
est impliquée dans le site actif, le saccharose protègera l’activité de la protéine (De Paz et
al., 2000). Le poly(ethyleneimine) (PEI) est un polycation qui est un des meilleur
protectant contre l’oxidation. L’EDTA est un agent chélateur qui protège contre l’oxidation
médiée par des traces d’ions métallique (Andersson et al., 2000). Le sorbitol inhibe
complètement la deamidation des résidus de la protéine.
Stabilisation des protéines par mutagenèse dirigée
Il existe plusieurs méthodes pour stabiliser une protéine en modification de sa structure primaire. Une
première méthode consiste à effectuer de la mutagène aléatoire puis à cribler les mutants les plus
stables (Morawski et al., 2001). Une deuxième méthode consiste à effectuer des mutagenèses
dirigées. Pour trouver les résidus à muter, deux informations peuvent être utilisées, les données
structurales et les données phylogénétiques. Dans ce deuxième cas, la comparaison des séquences de
plusieurs espèces peut être une source d’information pour la mutagenèse. Il est par exemple habituel
de comparer des protéines d’espèces mésophile et thermophiles, le problème est qu’elles diffèrent à
de nombreuses positions (Molk et al., 2001 ; Jiang et al., 2001, Perl et al., 2000).
Stabilisation des hélices α
Il existe plusieurs méthodes pour stabiliser les hélices alpha dans une protéine.
24/10/2011
150
Une solution consiste à ajouter une triade de résidus chargés Arg(+)-Glu(-)-Arg(+) espacés à des
intervalles i,i+4 ou i,i+3 dans la chaîne peptidique (Olson et al. 2001).
Une autre solution consiste à changer les glycine en alanine. Les résidus glycine sont les moins
fréquents dans les hélices α, juste après les prolines. Cette propriété a été remarquée par des études
statistiques comme par des études thermodynamiques. L’alanine stabilise l’α hélice de plus de 2
kcal/mol par rapport à la glycine et l’alanine a une forte préférence thermodynamique pour un
environnement hélicoïdal (O’Neil and DeGrado, 1990). Ainsi, la substitution de glycine en alanine
dans les hélices augmente la stabilité des protéines (Chakrabartty et al., 1991, 1995; Munoz et al.,
1994; Pace et al., 1998; Hecht et al., 1986; Ganter et al., 1990 ; Margarit et al., 1992, Blaber et al.,
1995 ; Predki et al., 1995).
On peut aussi ajouter un « cap » à l’extrémité N-terminale de la protéine le plus souvent en ajoutant
une serine à l’extrémité et un glutamate à la position 3 pour établir une liaison hydrogène.
Enfin, certains sites peuvent aider à calculer la stabilité d’une hélice α : http://www.emblheidelberg.de/Services/serrano/agadir/agadir-start.html
Stabilisation par rigidification du squelette
Pour fixer la structure tertiaire on peut ajouter des prolines dans les boucles.
Stabilisation par création de ponts
-
Ponts disulfures : on peut introduire des liaisons covalentes en créant des ponts disulfures.
Théoriquement, l’introduction d’un lien intramoléculaire décroît l’entropie de la protéine
dénaturée (Flory, 1956), déstabilisant ainsi l’état dénaturé et stabilisant thermodynamiquement la
protéine. De nombreuses protéines telles que le lysozyme (Johnson et al.,1978, Ueda et al., 1985 ;
Wetzel et al., 1988 ; Matsumura et al., 1989), des RNases (Lin et al., 1984, Futami et al. 2000), la
subtilisine (Pantoliano et al., 1987) ont été stabilisées en ajoutant des liaisons covalentes soit par
des moyens chimiques soit par des moyens génétiques. Cependant, l’introduction de liaison
covalentes peut aussi entraîner une inactivité de la protéine.
-
Les ponts salins : l’importance des ponts salins a été suggéré par Perutz et Raitz en 1975. Les
protéines thermostables provenant d’organismes thermostables ont généralement plus de ponts
salins que leurs homologues provenant d’organismes mésophiles et de nombreuses expériences
24/10/2011
151
de mutagenèse dirigée ont montré leur importance dans la stabilité des protéines. La force d’un
pont salin est estimée à 3-5 kcal mol-1. Cependant le rôle stabilisant des interactions
electrostatiques est controversé et dépend fortement de la position de l’interaction. Les ponts à
l’intérieur de la protéine sont plus favorables que les ponts à l’extérieur (Dao-pin et al., 1991) et
les interactions ioniques à la surface de la protéine peuvent même avoir un effet déstabilisant.
-
Les liaisons hydrogène stabilisent les protéines. Des mutations occasionnant une perte d’une
liaison hydrogène sont souvent trouvées dans les mutants thermosensibles produisant des
protéines à stabilité réduite (Grutter et al., 1987) et une étude récente (Pace et al., 2001) a montré
que le remplacement des tyrosines en phénylalanine déstabilise habituellement les protéines.
Ainsi, les liaisons hydrogène entre groupes polaires à l’intérieur des protéines sont plus
favorables que les interactions similaires avec l’eau dans les protéines dénaturées. La stabilité due
à une liaison hydrogène a été estimée à 1,3 kcal/mol et l’introduction de nouveaux ponts
hydrogène augmente la stabilité de la protéine (Peterson et al., 1999).
Stabilisation par mutagenèse des résidus exposés au solvant :
On peut remplacer les résidus Asp et Glu qui ont des liaisons hydrogènes exposées au solvant par des
résidus isostériques neutre, Asn or Gln (Irun et al., 2001).
L’exposition des chaînes latérales hydrophobes au solvant entraîne une variation d’énergie libre
défavorable en diminuant l’entropie du solvant. Certains résidus hydrophobes peuvent être moins
exposés au solvant dans l’état dénaturé que dans l’état natif. Pour ces résidus, il y a un effet
hydrophobe inverse qui s’oppose au repliement. Ainsi, des mutations qui remplacent des résidus
exposés au solvant par des résidus hydrophobes peuvent augmenter la stabilité de la protéine (Pakula
et Sauer, 1990).
Stabilisation par ajout de sites de glycosylation
La glycosylation est une des modifications post-traductionelles les plus importantes. Les chaînes de
sucre sont liées soit à l’azote d’une asparagine soit à l’oxygène d’une sérine ou d’une thréonine. La
N-glycosylation s’effectue à la séquence Asn-X-Ser or Asn-X-Thr (Kaplan et al., 1987). L’efficacité
de la glycosylation dépends de l’acide aminé à la position X, elle est impossible lorsqu’il y a une
24/10/2011
152
proline et relativement inefficace lorsque X est un tryptophane, un aspartate ou un glutamate (ShakinEshleman et al., 1996). Cette modification est co-traductionelle et la structure de l’oligosaccharide
est modifiée durant la translocation de la protéine du réticulum endoplasmique vers la membrane. La
plupart des protéines sont glycosylées dés que la chaîne polypeptidique entre dans le réticulum
endoplasmique, cependant la glycosylation ne précède pas nécessairement le repliement.
La stabilisation peut être augmentée par addition de site de N-glycosylation (Khanna et al., 2001).
Cette méthode est valable uniquement pour les protéines qui sont produites en cellules eucaryotes. Il
semble que la glycosylation décroît la dénaturation irréversible et non la dénaturation réversible
(Tams et Welinder, 2001).
Stabilisation par mutagenèse des résidus internes
On peut stabiliser les protéines en re-empaquetant leur cœur hydrophobe. Cette stratégie a donné de
bons résultats pour des protéines qui avaient des défauts de repliement évidents (Finucane and
Woolfson,1999), des résidus chargé à l’intérieur (Waldburger et al., 1995) ou des cavités qui peuvent
être remplies par des acides aminés avec des résidus plus encombrants. Cette stratégie a été appelée
«cavity-filling strategy » (Baldwin et al., 1996 ; Ohmura et al., 2001).
Stabilisation par élimination des résidus réactifs
L’inactivation thermique des protéines provient de certains acides aminés : aspartate, asparagine et
cystéine. L’asparagine est sujet à une déamidation, elle peut être remplacé par des résidus qui ont des
propriétées proches (Gln, Ile ou Thr). La présence d’aspartate conduit à la coupure de la liaison
peptidique, il peut être remplacé par un glutamate.
24/10/2011
153
Analyse des interactions entre macromolécules
Interactions acides nucléique-protéine
I - Techniques permettant de déterminer la (les) protéine(s) qui se fixe(nt) sur un acide
nucléique cible (ADN ou ARN) :
I – 1 : Criblage de banque d’expression :
Il s’agit d’utiliser la très classique technique de criblage d’une banque d’expression, le criblage se
faisant ici avec un oligonucléotide double brin marqué radioactivement. Les clones exprimant la
protéine interagissant avec cet ADN seront donc repérés après autoradiographie du filtre.
Banque d ’ADNc clonée dans un vecteur d’expression
Transformation chez E. coli
Etale sur boîte
Transfère sur filtre (nitrocellulose ou nylon)
Lyse les bactéries -> les protéines de chaque clone bactérien se fixent sur le filtre
Bloque (ADN double brin non spécifique)
Ajoute la sonde (ADN double brin marqué au 32P)
Repère les clones positifs
Récupère ces clones sur la boîte de pétri
Séquence l’ADNc de ces clones -> identification du partenaire
Une alternative à cette technique consiste à utiliser des phages lytiques de type lambda afin d’éviter
les étapes de lyse des bactéries.
I – 2 : Simple Hybride
Cette technique est dérivée de la technique du double hybride. Elle permet
Î d’identifier de nouvelles protéines interagissant avec un fragment d’ADN connu – et d’accéder
directement à leur ADNc
Î de vérifier une interaction entre une séquence d’ADN et une protéine
Î d’étudier les nucléotides et/ou acides aminés impliqués dans l’interaction.
Bien sûr, la stratégie expérimentale choisie variera légèrement en fonction de ce que l’on veut faire.
Comme pour le double hybride, on travaille chez la levure.
24/10/2011
154
Principe :
Si la protéine X se lie sur la séquence cis régulatrice E, il y aura activation de la transcription du gène
rapporteur. Si on fait pousser les levures ayant reçu ce vecteur sur un milieu en présence de X-gal, les
colonies obtenues seront bleues.
A
X
E
E
E
Gène rapporteur
R
t
E : Elément cis régulateur - séquence ADN cible à tester
X : protéine dont on teste l’interaction avec la séquence E
• soit une banque d ’ADNc
• soit un ADNc d’une protéine connu
A : domaine protéique activateur transcriptionnel (par exemple celui de Gal4)
Gène rapporteur - par exemple celui de la β galactosidase
Afin d’améliorer le rendement de l’activation transcriptionnelle, la séquence cible E est répétée
plusieurs fois.
Tout comme dans les cas du double hybride, un double système de sélection (β galactosidase et un
gène d’auxotrophie) est en général utilisé.
Afin d’améliorer le rendement de l’activation transcriptionnelle, la séquence cible E est répétée
plusieurs fois.
Tout comme dans les cas du double hybride, un double système de sélection (β galactosidase et un
gène d’auxotrophie) est en général utilisé.
Particularité des ARNs
Triple hybride
24/10/2011
155
Le système triple hybride permet la détection d’interactions ARN-protéine dans la levure en
utilisant un test phénotypique simple. Le principe est le même que celui du double hybride mais, ici,
un ARN adaptateur est utilisé en plus. Cet ARN est une molécule hybride qui présente :
Î une partie correspondant à un ARN connu interagissant avec une protéine connue (ex. ARN
MS2/protéine de l’enveloppe de MS2)
Î une partie correspondant à l’ARN à tester.
La protéine verte est, soit la protéine à tester pour son interaction avec l’ARN, soit la
transcription/traduction d’une banque d’ADNc.
L’ARN hybride est produit à partir de la transcription d’un plasmide qui présente l’ADN
correspondant sous la dépendance d’un promoteur inductible (Pmet25 par ex.).
D. SenGupta, B. Zhang, B. Kraemer, P. Prochart, S. Fields and M. Wickens. 1996. A three-hybrid
system for detecting RNA-protein interactions. Proc. Natl. Acad. Sci. 93, 8496-8501
24/10/2011
156
Méthode de Belasco (Jain et Belasco, 1996)
Le principe est semblable à celui du simple hybride mais les interactions se font chez E. coli (et non
chez la levure) et l’interaction se fait directement avec l’ARN (et non par l’intermédiaire de protéines
comme dans le cas du triple hybride).
La séquence d’ARN à tester est introduite (sous la forme d’un ADN double brin) en amont d’un site
de fixation du ribosome (RBS) lui-même en amont d’un gène β galactosidase. L’ensemble est porté
par un plasmide portant la résistance à l’ampicilline (plasmide reporter). Si l’interaction entre la
protéine à tester et notre ARN cible se fait, l’accès du ribosome au RBS sera empêché et il n’y aura
pas de traduction de la β galactosidase. Si, par contre, l’interaction ARN/protéine ne se fait pas, le
ribosome se fixera sur le RBS et la traduction de la β galactosidase pourra se faire. La présence de β
galactosidase sera vérifiée en présence de X gal.
Séquence à tester
Promoteur
RBS
ATG
β galactosidase
ADN
transcription
RBS
AUG
β galactosidase
ARNm
traduction
Il y a interaction
entre la protéine à tester et l ’ARN
Il n ’y a pas interaction
entre la protéine à tester et l ’ARN
ribosome
RBS
AUG
β galactosidase
RBS
β galactosidase
AUG
β galactosidase
X Gal
X + Gal
24/10/2011
157
Le plasmide rapporteur est donc cotransformé avec une banque d’ADNc clonée dans un vecteur
d’expression portant la résistance au choramphénicol. Les bactéries transformées sont alors
sélectionnées sur des boites en présence d’ampicilline, de chloramphénicol et de X gal. Si la
bactérie porte un plasmide d’expression avec un ADNc correspondant à une protéine qui fixe
notre séquence d’ARN, la bactérie sera blanche. Le cas échéant, la bactérie sera bleue. On
récupère donc les bactéries blanches, on extrait les plasmides qu’elles portent et on séquence
l’ADNc qu’elles contiennent. Il s’agit de l’ADNc d’une protéine interagissant avec notre ARN.
N.B. Il faut utiliser des bactéries ΔLacZ, c’est à dire des bactéries délétées pour le gène codant
pour la β galactosidase.
Jain C. & Belasco G. (1996) A structural model for the HIV-1 Rev-RRE complex deduced from
altered-specificity Rev variants isolated by a rapid Genetic Strategy. Cell, 87; 115-125
South-Western
Cette méthode permet de caractériser des protéines se liant sur un ADN cible. On peut aussi par cette
méthode cartographier leurs sites de liaison (Lelong et al., 1989). Les protéines sont séparées sur un
gel dénaturant (gel SDS-PAGE ou gel 2D) puis renaturées en présence d’une faible concentration en
urée et transférées sur nitrocellulose par diffusion ou encore directement électrotransférée sur
nitrocellulose. Dans ce dernier cas elle se renaturent durant le transfert. L’ADN à tester est marqué
radioactivement à ses extrémités et incubé avec la membrane de nitrocellulose.
Les fragments d’ADN spécifiquement liés à la protéine testée peuvent être élués de chaque complexe
ADN-protéine, et analysés après amplification par PCR.
L’ADN peut être :
♦ un fragment de restriction
♦ un oligonucléotide (double ou simple brin
♦ un fragment PCR, …
Si au lieu de faire migrer de l’ADN sur le gel, on fait migrer des ARN, la méthode prend le nom de
North-Western (Kwon et al., 1993).
24/10/2011
158
II - Techniques permettant de déterminer la cible (ADN ou ARN) d’une protéine :
II – 1 : Technique du Selex
La technique de SELEX (Systematic Evolution of Ligand by Exponential Enrichment), encore
appelée méthode de sélection in vitro, est une technique qui permet le tri simultané d’un mélange
complexe (plus de 1015 molécules d’ARN ou d’ADN (simple ou double brin) pour une
caractéristique particulière (ici la liaison avec une protéine).
Nous ne présenterons ici que le SELEX réalisé sur des ADN cibles double brin.
Principe :
Tout d’abord, un mélange d’oligonucléotides est synthétisé. Ces oligonucléotides sont composés
d’une vingtaine de nucléotides aléatoires (25 dans l’exemple ci-dessous) encadrés par deux
séquences constantes à partir desquelles se feront les PCR. Au moins 1015 molécules doivent être
synthétisées pour avoir des chances d’avoir un pool suffisamment dégénéré.
5’ TGGGCACTATTTATATCAAC (N25) AATGTCGTTGGTGGCCC-3′
Ces oligonucléotides simples brins sont fabriqués par synthèse chimique. Une fois le premier brin
réalisé, le deuxième est fabriqué en hybridant un oligonucléotide complémentaire de la région 3’
constante : 5’GGGCCACCAACGACATT
5’ TGGGCACTATTTATATCAAC (N25) AATGTCGTTGGTGGCCC-3′
TTACAGCAACCACCGGG-5’
On fabrique alors le deuxième brin à l’aide de polymérase de Klenow en présence de dNTP.
5’ TGGGCACTATTTATATCAAC (N25) AATGTCGTTGGTGGCCC-3′
3’ ACCCGTGATAAATATAGTTG (N25)TTACAGCAACCACCGGG-5’
La polymérase de Klenow (encore appelée grand fragment de l’ ADN polymerase I d’ E.
coli), est fréquemment utilisé à la place de cette dernière chaque fois que l’ on ne désire
24/10/2011
159
pas avoir l’ activité 5' -> 3' exonuclease de cette dernière. Il a été initialement été produit
par protéolyse à partir de l’ enzyme pleine taille. La protéase utilisée pour cela est la
subtilisine.
Aujourd’hui, ce fragment est exprimé directement dans la bactérie (E. Coli) à partir du gène tronqué
de l’ADN polymérase I
Parmi ce pool d’oligonucléotides dégénéré, la sélection des molécules interagissant avec la protéine à
tester se fait par chromatographie d’affinité, gel retard ou liaison sur filtre.
Chromatographie d’affinité ou techniques dérivées : la protéine cible est tagguée, biotinylée ou on
possède un anticorps dirigé contre cette protéine. On peut alors faire une chromatographie d’affinité,
un pull-down ou une Co-immunoprécipitation
Parce que le pool présente au départ une très faible proportion de molécules d’ADN capables
d’interagir avec la protéine appât, plusieurs cycles de sélection sont nécessaires. Une amplification
par PCR des fragments isolés est réalisée après chaque round de sélection.
Oligonucléotides utilisés dans notre exemple pour la PCR :
5’ TGGGCACTATTTATATCAAC
TTACAGCAACCACCGGG-5’
Plusieurs cycles successifs de sélection/amplification vont nous permettre d’augmenter de façon
exponentielle l’abondance dans le mélange des séquences fonctionnelles, jusqu’à avoir une majorité
de ce type de séquences. La stringence des tampons utilisés pour l’interaction augmente à chaque
cycle.
24/10/2011
160
Clonage et séquençage
Après chaque cycle de PCR, on vérifie par gel retard (EMSA) que l’on a bien augmenté l’affinité du
pool d’oligonucléotides pour notre protéine.
Enfin, on aligne (par bioinformatique les séquences obtenues -> séquence consensus)
A – Analyse par gel retard de l’interaction de la protéine X avec les ADN obtenus lors des premiers
cycles de SELEX, B : alignement des séquences obtenues par bioinformatique, C : séquence consensus
A
Cycles SELEX
0 1 2 3 4 5
II-2 : Immunoprécipitation de chromatine
24/10/2011
161
Le « ChIP » (Chromatin ImmunoPrecipitation) consiste à purifier des complexes ADN-protéines,
formés in vivo et liés de façon covalente par du formaldéhyde.
Principe de la Technique :
Les protéines cellulaires sont liées de façon covalente à l'ADN par un traitement au formaldéhyde.
L'ADN est ensuite clivé en fragments d’environ 500 pb par sonication.
La protéine d'intérêt est immunoprécipitée, l'ADN sur lequel elle était liée récupéré et analysé (par
exemple par PCR comme sur le schéma ci-dessous.
Avantage :
-
Cette technique est réalisée sur des cellules vivantes
Inconvénients :
-
Cette technique nécessite de trouver les conditions idéales d'immunoprécipitation, de cross-
link mais aussi de fragmentation de l'ADN. Le choix des oligonucléotides utilisés pour la PCR est
également important.
-
Il faut avoir un anticorps très spécifique et présentant une bonne affinité pour sa protéine cible
et que la protéine étudiée soit exprimée dans la cellule en quantité suffisamment importante. On peut
détourner ces derniers inconvénients en utilisant une protéine tagguée et surexprimée mais, dans ces
conditions là, on s’éloigne de l’ « in vivo ».
Méthode :
24/10/2011
162
Fixation au formaldéhyde, sonication et immunoprécipitation
Le formaldéhyde est une petite molécule de 2 Angström, c’est un agent de liaison qui va permettre de
produire un lien in vivo à la fois « acides nucléiques – protéines » et « protéines – protéines ».
Le formaldéhyde est un composé dipolaire très réactif dans lequel les atomes de carbones agissent
comme des centres nucléophiles. Les groupements « amines » et « imines » des acides aminés
(Lysines, Arginines et Histidines) et de l’ADN (Adénines et Cytosines) réagissent avec le
formaldéhyde pour former une base de Schiff. Cet intermédiaire peut alors réagir avec un second
groupe aminé et se condenser pour donner le complexe ADN-protéine final. Ces réactions se mettent
en place in vivo en quelques minutes après l’ajout de formaldéhyde sur les cellules vivantes. La
réaction est totalement réversible. Cette réaction est réalisée par protonation du groupe « imino » à
faible pH dans un milieu aqueux.
Un autre paramètre qui doit être considéré lors de la mise au point des conditions de fixation est le
fractionnement du matériel fixé. La sonication est une des possibilités (avec la digestion par les
endonucléases) pour solubiliser le matériel fixé, en particulier la chromatine.
Pour l’identification et la caractérisation in vivo des ADNs cibles d’une protéine donnée, après
immunoprécipitation de la chromatine « crosslinkée », l’ADN est purifié puis analysé par les
techniques conventionnelles telles que le southern blot, le séquençage, l’hybridation sur puces et
l’analyse par PCR. De telles analyses demandent l’élimination de toutes les protéines de la fraction
chromatine immunoprécipitée. Pour cela, le cross-link est réversé par chauffage en solution aqueuse
(65°C, au moins 4 heures) – on peut en plus traiter à la protéinase K pour éliminer les protéines puis
l’ADN est purifié par des méthodes standards (par exemple par une partition phénol/chloroforme/eau,
suivi d’une précipitation à l’éthanol).
2) Méthodes d’analyses
- Analyse par PCR :
Si on a une idée des régions chromosomiques sur lesquelles la protéine étudiée a pu se fixer, on peut
réaliser une analyse par PCR. Pour cela, on va dessiner des oligonucléotides qui s’hybrident de par et
d’autre de la séquence à tester (séquence sur laquelle on pense que s’est fixée la protéine étudiée)
puis on réalise une PCR à l’aide de ces amorces afin de tester la présence du fragment d’ADN
correspondant parmi les fragments précipités. Si la protéine était sur cette région de l’ADN, il y aura
amplification par PCR, sinon, on n’aura pas d’amplification.
24/10/2011
163
- Analyse par southern-blot
Les fragments d’ADN immunoprécipités sont marqués (éventuellement après LM-PCR) puis
hybridés par southern blot. Ce n’est bien sûr pas un génome total que l’on a fait migrer sur le blot
mais seulement différents fragments d’ADN que l’on veut tester.
- Hybridation sur « chip » - ChIP on chip ou ChIP to chip
Dans l’expérience appelée « ChIP to chip », tous les fragments d’ADN co-immunoprécipités avec la
protéine d’intérêt sont amplifiés. Ceci est réalisé en ajoutant par ligation des linkers classiques sur les
extrémités des fragments d’ADN réparés (LM PCR). Le matériel amplifié est alors hybridé à une
puce d’ADN (DNA microarray) portant les sondes appropriées – fragments d’ADN génomique ou
correspondant à des séquences promotrices. Ces expériences sont réalisées avec deux marquages, la
deuxième couleur correspondant à l’ADN total comme contrôle (Input). Chaque ADN enrichi par
l’immunoprecipitation est enregistré comme un site de liaison potentiel pour la protéine étudiée.
24/10/2011
164
Types de puces souvent utilisés :
•
Les puces génomiques : portent l’ensemble du génome – plutôt utilisées pour des organismes
peu complexes (levure, drosophile).
Point fort : on crible l’ensemble du génome
Points faibles : la résolution est mauvaise (de l’ordre de 0.5 méga base), on ne peut voir que des
régions d’interaction et non des sites. Beaucoup de faux positifs.
• Les puces à promoteurs :
Point fort : peu de faux positifs. Permet de déterminer l’identité du gène concerné
Points faibles : ne portent que les promoteurs proximaux, or, on sait que des séquences régulatrices
très importantes sont en dehors de ces régions. Ce type d’array n’existe que pour quelques
organismes modèles.
-
Clonage puis séquençage
24/10/2011
165
L’addition d’un linker permet l’amplification de la banque et le clonage des différents fragments
dans un vecteur d’expression.
Clonage
Séqu
ençage
Cette technique est sûrement la plus valable de toutes. Cependant elle est très lourde et onéreuse à
mettre en place. En effet, le nombre de clones à séquencer pour avoir une bonne idée de l’ensemble
des sites de fixation est très important (on estime le nombre de clones à séquencer à environ 100 000
pour l’analyse des sites d’interaction dans un génome humain).
SAGE appliquée au séquençage de fragments d’ADN génomiques
obtenus après immunoprécipitation de chromatine.
24/10/2011
166
Amélioration de la technique : les PET (Paired End Tags).
Ici, on veut séquencer les extrémités de chaque fragments obtenu par ChIP afin d’avoir une signature
parfaite de chaque fragment séquencé.
Les fragments d’ADN immunoprécipités sont clonés dans un plasmide contenant le site MmeI de
part et d’autre du site d’insertion.
24/10/2011
167
Ces plasmides sont alors digérés MmeI, digérés pour les rendre bord franc puis refermés par ligation.
On réalise enfin la concamérisation de ces fragments réalisée après les avoir isolés par digestion
BseRI.
Avantage de cette technique : on obtient alors, en séquençant juste quelques nucléotides des
extrémités de chaque fragment, une idée exacte de l’ensemble du fragment.
24/10/2011
168
Si on obtient plusieurs fragments correspondant à un site de fixation, on peut les aligner ce qui nous
permettra de préciser le site d’interaction.
Une alternative au ChIP : DamID
Les expériences d’immunoprécipitation de chromatine n’étant pas toujours réalisables (en particulier
si on n’a pas d’anticorps immunoprécipitant dirigés contre notre protéine, une alternative à cette
technique a été imaginée.
Cette technique consiste à fusionner la méthylase Dam d’E coli à la protéine X dont nous
recherchons les cibles. Ainsi, quand la protéine de fusion se liera à l’ADN (par l’intermédiaire de la
protéine X) la méthylase déposera sur l’ADN une marque (méthylation) de cette interaction.
Me
Dam
Me
X
Les méthylations seront ensuite repérées après digestion à l’enzyme DpnI (seuls les sites méthylés
par Dam seront digérés). Les fragments d’ADN génomique de petite taille (digérés par DpnI) seront
alors isolés et analysés (par séquençage, PCR, hybridation, chip, …etc.).
24/10/2011
169
Afin d’être sûr que ces méthylation sont bien spécifique de l’interaction de la protéine X avec sa cible
ADN, une transfection de la méthylase Dam seule est réalisée en parallèle.
Le schéma ci-dessous nous montre un exemple d’expérience avec analyse des résultats par chip.
A gauche : cellules transfectées par un plasmide permettant de produire la protéine X fusionnée à la méthylase Dam.
A droite : cellules contrôle transfectées par un plasmide permettant l’expression de la méthylase Dam seule.
24/10/2011
170
Méthodes permettant d’étudier les interactions acide nucléique / protéine
Electrophoretic Mobility Shift Assay (EMSA) - gel retard
Principe de la Technique :
La technique du gel retard est basée sur le retard de migration dans un gel natif de polyacrylamide de
duplexes d'oligonucléotides de séquences courtes en présence de protéines (ou de complexes
protéiques) ayant la propriété de reconnaître spécifiquement la séquence d'intérêt. La variation de
migration des duplexes (ou sondes) complexés aux protéines par rapport aux duplexes libres est
suivie grâce au marquage radioactif au 32P des sondes nucléotidiques.
Concentrations croissantes
en protéine
*
*
*
*
*
*
ADN complexé à deux protéines
ADN complexé à une protéine
ADN nu marqué en 5 ’
Le gel retard peut être réalisé à partir de protéines purifiées mais aussi à partir d’un extrait protéique
plus complexe (un extrait nucléaire par exemple).
La spécificité de reconnaissance des sondes marquées peut être testée par l'ajout en excès du même
duplexe non radioactif qui entrent en compétition avec la forme radioactive.
La présence de protéines spécifiques dans le complexe retardé peut être mise en évidence par l'ajout
d'anticorps spécifiques qui permettent un retard plus important sur le gel appelé " supershift ".
La même expérience peut-être réalisée avec de l’ARN.
24/10/2011
171
Footprint – empreinte sur l’ADN
Î Exonucléase A
L’exonucléase A est une enzyme qui a une activité 3’-5’ exonucléase, mais ne s’attaque qu’aux
extrémités proéminentes ou franches. Elle ne coupe ni l’ADN simple brin, ni les extrémités 3’
proéminentes.
Cette activité est utile pour déterminer les limites d’une interaction entre une protéine et un fragment
d’ADN.
Si on marque au 32P une seule des deux extrémités 5’ de notre fragment d’ADN, et si l’on traite celuici à l’exonucléase III pendant qu’une protéine en protège une partie, l’exonucléase III ne pourra
digérer l’ADN que jusqu’à ce qu’elle entre en contact avec cette protéine qui l’empêche de
progresser dans la digestion. La même expérience sera réalisée avec le fragment d’ADN marqué sur
l’autre extrémité.
La taille de l’ADN protégé que l’on détermine sur un gel dénaturant haute résolution nous permettra
de déterminer où est localisée l’interaction ADN-protéine.
Un des avantages de l’empreinte à l’exonucléase III est que l’ADN non-protégé par une protéine est
entièrement dégradé; une interaction partielle ne génère pas de bruit de fond.
24/10/2011
172
Î Dnase I
Î Radicaux libres
Le principe de l’empreinte se prête à différents réactifs outre les nucléases. On peut par exemple
générer dans le milieu d’incubation des radicaux hydroxyl libres qui attaquent la chaîne de phosphate
de l’ADN et cassent un des brins de l’ADN.
La réaction pour générer ces radicaux est la suivante:
Fe2+(EDTA4-) + H2O2 -> Fe3+ (EDTA4-) + HO.
C’est le radical HO. qui attaque l’ADN. Il n’a pas de préférence quant à la séquence et tend à couper
partout. Une telle empreinte peut donner plus de bruit de fond qu’une empreinte à la DNAse parce
24/10/2011
173
que cette dernière, beaucoup plus massive, peut difficilement atteindre des sites situés sous la
protéine qui protège l’ADN, alors qu’une petite molécule comme HO. y arrive plus facilement.
D’autres radicaux existent pour ce type de réaction, comme par exemple le cuivre-phénanthroline.
Le permanganate de potassium (KMnO4) par exemple, est une molécule très réactive qui oxyde
préférentiellement les thymines d’ADN monocaténaire [Rubin et Schmid, 1980; Kahl et Paule,
2001]. Il peut ainsi détecter des portions de séquences d’ADN qui sont monocaténaires. Le KMnO4 a
été utilisé pour déterminer des distorsions dépendantes de la séquence [McCarthy et Rich, 1991], des
structures d’ADN en épingle à cheveux [Balagurumoorthy et Brahmachari, 1994] ou l’ADN de type
B et l’ADN à hélice triple [Jiang et coll, 1991].
Î Les autres
Presque toutes les techniques utilisées pour étudier les interactions ADN-protéines in vitro peuvent
aussi être utilisées in vivo. Il est juste un peu plus difficile de faire pénétrer les réactifs dans la cellule
et d’en récupérer l’ADN par la suite. Parmi les traitements disponibles pour effectuer des empreintes
in vivo, on trouve les empreintes :
(a) à la DNAse I (il faut alors perméabiliser les cellules pour permettre l’entrée de l’enzyme, et
s’assurer de ce qu’il y ait assez de Mg2+ présent dans le milieu);
(b) au diméthylsulfate ou DMS, qui pénètre spontanément dans les cellules et va causer une
méthylation des guanines non-protégées, une activité particulièrement efficace dans le sillon majeur
de l’ADN; les guanines méthylées peuvent alors être coupées par la piperidine;
(c) l’ UV footprinting, ou formation de dimères de pyrimidines par irradiation aux rayons ultraviolets
UVB (280-320nm) ou UVC (200-280nm). Ces dimères de pyrimidines peuvent être coupés par une
photolyase et la piperidine. Cette empreinte aux UV a l’avantage de ne pas toucher aux cellules du
tout, et permet donc d’étudier une cellule très près de son état naturel.
24/10/2011
174
La technique la plus populaire pour récupérer des fragments d’ADN après une réaction d’empreinte
in
vivo
est
celle
du
LMPCR,
ou
ligation-mediated
Polymerase
chain
reaction.
24/10/2011
175
LMPCR et footprint in vivo :
(1) Récupération de l'ADN génomique. Cet ADN contient des coupures simple-brin, là où la DNAse
I ou un autre agent comme le DMS, a endommagé la chaîne d'acides phosphoriques.
(2) Séparation des brins et annélisation de l'un d'eux avec une amorce 1 spécifique à une région qui
nous intéresse. L'autre brin pourra être étudié plus tard lors d'une autre expérience. Notez que les
fragments d'ADN dont nous disposons à cette étape sont de tailles différentes, parce que la coupure à
la DNAse I n'est que partielle.
(2) Extension de l'amorce 1.
(3) Ligation d'un adapteur double brin à l'extrémité franche. Comme l'autre extrémité n'est pas
franche, l'adapteur ne peut pas s'y attacher. Cet adapteur a une extrémité prohéminente, ce qui
l'empêche de se liguer plusieurs fois au bout de notre extrémité franche.
(5) PCR entre une deuxième amorce spécifique (l'amorce 2, à côté du site de l'amorce 1) et une
amorce (l'amorce 3) semblable à l'extrémité prohéminente de l'adapteur que nous avons ajouté à
24/10/2011
176
l'étape précédente. Le premier cycle de ce PCR ne fonctionne que dans un sens, c'est à dire à partir de
l’amorce 2, parce que l'amorce 3 n'a pas encore de séquence complémentaire. Cette séquence sera
synthétisée lors de ce premier cycle.
24/10/2011
177
BIAcore
On mesure ici l’interaction entre deux partenaires moléculaires grâce à une machine mesurant
l’intensité d’un rayon de lumière. Cette machine est fabriquée par la compagnie Biacore, qui a
donnée son nom à l’appareil.
La SPR, ou résonance de plasmon, se produit quand un rayon lumineux est réfléchi sous certaines
conditions par un film conducteur à l’interface entre deux milieux d’indices de réfraction différents.
Dans le système Biacore (tm) ces milieux sont (1) la solution dans laquelle se trouvent les molécules
à analyser et (2) le verre d’une lame qui sert de senseur. Le film conducteur à l’interface des deux est
un très fin film d’or à la surface de la lame de verre.
La résonance de plasmon cause une réduction de l’intensité de la lumière réfléchie à un angle
spécifique de réflection. Cet angle varie avec l’indice de réfraction près de la surface du côté opposé
à la lumière réfléchie (c’est donc dire du côté de l’échantillon).
Dans le système Biacore (www.biacore.com) , la molécule appât est attachée à la feuille d’or, du côté
solution. Les molécules avec lesquelles elle peut interagir sont ajoutées en flot continu. Si l’une
d’entre elles interagit avec l’appât, la concentration locale en molécules augmentera dans la région
immédiate de l’appât, ce qui fera changer l’indice de réfraction local.
Le changement d’indice de réfraction aura pour effet de changer l’angle pour lequel la lumière
réfléchie perd un maximum d’énergie par résonance.
Le système détecte un changement et enregistre une interaction. La mesure du niveau d’interaction en
fonction du temps permet d’évaluer le taux d’association.
Une unité de résonance (RU) correspond à un changement de 0.0001° dans l’angle donnant une
intensité minimale de lumière réfléchie, ce qui pour la plupart des protéines correspond à un
changement de concentration de l’ordre de 1 pg/mm2 de surface sur la lame de verre. Le Biacore est
donc extrêmement sensible.
24/10/2011
178
Les puces en général…
ANNEXE :
Les puces à ADN (DNA microarray) permettent un criblage rapide et simultané d’un génome ADN.
Les puces à ADN consistent en un support solide (petite lame de verre comme celles utilisées en
microscopie traditionnelle ou membrane de nylon) sur lequel des milliers de fragment d’ADN sont
déposés de façon géométrique à l’aide d’une micropipette robotisée. Grâce à cette technique, chacun
des fragments d’ADN est représenté par un point sur le support (ou puce). Ils servent de sondes pour
fixer de façon très spécifique les fragments de gènes complémentaires (cibles), présents dans les
échantillons biologiques à tester : leur mise en contact permet de reconstituer la double hélice d’ADN
et ce phénomène (hybridation) peut être mis en évidence par des techniques optiques sous éclairage
fluorescent ou par détection de radioactivité; un système de « marquage » de l’échantillon au moyen
de traceurs fluorescents ou radioactifs ayant été réalisé préalablement. La quantification des signaux
obtenus et l’identification des fragments de gènes reconnus sont ensuite rendues possibles au moyen
d’un système d’acquisition d’image puis d’analyse des données faisant appel à des logiciels
informatiques spécialement conçus à cet effet. Les résultats obtenus sont ensuite validés sur le plan
statistique et interprétés dans un contexte biologique.
24/10/2011
179
Le potentiel de cette méthodologie est énorme, mais la masse de résultats qui résulte de ces
expériences est considérable et leur exploitation par le biais de programmes informatiques n’en est
encore qu’à ses débuts. De nombreux développements sont encore à faire au niveau des logiciels
d’analyse et de représentation afin d’extraire de ces données le maximum de sens sur le plan
biologique.
Le terme « puces à ADN » est un terme générique. Il existe actuellement 2 procédés majeurs de
fabrications de puces à ADN ce qui permet de distinguer différents types de puces : (1) les macro et
microarrays avec un dépôt direct de molécules d’ADN sur leur support
(2) les puces à
oligonucléotides avec la synthèse in situ des sondes oligonucléotidiques sur une surface solide.
Les macroarrays ou filtres à haute densité :
Les dépôts (sondes) sont des clones d’ADNc ou des produits de PCR fixés à haute densité sur une
membrane de nylon (8 x 12 cm). Le marquage est le plus souvent radioactif et le criblage est réalisé
en excès de cible, on obtient ainsi une mesure de l’abondance relative de chacun des ARNm présent
24/10/2011
180
dans l’échantillon de départ. On parle de macroarrays jusqu’à une densité d’environ 25 fragments
ADN déposé par cm2.
filtres à haute densité ou macroarrays
Les microarrays :
Ils permettent la miniaturisation des dépôts d'ADN, ce qui permet de fixer plusieurs milliers
de sondes sur des surfaces égales ou inférieures à celle d’une lame de microscope standard. Elles sont
déposées à une densité de 1 000 sondes/cm2 par un robot sur des lames de verre au préalablement
traitées chimiquement, soit jusqu’à 12 000 sondes/lame.
Les sondes sont généralement des ADN double brin de longueur de 200 à 2000 bp amplifiés
par la technique de PCR mais récemment, des oligonucléotides longs (50-70 mers) ont également été
greffés sur la puce après leur synthèse.
Les cibles utilisées sont réalisées par transcription inverse, à partir d’ARN total ou messager
utilisant 2 fluorochromes différents (Cy3 et Cy5) ce qui permet d’hybrider simultanément 2 cibles sur
une même sonde. Les signaux d’hybridation sont analysés grâce à un lecteur capable de discriminer
les 2 fluorochromes et de générer deux images dont le niveau de gris représente l’intensité de la
24/10/2011
181
fluorescence lue. Si on remplace les niveaux de gris par des niveaux de couleur verte pour la
première image et rouge pour la seconde, on obtient en les superposant une image en fausses couleurs
composée de spots allant du vert au rouge en passant par le jaune.
Un excès du gène X dans l’échantillon marqué en rouge donnera un signal rouge ; un excès du
gène Y dans l’échantillon en vert donnera un signal vert ; une expression équivalente du gène Z dans
les deux échantillons donnera un signal jaune. On calcule ensuite le ratio des intensités de
fluorescence rouge/fluorescence verte pour chacun des spots ce qui permet de rechercher une
expression différentielle des gènes dans les 2 échantillons biologiques étudiés. Généralement, on fixe
la limite d’un ratio supérieur à 2 ou inférieur à 0,5 pour considérer qu’un gène est sur- ou sousexprimé dans une des cibles par rapport à l’autre.
On peut ensuite essayer de regrouper des gènes ayant le même profil d’expression sur
plusieurs expériences ayant un rapport biologique.
24/10/2011
182
Principe d'une hybridation sur microarrays
Les puces à oligonucléotides :
Elles dérivent à l’origine d’un projet de séquençage par hybridation. Les puces les plus couramment
utilisées sont les puces de la société Affimetrix. Dans ce cas, les sondes sont des oligonucléotides
synthétisés in situ par une technique de photolithographie. On peut synthétiser jusqu’à 300 000
oligonucléotides représentant 30 000 gènes sur une puce d’une surface d’environ 1 cm2. On hybride
une seule sonde par puce et l’intensité de fluorescence mesurée par un scanner permet une mesure de
l’abondance relative de chacun des ARNm présent dans l’échantillon biologique étudié.
24/10/2011
183
Interactions protéine - protéine
1.
Avant propos
♦
Liaisons stables – liaisons transitoires
Deux protéines peuvent s’associer indépendamment de tout autre partenaire de deux manières
différentes :
Liaisons stables : toute association donnant naissance à un complexe que l’on peut isoler
(Attention, ne pas confondre avec liaison covalente ! une liaison peut-être stable sans être covalente).
Liaison transitoire : donnent des complexes trop peu stables pour que l’on puisse les isoler. Dans ce
cas là, l’isolement de ces complexes passera souvent par une étape préliminaire de cross-link
(pontage covalent réalisé par un traitement chimique ou physique).
La force de la liaison (affinité) est définie par des paramètres d’équilibre et en particulier par le Kd ou
constante de dissociation.
♦
Notion de Kd
Kon
A + B <====> AB
Koff
[A] x [B]
Kon : constante de vitesse de formation du complexe
Koff : constante de vitesse de dissociation du complexe
AB
Kd = [A] [B] / [AB] = koff / kon = 1 / Ka (constante
Avec [A], [B], [AB] : respectivement concentration en A, B et AB
d’association)
Quelques exemples de Kd :
streptavidine / biotine : 10-14 M
Histone / ADN 10-11 M
Antigène / Anticorps : 10-8 à 10-10 M pour un bon anticorps, 10-6 M pour un anticorps plus faible
♦
Liens moléculaires
Les interactions protéine / protéine sont possibles grâce à la formation de liaisons non covalente. Ces
liaisons sont de différente nature :
• Liaisons ioniques - interactions qui relient deux atomes de charges opposées- la plus forte des
liaisons non covalentes
24/10/2011
•
184
Liaisons hydrogène - se forment à chaque fois qu’un atome d’hydrogène lié à un atome
électronégatif est à proximité d’un autre atome électronégatif (en général oxygène et azote) L’énergie de liaison est moyenne
•
Liaisons hydrophobes - se rencontrent lorsque deux molécules hydrophobes voisines se
rencontrent (par exemple deux acides aminés hydrophobes) - l’énergie de liaison est faible
•
Forces de Van Der Waals – interactions électrostatiques entre deux atomes voisins. Doivent
être très proches car l’énergie de cette liaison est très faible.
2. Introduction
Les génomes de différentes espèces procaryotes mais aussi eucaryotes ayant été séquencés ces
dernières années, la majorité des efforts de la communauté scientifique se porte aujourd’hui sur
l'analyse du produit des gènes, les protéines. En effet, le nombre et la fonction biologique de la
plupart de ces molécules codées par les gènes ne sont pas encore connus. L’étude des protéines est
appelée la protéomique.
Comment accéder à la fonction (aux fonctions) d’une protéine X ?
Analyse in silico :, recherche de protéines présentant des
homologies de séquences, recherche de domaines connus (de
liaison à l’ADN par exemple), …
Etudes
biochimiques :
recherche
d’une
activité
enzymatique
Etudes de biologie cellulaire : cellules/compartiments
cellulaires dans lesquels la protéine est présente
Etudes de biologie structurale : recherche de domaines
structuraux de fonction connue
Etudes génétiques : inactivation du gène (KO, RNAi)
suivie d’étude du phénotype obtenu
Etudes biologie moléculaire : facteurs impliqués dans la régulation de ce gène ?
Comme les protéines fonctionnent le plus souvent (toujours ?) en réseaux, l'identification des
interactions entre protéines permet de mieux comprendre leur fonction (si la fonction du (des)
24/10/2011
185
partenaires de la protéine X est connue, cela nous donnera des informations sur sa propre fonction) et
permettra éventuellement de découvrir de nouvelles cibles thérapeutiques.
=> Etude de l’INTERACTOME
3 - Recherche de partenaires protéiques à partir d’une banque d’ADNc
Principe de ces techniques :
Les partenaires protéiques de la protéine d’intérêt (que nous appellerons la protéine appât) seront
recherchés à partir de banques d’ADNc. Ces ADNc seront transcrits puis traduits chez un hôte
particulier (la nature de l’hôte dépend de la technique choisie). L’interaction sera révélée par
différentes méthodologies décrites par la suite.
Intérêt de ces techniques :
Ö une fois le partenaire identifié, on aura directement accès à son ADNc.
Ö Simplicité de mise en œuvre
Inconvénients :
Ö Les interactions binaires pourront essentiellement être étudiées
Ö Les interactions sont réalisées avec des protéines hétérologues ou recombinantes (problème de
quantité relative des partenaires, de compartimentation de la cellule, de modifications posttraductionnelles, …).
3.1 - Criblage en interaction sur colonies ou sur plages de lyses
Il s’agit d’utiliser dans un premier temps la très classique technique de criblage d’une banque
d’expression, la seule différence repose sur le fait que le criblage ne fait pas par hybridation avec une
sonde simple brin radioactive mais avec la protéine appât (que nous appellerons protéine X) au
préalablement marquée. Les clones exprimant la protéine interagissant avec la protéine X seront donc
repérés par sa visualisation (autoradiographie si la protéine X est marquée radioactivement). Les clones
positifs, contenant l’ADNc des partenaires de la protéine X, seront identifiés par séquençage.
24/10/2011
186
Criblage avec la protéine X marquée
Pour marquer la protéine appât, on peut la traduire in vitro en présence de méthionine 35S. On peut
aussi la biotinyler ou encore la produire chez E. coli en fusion avec une étiquette facilement
repérable. On peut enfin la repérer grâce à des anticorps.
La banque peut être réalisée dans un plasmide ou dans un phage (lamda par exemple). L’avantage du
phage sur le plasmide est qu’il évite l’étape de lyse des bactéries.
Avantages de cette technique : ceux déjà cités plus haut pour l’ensemble de ces techniques.
Inconvénients de cette technique :
Ö
les interactions se faisant à partir de protéines fixées sur des filtres (nitrocellulose ou nylon),
l’efficacité de liaison entre la protéine X et ses partenaires est moins bonne.
Ö
Cette technique nécessite d’avoir la protéine X purifiée.
Ö
Si on veut tester un grand nombre de partenaires, il faudra cribler un grand nombre de boîtes.
3.2 - Phage display
Une alternative à cette technique consiste à faire du phage display, on peut alors faire un
enrichissement des phages positifs en milieu liquide, ce qui permet de tester un grand nombre de
clones sans augmenter la charge de travail.
Cette technique consiste à faire exprimer la protéine cible à la surface d’un bactériophage non lytique.
Ces phages seront utilisés pour infecter des bactéries E. coli.
Le bactériophage utilisé ici est le bactériophage filamenteux
M13. Pour faire exprimer nos protéines à tester en surface de
ce bactériophage, leur ADNc est cloné en fusion avec le gène
24/10/2011
187
III qui code pour une protéine mineure de la capside qui est
exprimé à la surface du phage.
Le site de clonage se trouve en N terminal de la protéine du gène III afin que le motif protéique
variable soit tourné vers l’extérieur, donc accessible à une sélection. Entre la séquence codante du
gène III et les ADNc, on met une séquence « espaceur » afin que les protéines à tester puissent
adopter un repliement indépendant de celui de la protéine "III". Une banque d’ADNc est insérée dans
l’ADN du phage au niveau du site de clonage.
L’ADN phagique ainsi modifié est transformé dans des bactéries E. coli (avec en théorie un phage
donc une protéine recombinante par bactérie) puis les phages sont obtenus par infection avec le
bactériophage « helper » M13KO7. Ce bactériophage présente un génome modifié qui ne permet pas
sa réplication. Il permettra par contre la formation des bactériophages à partir des ADN phagiques
portant les ADNc. Les phages recombinants sont récupérés dans le surnageant de culture puis
sélectionnés par rapport à leur interaction avec la protéine pour laquelle on recherche des partenaires.
La sélection peut se faire de différentes façons en fonction des caractéristiques de la protéine pour
laquelle on recherche des partenaires (protéine appât) :
• Fixation directement sur un support activé
Les supports ou matrices utilisés pour la chromatographie d'affinité sont généralement des
billes d'agarose ("Sepharose™", Pharmacia®).
L'immobilisation du ligand sur la matrice nécessite qu'il soit préalablement activé, c'est-à-dire qu'il
faut créer des sites réactionnels qui permettent d'établir des liaisons covalentes avec la protéine
appât.
• Colonne d’affinité
Si la protéine est étiquetée ou biotinylée, ou encore si on lui connait un ligand, on peut sélectionner
les phages positifs en réalisant une colonne d’affinité.
Particules virales exprimant des fragments d ’ADNc
Les phages ainsi sélectionnés sont
utilisés pour réinfecter des souches
Fixation sur
une protéine
cible
bactériennes, les surnageants sont
Amplifications
(infection d ’E. coli)
3à4X
Élutions
(augmente
conc. en NaCl par ex.)
lavages
24/10/2011
188
récupérés et resélectionnés contre
la protéine. En répétant cette étape
de sélection plusieurs fois (en
augmentant
la
stringence
de
l’interaction à chaque cycle), on
enrichit notre population en clones
produisant
les
recombinantes
protéines
interagissant
le
mieux avec l’appât. Ces candidats
sont alors isolés (par dilutions ou
sur boites – en effet, bien que le
phage ne soit pas
lytique, sa présence dans une bactérie diminue sa vitesse de division, on voit donc apparaître des
« pseudo » plages de lyse sur les tapis bactériens). L’ADNc du phage est alors séquencé, permettant
ainsi l’identification des les partenaires de la protéine X.
Avantages de cette technique : permet de cribler rapidement une grande quantité de clones.
Inconvénients de cette technique : seules des interactions de forte affinité peuvent ainsi être étudiées
(au moins 10-8M), nécessité d’avoir des quantités importante d’appât purifié.
3.3 - Double hybride ou « piège à interaction ».
Cette technique est basée sur la capacité des domaines de liaison à l’ADN (BD) et d’activation de la
transcription (AD) du facteur de transcription Gal4 à fonctionner de manière indépendante. Dans le
système du double hybride, ces deux domaines sont séparés et chacun est fusionné aux protéines
d’intérêt (X et Y). Ainsi, c’est l’interaction entre les deux protéines X et Y qui permettra de
reconstituer un facteur de transcription actif. Il y aura alors transcription de gènes rapporteurs.
Gène rapporteur : gène non présent dans la souche de levure utilisée et dont l’expression est
facilement repérable. Ex : lacZ : gène d’E. coli, non présent chez S. cerevisiae – facile à repérer
grâce à son activité enzymatique.
La séquence codant la protéine X (l’appât) sera fusionnée à la séquence codant pour le domaine de
liaison à l’ADN de Gal4 -> clonée dans un plasmide
La proie (protéine Y) correspondra soit à l’ADNc de la protéine dont on veut tester son interaction
avec la protéine X, soit une banque d’ADNc si aucune expérience préliminaire n’a encore été
24/10/2011
189
réalisée. Sa séquence sera fusionnée avec le domaine d’activation de la transcription de Gal4. ->
clonée dans un plasmide.
Le gène rapporteur, précédé du promoteur portant les sites de liaison de Gal 4 (répétés 6x), est
inséré dans le génome de la levure. Parmi les sites de liaison de Gal4, l’UAS de Gal1 est souvent
utilisé.
UAS : Upstream Activated Sequence
Les deux plasmides sont co-transformés dans la souche de levure appropriée présentant le gène
rapporteur sous la dépendance d’une UAS de Gal4 et déficiente pour les gènes d’auxotrophie utilisés
comme marqueurs de sélection.
Les protéines X et Y n’interagissent pas.
Y
Gal 4
AD
Pas d’expression
X
ARN
Pol II
Gal 4
BD
Gène rapporteur
Sites de liaison de Gal 4
Les protéines X et Y interagissent.
X
Y
Gal 4
BD
Expression
Gal 4
AD
ARN
Pol II
Gène rapporteur
Sites de liaison de Gal 4
Si le gène rapporteur est LacZ, les colonies positives seront capables de pousser sur milieu galactose
et, en présence de Xgal, les levures seront bleues.
Xgal : Le X-gal, ou 5-bromo-4-chloro-3-indolyl-beta-D-galactopyranoside est un
dérivé du galactose, lié à un noyau indole. Il peut être hydrolysé par la βgalactosidase, produit du gène LacZ, en formant un composé bleu, ce qui permet de
détecter la présence de cette enzyme.
Le dosage de l’activité β galactosidase peut nous donner une idée de la force de l’interaction.
Xgal
24/10/2011
190
Les levures utilisées pour ce double hybride seront donc : Gal4-, déficientes pour les gènes
d’auxotrophie utilisés, et porteront le gène rapporteur (sous la dépendance de Gal4) inséré dans
leur génome
Les limites de la méthode sont essentiellement le très grand nombre de clones artéfactuellement
positifs ou négatifs.
1 - Faux positifs (signaux « positifs » artéfactuels en double hybride).
Pour limiter le nombre de faux positifs, il est nécessaire, en préalable ou suite au criblage,
d’effectuer de nombreux contrôles et d’utiliser comme « marqueur » d’interaction plusieurs gènes
rapporteurs différents par la séquence de leur promoteur.
On utilisera, chaque fois que cela est possible, des contrôles positifs (deux protéines dont
l’interaction a déjà été caractérisée) et des contrôles négatifs (des protéines dont on sait qu’elles ne
présentent pas d’affinité l’une pour l’autre, transfection d’un plasmide vide avec l’autre plasmide
recombinant).
Faux positifs les plus fréquemment rencontrés :
¾
Transactivateurs :
C’est la capacité de X ou Y à activer spontanément la transcription des gènes rapporteurs lorsqu’ils
sont fusionnés à BD ou AD.
1er cas : l’appât X est transactivateur, la transactivation peut être directe (a) ou se faire via une
interaction avec une protéine résidente de la levure (b)
(a)
Lea une
la protéine appât
u2
activité transactivatrice
Leappât X lie une protéine de la Leu
levure
(b)La protéine
2
u2 la transcription
capable d’activer
Y
X
X
AD
Z
BD
BD
Contrôles: expression indépendante de la protéine de fusion BD-X dans S. cerevisiae (témoin négatif)
2ème cas : la proie Y est transactivatrice. Ceci a lieu quand la protéine AD-Y est recrutée au
promoteur Gal de manière indépendante de la proie. Il y a 2 cas classiques :
1.
liaison directe de Y au promoteur (a)
2.
liaison à des protéines (b) de l’hôte complexées au promoteur (ex : TATA Binding Protéine)
(a)
(b)
Y
AD
24/10/2011
Y
191
AD
TB
Contrôles à effectuer : expression de AD-Y seul (témoin négatif)
¾
Faux positifs dus à une affinité artéfactuelle des protéines proies et appât par les domaines
BD et AD
2 cas classiques :
1. La protéine proie reconnaît BD
Y
X
AD
BD
2.
Contrôle (témoins négatifs): combinaison
AD-Y + BD
La protéine appât reconnaît AD
Y
X
AD
BD
¾
Contrôle : combinaison BD-X + AD
Intervention d’une troisième protéine Z « adaptatrice » :
X
Z
Y
AD
BD
Contrôle avec techniques d’étude des
interactions protéine/protéine in vitro
(ex : GST-pull-down, co-immunoprécipitation)
2 - Faux négatifs (incapacité à mettre en évidence par double hybride des interactions qu’on
sait exister in vivo).
¾ La (les protéines) n’est (ne sont) pas produite(s) dans la levure
¾ La protéine n’entre pas dans le noyau ⇒ Contrôle : Vérifier la présence et la localisation de nos
protéines de fusion dans les levures (par exemple en immunofluorescence)
24/10/2011
192
¾ Certaines modifications post-traductionnelles sont absentes
¾ Protéines chimériques mal repliées
¾ Les protéines ne sont pas dans leur environnement naturel ⇒ pas d’interaction possible dans un
environnement autre (pH, concentration saline, … non adéquat)
⇒ Contrôle : tester, chaque fois que c’est possible, une proie connue pour interagir avec l’appât
Conclusion
♦ La méthode du double hybride permet de montrer que 2 protéines sont capables d’interagir de
façon binaire lorsqu’elles coexistent dans le noyau de la levure. La technique n’est pas suffisante en
soi pour valider une interaction.
♦ Le résultat doit être validé par d’autres types d’expériences complémentaires (coimmunoprécipitation, pull-down)
♦ Nécessité d’une validation biologique : les deux protéines coexistent-elles dans l’organisme ?
L’interaction peut-elle avoir une signification biologique ?
Références
Brachmann and Boeke (1997) Current opinion in biotechnology 8: 561-568
¾
¾
Vidal M. and Legrain P. (1999) Nucleic Acids Research 27, n° 4, 919-929;
¾
Fashena et al. (2000) Gene 250, 1-14
¾
Suter B, Kittanakom S, Stagljar I. (2008) Curr Opin Biotechnol. Aug;19(4):316-23.
3.4 – Complémentation (PCA Protein fragment Complementation Assay).
Cette méthode permet de tester les interactions protéine-protéine à l’intérieur des cellules vivantes,
quelles qu’elles soient. Elle permet soit d’étudier une interaction entre des protéines connues, soit
d’identifier, à partir d’une banque d’ADNc, le (les) partenaires d’une protéine. Dans la stratégie PCA,
une enzyme ou une protéine facilement détectable soit directement par sa présence (protéine
fluorescente) soit par son activité (par exemple avec la β galactosidase). Cette protéine est appelée
« reporteur ». Elle sera alors séparée en deux fragments et les deux fragments seront fusionnés avec
les protéines dont on veut tester l’interaction (protéines A et B dans le schéma ci dessous). L’activité
de la protéine reporteur est alors conditionnelle de l’interaction entre les deux partenaires. Les deux
fragments de la protéine reporteur ne doivent pas à être capables de s’associer indépendamment des
protéines A et B.
Avantages de la stratégie PCA :
24/10/2011
193
¾ Les interactions moléculaires sont visualisées plus directement – et non au travers d’événements
secondaires comme une activation transcriptionnelle -> moins de faux positifs/négatifs.
¾ Ces expériences peuvent être réalisées dans tous organismes et types cellulaires.
¾ La localisation cellulaire peut-être choisie, y compris au niveau des membranes.
Inconvénients de la technique PCA:
¾ peut manquer de sensibilité si les constantes d’affinité entre les protéines à tester sont faibles.
¾ L’interaction entre les protéines A et B doit permettre le rapprochement dans l’espace des deux
parties du reporteur – pour pallier à ce problème, on utilise des espaceurs – séquences de quelques
acides aminés (souvent des glycines) qui permettent une grande flexibilité dans le positionnement des
deux parties des protéines de fusion. On peut aussi tester les fusions en N et C terminal des protéines
reporteurs.
Les protéines reporteurs utilisées peuvent être de différentes natures, l’une d’elles est présentée
ci-dessous.
luciférase (Osawa et al, 2001)
Certains êtres vivants tels que la luciole (firefly) émettent
spontanément de la lumière par un phénomène appelé
bioluminescence.
La luciférase de type Firefly est une protéine monomérique de
61kDa très utilisée en imagerie de bioluminescence. Cette
protéine catalyse l’oxydation de la luciférine selon les réactions
décrites dans la figure ci-contre: l’activation de la luciférine par
la luciférase en présence d’ATP permet la formation d’un
complexe instable qui émettra de la lumière lors de son retour à
un état fondamental.
Réaction d’oxydation de la luciférine par la luciférase Firefly
Ici, la luciférase sera séparée en deux parties :
la partie N terminale (acide aminés 1 à 437)
et la partie C terminale (acides aminés 438 à 544).
Ces deux parties ne sont pas capables de s’associer.
24/10/2011
194
L’activité de la luciférase est détectée par la mesure de la bioluminescence émise en présence de
luciférine.
Ozawa T, Kaihara A, Sato M, Tachihara K, Umezawa Y. 2001 Anal Chem. 73(11):2516-21.
4
Recherche
de
partenaires
protéiques
à
partir
d’un
extrait
protéique :
Co-
immunoprécipitation (co IP)
Bille de sépharose
4 – 1 : Principe général :
La co immunoprécipitation est une technique qui consiste à
isoler un complexe protéique en utilisant un anticorps dirigé
contre un des membres du complexe. Si on recherche les
Anticorps
partenaires de la protéine X, on va donc utiliser un Ac antiX
qui nous permettra de l’immunoprécipiter. Avec elle seront
Protéine A
isolés ses partenaires protéiques. Ces protéines seront alors
Protéine
cible
identifiées.
L’anticorps utilisé sera de préférence un anticorps polyclonal, afin d’éviter que l’épitope reconnu par
l’anticorps ne soit masqué dans le complexe.
L’immunoprécipitation se fera alors en utilisant de la protéine A ou de la protéine G, couplée à des
billes de sépharose, d’agarose ou des billes magnétiques. Le choix protéine A / protéine G dépend de
l’anticorps que l’on va utiliser (ex. protéine A pour un IgG préparé chez la souris).
Les protéines A et G sont des protéines recombinantes d’origine microbienne qui présentent la
capacité de fixer les molécules d’immunoglobuline de mammifère. Ces protéines sont couplées de
façon covalente à des billes de sépharose. L’interaction entre ces protéines et les immunoglobulines
n’est pas équivalente pour toutes les catégories d’anticorps :
Antibody
Human IgG
Goat IgG
Chicken IgG
Protein A
S
W
NB
Protein G
S
S
NB
W = interaction faible
S = interaction forte
NB = pas d’interaction; — non testé
Si les Ig dont nous disposons pour faire l’immunoprécipitation ne se fixent ni sur la protéine A, ni sur
la protéine G, il est toujours possible de faire un « sandwich » :
4 – 2 : le matériel de départ :
Le matériel de départ correspond à un extrait protéique qui sera réalisé par une lyse des cellules,
suivie d’une sonication (pour casser l’ADN, ce qui permet de diminuer la viscosité de la solution)
puis d’une clarification par centrifugation (afin d’éliminer les débrits cellulaires). Si le nombre de
protéines ainsi isolées est trop important et si on connaît la localisation de la protéine appât dans la
Partenaire
24/10/2011
195
cellule, on peut simplifier le système en faisant du fractionnement cellulaire. Le même protocole
précédemment décrit sera alors appliqué après fractionnement.
4 – 3 : Méthodologie :
Pratiquement, on va dans un premier temps réaliser l’interaction extrait protéique/protéineA ou G
fixée sur les billes. Cette étape va nous permettre d’éliminer toutes les protéines de l’extrait qui se
fixent sur les billes de façon non spécifique (clearing).
On va alors centrifuger et récupérer le surnageant. Puis on va ajouter l’anticorps dirigé contre notre
protéine puis, enfin, un nouveau lot de billes protéine A/ G.
On va à nouveau centrifuger (ou passer sur le portoir aimanté) et récupérer les billes que l’on va laver
afin de se débarrasser de toutes les interactions non spécifiques.
Enfin, il faudra éluer les complexes des billes. Différentes techniques sont alors possibles en fonction
du type d’analyse que l’on veut réaliser sur les co-immunoprécipitats (reprendre dans du tampon
SDS/DTT et chauffer si on veut faire une séparation sur gel polyacrylamide dénaturant, élution par la
force ionique si on ne veut pas récupérer notre protéine, élution par un peptide compétiteur, élution
par choc acide, …)
4 – 4 : Identification des protéines du complexe :
Une fois les complexes isolés, elles devront être identifiées. Cependant, une étape de séparation des
membres du complexe est généralement utilisée comme étape préliminaire.
Séparation des protéines
9
Gel 1D (dénaturant, de type SDS-PAGE)
C’est la façon la plus simple de procéder mais on peut être limité par la qualité de la résolution
(bandes trop proches sur le gel pour pouvoir être séparées). Pour améliorer la résolution du gel, on
peut jouer :
Sur le % en acrylamide, éventuellement en gradient
Sur le tampon de migration (tris tricine par exemple)
Sur la taille du gel
Une fois les protéines séparées, il faut les identifier.
Identification des protéines
9
Western blot
Si on présume de la présence d’une protéine partenaire P déjà connue, on peut faire un western blot à
l’aide d’un anticorps anti-P.
Si les protéines ont été récupérées par co-immunoprécipitation, on peut, dans certains cas, rencontrer
un autre problème : la protéine que l’on veut détecter migre à la même vitesse que les chaînes lourdes
ou légères des anticorps qui nous ont servi à immunoprécipiter. Dans ce cas là, deux solutions sont
possibles.
24/10/2011
196
¾ Utiliser des anticorps secondaires qui détectent la forme native (avec les ponts disulfide) des
immunoglobulines, permettant ainsi de ne pas révéler les anticorps qui ont permis de réaliser
l’immunoprécipitation qui eux sont dénaturés (traités au SDS).
¾ Une deuxième possibilité consiste à utiliser pour le western blot un anticorps réalisé dans une
espèce différente de celle qui a été utilisée pour fabriquer l’anticorps utilisé en immunoprécipitation.
9
Digestion trypsique / Spectroscopie de Masse Maldi-ToF
La première étape consiste à découper la/les bandes d’acrylamide qui contiennent des protéines. Pour
cela, il faut colorer le gel. Le bleu de coomassie est le plus souvent utilisé pour cette étape.
Une alternative à cela consiste à analyser l’ensemble du gel. Pour cela, la piste de migration sera
découpée en bandes de tailles égales et chacune de ces bandes sera analysée.
Les bandes découpées sont alors digérée à la trypsine (ou toute autre protéase spécifique). La masse
précise de l’ensemble des peptides obtenus est alors déterminée par spectrométrie Maldi ToF (ou
autre spectrophotomètre de masse présentant ce type d’ionisation). La comparaison avec des banques
de données nous permet d’identifier la protéine recherchée.
Si des ambiguïtés restent à lever, un séquençage par LC/MS/MS est possible, il nous permettra
d’obtenir la séquence de 5 à 10 acides aminés. La digestion trypsique est alors toujours une digestion
totale et la séparation des peptides est réalisée grâce à un système de chromatographie en phase
liquide (LC) qui est couplé au Spectro de Masse (en tandem). Le premier étage de MS sert à
sélectionner un ion, et le second analysera les ions issus de la fragmentation de celui-ci. La
fragmentation se réalise par coupure au niveau des liaisons peptidiques principalement (et ce à partir
des deux extrémités). Il est alors possible de déduire de l'ensemble des ions obtenus la séquence
peptidique lue simultanément dans les deux sens.
4 – 5 : Avantages/inconvénients :
Avantages de la co IP ::
¾
Le complexe s’est formé in vivo avec de la protéine «endogène» .
¾
L’affinité Ag/Ac est généralement très forte et spécifique.
Inconvénient de la coIP :
¾
Il faut avoir un Ac immunoprécipitant c'est-à-dire un anticorps reconnaissant la protéine appât
au sein d’un complexe avec à la fois une forte affinité et une grande spécificité.
¾
Un autre inconvénient est la quantité de protéine appât endogène dans les cellules. Si elle est
trop faible, la quantité de complexe isolée ne sera pas suffisante pour isoler les complexes.
¾
Dans le cas de complexes de tailles très importantes, le/les épitope(s) peuvent être masqués,
on ne pourra pas alors utiliser cette méthode.
24/10/2011
197
Pour cette technique également, il faudra réaliser différents contrôles et en particulier extrait
+billes protéine A/G+Ac non spécifique.
4 – 6 : Alternatives à la Co Immunoprécipitation :
- Chromatographie d’affinité, pull down.
Quand l’immunoprécipitation n’est pas possible (on n’a pas d’anticorps utilisable pour
l’immunoprécipitation ou la protéine appât est en concentration trop faible dans nos cellules pour
récupérer suffisamment de complexes pour leur analyse ultérieure), on utilisera des variantes à cette
techniques que sont les chromatographies d’affinité ou les « pull down » (chromatographies d’affinité
pour lesquelles la phase stationnaire n’est pas insérée dans une colonne mais est récupérée par
centrifugation.
Pour la purification d’un complexe protéique associé à une
protéine X, on utilise un support solide constitué de billes
d’agarose ou de sépharose sur lesquelles on a greffé un
ligand présentant une forte affinité avec la protéine X.
Support
solide
Tag
Protéine
cible
Ces billes seront alors introduites dans une colonne. Ensuite on fait passer l’extrait de protéine
contenant la protéine X.
Après différents lavages, l’élution se fera le plus souvent à l’aide d’un compétiteur. Une autre
possibilité est d’utiliser un gradient de force ionique. Dans ce dernier cas, sortiront les premières les
protéines faiblement associées dans le complexe (souvent par des liaisons indirectes), puis celles plus
fortement liées.
Si la protéine appât ne possède pas naturellement de ligand connu, on utilisera une protéine X taguée.
C tag sera éloigné de notre protéine grâce à un espaceur qui permettra l’interaction quelque soit la
taille et la géométrie du complexe. On a alors deux possibilités : soit on transfecte (transforme) nos
cellules par un vecteur d’expression portant l’ADNc de la protéine appât fusionné avec une (ou
plusieurs) étiquette(s), soit la protéine tagguée aura été au préalablement préparée.
Dans ces cas là, c’est le ligand du tag qui sera fixé sur les billes. Si on a inséré un site reconnu par une
protéase spécifique entre le tag et la protéine X, l’élution pourra se faire par digestion de ce site.
L’inconvénient de ces deux variantes est qu’on ne travaille plus sur une protéine sauvage mais sur
une protéine modifiée. La quantité de protéine appât est généralement plus importante que la protéine
endogène ce qui peut engendrer des faux positifs.
♦ Pull down
Une variante de la chromatographie d’affinité est utilisée mais, au lieu de retenir les billes dans une
colonne, on les sédimentera par centrifugation. Une autre variante consiste à utiliser des billes
magnétiques. La récupération se fera alors par l’intermédiaire d’un aimant.
Ex. GST pull down, billes magnétiques, complexe formé in vitro.
Partenaire
24/10/2011
198
GST : glutathione Sulfo Transférase – fusionné avec la protéine X – entre les deux, un site de
digestion à la thrombine.
On veut tester la liaison de la protéine
X avec la protéine Y. Pour cela, on va
:
1 - fusionner la protéine X avec la
Fixation et
lavage
GST et marquer la protéine Y.
2 - fixer la protéine X sur des billes de
glutathione sépharose
3 - ajouter la protéine Y en présence
Protéine X, fusionnée à la GST
SDS-PAGE
Bille
glutathione sépharose
Si on ne veut pas marquer la protéine Y, on peut la détecter
par de
western.
Protéine
Y, radioactive
La même technique est utilisée pour aller « pêcher » des
partenaires
de la protéine X dans un
extrait
protéique complexe.
Autoradiographie
Protéines compétiteurs
Coloration
coomassie
! Penser aux témoins : billes + extraits, billes + GST + extraits car des interactions non spécifiques de
ce type peuvent être obtenues et ce, indépendamment de la protéine X.
Autres systèmes utilisés : steptavidine/biotine, Ni/6xHis, maltose/MBP, …
Avantage de cette technique : simple et rapide
Inconvénients :
¾
Dans le cas des GST-pull-down, la taille importante de la GST peut entrainer un
encombrement stérique qui peut gêner la fixation de certains membres du complexe. On peut dans ce
cas là essayer de mettre le tag en C-terminal si il était en N (ou vice-versa). On peut aussi mettre un
« espaceur » entre le tag et notre protéine. Enfin, on peut aussi essayer avec un autre tag plus petit
(flag, 6xHis, …)
¾
Souvent des « faux positifs », valider la validité de ces interactions par une autre technique, si
possible « in vivo ».
Quelle que soit la technique utilisée, les interactions doivent ensuite être vérifiées in vitro et
même de préférence in vivo afin de
¾
S’assurer de la validité de l’interaction
¾
Vérifier si cette interaction est directe ou indirecte.
24/10/2011
5
199
Etude/vérification des interactions protéine/protéine.
5.1 -> Vérification par une des techniques précédemment citées
Pour tester l’interaction entre une protéine X et une protéine Y ou vérifier la validité d’un partenaire
identifié par l’une des techniques précédemment citées, toutes les techniques permettant de
rechercher des partenaires protéiques peuvent être utilisées. Cependant, dans le cas de la vérification
d’une interaction, il faudra changer de type d’expérience mais aussi inverser la nature de l’appât et de
la proie (ex. : si la protéine Y a été identifiée comme partenaire de la protéine X en utilisant cette
dernière comme appât, la vérification se fera en prenant la protéine Y comme appât).
Pour vérifier si l’interaction est directe, on fera un pull down à partir des deux partenaires purifiés.
5.2 -> Vérification de l’interaction in vivo
♦
Colocalisation par immunofluorescence
Rappels sur l’immunofluorescence : L'immunofluorescence est une technique qui permet la
détection et la localisation d'une ou plusieurs protéines grâce à l'utilisation d'anticorps spécifiques. La
réalisation d'un marquage passe par différentes étapes : (i) prétraitement (fixation et perméabilisation)
du tissu ou des cellules, (ii) ajout de l'anticorps primaire puis lavages, (iii) ajout de l'anticorps
secondaire spécifique de l’anticorps primaire couplé à un fluorochrome puis lavages, (iv) révélation
du signal fluorescent à l'aide d'un microscope de fluorescence ou par microscopie confocale.
L'immunofluorescence est utilisée sur les
cellules en culture (on parlera alors
d'immunocytochimie) ou sur des coupes de
tissus (immunohistochimie).
I
ii
iii
iv
Utilisation de l’immunofluorescence pour faire de la colocalisation de protéines :
L’immunofluorescence sera réalisée de la même façon que décrite précédemment mais on met les
deux anticorps primaires dirigés contre les deux protéines dont on veut tester la colocalisation puis les
deux anticorps secondaires dirigés contre les deux anticorps primaires et portant des fluorochromes
différents. Il est impératif que les deux anticorps primaires soient de types différents afin que l’on
puisse différencier les deux signaux et que les deux fluorophores aient des spectres d’émission
24/10/2011
200
suffisamment éloignés. L’acquisition des deux signaux se fait indépendamment puis on superpose les
deux images pour voir s’il y a colocalisation.
Dans l’exemple montré ci-contre, la première protéine est détectée avec
un anticorps préparé dans la chèvre et la deuxième avec un anticorps
préparé dans la souris. L’anticorps secondaire permettant de révéler la
première protéine est un anticorps anti anticorps de chèvre couplé à la
Cy3 (fluorescence rouge) et l’anticorps secondaire permettant de révéler
la deuxième protéine est un anticorps anti anticorps de souris couplé au
FITC (fluorescence verte). La superposition des deux images montre un
signal jaune, ce qui nous permet de valider l’hypothèse d’une
colocalisation de ces deux protéines.
Avantages de cette technique : la visualisation de la colocalisation se fait in vivo sur des protéines
endogènes.
Inconvénients :
¾
Il faut avoir des anticorps spécifiques des deux protéines à tester, les anticorps doivent pouvoir
être différenciés (organismes à partir desquels ils ont été préparés différents ou isotypes différents
IgG pour un et IgM pour l’autre par exemple).
¾
La concentration de chacune des protéines doit être suffisamment importante pour pouvoir
être révélée par cette technique qui n’est pas très sensible.
Parfois, on fait de l’immunofluorescence directe. Dans ce cas particulier c’est l’anticorps primaire qui
porte le fluorochrome, la révélation se fait alors sans passer par la troisième étape. Ceci permet d’une
part de diminuer le bruit de fond dû à des interactions non spécifiques des divers anticorps utilisés et
d’autre part permet de faire de la colocalisation alors que les deux anticorps dont nous disposons sont
du même type (IgG de type 1 de souris par exemple).
♦
Protéines de fusion
Dans le cas où des anticorps ne sont pas disponibles ou si la quantité de protéine à tester est
insuffisante pour la détection en immunofluorescence, une alternative est l’utilisation de protéine de
fusion entre la protéine d’intérêt et des protéines naturellement fluorescentes comme la GFP (Green
Fluorescent Protein) ou un de ses mutants (BFP – Blue Fluorescent Protein, CFP - Cyan Fluorescent
Protein ou encore YFP – Yellow Fluorescent Protein). Le gène de la GFP a été initialement identifié
24/10/2011
201
chez la méduse Aequorea Victoria. Les autres protéines (BFP, CFP, YFP, …) ont été produites par
biotechnologie (mutagénèse de la séquence sauvage).
Avantage de cette technique : la visualisation est directe, on n’a donc plus de problèmes de bruit de
fond lié à des interactions non spécifiques des anticorps (primaires et secondaires avec d’autres
constituants cellulaires). D’autre part, comme on contrôle la quantité de protéine produite, on n’est
donc plus limité par cette quantité.
Inconvénients : on ne travaille plus avec des protéines endogène ni à des concentrations
physiologiques. On n’est donc pas assuré d’avoir la localisation naturelle des protéines à tester.
Pour ces deux dernières techniques, l’interaction n’est pas prouvée, on montre juste que cette
interaction est possible de part la localisation des partenaires. Ces expériences ne sont donc en
aucun cas suffisantes pour démontrer une interaction.
♦
FRET (Föster Resonance Energy Transfer)
Le FRET est une technique qui permet de détecter la proximité de deux molécules. Chacune de ces
molécules porte un groupement fluorescent et la technique repose sur le transfert, par résonance, de
l’excitation de l’un de ces groupements (le donneur) à l’autre (l’accepteur) sans émission d’un
photon.
Pour cela, les deux partenaires de l’interaction (protéine A et B) doivent être conjugués avec un
couple de fluorophores de couleurs différentes (donneur et accepteur). On excite ensuite le donneur
A. Quand l’interaction entre A et B amène les colorants fluorescents à faible distance l’un de l’autre,
un signal de fluorescence nouveau (issu de l’émission du receveur B) est développé. La présence de
ce signal confirme la faible distance et donc l’interaction entre A et B. Ces interactions peuvent être
suivies en temps réel grâce à une caméra jointe au microscope à fluorescence.
Pour réaliser le transfert d’énergie de fluorescence, les spectres d’absorption de la première molécule
fluorescente (le donneur) et de la deuxième molécule fluorescente (l’accepteur) doivent se
superposer.
La famille des GFP (Green Fluorescent
Protein) offre différentes paires de mutants
utilisables pour des expériences de FRET.
Par exemple, le mutant appelé EGFP
(Enhanced GFP) et le mutant appellé BFP
(Blue Fluorescent Protein).
24/10/2011
202
Avantage de cette technique : La visualisation de l’interaction se fait dans les cellules vivantes
Inconvénients : on ne travaille pas sur des protéines endogènes.
♦
BRET
Une variation de cette technique est le BRET (Bioluminescence Resonance Energy Transfert).
Dans cette variante, le « donneur » est une molécule capable d’émettre des photons. Les photons émis
iront, si la distance entre le donneur et l’accepteur est suffisamment faible, exciter l’accepteur.
Généralement, le donneur est la luciférase de Renillla, qui sera fusionnée à une protéine d’intérêt
(protéine A). La GFP est fusionnée à l’autre protéine d’intérêt (protéine B), susceptible d’interagir
avec la protéine A. La luciférase est excitée à l’aide d’un substrat qui pénètre dans la cellule (la
cœlenterazine).
La luciférase de Renilla, initialement isolée à partir de l’organisme Renilla Reniformis (pensée de
mer) est une enzyme de 36 kDa qui catalyse l'oxydation de la coelentérazine en présence d’oxygène.
Cette réaction catalytique produit une lumière bleue avec un pic d'émission à 480 nm.
Si les deux protéines n’interagissent pas, on ne détecte que le signal émis par la luciférase. Si les deux
protéines interagissent, il y a transfert d’énergie entre la luciférase et la GFP et l’on peut mesurer un
signal supplémentaire émis par la GFP à 530 nm. Le transfert d’énergie reflète une interaction
physique étroite : pour qu’il y ait transfert d’énergie, la distance entre la luciférase et la GFP doit être
inférieure à 100 Å.
24/10/2011
203
Avantage de cette technique : Les mêmes que pour le FRET mais, en plus, le BRET est plus sensible
que le FRET et elle permet de s’affranchir d’une source excitatrice extérieure évitant ainsi les
problèmes de photoblanchiment des GFP, d’effet de filtre des milieux à la longueur d’onde
d’excitation du donneur ou encore de l’excitation croisée de l’accepteur.
Inconvénients : Les mêmes que pour le FRET
6 - Cross-linking (association par des agents pontants)
On l’utilisera en complément d’une des techniques décrites ci-dessus chaque fois que l’on voudra
stabiliser une interaction.
Le principe consiste à associer de façon covalente la protéine à tester avec son partenaire avant
d’isoler le complexe. Cette technique nous permet de révéler des complexes présentant des
interactions de faible affinité. Elle peut aussi se réaliser in vivo, à condition que les agents crosslinkant utilisés traversent les membranes de la cellule. Enfin, en utilisant un ensemble d’agents
pontants qui agissent à des distances variables, on pourra positionner les différents constituants au
sein d’un complexe multimoléculaire.
Les agents cross-linkant chimiques :
Il existe un très grand nombre d’agents cross-linkant chimiques. Ils se distinguent :
•
…)
Par la nature du résidu impliqué dans le cross-link (amine, sulfhydryls, carboxyls, hydroxyls,
24/10/2011
204
•
Par la distance entre les deux espèces à cross-linker (de 1,5 à plus de 30 A)
•
Par la possibilité de réverser le cross-link (certains ne sont pas réversibles, d’autres le sont en
présence de thiols, d’un milieu basique, …)
•
Le milieu dans lequel ils sont solubles (on choisira de préférence ceux qui le sont en milieu
aqueux pour un cross-link in vivo)
•
Leur capacité à traverser les membranes de la cellule (indispensable pour un cross-link in
vivo)
•
Le nombre de partenaires (deux ou plus) qu’ils peuvent assembler, …
La société Pierce en commercialise un très grand nombre, toutes leurs caractéristiques sont
répertoriées dans leur catalogue. Leur site sur le web – www.piercenet.com permet même un guide de
sélection de l’agent cross-linkant en fonction de l’expérience que l’on veut réaliser.
Cette technique ne permet pas d’affirmer qu’il y a interaction directe entre les deux partenaires, il
peut y avoir seulement une proximité dans l’espace qui peut être due à une interaction indirecte.
1. Caractérisation de l’interaction
♦ Quelle partie de la protéine X interagit avec la protéine Y
Beaucoup de protéines, en particulier des protéines eucaryotes, présentent une structure avec
différents domaines structuraux indépendants. Dans ce cas, la protéine peut être « découpée » en
différents morceaux capables de se structurer dans l’espace indépendamment les uns des autres. Dans
ce cas là (et dans ce cas là uniquement), on peut rechercher le ou les domaines impliqués dans
l’interaction protéine/protéine.
Î définition des domaines structuralement indépendants
¾ il est nécessaire de connaître la structure de la protéine soit directement (RMN ou
cristallographie), soit parce qu’elle appartient à une famille dont la structure est connue,
soit parce qu’elle présente des domaines structuralement identifiés.
Ex : 1 séquence protéique pour X – bioinfo (voir TP bioinfo)-> 1 domaine POU (lui-même
constitué de deux sous domaines POUh et POUs), 1 domaine GLU, 1 domaine ring. Pour
Y, pas de domaines structuraux définis
POU
GLU
RING
24/10/2011
205
¾ Clonage de ces sous domaines
clonage dans un vecteur d’expression, production, éventuellement purification (pas obligé)
PCR
Etude de leur interaction (far western, coIP, pull down…) avec Y repérable (marquage par exemple).
♦ Kd, Kon, stœchiométrie de l’interaction, détermination des paramètres de tampon, …
9 Ultracentrifugation analytique
L'ultracentrifugation analytique (UCA) est une méthode de choix pour l'étude des interactions en
solution. En effet, elle permet de déterminer les stœchiométries, les processus d'association,
l'agencement spatial des sous-unités dans des complexes, l'influence des paramètres du solvant (pH,
sel, température).
Il existe deux types principaux d’expériences de sédimentation :
Î vitesse de sédimentation
Î équilibre de sédimentation
La plus utilisée pour étudier les interactions protéine/protéine est la deuxième.
Pratiquement, on va mesurer précisément la masse des particules présentes dans des solutions
présentant des concentrations croissantes en protéine A, protéine B, et protéine A + protéine B. On
pourra ainsi en déduire
•
si la protéine A est présente en solution sous forme d’un monomère ou d’un multimère
•
idem pour la protéine B
•
si les protéines A et B s’associent. Si cela est le cas, la stœchiométrie de l’interaction sera
déduite de la masse du complexe.
Des expériences de diffusion de lumière (DLS – Dynamic Light scattering) peuvent nous apporter en
plus une information sur la forme du complexe, information qui peut nous aider à proposer un
modèle d’interaction pour ce complexe.
9 Biacore
24/10/2011
206
La fonction de cet appareil est déjà suggérée par son appellation : "BIA" signifie Biospecific
Interaction Analysis et "core", au cœur de. En effet, le BIAcore est un automate qui permet de
mesurer en temps réel toute interaction biologique sans marquage de molécules. L'intérêt majeur de
cette mesure en temps réel est de pouvoir visualiser, sur l'écran, la cinétique de l'interaction et d'en
dégager ses caractéristiques propres. On peut ainsi mesurer les vitesses d'association et de
dissociation et en déduire la constante d'affinité et la constante de dissociation
Son principe de fonctionnement est d'enregistrer, en continu, à la surface d'une lamelle réactive
(appelée "sensor chip") la modification de résonance induite par toute interaction moléculaire
[résonance plasmonique de surface ( S P R ) ] . Cette modification est directement proportionnelle à la
masse de molécule liée et à sa quantité fixée sur le chip.
Le système de mesure est composé de trois éléments :
1. Le sensor chip
Il comprend une lamelle de verre sur laquelle est déposée une fine pellicule d'or elle-même
recouverte d'une couche de dextran carboxyméthylé sur lequel on couple de façon covalente la
première molécule impliquée dans la réaction que l'on veut étudier. Le couplage peut se faire par les
groupements amines, par les sucres ou par les groupements thiols selon des procédés de chimie
classique.
2. La micro-plaquette fluidique
Elle contrôle l'injection (de 5 à 300 microlitres) et le débit (de 1 à 100 microlitres/mn) des réactifs
à la surface du sensor chip.
3. L'unité optique
Une lumière polarisée est envoyée sur un prisme de verre, en contact direct avec la lamelle de
verre du sensor chip. L’appareil mesure et enregistre les changements de l’indice de réfraction
générés par un faisceau de lumière polarisée dirigée vers la face opposée de la feuille d’or lors du
processus d’association et de dissociation de A et B. Le faisceau réfléchi, qui est analysé en temps
réel par un ensemble de diodes, montre une extinction partielle pour un angle précis d’incidence, qui
dépend de l’indice de réfraction au voisinage de la feuille d’or. Les signaux obtenus, mesurés en
unités arbitraires (unités de résonance ou RU) sont proportionnels à la masse de B adsorbée à la
24/10/2011
207
surface (pour les protéines, 1 RU approximativement égal à 1 pg.mm-2). Les courbes obtenues sont
alors traitées par le logiciel BIAevaluation -> constante d’équilibre à l’interface K’d. L'interaction
peut être analysée rapidement en quelques minutes et nécessite de très petits volumes de réactifs (80
microlitres en moyenne).
En pratique, une protéine ligand (A) est immobilisée sur un support (chip).
On distingue alors trois phases :
1 - Phase d’adsorption : un tampon circule en flux continu à sa surface. Dans ce tampon se trouve la
protéine (B) qui interagit avec la protéine (A).
2 - Phase de désorption : un tampon n’incluant pas B est injecté, conduisant à une dissociation
progressive des complexes AB formés.
3 – Phase de régénération : la dissociation est brutalement accélérée, aboutissant à une surface vierge
de B, comme au début de l’expérience.
9
Microcalorimétrie [Microcalorimétrie isotherme à titration (ITC)]
1) Principe et méthode
24/10/2011
208
Afin de mesurer l’interaction entre deux molécules et les paramètres thermodynamiques qui en
découlent, il est nécessaire de mesurer les échanges thermiques dus aux associations entre ces
molécules. Le principe est le suivant : une macromolécule est placée dans la cellule de mesure d’un
calorimètre isotherme puis est progressivement saturée par injection à l’aide d’une seringue de petits
volumes de la deuxième molécule. L’interaction entre 2 molécules peut s’accompagner d’un échange
de chaleur (absorption ou émission). Le suivi des interactions va se faire indirectement par suivi des
échanges thermiques. Prenons l’exemple d’un ligand se fixant sur une protéine :
En fonction de la quantité de complexe formée, on obtient des signaux thermiques proportionnels qui
seront visualisables sous forme de pics grâce à un logiciel (Origin). La mesure du signal thermique
permet donc de mesurer la quantité de complexe formé, et ainsi de mesurer les paramètres
thermodynamiques de l’interaction.
Ligand + protéine = complexe + ΔH
Ainsi, la microcalorimétrie isotherme à titration permet de mettre en évidence et de quantifier les
interactions entre diverses familles de protéines et leurs ligands potentiels et les modifications
structurales qui en découlent.
♦ Interactions moléculaires – structure 3D
Une protéine se replie et acquiert une conformation particulière dans l'espace. C'est cette structure
tridimensionnelle qui détermine la fonction que va jouer la protéine dans la cellule. Connaître cette
structure est donc une étape-clé si l'on veut comprendre le détail des mécanismes de la cellule, par
24/10/2011
209
exemple pour concevoir des médicaments. Pour étudier la structure tridimensionnelle des protéines,
mais aussi des complexes protéine/protéine, il y a plusieurs approches possibles :
9 La RMN (Resonnance Magnétique Nucléaire)
On excite les atomes de la molécule étudiée. Chaque atome résonne à une fréquence qui lui est
propre et qui dépend de son environnement magnétique. L'atome réémet un signal à cette fréquence.
La superposition des signaux provenant de tous les atomes est enregistrée puis analysée. En jouant
sur les différents types d'atomes et en utilisant des séquences d'excitation particulières, on peut faire
apparaître de façon sélective certaines propriétés géométriques comme la proximité de deux atomes à
travers l'espace ou leur proximité dans le squelette de la molécule. Contrairement à la
cristallographie, l'analyse des spectres de RMN ne donne pas accès immédiatement à la structure
tridimensionnelle. Il faut d'abord attribuer chaque fréquence de résonance à l'atome correspondant
dans la molécule, puis utiliser les données géométriques observées pour calculer la structure
tridimensionnelle globale. Aujourd'hui, la RMN est limitée par la résolution des spectres, qui dépend
directement de la puissance des champs magnétiques utilisés pour exciter les atomes.
La RMN en phase liquide est la seule méthode amenant à la structure atomique de macromolécules en
solution. Elle comporte cependant des contraintes significatives sur la taille des molécules étudiées (30 40 kDa au plus) comme sur leurs propriétés de solubilité.
La RMN du solide ouvre quant à elle des possibilités intéressantes, mais encore peu exploitées, pour
l’étude de macromolécules sous forme de poudre (donc non cristallisable) et pour les protéines
membranaires.
9 Cristallographie et diffraction aux rayons X
En envoyant des rayons X sur un cristal de protéines, on observe un spectre de diffraction. Grâce à une
transformation mathématique simple, il est possible d'accéder rapidement à la structure
tridimensionnelle des protéines dans le cristal. L'étape limitante de cette méthode est la production d'un
cristal pur (un monocristal). Elle peut être plus ou moins difficile, de façon plutôt imprévisible.
Amélioration de la technique : le rayonnement synchrotron.
Le rayonnement synchrotron permet la production d’un rayonnement X intense, stable, de longueur
d’onde variable et de grande qualité optique. Ils offrent des données exploitables pour des cristaux de
macromolécules que des méthodes classiques ne permettaient pas d’étudier : mailles plus grandes (et
donc molécules ou complexes plus grands), cristaux plus petits voire imparfaits. D’autre part, le
rayonnement synchrotron a considérablement accéléré la vitesse d’acquisition des données, réduisant
celle-ci à quelques heures au lieu de quelques semaines. La très grande majorité des études
cristallographiques contemporaines reposent sur l’utilisation de données collectées à partir d’un
synchrotron.
9 In silico
Il est possible de prédire in silico la structure tridimensionnelle d'une protéine X par homologie par
rapport à une autre protéine, de structure connue et présentant des homologies structurales avec la
protéine X.
24/10/2011
210
La prédiction ab-initio du repliement, sans autre information que la seule séquence de la protéine, reste
encore largement hors de portée, sauf cas exceptionnels. La méthode ab-initio nécessite des puissances
de calcul importantes.
Toute molécule dessinée doit être minimisée, c’est à dire que sa conformation doit être amenée à une
position stable. Cette procédure appelée minimisation est un processus itératif dans lequel les
coordonnées des atomes sont constamment ajustées jusqu'à amener la molécule à une énergie minimale.
La conformation ayant la plus basse énergie est considérée comme la plus stable.
Le docking est l'étude des interactions entre molécules.
D’autre part, différents programmes ou serveurs permettent soit de prédire les régions protéiques
permettant éventuellement à une protéine d’interagir avec une autre, soit de retrouver une interaction
déjà mise en évidence dans le passé.
Quelques exemples de ce type de sites :
banques d’interaction protéine/protéine
DIP : Database of Interacting Proteins : http://dip.doe-mbi.ucla.edu
Cette banque de donnée catalogue les interactions (déterminées expérimentalement) entre protéines.
Ce site présente un accès libre sur Internet et est supposé aider ceux qui étudient les interactions
protéine/protéine, les voix de signalisation les interactions multiples et les systèmes complexes.
prédiction de surfaces potentielles d’interaction
Protein – protein Interaction server : http://www.biochem.ucl.ac.uk/bsm/PP/server
Ce serveur nous fourni un moyen de calculer une série de paramètres descriptifs sur l’interface entre
deux chaînes polypeptidiques dans une structure protéique tridimensionnelle. En comparant ces
résultats avec des résultats obtenus avec des protéines connues pour interagir les unes avec les autres,
on peut estimer la validité de l’interface prédite entre nos deux protéines.
Inconvénient : ce programme ne fonctionne actuellement que sous Unix et nécessite une bonne
connaissance en biologie structurale et en bioinformatique.
9 Applications – conception de peptides inhibiteurs
Lorsqu'un composé actif de base (LEAD) a été identifié (expérimentalement ou in silico) et sa structure
chimique déterminée, on peut améliorer l'activité et/ou réduire les effets secondaires en modifiant sa
structure chimique de base.
Les peptides sont subséquemment optimisés par des modifications apportées aux chaînes latérales ou au
squelette de base. On peut ainsi concevoir des peptides avec des affinités supérieures à la cible (par
24/10/2011
211
rapport à la molécule de départ). Mais le plus grand défi qui reste à surmonter dans le cas des inhibiteurs
peptidomimétiques est de modifier ceux-ci pour qu'ils puissent être absorbés oralement et qu'ils ne se
décomposent pas rapidement dans l’organisme. Il faut alors trouver des inhibiteurs de type
nonpeptidique.
24/10/2011
212
Références
Adams M.D., Kelley J.M., Gocayne J.D., Dubnick M., Polymeropoulos M.H., Xiao H., Merril
C.R., Wu A., Olde B., Moreno R.F., Kerlavage A.R. McCombie W.R. et Venter J.C.
(1991) Science 252, 1651-1656.
Ahmad A., Akhtar M.S. et Bhakuni V. (2001) Biochemistry 40, 1945-55.
Ahern T.J. et Klibanov A.M. (1986) Dans Protein Structure, Folding and Design, 283-286, Alan
R. Liss ed.
Ahmadian A., Gharizadeh B., Gustafsson A.C., Sterky F., Nyrén P., Uhlén M. et Lundeberg J.
(2000) Anal. Biochem. 280, 103-110.
Andersson M.M., Breccia J.D. et Hatti-Kaul R. (2000) Biotechnol. Appl. Biochem. 32, 145-53.
Arakawa T. et Timasheff S. (1982) Biochemistry 21, 6545-6552.
Arakawa T., Bhat R. et Timasheff S. (1990) Biochemistry 29, 1914-1923.
Aronheim A., Zandi E., Hennemann H., Elledge S.J., Karim M. (1997) Mol. Cell. Biol. 17, 30943102.
Bachman B., Luke W. et Hunsmann G. (1990) Nucleic Acid Res. 18, 1309.
Bachmsair A., Findley D. et Varshavsky A. (1986) Science 234, 179-186.
Baird G.S., Zacharias D.A. et Tsien R.Y. (2000) Proc. Natl. Acad. Sci. U.S.A. 97, 11984-11989.
Baldwin E. Xu J. Hajiseyedjavadi O. Baase W. A. Matthews B. W. (1996) J. Mol. Biol. 259, 542559.
Bambara R.A., Uyemura D. et Choi, T. (1978) J. Biol. Chem. 253, 413-423
Baskakov I. et Bolen D.W. (1998) Biophys J. 74, 2658-2665.
Barnard G.C., Henderson G.E., Srinivasan S. et Gerngross T.U. (2004) Protein Expression Purif.
(In press)
Barnes W.M. (1994) Proc. Natl. Acad. Sci. 91, 2216-2220.
Barr P.J. et al. (1986) Biotechniques 4, 428.
Bernard (1995) Gene 162, 159-160.
Bielefeldt-Ohmann et Fitzpatrick (1997) Biotechniques 23, 822-824.
Bevis B.J. et Click B.S. (2002) Nat. Biotechnol. 20, 83-87.
Blaber M., Baase W. A., Gassner N. et Matthews, B. W. (1995) J Mol Biol 246, 317-30
24/10/2011
213
Blais B.W., Turner G., Sooknanan R. et Malek L.T. (1997) Appl. Environ. Microbiol. 63, 310313.
Brenner M., Kisseberth W.C., Su, Y., Besnard F. et Messing A. (1994) J. Neurosci. 14, 10301037.
Brunk C. F., Jones K.J. et James T.W. (1979) Anal. Biochem. 92, 497-500.
Burton K. (1956) Biochem. J. 62, 315-323.
Carninci P., Shiraki T., Mizuno Y., Muramatsu M., Hayashizaki Y. (2002) BioTechniques 32,
984-985.
Cha J. (1993) Gene 136, 369-370.
Chakrabarti G., Kim S., Gupta M.L. Jr, Barton J.S. et Himes R.H. (1999) Biochemistry 38, 30673072.
Chakrabarti R. et Schutt C.E. (2002) BioTechniques 32, 866-874.
Chakrabartty A., Schellman J. A. et Baldwin R. L. (1991) Nature 351, 586-588.
Chakrabartty A. et Baldwin, R. L. (1995) Adv Protein Chem 46, 141-76.
Chamberlain J.S., Gibbs R.A., Ranier J.E. Nguyen P.N.et Casley C.T. (1988) Nucleis Acid Res.
16, 11141-11156.
Chatterjee D.K. et Esposito D. (2005) Protein Exp Purif sous presse
Chen B. et Przybyla A.E. (1994) Biotechniques 17, 657-659.
Cheng S., Fockler C., Barnes W.M. et Higuchi R. (1994) Proc. Natl. Acad. Sci. USA 91, 56955699.
Cho R., Campbell M.J., Winzeler E.A., Steinmetz L., Conway A., Wodicka L., Wolfsberg T.G.,
Gabrielian A.E., Landsman D., Lockahart D.J. et Davis R.W. (1998) Mol. Cell. 2, 65-73.
Chong S., Shao Y., Paulus H., Benner J., Perler F.B. et Xu M-Q. (1996) J. Biol. Chem. 271,
22159-22168.
Chong S., Mersha F.B., Comb D.G., Scott M.E. Landry D., Vence L.M., Perler F.B., Benner J.,
Kucerra R.B., Hirnoven C.A., Pelletier J., Paulus H. et Xu M-Q. (1997) Gene 192, 271281.
Chong S., Montello G.E., Zhang A., Cantor E.J., Liao W., Xu M-Q. et Benner J. (1998) Nucl. Acid
Res. 26, 5109-5115.
Chong Y. et Chen H. (2000) BioTechniques 29, 1166-1167.
24/10/2011
214
Citti L., Rovero P., Colombo M.G., Mariani L., Poliseno L. et Rainaldi G. (2002) BioTechniques
32, 172-177.
Clark (1988) Nucleic Acid Res. 16, 9677-9686.
Compton J. (1991) Nature 350, 91-92.
Cormack B.P., Valdivia R.H., Falkow S. (1996) Gene 173, 33-38.
Cotton R.G.H., Rodrigues N.R. et Campbell R.D. (1988) Proc. Natl. Acad. Sci. U.S.A. 85, 43974401.
Crameri A., Whitehorn E.A. Tate E., Stemmer W.P. (1996) Nat. Biotechnol. 14, 315-319.
Dao-pin, S., Sauer, U., Nicholson, H. et Matthews, B.W. (1991) Biochemistry 30, 7142-7153.
Davies M. J., Taylor J. I., Sachsinger N. et Bruce I.J. (1998) Anal. Biochem. 262, 92-94.
Daxelet G.A., Coene M.M., Hoet P.P. et Cocito C.G. (1989) Anal. Biochem. 179, 401-403.
De Boer H.A., Comstock L.J. et Vasser M. (1983) Proc. Natl. Acad. Sci. USA 80, 21-25.
DePaz R.A., Barnett C.C., Dale D.A., Carpenter J.F., Gaertner A.L. et Randolph TW. (2000)
Arch. Biochem. Biophys. 384,123-32.
Di Donato A., de Nigris M., Russo N., Di Biase S. et D’Alessio G. (1993) Anal. Biochem. 212,
291-293.
Ebel C., Faou P., Kernel B. et Zaccai G.(1999) Biochemistry 38, 9039-47
Felix C. F., Moreira C. C., Oliveira M. S., Sola-Penna M., Meyer-Fernandes J. R., Scofano H. M.
et Ferreira-Pereira A. (1999). Eur. J. Biochem. 266, 660-664.
Feng L., Chan W.W., Roderick S.L. et Cohen D.E. (2000) Biochemistry 39, 15399-15409.
Fisher C.L. et Pei (1997) Biotechniques 23, 570-574.
Finucane M. D. Woolfson D. N. (1999) Biochemistry 38, 11613-11623.
Flory D.J. (1956) J. Am. Chem. Soc. 78, 5222-5235.
Futami J., Tada H., Seno M., Ishikami S. et Yamada H. (2000) J Biochem (Tokyo). 128, 245-50.
Ganter C. et Pluckthun A. (1990) Biochemistry 29, 9395-9402.
Gossen M. et Bujard H. (1992) Proc. Natl. Acad. Sci. USA, 89, 5547-5551.
Gossen M., Freundlieb S., Bender G., Müller G., Hillen W. et Bujard H. (1995) Science 268,
1766-1769.
Gould S. J., Subramani S. et Scheffler I.E. (1989) Proc. Natl. Acad. Sci. USA 86, 1934-1938.
Graham Jr R.C. et Karnovsky M.J. (1966) J. Histochem. Cytochem. 14, 291-302.
Griffin B.A., Adams S.R. et Tsien R.Y. (1998) Science 281, 269-272.
24/10/2011
215
Gritson T.S., Mikhailov M.V., Roy P. et Gould E.A. (1977) Nucleic Acid Res. 25, 1864-1865.
Grutter M.G., Gray, T.M., Weaver, L.H., Wilson, T.A. et Matthews B.W. (1987). J Mol Biol. 197,
315-29.
Guan C. di, Li P., Riggs P.D. et Inouye H. (1988) Gene 67, 21-30.
Hanes O. et Plückthun A. (1997) Proc. Natl. Acad. Science USA 94, 4937-4942.
Hasan N et Szybalski W. (1995) Gene 163, 35-40.
Hawley D.K. et McClure W.R. (1983) Nucleic Acids Res. 11, 2237-2255.
Hecht M. H., Sturtevant J. M. et Sauer R. T. (1986) Proteins 1, 43-46.
Hill B.T. (1976) Anal. Biochem. 70, 635-638.
Hirschel B.J., Shen V. et Schlessinger D. (1980) J. Baceriol. 143, 1534-1537.
Ho A. et al. (2001) Cancer Res. 61, 474-477.
Hoff H., Random J. et Bricca G. (1999) Anal. Biochem. 268, 398-401.
Hom L.G. et Volkman L.E. (1998) Biotechniques 25, 20-22.
Hopp T et al., (1988) Biotechnology 6, 1204-1210.
Irun M.P., Maldonado S.et Sancho J. (2001) Protein Eng. 4, 173-81
Jiang X., Kowalski J. et Kelly J.W. (2001) Protein Sci.10, 1454-65.
Johnson R.E., Adams P. et Rupley J.A. (1978) Biochemistry 17, 1479-1484.
Johnsson N. et Varshavsky A. (1994) Proc. Natl. Acad. Sci. USA, 91, 10340-10344.
Kaplan, H.A., Welpy, J.K. et Lennarz, W.J. (1987) Biochim. Biophys. Acta 906, 161-173.
Karpeisky M.Y., Senchenko V.N., Dianova M.V. et Kanevsky V (1994) FEBS Lett 339, 209-212.
Keefe A.D., Wilson D.S., Seelig B. et Szostak J.W. (2001) Protein Expr Purif 2001, 440-446.
Kennedy D.G., Nelson J., van den Berg H.W. et Murphy R.F. (1987) Anal. Biochem. 167, 127127.
Kinney J., Leippe D., Lewis K., Lyke B., Mandrekar M. et Shultz J. Promega notes 73, 3-7.
Khanna R., Myers M.P., Laine M. et Papazian D.M. (2001) J Biol Chem. Jun 26 [epub ahead of
print])
Kholod N. et Mustelin T. (2001) Biotechniques, 31,322-328.
Kondoh N., Wakatsuki T., Ryo A., Tanaka K., Hada A., Shichita M. et Yamamoto M. (1999)
Anal. Biochem. 269, 427-430.
Krest I. et Keusgen M.(1999) Pharmazie 54, 289-93
Kunkel T.A. (1985) Proc. Natl. Acad. Sci. U.S.A. 82, 488-492.
24/10/2011
216
Kwon Y.K., Murray M.T. et Hecht N.B. (1993) Dev. Biol. 158, 90-100.
LaVallie E.R., DiBlasio E.A., Kovacic S., Grant K.L., Schendel P.F. et McCoy J.M. (1993)
Bioctechnology 11, 187-193.
Langemeier J.L., Cook F., Issel C.J.et Montelaro R.C. (1994) Biotechniques 17, 486-490.
Lelong JC, Prevost G, Lee K, Crepin M.(1989) Anal. Biochem. 179, 299-303
Le Peck, J.-B. et Paoletti , C. (1966) Anal. Biochem. 17, 100-107.
Letsinger, R.L. et al. (1989) Proc. Natl. Acad. Sci - USA 86, 6553.
Leush M.S., Lee S.C. et Ollins P. (1995) Gene 160, 191-194.
Lewis,R.V., Hinman, M., Kothakota, S., Fournier, M.J. (1996) Protein expression Purif. 7, 400406.
Liang P. et Pardee (1992) Science 257, 967-969.
Lin S.H., Konishi Y., Denton M.E. et Scheraga, H.A. (1984) Biochemistry 23, 5504-5512.
Lippert K. et Galinski E.A. (1992) Appl. Microbiol. Biotechnol. 37, 61-65.
Looman A.C., Bodlaender J., Comstock L.J., Eaton D., Jhurani P., de Boer H.A. et van
Knippenberg P.H. (1987) EMBO J. 6, 2489-2492.
Luckow V.A., Lee S.C., Barry G.F. et Olins P.O. (1993) J. Virol. 67, 4566-4579.
Lutz R. et Bujard H. (1997) Nucl. Acid. Res. 25, 1203-1210.
Majunder K. (1992) Gene 110, 89-94.
Makarova O., Kamberov E. et Margolis B. (2000) BioTechniques 29, 970-972.
Manstein D.J., Schuster H-P, Morandini P. et Hunt D.M. (1977) Gene 162, 129-134.
Margarit, I., Campagnoli, S., Frigerio, F., Grandi, G., De Filippis, V. et Fontana, A.(1992) Protein
Eng 5, 543-50.
Mariac C., Trouslot P., Poteaux C., Bezançon G. et Renno J.-F. Biotechniques 28, 110-113.
Maruyama, I.N., Rakow, T.L., Maruyama, H.I. (1995) Nucl. Acid. Res. 23, 3796-3797.
Matsumura M., Becktel W.J., Levitt M. et Matthews B.W. (1989) Proc. Natl. Acad. Sci. USA 86,
6562-6566
Meerman H.J. et Georgiou G. (1994) Biotechnology 12, 1107-1110.
Mitraki A. et King J. (1989) BioTechnology 7, 690-697.
Mok Y.K., Elisseeva E.L., Davidson A.R. et Forman-Kay J.D. (2001) J Mol Biol. 307, 913-28.
Monia B.P., Lesnik E.A., Gonzalez C., Lima W.F., McGee D., Guinosso C.J., Kawasaki A.M.,
Cook P.D. et Freier S.M. (1993) J. Biol. Chem., 268, 14514–14522.
24/10/2011
217
Morawski B., Quan, S. et Arnold F.H; (2001) Biotech. Bioengin. 76, 99-107.
Müller W., Weber H., Meyer F. et Weissmann C. (1978) J. Mol. Biol. 124, 343-358.
Munoz V. et Serrano L. (1994) Proteins 20, 301-311.
Myers R.M., Larin Z. et Maniatis T. (1985) Science 230, 303-305.
Myers R.M., Lumelsky N., Lerman L.S. et Maniatis T. (1985) Nature 313, 495-498.
Nakamaye K. et Eckstein F. (1986) Nucleic Acid Res. 14, 9679-9698.
Nilsson B. et Abrahmsen L. (1990) Methods Enzymol. 185, 144-161.
Noren C.J., Anthony-Cahill M.C., Griffith M.C., Schultz P.G. (1989) Science 244, 182-188.
O’Hare P. et Elliot G. (1997) Cell 88, 223-233.
O’Neil K.T. et DeGrado W.F. (1990) Science 250, 646-651.
Ochman H., Gerber A.S. et Hartl D.L. (1988) Genetics 120, 621-623.
Oefner P.J. et Underhill P.A. (1995) Am. J. Hum. Genet. 57 suppl, A266
Ohmura T., Ueda T., Ootsuka K., Saito M. et Imoto T (2001) Protein Sci. 10, 313-320.
Oleykowski C.A., Bronson C.R., Godwin A.K. et Yeung A.T. (1998) Nucleic Acid Res. 26, 45974602.
Oliphant A.R et Struhl K. (1988) Nucleic Acid Res. 16, 7673-7683.
Oliphant A.R et Struhl K. (1989) Proc. Natl. Acad. Science USA 86, 9094-9098.
Olson P, Zhang Y., Olsen D., Owens A., Cohen P., Nguyen K., Ye J-J., Bass S. et Mascarenhas D.
(1998) Prot. Exp. Purif. 14, 160-166.
Olson C.A., Spek E.J., Shi Z., Vologodskii A. et Kallenbach N.R. (2001) Proteins 44,123-132.
Orita M. Iwahana H., Kanazawa K., Hayashi K et Sekiya T. (1989) Proc. Natl. Acad. Sci. 86,
2766-2770.
Ozawa T., Nogami S., Sato M., Ohya Y. et Umezawa Y. (2000) Anal. Chem. 72, 5151-5157.
Paabo S., Irwin D.M. et Wilson A.C. (1990) J. Biol. Chem. 265, 4718-4721.
Pace, C. N. et Scholtz, J. M. (1998) Biophys J. 75, 422-7.
Pace C.N., Horn G., Hebert E.J., Bechert J., Shaw K., Urbanikova L., Scholtz J.M. et Sevcik J.
(2001) J. Mol. Biol. 312, 393-404.
Pakula AA et Sauer RT (1990) Nature 344, 363-364.
Pan S-H. et Malcolm B.A. (2000) Biotechniques 29, 1234-1238.
Panjkovich A. et Melo F. (2005) Bioinformatics 21, 711-722.
24/10/2011
218
Pantoliano M.W., Ladner R.C., Bryan P.N., Rollence M.L., Wood J.F. et Poulos T.L. (1987)
Biochemistry 26, 2077-2082
Parker J.D., Rabinovitch P.S. et Burmer G.C. (1991) Nucl. Acid Res. 19, 3055-3060.
Parks D., Leuther K.K., Howard E., Johnston S.A. et Dougherty W.G. (1994) Anal. Biochem. 216,
416-417.
Paris P.L., Langenham J.M. et Kool E.T. (1998) Nucl. Acid Res. 26, 3789-3793.
Paulmurugan, R. et Gambhir, S.S. (2003) Anal. Chem. 75, 1584-1589.
Pelletier J. et Sonenberg N. (1988) Nature 334, 320-325.
Perl D. Mueller U. Heinemann U. et Schmid F. X. (2000) Nature Struct. Biol. 7, 380-383
Persson M., Bergstrand M.G., Bulow L.et Mosbach K. (1988) Anal. Biochem. 172, 330-337.
Perutz, M.F. and Raidt, H. (1975) Nature 255, 256-259.
Peterson, R.W., Nicholson, E.M., Thapar, R., Klevit, R.E. et Scholtz, J.M. (1999) J. Mol. Biol.
286, 1609-1619.
Porath J., Carlsson J., Olsson I. et Belfrage G. (1975) Nature 258, 598-599.
Powell J. (1998) Nucleic Acid Res. 26, 3445-3446.
Prasher D.C., Eckenrode V.K., Ward W.W., Prendergast F.G., Cormier M.J. (1992) Gene 111,
229-233.
Predki P. F., Nayak L. M., Gottlieb M. B. et Regan L. (1995) Cell 80, 41-50.
Raschthian A., Buchman G.W., Schuster D.M. et Berninger M.S. (1992) Anal. Biochem. 206, 9197.
Reddy A., Grimwood B.G., Plummer T.H. et Tarentino A.L. (1998) Glycobiology 8, 633-638.
Ringquist S., Shinedling S., Barrick L., Green L., Bindley J., Stormo G.D. et Gold L. (1992) Mol.
Microbiol. 6, 1219-1229.
Ronaghi M., Uhlén M. et Nyrén P. (1998) Science 281, 363-364
Rosenthal A. et Jones D.S.J. (1990) Nucl. Acid Res. 18, 3095-3096.
Ross-Macdonald P., et al. (1999) Nature 402, 413-417.
Rossi, F., Charlton C.A. et Blau, H.M. (1997) Proc. Natl. Acad. Sci. USA, 94, 8405-8410.
Russel M., Kidd S. et Kelly M.R. (1986) Gene 45, 333-338.
SantaLucia J.Jr., Allawi H.T. et Seneviratne P.A. (1996) Biochemistry 35, 3555-3562.
Sarkar G. et Sommer S.S. (1990) Biotechniques 8, 404-407.
Sarkar G., Yoon H.S. et Sommer S.S. (1992) Genomics 13, 441-443.
24/10/2011
219
Sassenfeld H.M. et Brewer S.J. (1984) Bio/Technology 2, 76-81
Sauge-Merle S., Falconet D. et Fontecave M. (1999) Eur. J. Biochem. 266, 62-69.
Schauder B et McCarthy J.E.G. (1989) Gene 78, 59-72.
Schaeffer B.C. (1995)
Schalling M., Hudson T.J, Buctow K.H.et Housman D.E. (1993) Nat. Genet. 4, 135-139.
Schatz P.J. (1993) Biotechnology 11, 1138-1143.
Schildkraut C et Lifton S. (1965) Biopolymers 3, 3555-3562.
Schmidt T.G.M. et Skerra, A. (1993) Protein Eng. 6, 109-122.
Scholz O., Thiel A., Hillen W. et Niederweis M., (2000) Eur. J. Biochem. 267, 1565-1570.
Scott M.R.D., Westphal K-H et Rigby P.W.J. (1983) Cell 34, 557-567.
Sektas M., Hasan N. et Szybalski W. (2001) Gene 267, 213-220.
Shakin-Eschleman S., Spitalnik S. L. et Kasturi L. (1996) J. Biol. Chem. 271, 6363-6366.
Shpigel E., Elias D., Cohen I.R. et Shoseyov O. (1998) Prot. Exp. Purif. 14, 185-191.
Short J.M., Fernandez J.M., Sorge J.A. et Huse W.D. (1988) Nucleic Acid Res. 16, 7583-7600.
Shortle D. et Nathans D. (1978) Proc. Natl. Acad. Sci. USA 75, 2170-2174.
Shuman S. (1994) J. Biol. Chem. 269, 32678-32684.
Siebert P.D., Chenchik A., Kellogg D.E., Lukyanov K.A. et Lukyanov S.A. (1995) Nucl. Acid .
Res. 23, 1087-1088.
Skerra A. (1994) Gene 151, 131-135.
Smith H.W. (1975) Nature 255, 500-502.
Smith D.B. et Johnson K.S. (1988) Gene 67, 31-40.
Sommer S.S., Groszbbach A.R. et Bottenma C.D.K. (1992) BioTechniques 12, 82-87.
Southern E.M. (1975) J. Mol. Biol. 98, 503-517.
Song S.B., Kim K.K.et Kim K.E. (2002) BioTechniques 32, 248-252.
Srinivasan S., Barnard G.C. et Gerngross T.U. (2002) Applied Environ. Microbiol. 68, 5912-5932.
Stemmer, W.P.C., Crameri, A., Ha, K.D., Brennan, T.M. et Heyneker, H.L. (1995) Gene 164, 4953.
Stofko-Hahn R.E., Carr D.W. et Scott J.D. (1992) FEBS Lett. 302, 274-278.
Studier F.W. (1991) J. Mol. Biol. 219, 37-44.
Studier F.W. et Moffatt B.A. (1986) J. Mol. Biol. 189, 113-130.
Tabor S. et Richardson C.C. (1995) Proc. Natl. Acad. Sci. U.S.A. 92, 6339-6343.
24/10/2011
220
Tams J.W. et Welinder K.G. (2001) Biochem. Biophys. Res. Comm. 286, 701-706.
Taniguchi K., Nomura K., Hata Y., Nishimura T., Asami Y., Kuroda A. (2007) Biotechnol.
Bioeng. 96, 1023–1029.
Thalhammer, S., Stark, R.W., Schütze, K et Heckl, W.M. (1997)
Thomas C.A.J. et Dancis B.M. (1973) J. Mol. Biol. 77, 43-55.
Ueda T., Yamada H., Hirata M. et Imoto T. (1985) Biochemistry 24, 6316-6322.
de Valdivia E.I.G et Isaksson L.A. (2005) FEBS J. 272, 5306-5316.
Van Dyke M.W., Sirito M. et Sawadogo M. (1992) Gene 111, 99-104.
Van Hest J.C.M., Kiick K.L., Tirrell D.A., (2000) J. Am. Chem. Soc. 122, 1282Vartamian J.P., Henry M., Wain-Hobson, S. (1996) Nucleic Acids Res. 24, 2627-2631.
Velculescu V.E., Zhang L., Volgelstein B. et Kinzler K.W. (1995) Science 270, 484-487.
Viazov S., Zibert A., Ramakrishnan K., Widell A., Cavicchini A., Schreier E. et Roggendorf M.
(1994) J Virol Methods 48, 81-91.
Waldburger C. D. Schildbach J. F. et Sauer R. T. (1995) Nature Struct. Biol. 2, 122-128.
Wang M., Doyle M.V. et Park D.F. (1989) Proc. Natl. Acad. Science USA 86, 9717-9721.
Wang D.G. et al. (1998) Science 280, 1077-1082.
Wang L., Brock A., Herberich B., Schultz P.G. (2001) Science 292, 498-500.
Watson D.E. et Bennett G.N. (1997) BioTechniques 23,858-862.
Weijers S. R. et van’t Riet K. (1992) Biotechnol. Adv. 10, 237–249.
West M. et Wilson V.G. (2002) BioTechniques 32, 44-46.
Wetzel R., Perry L.J., Baase W.A. et Becktel W.J. (1988) Proc. Natl. Acad. Sci. USA 85, 401-405.
Wieland I., Bolger G, Asouline G., Wigler M. (1990) Proc. Natl. Acad. Sci. 87, 2720-2724.
Zamecnik P.C. et Stephenson M.L. (1978). Proc. Natl. Acad. Sci. USA, 75, 280-284.
Zabner J., Fasbender A.J., Moninger T, Poellinger K.A. et Welsh M.J. (1997) J. Biol. Chem. 270,
18997-19007.
Zaccolo M., Williams D.M., Brown D.M., Gherardi E. (1996) J. Mol. Biol. 225, 589-603.
Zhen G. et Lyons G. (2002) BioTechniques 33, 32-36.
Zhou M. et Hatalet Z. (1995) Nucleic Acid Res. 23, 1089-1090.
24/10/2011
Fournisseurs
Clonteck : www.clonteck.com
In Vitrogene : www.invitrogen.com
Perbio : www.perbio.com
Gene Therapy Sustem Inc : www.genetherapysystems.com
221
24/10/2011
Index
A
adenovirus, 285
ADNc, 58
ADN-T, 274
Adriamycine, 12
AFLP, 230
Agrobacterium tumefasciens, 274
alfavirus, 287
Aminoglycosides, 44
Aminopteridine, 46
ampicilline, 45
Amplification, 99
Amplification d’ARN, 105
AP-PCR, 234
ARN polymérase, 29
B
BAC, 40
Bacillus, 263
Baculovirus, 276
banque, 58
banque de cDNA, 124
Banque de saut, 147
biotine, 68
bisbenzimide, 10
Blasticidine, 46
blot overlay, 348
Bovine Papilloma Virus, 284
Bridging PCR, 106
Bromodesoxyuridine, 47
bromure d'éthidium, 9
digoxigénine, 69
diphenylamine, 13
DNase I, 17
DNases, 16
double hybride, 150
E
enterokinase, 319
Erythromycine, 43
exonucléases, 16
F
facteur Xa, 319
Far-Western, 347
G
G418, 47
GFP, 317
glancicovir, 47
glutathion S-transférase, 315
glycosidase, 32
Green fluorescent protein, 317
GST pull down, 347
H
C
chitine, 318
Chloramphenicol, 44
corps d’inclusion, 327
cosmide, 41
Cristal violet, 12
HcRed, 317
HIS-tag, 316
Histidinol, 47
Hoechst, 10
hot start, 101
Hybridation, 78
hybridation soustractive, 157
Hygromycine B, 48
I
IMA, 234
Intein, 320
D
DAF, 234
DAPI, 11
ddF, 224
DDPCR, 160
dénaturation, 78
DGGE, 224
Dictyostelium discoideum, 272
didéoxynucléotide, 77
differential display, 160
J
Jumping PCR, 106
K
kanamycine, 45
L
lentivirus, 284
222
24/10/2011
ligase, 30
M
M13, 38
MAAP, 234
Macrolides, 43
maltose binding protéine, 315
Maxam et Gilbert, 89
Methotrexate, 48
méthylase, 32
Microsatellites, 232
minisatellites, 232
mithramycine, 13
Mitomycine C, 48
Molecular beacons, 103
mung bean, 18
mutagenèse, 108
mutation, 213
RFLP, 222, 229
ribosome display, 122
Rifampicine, 46
RNases, 22
S
Saccharomyces cerevisiae, 266
Sanger, 90
Schizosaccharomyces pombe, 269
scintillation proximity assay, 347
séquence, 89
sonde, 68
Southern, 83, 216
South-Western, 350
SPA, 347
SSCP, 223
streptavidine, 69, 315
SV40, 284
T
N
NASBA, 105
nick translation, 73
northern, 86
North-Western, 350
Nucléase S1, 17
O
Oubaine, 48
P
PAC, 40
PASA, 219
PCR, 99
phage, 36
phage display, 131
phagemide, 40
Phosphatase, 31
Pichia pastoris, 270
plasmide, 34
polymérase, 23
polymorphisme, 229
protéase, 318
Puromycine, 49
Pyrosequencing, 92
V
vaccine, 285
Vancomycine, 45
Viomycine, 45
X
Xénope, 283
Xyl-A, b-D-Xylofuranosyl, 49
Y
R
Ramdom priming, 74
RAPD, 234
restriction, 18
rétrovirus, 286
reverse transcriptase, 27
Taq DNA pol, 26
télomérase, 28
Terminal transférase, 28
Tétracycline, 44
Tetracystéine, 318
TEV, 319
Thioredoxine, 316
thrombine, 319
Tm, 78
topoisomérase, 30
traduction, 236
Trichoderma reesei, 272
tsp, 180
YAC, 40
λ Zap, 41
223

Documents pareils