Interactions acides nucléique

Transcription

Interactions acides nucléique
Interactions acides nucléique-protéine
I – Quelques techniques d’analyse des interactions acides nucléiques / protéines :
I – 1 : technique de retardement dur gel
La technique du gel retard (EMSA pour Electrophoretic Mobility Shift Assay) est basée sur le retard de
migration dans un gel natif de polyacrylamide de duplexes d'oligonucléotides de séquences courtes en
présence de protéines (ou de complexes protéiques) ayant la propriété de reconnaître spécifiquement la
séquence d'intérêt. La variation de migration des duplexes (ou sondes) complexés aux protéines par rapport
aux duplexes libres est suivie grâce au marquage radioactif au 32P des sondes nucléotidiques.
Le gel retard peut être réalisé à partir de protéines purifiées mais aussi à partir d’un extrait protéique plus
complexe (un extrait nucléaire par exemple).
•
Gel retard réalisé à partir de protéines purifiées :
Concentrations croissantes
en protéine
*
*
*
*
*
*
ADN complexé à deux protéines
ADN complexé à une protéine
ADN nu marqué en 5 ’
Il permet :
de vérifier l’interaction d’une protéine avec une séquence ADN
d’étudier les nucléotides importants dans cette séquence (mutagenèse des différents nucléotides de la
cible ADN, test de leur interaction avec la protéine X par gel retard)
d’étudier l’affinité apparente de la protéine pour la cible ADN
La spécificité de reconnaissance des sondes marquées peut être testée par l'ajout en excès du même duplex
non radioactif qui entrent en compétition avec la forme radioactive.
• Gel retard réalisé à partir d’extrait nucléaire :
La présence de protéines spécifiques dans le complexe retardé devra être mise en évidence par l'ajout
d'anticorps spécifiques qui permettent un retard plus important sur le gel appelé " supershift ".
1
+ ADN compétiteur
AC antiX AC non spé
Complexes non spécifiques
EN X
EN X
EN X
EN X
EN ∆X
Cible ADN Cible ADN Cible ADN Cible ADN Cible ADN Cible ADN
I – 2 : le footprint
Différentes possibilités existent pour réaliser un footprint. Ici, nous n’étudierons que le footprint in vitro à la
DNase I.
Clone Génomique
La molécule que l'on va suivre est
Fragment d’environ 300pb
le fragment d’ADN marqué à une
Marquage en 5 ’
Maxam et Gilbert
DMS
+ EN
seule extrémité.
+ Dnase I Ménagée
Il existe différentes possibilités
Pipéridine
pour faire ce marquage unilatéral
mais, généralement, ce marquage
est réalisé par PCR en utilisant un
Avec E.N.
oligonucléotide marqué en 5’.
Le
fragment
est
incubé
Sans E.N.
en
-
présence d’extrait nucléaire (ou
d’une
protéine
purifiée)
puis
Empreinte 2
Gel d’acrylamide dénaturant
soumis à une digestion ménagée
par la DNaseI. Un témoin est
Empreinte 1
réalisé en incubant le fragment
sans
E.N.
avec
la
DNaseI.
Coupure DNaseI possible
Fragment détectable
Coupure DNaseI impossible
Coupure pipéridine possible
Méthylation
+
L’analyse est effectuée sur gel de polyacrylamide en conditions dénaturantes (gel
de séquence) et le profil obtenu permet de déterminer les régions qui ont été
protégées de l’action de la DNaseI par l’extrait nucléaire – ou la protéine purifiée.
Si les fragments utilisés sont reconnus par plusieurs facteurs on pourra mettre en
évidence des « Footprint » multiples. Pour déterminer les positions exactes des
séquences protégées, une réaction de séquençage (type Maxam and Gilbert) est
réalisée et déposée en parallèle sur le gel.
2
II - Techniques permettant de déterminer la (les) protéine(s) qui se fixe(nt) sur un acide
nucléique cible (ADN ou ARN) :
Simple Hybride
Cette technique permet
d’identifier de nouvelles protéines interagissant avec un fragment d’ADN connu
de vérifier une interaction entre une séquence d’ADN et une protéine
d’étudier les nucléotides et/ou acides aminés impliqués une interaction connue.
Bien sûr, la stratégie expérimentale choisie variera légèrement en fonction de ce que l’on veut faire.
Comme pour le double hybride, on travaille chez la levure.
Principe :
A : domaine protéique activateur transcriptionnel (en général celui
de Gal4)
A
X
E
E
Gène rapporteur - par exemple celui de la β galactosidase
E
Gène
rapporteur
Reporter
E : Elément cis régulateur - séquence ADN cible
• soit séquence cible connue
• soit séquence cible connue dégénérée
(pour étudier l’effet de mutations)
X : protéine se liant sur la séquence E
• soit une banque d ’ADNc
• soit l’ADNc d’une protéine connu
• soit l’ADNc d’une protéine connu ayant été entièrement ou partiellement mutagénisé
Si la protéine X se lie sur la séquence cis régulatrice E, il y aura activation de la transcription du gène
rapporteur. Si on fait pousser les levures ayant reçu ce vecteur sur un milieu en présence de X-gal, les
colonies obtenues seront bleues.
Afin d’améliorer le rendement de l’activation transcriptionnelle, la séquence cible E est répétée plusieurs
fois.
III - Techniques permettant de déterminer la cible (ADN ou ARN) d’une protéine :
Immunoprécipitation de chromatine
Le « ChIP » (Chromatin ImmunoPrecipitation) consiste à purifier des complexes ADN-protéines, formés in
*
1
(X
vivo et liés de façon covalente par du formaldéhyde.
**
3
Principe de la Technique :
Les protéines cellulaires sont liées de façon covalente à l'ADN par un traitement au formaldéhyde. L'ADN
est ensuite clivé en fragments d’environ 500 pb par sonication.
La protéine d'intérêt est immunoprécipitée, l'ADN sur lequel elle était liée récupéré et analysé (par exemple
par PCR comme sur le schéma ci-dessous.
Avantage :
- Cette technique est réalisée sur des cellules vivantes
Inconvénients :
- Cette technique est assez difficile à mettre en œuvre. Il faut trouver les conditions idéales
d'immunoprécipitation, de cross-link mais aussi de fragmentation de l'ADN. Le choix des oligonucléotides
utilisés pour la PCR est également important.
- Il faut avoir un anticorps très spécifique et présentant une bonne affinité pour sa protéine cible et que la
protéine étudiée soit exprimée dans la cellule en quantité suffisamment importante. On peut détourner ces
derniers inconvénients en utilisant une protéine tagguée et surexprimée mais, dans ces conditions là, on
s’éloigne de l’ « in vivo ».
Méthode :
1) Fixation au formaldéhyde, sonication et immunoprécipitation
4
Le formaldéhyde est une petite molécule de 2 Angström, c’est un agent de liaison qui va permettre de
produire un lien in vivo à la fois « acides nucléiques – protéines » et « protéines – protéines ».
Le formaldéhyde est un composé dipolaire très réactif dans lequel les atomes de carbones agissent comme
des centres nucléophiles. Les groupements « amines » et « imines » des acides aminés (Lysines, Arginines et
Histidines) et de l’ADN (Adénines et Cytosines) réagissent avec le formaldéhyde pour former une base de
Schiff. Cet intermédiaire peut alors réagir avec un second groupe aminé pour donner le complexe ADNprotéine final. Ces réactions se mettent en place in vivo en quelques minutes seulement après l’ajout de
formaldéhyde sur les cellules vivantes. L’avantage de l’utilisation du formaldéhyde est que la réaction est
totalement réversible.
Un autre paramètre qui doit être considéré lors de la mise au point des conditions de fixation est le
fractionnement du matériel fixé. La sonication est une des possibilités (avec la digestion par les
endonucléases) pour solubiliser le matériel fixé, en particulier la chromatine.
Pour l’identification et la caractérisation in vivo des ADNs cibles d’une protéine donnée, après
immunoprécipitation de la chromatine « crosslinkée », l’ADN est purifié puis analysé par les techniques
conventionnelles telles que le southern blot, le séquençage, l’hybridation sur puces et l’analyse par PCR. De
telles analyses demandent l’élimination de toutes les protéines de la fraction chromatine immunoprécipitée.
Pour cela, le cross-link est réversé par chauffage en solution aqueuse (65°C, au moins 4 heures) – on peut en
plus traiter à la protéinase K pour éliminer les protéines puis l’ADN est purifié par des méthodes standards
(par exemple par une partition phénol/chloroforme/eau, suivi d’une précipitation à l’éthanol).
L’utilisation d’anticorps purifiés est fortement recommandée, et les anticorps polyclonaux sont préférés aux
anticorps monoclonaux pour éviter les problèmes potentiels de masquage d’épitopes dans le matériel «
crosslinké ».
2) Méthodes d’analyses
- Analyse par PCR :
Si on a une idée des régions chromosomiques sur lesquelles la protéine étudiée a pu se fixer, on peut réaliser
une analyse par PCR. Pour cela, on va dessiner des oligonucléotides qui s’hybrident de par et d’autre de la
séquence à tester (séquence sur laquelle on pense que s’est fixée la protéine étudiée) puis on réalise une PCR
à l’aide de ces amorces afin de tester la présence du fragment d’ADN correspondant parmi les fragments
5
précipités. Si la protéine était sur cette région de l’ADN, il y aura amplification par PCR, sinon, on n’aura
pas d’amplification.
- Hybridation sur « chip » - ChIP on chip ou ChIP to chip
Dans l’expérience appelée « ChIP on chip », tous les fragments d’ADN co-immunoprécipités avec la
protéine d’intérêt sont amplifiés. Ceci est réalisé en ajoutant par ligation des linkers classiques sur les
extrémités des fragments d’ADN réparés (LM PCR). Le matériel amplifié est alors hybridé à une puce
d’ADN (DNA microarray) portant les sondes appropriées – fragments d’ADN génomique voire
oligonucléotides correspondant à des séquences promotrices. Ces expériences sont réalisées avec deux
marquages, la deuxième couleur correspondant à l’ADN total comme contrôle. Chaque ADN enrichi par
l’immunoprecipitation est enregistré comme un site de liaison potentiel pour la protéine étudiée.
Types de puces souvent utilisés :
•
Les puces génomiques : portent l’ensemble du génome – plutôt utilisées pour des organismes peu
complexes (levure, drosophile).
Point fort : on crible l’ensemble du génome
Points faibles : la résolution est mauvaise (de l’ordre de 0.5 méga base), on ne peut voir que des régions
d’interaction et non des sites. Beaucoup de faux positifs – difficile à analyser.
•
Les puces à promoteurs :
Point fort : peu ou pas de faux positifs. Permet de déterminer l’identité du gène concerné
6
Points faibles : ne portent que les promoteurs proximaux, or, on sait que des séquences régulatrices très
importantes sont en dehors de ces régions. Ce type d’ « array » n’existe que pour quelques organismes
modèles.
-
séquençage
L’addition d’un linker permet l’amplification de la banque. L’ADN est ensuite séquencé.
séquençage
Cette technique est sûrement la plus valable de toutes. Cependant elle est très lourde et onéreuse à mettre en
place. En effet, le nombre de clones à séquencer pour avoir une bonne idée de l’ensemble des sites de
fixation est très important (on estime le nombre de clones à séquencer à environ 100 000 pour l’analyse des
sites d’interaction dans un génome humain).
7

Documents pareils