Interactions acides nucléique
Transcription
Interactions acides nucléique
Interactions acides nucléique-protéine I – Quelques techniques d’analyse des interactions acides nucléiques / protéines : I – 1 : technique de retardement dur gel La technique du gel retard (EMSA pour Electrophoretic Mobility Shift Assay) est basée sur le retard de migration dans un gel natif de polyacrylamide de duplexes d'oligonucléotides de séquences courtes en présence de protéines (ou de complexes protéiques) ayant la propriété de reconnaître spécifiquement la séquence d'intérêt. La variation de migration des duplexes (ou sondes) complexés aux protéines par rapport aux duplexes libres est suivie grâce au marquage radioactif au 32P des sondes nucléotidiques. Le gel retard peut être réalisé à partir de protéines purifiées mais aussi à partir d’un extrait protéique plus complexe (un extrait nucléaire par exemple). • Gel retard réalisé à partir de protéines purifiées : Concentrations croissantes en protéine * * * * * * ADN complexé à deux protéines ADN complexé à une protéine ADN nu marqué en 5 ’ Il permet : de vérifier l’interaction d’une protéine avec une séquence ADN d’étudier les nucléotides importants dans cette séquence (mutagenèse des différents nucléotides de la cible ADN, test de leur interaction avec la protéine X par gel retard) d’étudier l’affinité apparente de la protéine pour la cible ADN La spécificité de reconnaissance des sondes marquées peut être testée par l'ajout en excès du même duplex non radioactif qui entrent en compétition avec la forme radioactive. • Gel retard réalisé à partir d’extrait nucléaire : La présence de protéines spécifiques dans le complexe retardé devra être mise en évidence par l'ajout d'anticorps spécifiques qui permettent un retard plus important sur le gel appelé " supershift ". 1 + ADN compétiteur AC antiX AC non spé Complexes non spécifiques EN X EN X EN X EN X EN ∆X Cible ADN Cible ADN Cible ADN Cible ADN Cible ADN Cible ADN I – 2 : le footprint Différentes possibilités existent pour réaliser un footprint. Ici, nous n’étudierons que le footprint in vitro à la DNase I. Clone Génomique La molécule que l'on va suivre est Fragment d’environ 300pb le fragment d’ADN marqué à une Marquage en 5 ’ Maxam et Gilbert DMS + EN seule extrémité. + Dnase I Ménagée Il existe différentes possibilités Pipéridine pour faire ce marquage unilatéral mais, généralement, ce marquage est réalisé par PCR en utilisant un Avec E.N. oligonucléotide marqué en 5’. Le fragment est incubé Sans E.N. en - présence d’extrait nucléaire (ou d’une protéine purifiée) puis Empreinte 2 Gel d’acrylamide dénaturant soumis à une digestion ménagée par la DNaseI. Un témoin est Empreinte 1 réalisé en incubant le fragment sans E.N. avec la DNaseI. Coupure DNaseI possible Fragment détectable Coupure DNaseI impossible Coupure pipéridine possible Méthylation + L’analyse est effectuée sur gel de polyacrylamide en conditions dénaturantes (gel de séquence) et le profil obtenu permet de déterminer les régions qui ont été protégées de l’action de la DNaseI par l’extrait nucléaire – ou la protéine purifiée. Si les fragments utilisés sont reconnus par plusieurs facteurs on pourra mettre en évidence des « Footprint » multiples. Pour déterminer les positions exactes des séquences protégées, une réaction de séquençage (type Maxam and Gilbert) est réalisée et déposée en parallèle sur le gel. 2 II - Techniques permettant de déterminer la (les) protéine(s) qui se fixe(nt) sur un acide nucléique cible (ADN ou ARN) : Simple Hybride Cette technique permet d’identifier de nouvelles protéines interagissant avec un fragment d’ADN connu de vérifier une interaction entre une séquence d’ADN et une protéine d’étudier les nucléotides et/ou acides aminés impliqués une interaction connue. Bien sûr, la stratégie expérimentale choisie variera légèrement en fonction de ce que l’on veut faire. Comme pour le double hybride, on travaille chez la levure. Principe : A : domaine protéique activateur transcriptionnel (en général celui de Gal4) A X E E Gène rapporteur - par exemple celui de la β galactosidase E Gène rapporteur Reporter E : Elément cis régulateur - séquence ADN cible • soit séquence cible connue • soit séquence cible connue dégénérée (pour étudier l’effet de mutations) X : protéine se liant sur la séquence E • soit une banque d ’ADNc • soit l’ADNc d’une protéine connu • soit l’ADNc d’une protéine connu ayant été entièrement ou partiellement mutagénisé Si la protéine X se lie sur la séquence cis régulatrice E, il y aura activation de la transcription du gène rapporteur. Si on fait pousser les levures ayant reçu ce vecteur sur un milieu en présence de X-gal, les colonies obtenues seront bleues. Afin d’améliorer le rendement de l’activation transcriptionnelle, la séquence cible E est répétée plusieurs fois. III - Techniques permettant de déterminer la cible (ADN ou ARN) d’une protéine : Immunoprécipitation de chromatine Le « ChIP » (Chromatin ImmunoPrecipitation) consiste à purifier des complexes ADN-protéines, formés in * 1 (X vivo et liés de façon covalente par du formaldéhyde. ** 3 Principe de la Technique : Les protéines cellulaires sont liées de façon covalente à l'ADN par un traitement au formaldéhyde. L'ADN est ensuite clivé en fragments d’environ 500 pb par sonication. La protéine d'intérêt est immunoprécipitée, l'ADN sur lequel elle était liée récupéré et analysé (par exemple par PCR comme sur le schéma ci-dessous. Avantage : - Cette technique est réalisée sur des cellules vivantes Inconvénients : - Cette technique est assez difficile à mettre en œuvre. Il faut trouver les conditions idéales d'immunoprécipitation, de cross-link mais aussi de fragmentation de l'ADN. Le choix des oligonucléotides utilisés pour la PCR est également important. - Il faut avoir un anticorps très spécifique et présentant une bonne affinité pour sa protéine cible et que la protéine étudiée soit exprimée dans la cellule en quantité suffisamment importante. On peut détourner ces derniers inconvénients en utilisant une protéine tagguée et surexprimée mais, dans ces conditions là, on s’éloigne de l’ « in vivo ». Méthode : 1) Fixation au formaldéhyde, sonication et immunoprécipitation 4 Le formaldéhyde est une petite molécule de 2 Angström, c’est un agent de liaison qui va permettre de produire un lien in vivo à la fois « acides nucléiques – protéines » et « protéines – protéines ». Le formaldéhyde est un composé dipolaire très réactif dans lequel les atomes de carbones agissent comme des centres nucléophiles. Les groupements « amines » et « imines » des acides aminés (Lysines, Arginines et Histidines) et de l’ADN (Adénines et Cytosines) réagissent avec le formaldéhyde pour former une base de Schiff. Cet intermédiaire peut alors réagir avec un second groupe aminé pour donner le complexe ADNprotéine final. Ces réactions se mettent en place in vivo en quelques minutes seulement après l’ajout de formaldéhyde sur les cellules vivantes. L’avantage de l’utilisation du formaldéhyde est que la réaction est totalement réversible. Un autre paramètre qui doit être considéré lors de la mise au point des conditions de fixation est le fractionnement du matériel fixé. La sonication est une des possibilités (avec la digestion par les endonucléases) pour solubiliser le matériel fixé, en particulier la chromatine. Pour l’identification et la caractérisation in vivo des ADNs cibles d’une protéine donnée, après immunoprécipitation de la chromatine « crosslinkée », l’ADN est purifié puis analysé par les techniques conventionnelles telles que le southern blot, le séquençage, l’hybridation sur puces et l’analyse par PCR. De telles analyses demandent l’élimination de toutes les protéines de la fraction chromatine immunoprécipitée. Pour cela, le cross-link est réversé par chauffage en solution aqueuse (65°C, au moins 4 heures) – on peut en plus traiter à la protéinase K pour éliminer les protéines puis l’ADN est purifié par des méthodes standards (par exemple par une partition phénol/chloroforme/eau, suivi d’une précipitation à l’éthanol). L’utilisation d’anticorps purifiés est fortement recommandée, et les anticorps polyclonaux sont préférés aux anticorps monoclonaux pour éviter les problèmes potentiels de masquage d’épitopes dans le matériel « crosslinké ». 2) Méthodes d’analyses - Analyse par PCR : Si on a une idée des régions chromosomiques sur lesquelles la protéine étudiée a pu se fixer, on peut réaliser une analyse par PCR. Pour cela, on va dessiner des oligonucléotides qui s’hybrident de par et d’autre de la séquence à tester (séquence sur laquelle on pense que s’est fixée la protéine étudiée) puis on réalise une PCR à l’aide de ces amorces afin de tester la présence du fragment d’ADN correspondant parmi les fragments 5 précipités. Si la protéine était sur cette région de l’ADN, il y aura amplification par PCR, sinon, on n’aura pas d’amplification. - Hybridation sur « chip » - ChIP on chip ou ChIP to chip Dans l’expérience appelée « ChIP on chip », tous les fragments d’ADN co-immunoprécipités avec la protéine d’intérêt sont amplifiés. Ceci est réalisé en ajoutant par ligation des linkers classiques sur les extrémités des fragments d’ADN réparés (LM PCR). Le matériel amplifié est alors hybridé à une puce d’ADN (DNA microarray) portant les sondes appropriées – fragments d’ADN génomique voire oligonucléotides correspondant à des séquences promotrices. Ces expériences sont réalisées avec deux marquages, la deuxième couleur correspondant à l’ADN total comme contrôle. Chaque ADN enrichi par l’immunoprecipitation est enregistré comme un site de liaison potentiel pour la protéine étudiée. Types de puces souvent utilisés : • Les puces génomiques : portent l’ensemble du génome – plutôt utilisées pour des organismes peu complexes (levure, drosophile). Point fort : on crible l’ensemble du génome Points faibles : la résolution est mauvaise (de l’ordre de 0.5 méga base), on ne peut voir que des régions d’interaction et non des sites. Beaucoup de faux positifs – difficile à analyser. • Les puces à promoteurs : Point fort : peu ou pas de faux positifs. Permet de déterminer l’identité du gène concerné 6 Points faibles : ne portent que les promoteurs proximaux, or, on sait que des séquences régulatrices très importantes sont en dehors de ces régions. Ce type d’ « array » n’existe que pour quelques organismes modèles. - séquençage L’addition d’un linker permet l’amplification de la banque. L’ADN est ensuite séquencé. séquençage Cette technique est sûrement la plus valable de toutes. Cependant elle est très lourde et onéreuse à mettre en place. En effet, le nombre de clones à séquencer pour avoir une bonne idée de l’ensemble des sites de fixation est très important (on estime le nombre de clones à séquencer à environ 100 000 pour l’analyse des sites d’interaction dans un génome humain). 7