Etude des peptides et des protéines par spectrométrie de masse
Transcription
Etude des peptides et des protéines par spectrométrie de masse
32 CHAPITRE V ÉTUDE DES PEPTIDES ET DES PROTÉINES PAR SPECTROMÉTRIE DE MASSE Introduction: intérêt de la spectrométrie de masse pour l'étude des protéines Les deux origines de la connaissance des séquences de protéines et de peptides sont le séquençage du génome, d'une part, le séquençage de la protéine d'autre part (méthode d'Edman sur microséquenceurs automatiques). La première approche est indirecte et prédictive alors que la seconde est basée sur la dérivation chimique (dérivés phénylthiohydantoïnes ou PTH de la fonction amine terminale) et le comportement chromatographique des acides aminés individuels. La spectrométrie de masse, à la différence de ces deux méthodes, est un outil d'analyse directe du composé. Le séquençage des acides aminés par la méthode d'Edman bute sur un certain nombre d'écueils: blocage éventuel du groupement amine-terminal, chaîne peptidique branchée, un acide aminé modifié non reconnu ou identifié à tort à un acide aminé classique, etc… Le séquençage d'Edman est également inapproprié aux peptides cycliques. Le séquençage du génome ne permet d'attribuer au peptide qu'une structure probable par traduction des codons en acides aminés correspondant. Il ne tient donc pas compte des modifications chimiques post-traductionnelles qui se produisent souvent dans le milieu cellulaire et qui peuvent être nécessaires à l'activité du peptide ou de la protéine. Il y a donc nécessité de vérifier, par une analyse directe du peptide l'adéquation de sa structure à celle qui est prévue par le séquençage du génome. Cette vérification est absolument essentielle dans le cas de protéines recombinantes. De manière générale, les techniques du génie génétique qui consistent à faire exprimer par une lignée cellulaire un gène codant pour une protéine issue d'une lignée cellulaire différente exigent que l'on vérifie l'identité du peptide ou de la protéine issus de cette nouvelle source ou que l'on décèle d'éventuelles modifications. Dans le cas où les peptides seraient produits en mélange, la MS/MS ou le couplage chromatographie/SM peuvent être rendus nécessaires. Tout particulièrement lorsque le composé est destiné à un usage pharmaceutique, l'identification du peptide majoritaire doit se compléter par celle des dérivés minoritaires (de dégradation par exemple) et éventuellement de leur dosage. Enfin, dans nombre de cas, l'origine naturelle de ces composés et leur isolement à partir de matrices biologiques, font en sorte qu'ils ne peuvent souvent être obtenus qu'en faible quantité; il y a donc nécessité d'une grande sensibilité de la technique d'analyse. Dans le cas d'une protéine, si l'importance de la masse moléculaire en a fait longtemps des composés rétifs à l'analyse spectrométrique, aujourd'hui, grâce à l'electrospray ou au MALDI, la mesure de masse de composés dont le poids moléculaire atteint plusieurs dizaines de milliers de Daltons est du domaine de la routine, même si la quantité de produit analysé n'excède pas quelques picomoles. La bonne maîtrise des techniques de couplage LC/MS ou CZE (électrophorèse capillaire)/MS avec une source electrospray permet d'obtenir simultanément la séparation et l'analyse de mélanges de peptides ou de protéines dont chaque composant est en quantité picomolaire. Enfin, le séquençage par MS/MS de peptides se fait désormais en routine; l'apparition d'appareils magnétiques tandem dotés de détecteurs extrêmement sensibles permet de compléter efficacement le séquençage d'Edman sur des composés isolés en quantités de plus en plus faibles. V . 1 Le problème des hautes masses Quelles sont les informations que l'on peut tirer de la masse moléculaire ? Ø Dans le cas ou le peptide est inconnu, il s'agit évidemment d'une donnée essentielle 33 Ø Dans le cas où le peptide (ou la protéine) serait connu, cela permet de vérifier la masse moléculaire par rapport à ce qui était attendu à la suite du séquençage du génome ou de la protéine selon Edman; il s'agit alors d'une vérification indirecte (car globale) de la séquence peptidique. Quelques problèmes concrets peuvent ainsi être abordés Ø Détection de modifications post-traductionnelles d'acides aminés: N-acylations, Ophosphorylations, sulfatations, O- et N-glycosylations se traduisent par un accroissement, mesurable et connu, du poids moléculaire. Ø Formation de ponts disulfure: chaque pont S-S formé se traduit par la perte de deux unités de masse par rapport à la valeur attendue. Ø Un remplacement d'acide aminé par un autre se traduit par une modification de la masse moléculaire, l'emplacement de ce nouvel acide aminé étant déterminé par séquençage MS/MS. Par ailleurs, les contraintes du code génétique ne rendent possibles qu'un nombre limité d'échanges d'acides aminés, les mutations étant le plus souvent "simple base". Ø Perte d'un ou de plusieurs acides aminés: cette modification post-traductionnelle relativement fréquente (protéolyse) abaisse le poids moléculaire du composé. Deux méthodes sont utilisées pour la mesure de masse de protéines de grande taille (10 000 Da et plus): l'ionisation par electrospray et l'ionisation MALDI. V . 1 . A L'electrospray et la caractérisation de protéines dénaturées ou à l'état natif: L'utilisation de systèmes solvants comprenant une large part de solvants (alcools, acétonitrile) et d'acides (formique, acétique, trifluoroacétique) organiques conduit, dans la plupart des cas, à une dénaturation de la protéine, c'est à dire à une rupture de la plupart des liaisons faibles intra- ou intermoléculaires. Dans ces conditions, seul reste observable l'enchaînement peptidique. Si l'échantillon est dissout dans de l'eau tamponnée à un pH proche de la neutralité à l'aide de sels volatils (acétate ou bicarbonate d'ammonium), certaines interactions faibles survivent au processus d'évaporation ionique. Ces conditions permettent l'observation de protéines dans un état dit "natif", c'est à dire dans lequel leurs structures tertiaire (repliée) et quaternaire (protéines multimériques) ainsi que leurs liaisons avec des cofacteurs métalliques ou organiques sont conservées. De façon générale, la différence de conditions expérimentales se traduit par des différences spectrales spectaculaires. Dans des conditions dénaturantes, le spectre electrospray d'une protéine présente généralement un grand nombre de pics ioniques à relativement basses valeurs de m/z correspondant à des nombres de charge (z) élevés. En milieu tamponné, le nombre de charge est beaucoup plus réduit, ce qui déplace les signaux vers de hautes valeurs de m/z (souvent supérieures à 4 000 Th). La large gamme de m/z des spectromètres magnétique et à temps de vol est donc idéale pour l'observation de ces pics. Exemples: Métalloprotéines MZn 17 654,4 M 17 592,3 MZn (des-Met) 17 523,3 Impureté Caractérisation de l'atome de zinc d'une déformylase (déconvolution d'un spectre ESI, conditions natives) Dans le cas des métalloprotéines, la difficulté analytique est liée à la taille du métal qui est très petite devant celle de la protéine. La caractérisation d'un métal se fait en deux temps. Un premier spectre, enregistré en milieu dénaturant, permet de caractériser la partie peptidique de la protéine. Un second spectre, obtenu en milieu tamponné, permet de mesurer la masse de la protéine associée avec son (ou ses) cations(s). La différence de masse entre celle du complexe et celle de la protéine seule permet d'identifier le cation métallique. 34 Interactions protéine/protéine: enzymes dimères M2(Fe-O-Fe)2 Calc. 87 029 Da Mes. 87 033 Da La ribonucléotide-réductase de E. coli contient une sous-unité (R2) qui assure la liaison de l'enzyme à l'ADN et qui est active sous forme de dimère. La présence d'un "cluster" Fe-O-Fe non covalent sur chaque monomère serait nécessaire à l'activité de cet enzyme. Le spectre de masse de la protéine, enregistré dans un tampon bicarbonate d'ammonium montre des pics ioniques dans la région m/z 4100-5500 du spectre. La déconvolution du spectre permet de déterminer sans ambiguïté la nature dimérique de l'enzyme et la présence d'un cluster sur chaque sous-unité (ci-contre). Spectre de masse (ESI) de la ribonucléotide réductase (conditions non-dénaturantes) Protéines tétramériques: le cas de l'hémoglobine Spectre de Masse (ESI) de l'hémoglobine humaine A0 (T: tétramère) Spectre de Masse (ESI) de l'isoméroréductase en présence de Mg2+, NADPH et inhibiteur (I). L'une des questions qui se pose systématiquement lorsque l'on aborde les questions d'interactions non covalentes observées en electrospray est celle de la spécificité de l'association macromoléculaire observée. La formation d'agrégats ioniques (clusters) en phase gazeuse est en effet un processus bien connu en spectrométrie de masse qui peut être de nature à porter la suspicion sur la spécificité des complexes protéine/protéine observés par electrospray. Dans ce contexte, l'hémoglobine, un hétérotétramère composé de deux types différents de sous-unités (α: 15 053 Da et β: 15 954 Da) est un excellent modèle pour évaluer la spécificité de la formation de complexes protéiques en phase gazeuse. Si, dans des conditions dénaturantes, la dissociation de l'hémoglobine se traduit par l'apparition de deux séries de pics correspondant aux deux sous-unités, en revanche, dans des conditions douces, la protéine α2β2 est parfaitement caractérisée, chaque sous-unité étant elle-même liée à une molécule d'hème. L'absence totale de toute autre forme non spécifique de complexe protéine/protéine (α1β3 ou α3β1 par exemple) permet de confirmer la validité de l'analyse par electrospray en termes de spécificité. Complexes protéine/ligand organique La qualité des spectres obtenus à l'aide d'un instrument magnétique ou à temps de vol dans le cas d'enzymes multimériques est illustrée parfaitement par l'étude de protéines associées à leurs cofacteurs métalliques ou organiques ainsi qu'à leur substrat. L'addition successive de cofacteurs et de substrats à une protéine peut permettre de suivre la formation et la stœchiométrie d'entités multimériques complexes comme la présence de quatre atomes de magnésium, de deux NADPH et de deux molécules d'un inhibiteur non covalent sur un enzyme dimère de plus de 115 000 Daltons (isoméroréductase, ci-contre). 35 -MALDI (Matrix-Assisted Laser Desorption/Ionisation) La découverte, faite par Hillenkamp, de la possibilité de désorber des espèces moléculaires de très haute masse (300 000 Da ou plus) par l'utilisation d'un laser et d'une matrice aromatique cristallisable a été à peu près simultanée à celle de l'electrospray. Si le défaut de cette technique réside dans la résolution limitée obtenue sur les pics, elle permet toutefois d'atteindre des masses plus élevées qu'avec l'electrospray et, surtout, elle semble mieux adaptée à l'étude de mélanges, à la présence de sels et, de façon générale, à l'analyse des acides nucléiques et des polysaccharides. Dans ces conditions, l'analyse directe de fluides biologiques semble possible. Très récemment, des caractérisations de complexes multimériques non covalents de très haute masse ont été rapportées (M supérieure à 600 000 Da). Toutefois, ces entités présentent des constantes de stabilité extrêmement élevées et, formées à partir d'une phase cristalline acide, ne peuvent atteindre le degré de spécificité que l'on connaît en electrospray où elles sont obtenues dans de l'eau tamponnée à pH proche de 7. Il n'en demeure pas moins que la sensibilité et la facilité de mise en œuvre inégalées des spectromètres MALDI-TOF ne peuvent que renforcer la place de ces instruments dans le domaine de la mesure de masse de routine à grande échelle (problèmes liés au protéome et à la "protéomique"). V . 2 La détermination de la séquence Les séquences peptidiques sont déduites de la présence sur les spectres d'ions-fragments dont les valeurs de m/z correspondent à des enchaînements d'acides aminés déterminés. L'ionisation des peptides nécessitant la mise en œuvre de techniques douces (FAB/LSIMS, ESI, MALDI), l'obtention de fragments reste donc très aléatoire, ce qui implique le plus souvent de recourir à la MS/MS. Toutefois, la MS/MS n'est applicable qu'à des composés de masse modérée (3000 Daltons est généralement un maximum). Il faut donc, dans le cas des protéines, recourir à une protéolyse initiale pour obtenir un mélange de peptides plus courts qui pourront être analysés individuellement par MS/MS. Par le jeu d'endoprotéases spécifiques (trypsine, Asp-N, …) le recouvrement des séquences des peptides de digestion permet de remonter à la séquence de la protéine entière. Par ailleurs, dans le cas de protéines inconnues, les données de poids moléculaire de peptides de digestion ainsi que quelques éléments de séquence obtenus par MS/MS peuvent être insérés (via Internet) dans des banques de données de protéines et permettent l'identification de la protéine étudiée. C'est la cause essentielle du succès de la spectrométrie de masse dans la problématique du protéome. Nomenclature des fragments peptidiques (Roepstorff et Fohlman complétée par Biemann): A1 B1 C1 O An-1 Bn-1 Cn-1 R2 O Rn H2N OH N H N H Rn-1 O R1 Xn-1 Yn-1 Zn-1 O X1 Y1 Z1 Ions C-terminaux Ions N-terminaux An: H-(NH-CHR-CO)n-1-N+H=CHRn Xn:+OC-NH-CHRn-CO-(NH-CHR-CO)n-1-OH Bn: H-(NH-CHR-CO)n-1-NH-CHRn-CO Yn: [H(NH-CHR-CO)n-OH + H]+ Cn: [H-(NH-CHR-CO)n-NH2 + H]+ Zn: [CH(=RnaRnb)-CO-(NH-CHR-CO)n-1-OH + H]+ + 36 C'est la succession, sur un spectre, de fragments de séquence appartenant à la même série (en général Y ou B, souvent A lorsque l'acide aminé N-terminal est basique) qui permet de reconnaître la séquence du peptide puisque la différence de m/z entre deux pics de la même série correspond à la masse caractéristique d'un résidu. En FAB et LSIMS, des fragments caractéristiques de la séquence peuvent apparaître sur les spectres qui présentent cependant des inconvénients majeurs: Ø Présence d'ions issus de la matrice, notamment en basse masse, qui masquent des fragments de séquence et rendent hasardeuse l'attribution des pics, Ø Présence d'ions adduits avec la matrice, Ø Présence éventuelle d'ions cationisés, Ø Nécessité d'une parfaite pureté du composé. En electrospray (ESI), il est également possible, par le jeu de la collision à l'interface source/analyseur, de provoquer la fragmentation du peptide. Toutefois, les performances de cette approche demeurent relativement limitées, par comparaison avec la MS/MS. 934.4 * 100 % I I R 288.3 T H Y-NO2 S 401.3 175.1 538.3 50 847.4 639.4 0 200 300 400 500 600 700 800 900 m/z Localisation d'une nitro-tyrosine au sein d'un peptide par activation collisionnelle à l'interface d'une source electrospray. Le séquençage par MS/MS: Le couplage entre méthodes de désorption et MS/MS est très intéressant en raison de la grande abondance de molécules protonées [M+H]+, doublement chargées [M+2H]2+ ou cationisées produites à partir des peptides. Sur ces ions, la collision obtenue en CID de haute énergie sur des instruments magnétiques (MIKE ou MS/MS) semble plus intéressante que celle obtenue en basse énergie avec des quadripôles. Les ions fragments obtenus dans ces conditions appartiennent majoritairement aux séries B et Y. 37 Théoriquement, une seule série (B, Y ou autre) devrait suffire à la détermination de séquence mais l'existence d'une seconde permet de confirmer le résultat obtenu. Appareils: Ø BE (MIKE) Ø Appareils magnétiques multi-secteurs qui permettent une haute résolution aussi bien sur les ionsprécurseurs que sur les ions-produits. Ce sont d'excellents instruments mais aussi les plus coûteux. Dans ce domaine, parmi les équipes pionnières dans le séquençage de peptides sur tandems magnétiques, on citera surtout Biemann (M.I.T.) et Burlingame (San Francisco). Ces équipes ont développé des programmes informatiques de calcul d'incréments basés sur les différentes séries ioniques, permettant une interprétation plus rapide des spectres et le couplage des données spectrométriques avec la recherche en banque de données. Ø Dans le domaine des hautes énergies, de nouveaux spectromètres tandem, constitués à chaque étage d'un analyseur à temps de vol (TOF-TOF), sont apparus en 2001. En raison de leurs performances inhérentes (haute énergie, haute résolution sur les fragments et haute sensibilité) ces instruments semblent très prometteurs. Ø Appareils à temps de vol. Les instruments dotés d'un réflectron permettent, dans certaines conditions, d'observer des fragmentations d'ions métastables durant le vol (voire activés par collision). Un balayage adéquat des potentiels du miroir électrostatique permet de détecter ces fragments et d'obtenir ainsi, à partir de peptides désorbés par MALDI, quelques données de séquence. Cette technique, très récente, est appelée "Post-Source Decay" ou PSD (décomposition après la source). Ø Appareils hybrides Q-TOF. Ces instruments offrent des analyses MS/MS dans les deux modes d'ionisation MALDI et electrospray. Leur succès considérable est lié à leur sensibilité dans la détection des ions-fragments et à la résolution atteinte par le second analyseur à temps de vol. Ø Trappes à ion. Outre la grande sensibilité de ces appareils, la possibilité de réaliser des expériences de MSn permet de lever des ambiguïtés d'attribution pour les fragments formés par MS/MS. V . 3 Le problème des mélanges En matière d'étude de peptides et de protéines, ce problème est crucial. Par exemple, on l'a mentionné plus haut, l'étude de la séquence d'une protéine par spectrométrie de masse nécessite toujours, à un moment ou un autre, un clivage enzymatique ou chimique (hydrolyse acide, BrCN). Les peptides fragments destinés à l'analyse de séquence par spectrométrie de masse se trouveront donc en mélange. Nous l'avons également précisé, l'analyse de composés en mélange est un domaine d'application de choix de la MS/MS. Nous n'y reviendrons pas. Cependant, elle peut être parfois rendue délicate lorsque l'on utilise certains modes d'ionisation comme le FAB ou la LSIMS. En effet, la désorption du composé dépend de son activité de surface vis à vis de la goutte de matrice. Or, les peptides ont des polarités très variées et il n'est pas rare qu'en FAB un produit minoritaire apparaisse sur le spectre de masse avec une intensité relative plus forte que le composé majoritaire; dans le cas de peptides, un produit pur à 90 % peut être ainsi totalement "masqué" par les 10 % restant. C'est l'effet dit de "suppression spectrale". Il est donc préférable, dans ce cas, de séparer les peptides avant l'analyse, la MS/MS n'intervenant que pour le séquençage proprement dit. Depuis quelques années, la séparation des peptides par électrophorèse ou HPLC capillaires est devenue parfaitement compatible avec une analyse simultanée par spectrométrie de masse. Ces deux techniques sont particulièrement bien adaptées au couplage avec l'electrospray puisque l'introduction des composés dans le spectromètre se fait, dans ce cas, par injection d'une solution aqueuse ou d'un hydro-organique du composé à analyser. Le débit d'éluant compatible avec l'electrospray varie considérablement selon le dessin des sources, de l'ordre du ml/min jusqu'à quelques dizaines de nl/min (en "nanospray"). La miniaturisation des colonnes, la mise en place de diviseurs de flux (split), la détection parallèle (détecteurs UV, détecteur à diffusion de lumière ou autre) représentent autant d'amélioration du système. Avec la chromatographie liquide multidimensionnelle (MDLC), la 38 spectrométrie de masse (MS et MS/MS) atteint un degré d'efficacité qui était inimaginable il y a encore quelques années. Conclusion La spectrométrie de masse organique a évolué, comme méthode d'analyse structurale, de la Chimie organique vers la Chimie biologique. Parallèlement, l'explosion des méthodes de Chimie combinatoire ou les problèmes biologiques liés à la post-génomique tels que l'identification de protéines issues de gels d'électrophorèse 2D ont justifié le développement actuel de la spectrométrie de masse, en recherche, en achats d'appareils, et en emplois créés. Il n'en demeure pas moins que, quelle que soit la nature du problème analytique, la spectrométrie de masse continue à n'observer rien d'autre que des ions organiques en phase gazeuse, dont la réactivité est conditionnée par leur structure et régie par les règles de thermodynamique et de cinétique. La connaissance de ces domaines et celle des instruments de mesure que l'on va utiliser pour scruter les échantillons reste donc essentielle en spectrométrie de masse et ne doit pas être occultée par les succès récents et spectaculaires de cette discipline.