Etude des peptides et des protéines par spectrométrie de masse

Transcription

Etude des peptides et des protéines par spectrométrie de masse
32
CHAPITRE V ÉTUDE DES PEPTIDES ET DES PROTÉINES PAR SPECTROMÉTRIE DE MASSE
Introduction: intérêt de la spectrométrie de masse pour l'étude des protéines
Les deux origines de la connaissance des séquences de protéines et de peptides sont le séquençage du
génome, d'une part, le séquençage de la protéine d'autre part (méthode d'Edman sur microséquenceurs
automatiques). La première approche est indirecte et prédictive alors que la seconde est basée sur la
dérivation chimique (dérivés phénylthiohydantoïnes ou PTH de la fonction amine terminale) et le
comportement chromatographique des acides aminés individuels. La spectrométrie de masse, à la
différence de ces deux méthodes, est un outil d'analyse directe du composé. Le séquençage des acides
aminés par la méthode d'Edman bute sur un certain nombre d'écueils: blocage éventuel du groupement
amine-terminal, chaîne peptidique branchée, un acide aminé modifié non reconnu ou identifié à tort à
un acide aminé classique, etc… Le séquençage d'Edman est également inapproprié aux peptides
cycliques.
Le séquençage du génome ne permet d'attribuer au peptide qu'une structure probable par traduction
des codons en acides aminés correspondant. Il ne tient donc pas compte des modifications chimiques
post-traductionnelles qui se produisent souvent dans le milieu cellulaire et qui peuvent être nécessaires
à l'activité du peptide ou de la protéine. Il y a donc nécessité de vérifier, par une analyse directe du
peptide l'adéquation de sa structure à celle qui est prévue par le séquençage du génome. Cette
vérification est absolument essentielle dans le cas de protéines recombinantes.
De manière générale, les techniques du génie génétique qui consistent à faire exprimer par une lignée
cellulaire un gène codant pour une protéine issue d'une lignée cellulaire différente exigent que l'on
vérifie l'identité du peptide ou de la protéine issus de cette nouvelle source ou que l'on décèle
d'éventuelles modifications. Dans le cas où les peptides seraient produits en mélange, la MS/MS ou le
couplage chromatographie/SM peuvent être rendus nécessaires. Tout particulièrement lorsque le
composé est destiné à un usage pharmaceutique, l'identification du peptide majoritaire doit se
compléter par celle des dérivés minoritaires (de dégradation par exemple) et éventuellement de leur
dosage. Enfin, dans nombre de cas, l'origine naturelle de ces composés et leur isolement à partir de
matrices biologiques, font en sorte qu'ils ne peuvent souvent être obtenus qu'en faible quantité; il y a
donc nécessité d'une grande sensibilité de la technique d'analyse.
Dans le cas d'une protéine, si l'importance de la masse moléculaire en a fait longtemps des composés
rétifs à l'analyse spectrométrique, aujourd'hui, grâce à l'electrospray ou au MALDI, la mesure de
masse de composés dont le poids moléculaire atteint plusieurs dizaines de milliers de Daltons est du
domaine de la routine, même si la quantité de produit analysé n'excède pas quelques picomoles.
La bonne maîtrise des techniques de couplage LC/MS ou CZE (électrophorèse capillaire)/MS avec une
source electrospray permet d'obtenir simultanément la séparation et l'analyse de mélanges de peptides
ou de protéines dont chaque composant est en quantité picomolaire.
Enfin, le séquençage par MS/MS de peptides se fait désormais en routine; l'apparition d'appareils
magnétiques tandem dotés de détecteurs extrêmement sensibles permet de compléter efficacement le
séquençage d'Edman sur des composés isolés en quantités de plus en plus faibles.
V . 1 Le problème des hautes masses
Quelles sont les informations que l'on peut tirer de la masse moléculaire ?
Ø Dans le cas ou le peptide est inconnu, il s'agit évidemment d'une donnée essentielle
33
Ø Dans le cas où le peptide (ou la protéine) serait connu, cela permet de vérifier la masse
moléculaire par rapport à ce qui était attendu à la suite du séquençage du génome ou de la protéine
selon Edman; il s'agit alors d'une vérification indirecte (car globale) de la séquence peptidique.
Quelques problèmes concrets peuvent ainsi être abordés
Ø Détection de modifications post-traductionnelles d'acides aminés: N-acylations, Ophosphorylations, sulfatations, O- et N-glycosylations se traduisent par un accroissement,
mesurable et connu, du poids moléculaire.
Ø Formation de ponts disulfure: chaque pont S-S formé se traduit par la perte de deux unités de
masse par rapport à la valeur attendue.
Ø Un remplacement d'acide aminé par un autre se traduit par une modification de la masse
moléculaire, l'emplacement de ce nouvel acide aminé étant déterminé par séquençage MS/MS. Par
ailleurs, les contraintes du code génétique ne rendent possibles qu'un nombre limité d'échanges
d'acides aminés, les mutations étant le plus souvent "simple base".
Ø Perte d'un ou de plusieurs acides aminés: cette modification post-traductionnelle relativement
fréquente (protéolyse) abaisse le poids moléculaire du composé. Deux méthodes sont utilisées
pour la mesure de masse de protéines de grande taille (10 000 Da et plus): l'ionisation par
electrospray et l'ionisation MALDI.
V . 1 . A L'electrospray et la caractérisation de protéines dénaturées ou à l'état natif:
L'utilisation de systèmes solvants comprenant une large part de solvants (alcools, acétonitrile) et
d'acides (formique, acétique, trifluoroacétique) organiques conduit, dans la plupart des cas, à une
dénaturation de la protéine, c'est à dire à une rupture de la plupart des liaisons faibles intra- ou
intermoléculaires. Dans ces conditions, seul reste observable l'enchaînement peptidique.
Si l'échantillon est dissout dans de l'eau tamponnée à un pH proche de la neutralité à l'aide de sels
volatils (acétate ou bicarbonate d'ammonium), certaines interactions faibles survivent au processus
d'évaporation ionique. Ces conditions permettent l'observation de protéines dans un état dit "natif",
c'est à dire dans lequel leurs structures tertiaire (repliée) et quaternaire (protéines multimériques) ainsi
que leurs liaisons avec des cofacteurs métalliques ou organiques sont conservées.
De façon générale, la différence de conditions expérimentales se traduit par des différences spectrales
spectaculaires. Dans des conditions dénaturantes, le spectre electrospray d'une protéine présente
généralement un grand nombre de pics ioniques à relativement basses valeurs de m/z correspondant à
des nombres de charge (z) élevés. En milieu tamponné, le nombre de charge est beaucoup plus réduit,
ce qui déplace les signaux vers de hautes valeurs de m/z (souvent supérieures à 4 000 Th). La large
gamme de m/z des spectromètres magnétique et à temps de vol est donc idéale pour l'observation de
ces pics.
Exemples: Métalloprotéines
MZn
17 654,4
M
17 592,3
MZn
(des-Met)
17 523,3
Impureté
Caractérisation de l'atome de zinc d'une
déformylase (déconvolution d'un spectre
ESI, conditions natives)
Dans le cas des métalloprotéines, la difficulté
analytique est liée à la taille du métal qui est
très petite devant celle de la protéine. La
caractérisation d'un métal se fait en deux
temps. Un premier spectre, enregistré en
milieu dénaturant, permet de caractériser la
partie peptidique de la protéine. Un second
spectre, obtenu en milieu tamponné, permet
de mesurer la masse de la protéine associée
avec son (ou ses) cations(s). La différence de
masse entre celle du complexe et celle de la
protéine seule permet d'identifier le cation
métallique.
34
Interactions protéine/protéine: enzymes dimères
M2(Fe-O-Fe)2
Calc. 87 029 Da
Mes. 87 033 Da
La ribonucléotide-réductase de E. coli
contient une sous-unité (R2) qui assure la
liaison de l'enzyme à l'ADN et qui est active
sous forme de dimère. La présence d'un
"cluster" Fe-O-Fe non covalent sur chaque
monomère serait nécessaire à l'activité de cet
enzyme. Le spectre de masse de la protéine,
enregistré dans un tampon bicarbonate
d'ammonium montre des pics ioniques dans
la région m/z 4100-5500 du spectre. La
déconvolution du spectre permet de
déterminer sans ambiguïté la nature
dimérique de l'enzyme et la présence d'un
cluster sur chaque sous-unité (ci-contre).
Spectre de masse (ESI) de la ribonucléotide réductase
(conditions non-dénaturantes)
Protéines tétramériques: le cas de l'hémoglobine
Spectre de Masse (ESI) de
l'hémoglobine humaine A0 (T:
tétramère)
Spectre de Masse (ESI) de
l'isoméroréductase en présence de Mg2+,
NADPH et inhibiteur (I).
L'une des questions qui se pose systématiquement lorsque l'on
aborde les questions d'interactions non covalentes observées
en electrospray est celle de la spécificité de l'association
macromoléculaire observée. La formation d'agrégats ioniques
(clusters) en phase gazeuse est en effet un processus bien
connu en spectrométrie de masse qui peut être de nature à
porter la suspicion sur la spécificité des complexes
protéine/protéine observés par electrospray. Dans ce contexte,
l'hémoglobine, un hétérotétramère composé de deux types
différents de sous-unités (α: 15 053 Da et β: 15 954 Da) est un
excellent modèle pour évaluer la spécificité de la formation de
complexes protéiques en phase gazeuse. Si, dans des
conditions dénaturantes, la dissociation de l'hémoglobine se
traduit par l'apparition de deux séries de pics correspondant
aux deux sous-unités, en revanche, dans des conditions
douces, la protéine α2β2 est parfaitement caractérisée, chaque
sous-unité étant elle-même liée à une molécule d'hème.
L'absence totale de toute autre forme non spécifique de
complexe protéine/protéine (α1β3 ou α3β1 par exemple) permet
de confirmer la validité de l'analyse par electrospray en termes
de spécificité.
Complexes protéine/ligand organique
La qualité des spectres obtenus à l'aide d'un instrument
magnétique ou à temps de vol dans le cas d'enzymes
multimériques est illustrée parfaitement par l'étude de
protéines associées à leurs cofacteurs métalliques ou
organiques ainsi qu'à leur substrat. L'addition successive de
cofacteurs et de substrats à une protéine peut permettre de
suivre la formation et la stœchiométrie d'entités multimériques
complexes comme la présence de quatre atomes de
magnésium, de deux NADPH et de deux molécules d'un
inhibiteur non covalent sur un enzyme dimère de plus de 115
000 Daltons (isoméroréductase, ci-contre).
35
-MALDI (Matrix-Assisted Laser Desorption/Ionisation)
La découverte, faite par Hillenkamp, de la possibilité de désorber des espèces moléculaires de très
haute masse (300 000 Da ou plus) par l'utilisation d'un laser et d'une matrice aromatique cristallisable
a été à peu près simultanée à celle de l'electrospray. Si le défaut de cette technique réside dans la
résolution limitée obtenue sur les pics, elle permet toutefois d'atteindre des masses plus élevées
qu'avec l'electrospray et, surtout, elle semble mieux adaptée à l'étude de mélanges, à la présence de
sels et, de façon générale, à l'analyse des acides nucléiques et des polysaccharides. Dans ces
conditions, l'analyse directe de fluides biologiques semble possible. Très récemment, des
caractérisations de complexes multimériques non covalents de très haute masse ont été rapportées (M
supérieure à 600 000 Da). Toutefois, ces entités présentent des constantes de stabilité extrêmement
élevées et, formées à partir d'une phase cristalline acide, ne peuvent atteindre le degré de spécificité
que l'on connaît en electrospray où elles sont obtenues dans de l'eau tamponnée à pH proche de 7. Il
n'en demeure pas moins que la sensibilité et la facilité de mise en œuvre inégalées des spectromètres
MALDI-TOF ne peuvent que renforcer la place de ces instruments dans le domaine de la mesure de
masse de routine à grande échelle (problèmes liés au protéome et à la "protéomique").
V . 2 La détermination de la séquence
Les séquences peptidiques sont déduites de la présence sur les spectres d'ions-fragments dont les
valeurs de m/z correspondent à des enchaînements d'acides aminés déterminés. L'ionisation des
peptides nécessitant la mise en œuvre de techniques douces (FAB/LSIMS, ESI, MALDI), l'obtention
de fragments reste donc très aléatoire, ce qui implique le plus souvent de recourir à la MS/MS.
Toutefois, la MS/MS n'est applicable qu'à des composés de masse modérée (3000 Daltons est
généralement un maximum). Il faut donc, dans le cas des protéines, recourir à une protéolyse initiale
pour obtenir un mélange de peptides plus courts qui pourront être analysés individuellement par
MS/MS. Par le jeu d'endoprotéases spécifiques (trypsine, Asp-N, …) le recouvrement des séquences
des peptides de digestion permet de remonter à la séquence de la protéine entière. Par ailleurs, dans le
cas de protéines inconnues, les données de poids moléculaire de peptides de digestion ainsi que
quelques éléments de séquence obtenus par MS/MS peuvent être insérés (via Internet) dans des
banques de données de protéines et permettent l'identification de la protéine étudiée. C'est la cause
essentielle du succès de la spectrométrie de masse dans la problématique du protéome.
Nomenclature des fragments peptidiques (Roepstorff et Fohlman complétée par Biemann):
A1
B1
C1
O
An-1 Bn-1 Cn-1
R2
O
Rn
H2N
OH
N
H
N
H
Rn-1
O
R1
Xn-1 Yn-1 Zn-1
O
X1
Y1
Z1
Ions C-terminaux
Ions N-terminaux
An: H-(NH-CHR-CO)n-1-N+H=CHRn
Xn:+OC-NH-CHRn-CO-(NH-CHR-CO)n-1-OH
Bn: H-(NH-CHR-CO)n-1-NH-CHRn-CO
Yn: [H(NH-CHR-CO)n-OH + H]+
Cn: [H-(NH-CHR-CO)n-NH2 + H]+
Zn: [CH(=RnaRnb)-CO-(NH-CHR-CO)n-1-OH + H]+
+
36
C'est la succession, sur un spectre, de fragments de séquence appartenant à la même série (en général
Y ou B, souvent A lorsque l'acide aminé N-terminal est basique) qui permet de reconnaître la séquence
du peptide puisque la différence de m/z entre deux pics de la même série correspond à la masse
caractéristique d'un résidu.
En FAB et LSIMS, des fragments caractéristiques de la séquence peuvent apparaître sur les spectres
qui présentent cependant des inconvénients majeurs:
Ø Présence d'ions issus de la matrice, notamment en basse masse, qui masquent des fragments de
séquence et rendent hasardeuse l'attribution des pics,
Ø Présence d'ions adduits avec la matrice,
Ø Présence éventuelle d'ions cationisés,
Ø Nécessité d'une parfaite pureté du composé.
En electrospray (ESI), il est également possible, par le jeu de la collision à l'interface source/analyseur,
de provoquer la fragmentation du peptide. Toutefois, les performances de cette approche demeurent
relativement limitées, par comparaison avec la MS/MS.
934.4
*
100 %
I
I
R
288.3
T
H
Y-NO2
S
401.3
175.1
538.3
50
847.4
639.4
0
200
300
400
500
600
700
800
900
m/z
Localisation d'une nitro-tyrosine au sein d'un peptide par activation collisionnelle à l'interface d'une
source electrospray.
Le séquençage par MS/MS:
Le couplage entre méthodes de désorption et MS/MS est très intéressant en raison de la grande
abondance de molécules protonées [M+H]+, doublement chargées [M+2H]2+ ou cationisées produites à
partir des peptides. Sur ces ions, la collision obtenue en CID de haute énergie sur des instruments
magnétiques (MIKE ou MS/MS) semble plus intéressante que celle obtenue en basse énergie avec des
quadripôles. Les ions fragments obtenus dans ces conditions appartiennent majoritairement aux séries
B et Y.
37
Théoriquement, une seule série (B, Y ou autre) devrait suffire à la détermination de séquence mais
l'existence d'une seconde permet de confirmer le résultat obtenu.
Appareils:
Ø BE (MIKE)
Ø Appareils magnétiques multi-secteurs qui permettent une haute résolution aussi bien sur les ionsprécurseurs que sur les ions-produits. Ce sont d'excellents instruments mais aussi les plus coûteux.
Dans ce domaine, parmi les équipes pionnières dans le séquençage de peptides sur tandems
magnétiques, on citera surtout Biemann (M.I.T.) et Burlingame (San Francisco). Ces équipes ont
développé des programmes informatiques de calcul d'incréments basés sur les différentes séries
ioniques, permettant une interprétation plus rapide des spectres et le couplage des données
spectrométriques avec la recherche en banque de données.
Ø Dans le domaine des hautes énergies, de nouveaux spectromètres tandem, constitués à chaque
étage d'un analyseur à temps de vol (TOF-TOF), sont apparus en 2001. En raison de leurs
performances inhérentes (haute énergie, haute résolution sur les fragments et haute sensibilité) ces
instruments semblent très prometteurs.
Ø Appareils à temps de vol. Les instruments dotés d'un réflectron permettent, dans certaines
conditions, d'observer des fragmentations d'ions métastables durant le vol (voire activés par
collision). Un balayage adéquat des potentiels du miroir électrostatique permet de détecter ces
fragments et d'obtenir ainsi, à partir de peptides désorbés par MALDI, quelques données de
séquence. Cette technique, très récente, est appelée "Post-Source Decay" ou PSD (décomposition
après la source).
Ø Appareils hybrides Q-TOF. Ces instruments offrent des analyses MS/MS dans les deux modes
d'ionisation MALDI et electrospray. Leur succès considérable est lié à leur sensibilité dans la
détection des ions-fragments et à la résolution atteinte par le second analyseur à temps de vol.
Ø Trappes à ion. Outre la grande sensibilité de ces appareils, la possibilité de réaliser des expériences
de MSn permet de lever des ambiguïtés d'attribution pour les fragments formés par MS/MS.
V . 3 Le problème des mélanges
En matière d'étude de peptides et de protéines, ce problème est crucial. Par exemple, on l'a mentionné
plus haut, l'étude de la séquence d'une protéine par spectrométrie de masse nécessite toujours, à un
moment ou un autre, un clivage enzymatique ou chimique (hydrolyse acide, BrCN). Les peptides
fragments destinés à l'analyse de séquence par spectrométrie de masse se trouveront donc en mélange.
Nous l'avons également précisé, l'analyse de composés en mélange est un domaine d'application de
choix de la MS/MS. Nous n'y reviendrons pas. Cependant, elle peut être parfois rendue délicate
lorsque l'on utilise certains modes d'ionisation comme le FAB ou la LSIMS. En effet, la désorption du
composé dépend de son activité de surface vis à vis de la goutte de matrice. Or, les peptides ont des
polarités très variées et il n'est pas rare qu'en FAB un produit minoritaire apparaisse sur le spectre de
masse avec une intensité relative plus forte que le composé majoritaire; dans le cas de peptides, un
produit pur à 90 % peut être ainsi totalement "masqué" par les 10 % restant. C'est l'effet dit de
"suppression spectrale". Il est donc préférable, dans ce cas, de séparer les peptides avant l'analyse, la
MS/MS n'intervenant que pour le séquençage proprement dit.
Depuis quelques années, la séparation des peptides par électrophorèse ou HPLC capillaires est
devenue parfaitement compatible avec une analyse simultanée par spectrométrie de masse. Ces deux
techniques sont particulièrement bien adaptées au couplage avec l'electrospray puisque l'introduction
des composés dans le spectromètre se fait, dans ce cas, par injection d'une solution aqueuse ou d'un
hydro-organique du composé à analyser. Le débit d'éluant compatible avec l'electrospray varie
considérablement selon le dessin des sources, de l'ordre du ml/min jusqu'à quelques dizaines de nl/min
(en "nanospray"). La miniaturisation des colonnes, la mise en place de diviseurs de flux (split), la
détection parallèle (détecteurs UV, détecteur à diffusion de lumière ou autre) représentent autant
d'amélioration du système. Avec la chromatographie liquide multidimensionnelle (MDLC), la
38
spectrométrie de masse (MS et MS/MS) atteint un degré d'efficacité qui était inimaginable il y a
encore quelques années.
Conclusion
La spectrométrie de masse organique a évolué, comme méthode d'analyse structurale, de la Chimie
organique vers la Chimie biologique. Parallèlement, l'explosion des méthodes de Chimie combinatoire
ou les problèmes biologiques liés à la post-génomique tels que l'identification de protéines issues de
gels d'électrophorèse 2D ont justifié le développement actuel de la spectrométrie de masse, en
recherche, en achats d'appareils, et en emplois créés.
Il n'en demeure pas moins que, quelle que soit la nature du problème analytique, la spectrométrie de
masse continue à n'observer rien d'autre que des ions organiques en phase gazeuse, dont la réactivité
est conditionnée par leur structure et régie par les règles de thermodynamique et de cinétique. La
connaissance de ces domaines et celle des instruments de mesure que l'on va utiliser pour scruter les
échantillons reste donc essentielle en spectrométrie de masse et ne doit pas être occultée par les succès
récents et spectaculaires de cette discipline.

Documents pareils