Réseau moléculaire
Transcription
Réseau moléculaire
Quelques outils et idées en spectrométrie de masse assistée par vos neurones et la bioinformatique David TOUBOUL CNRS ICSN Gif-sur-Yvette [email protected] La problématique des « big data » L’étude des systèmes biologiques conduit à la nécessité de gérer des données de plus en plus conséquentes de données afin d’évaluer un plus grand nombre de variables (pertinentes ou non). Deux approches sont possibles et complémentaires: - Approches ciblées (connaissance a priori de l’objet à étudier ou hypothèses initiales plus ou moins crédibles) - Approches non ciblées (génération de « big data ») - Comment les générer ? - Comment les stocker ? - Comment les analyser ? 2 Un cas simple: la protéomique Simple car: - 20 acides aminés principaux - Des modifications connus et facile à implémenter - Des bases de données riches (mais avec des erreurs d’annotation aussi) 3 Un cas compliqué: la métabolomique Pas plus de complexité qu’en protéomique en terme de nombre de molécules détectées Mais plus compliqué d’interprétation car: - un grand nombre de fonctions chimiques et de squelettes carbonés - base de données incomplètes 4 Première étape: choisir sa stratégie ! Shotgun: Rapide MS haute résolution nécessaire Suppression ionique Difficile pour la quantification Chromatographie-MS: Long Pas de méthode universelle pour toutes les classes de molécules MS haute résolution nécessaire Moins de suppression ionique Plus facile pour la quantification 5 Première étape: choisir sa stratégie ! DOI: 10.1021/acs.analchem.5b04491 Anal. Chem. 2016, 88, 524−545 6 La physico-chimie au cœur du problème MTBE: Méthyl tert-butyl éther Shotgun: tout est dans la préparation de l’échantillon DOI: 10.1021/acs.analchem.5b04491 Anal. Chem. 2016, 88, 524−545 8 Chromatographie: un vaste choix … ! Ne pas négliger la GC-MS ! DOI: 10.1021/acs.analchem.5b04491 Anal. Chem. 2016, 88, 524−545 9 Chromatographie: un vaste choix … 10 Source d’ionisation et polarité 11 Impact électronique M+ e- . + M filament + 2 e70 V ℓℓℓℓℓℓℓℓℓℓℓℓℓℓ électrons + repousseur + vers l’analyseur + + + ions molécules V0 anode (trappe) 12 Impact électronique L’énergie d’ionisation dépend des électrons de la HOMO: Type d’orbitale: s, p, n Électronégativité de l’atome porteur Et de la stabilité de l’ion formé 13 Impact électronique 14 Impact électronique Esterification O R C OH + CH3 OH O KOH BF3 R C O Acide gras CH 3 Ester méthylique Silylation O t-BDMCS O R C OH Acide gras + MTBSTFA 1H, 60°C N-Methyl-N-[tertbutyldimethylsilyl] trifluoroacetimide R CH CH3 3 C O Si C CH 3 CH3 CH 3 Dérivé t-BDMS 15 Impact électronique Un spectre impact électronique 70 eV M +• CH2OH -CH2O -NO2 -H2O NO2 M+• : m/z 153 -OH -NO -C2H2 -HCO 16 Banque de données en IE Scheubert et al. Journal of Cheminformatics 2013, 5:12 17 GC-IE-MS Un outil extrêmement robuste et fiable pour la métabolomique mais un accès restreint au métabolome … 18 GC-IE-HRMS 19 Ionisation chimique Première étape: Ionisation d’un gaz réactif (exemple: l’ammoniac): NH3 + e→ NH3+. + 2 eNH3+. + NH3 → NH4+ + NH2. Deuxième étape: protonation de la molécule M par l'ion ammonium M + NH4+ → (M …..H….. NH3)+ → m/z 18 m/z M+18 MH+ + NH3 m/z M+1 Lorsque l'on utilise un gaz réactif GH+, la réaction qui se produit avec la molécule M peut s'écrire de la façon suivante: M + GH+ → MH+ + G GH+ → G + H+ MH+ → M + H+ ΔH°(G) = AP(G) ΔH°(M) = AP(M) Les enthalpies de ces deux réactions s'appellent "affinités protoniques" (respectivement du gaz et de la molécule à analyser); elles correspondent au terme enthalpique de la basicité en phase gazeuse. La réaction de protonation a lieu lorsque AP(G )< AP(M) Concrètement, on choisira un gaz réactif adapté à la molécule étudiée (de plus faible AP), en général dans le but de limiter les phénomènes de fragmentation. 20 Ionisation chimique CH4 H2O isobutane NH3 21 Ionisation chimique Un spectre IC positive MH+ CH2OH NO2 MH+ : m/z 154 -H2O 22 Source à pression atmosphérique 23 Une vue non globale du métabolome Phase A: n-heptane/ethyl acetate (99.8:0.2, v/v), Phase B : acetone/ethyl acetate (2:1; v/v) +0.02% acetic acid, Phase C : propan-2-ol/water (85:15, v/v) + 0.05% acetic acid and ethanolamine. Imbert L, Gaudin M, Libong D, Touboul D, Abreu S, Loiseau PM, Laprévote O, Chaminade P. J Chromatogr A. 2012 Jun 15;1242:75-83. 24 Une vue non globale du métabolome Imbert L, Gaudin M, Libong D, Touboul D, Abreu S, Loiseau PM, Laprévote O, Chaminade P. J Chromatogr A. 2012 Jun 15;1242:75-83. 25 Une vue non globale du métabolome PC, PE, SM, Cer, GalCer 7 ESI+ TOF-MS -4 4 LPC, LPE 3 ESITOF-MS 3 -6 5 Intensity (x10 ) 6 Intensity (x10 ) 4 2 FFA 2 PE, PG, PI, Cer, GalCer, ST, 1 1 0 0 0 2 4 6 8 10 0 2 4 6 8 10 Retention time (min) Retention time (min) Fig 1 : Positive ESI UPLC-MS lipid profile of a control brain sample Fig 2 : Negative ESI UPLC-MS lipid profile of a control brain sample Solvent A : H2O/ACN 60/40 + 10 mM AcONH4 Solvent B : ACN/iPrOH 50/50 + 10 mM AcONH4 26 Le spectromètre de masse - Résolution spectrale - Résolution chromatographique - Résolution en masse 27 Le spectromètre de masse Il est donc impératif de bien étalonner un spectromètre de masse pour obtenir des mesures en haute précision en masse (HRMS)!!! 28 Le spectromètre de masse Élément Isotope Masse isotopique Rapport isotopique H 1 1,00782503207 0,999885 2 2,0141017778 0,000115 12 12,0000000000 0,9893 13 13,0033548378 0,0107 14 14,0030740048 0,99636 15 15,0001088982 0,00364 16 15,99491461956 0,99757 17 16,99913170 0,00038 18 17,9991610 0,00205 C N 0 Défaut de masse! 29 Le spectromètre de masse Élément Isotope Masse isotopique Rapport isotopique Cl 35 34.96885268 0.7576 37 36.96590259 0.2424 79 78.9183371 0.5069 81 80.9162906 0.4931 190 189.959932 0.00014 192 191.9610380 0.00782 194 193.9626803 0.32967 195 194.9647911 0.33832 196 195.9649515 0.25242 198 197.967893 0.07163 Br Pt 30 Le spectromètre de masse - Basse résolution: quadripôle / trappe ionique (2D ou 3D) - Haute résolution: TOF, Orbitrap, FT-ICR - Et toutes les combinaisons de ces techniques ! Un seul impératif: il faut que le spectromètre de masse ait une vitesse de scan compatible avec le système chromatographique (identification versus quantification) 31 Workflow en métabolomique doi:10.1038/nrd4510 33 Comparaison de deux populations: analyse statistique univarié et multivarié - Univariée: une seule variable comme observable - Multivariée: prise en compte de tous les paramètres 34 Annotation de pics 35 Annotation de pics 36 Annotation de pics 37 Annotation de pics Scheubert et al. Journal of Cheminformatics 2013, 5:12 38 Banque de données Banque de données doi:10.1038/nrd4510 Comment identifier ? - Spectrométrie de masse tandem (MS/MS, principalement CID ou HCD pour les métabolites) - Spectroscopie optique non destructive (UV-Vis, fluorescence…) - Isolement et RMN 41 Quid des énergies de collision et de la transposition des spectres MS/MS par collision ? Scheubert et al. Journal of Cheminformatics 2013, 5:12 Mode d’acquisition des données Mode d’acquisition des données Méthode SWAT (Sciex) Mode d’acquisition des données Data-Dependant Acquisition (DDA) DDA 50 20 s s 10 Our condition in DDA mode: MS 10 spectres/s MS/MS a maximum of 4 precursor ions per cycle MS MS/MS MS/MS MS/MS MS/MS 100 ms 250 ms 250 ms 250 ms 250 ms s Total operating time: 1.2 s between 2 scans until 16 spectra acquisitions in until 8 spectra MSMS acquisitions in MSMS 47 DDA MS-1 scan (100ms) - iBuOH Perte théo: 88,0524 Perte exp: 88,0516 - TiglOH MS/MS-1 scan (250 ms) Perte théo: 100,0524 Perte exp: 100,0554 48 Arbre décisionnel DOI 10.1007/s11306-015-0882-8 49 Aide à l’identification des spectres MS/MS 50 Stratégies ??? 51 Stratégies ??? 52 Fragmentation in silico Prédictions de structure Arbre de fragmentation Arbre de fragmentation 57 Un autre point de vue … la déréplication Nat. Prod. Rep., 2015, 32, 779–810 | 58 Domaine en plein essor 59 Complexité et intérêt du vivant doi:10.1038/nrd4510 Problématique - Faire le tri entre le connu et l’inconnu - Classer l’intérêt de l’inconnu - Rapide et simple 61 Réseau moléculaire Ce n’est, ni plus ni moins, qu’une manière de classer des spectres de masse tandem par homologie, donc assez similaire des arbres de fragmentation sans décrire réellement les voies de fragmentation! 62 Facteur de similarité Similarité cosinus ou mesure cosinus Facteur de similarité 64 Initialement … pour l’analyse de séquences peptidiques Mol. BioSyst., 2012, 8, 2535–2544 65 Initialement … pour l’analyse de séquences peptidiques 66 Initialement … pour l’analyse de séquences peptidiques 67 Initialement … pour l’analyse de séquences peptidiques www.pnas.org/cgi/doi/10.1073/pnas.1203689109 68 Initialement … pour l’analyse de séquences peptidiques www.pnas.org/cgi/doi/10.1073/pnas.1203689109 69 Initialement … pour l’analyse de séquences peptidiques www.pnas.org/cgi/doi/10.1073/pnas.1203689109 70 Biofilms The ISME Journal (2015) 9, 2605–2619 71 Tous les pièges … International Journal of Mass Spectrometry 377 (2015) 719–727 72 Cholestérol 73 Données redondantes … 74 Initialement … pour l’analyse de séquences peptidiques 75 Pressure (bar) CO2 Subcritical Solid Supercritical Liquid Subcritical Gas Temperature (°C) SFC versus LC SFC coupled to a Q-TOF mass spectrometer SFC 1260 Infinity (Agilent Technologies) Q-TOF 6540 (Agilent Technologies) Pressure range 10 bar 50 bar 90-400 bar 90-600 bar SFC module Degasser Caloratherm Pumps CO2 Pump Mass accuracy down to 2 ppm High mass resolution : 20 000 - 40 000 at m/z 922 MS/MS capabilities Sampler Oven BPR Oven Q-TOF 6540 (Agilent technologies) Pump Isocratic Pump UV Choice of the column N° Polarité de la phase 1 2 apolaire 3 4 5 Hybride 6 7 8 9 10 11 Polaire Colonne Octadécyle silane C18 Eclipse 150 * 2,1 mm et 1,8 µm de diamètre de particules Carbone graphite poreux HypercarbR 100 * 2,1 mm et 3 µm de diamètre de particules et 100 * 2,1 et 5µm de diamètre de particules Zirconium ZR carbon 150 * 2,1 mm et 3µm de diamètre de particules Torus 1-aminoanthracène (1-AA) 150 * 2,1 mm et 1,7 µm de diamètre de particules Torus 2-picolylamine (2-PIC) 150 * 2,1 mm et 1,7 µm de diamètre de particules Torus diéthylamine (DEA) 150 * 2,1 mm et 1,7 µm de diamètre de particules Pentafluorophényl (PFP) 150 * 2 mm et 3 µm de diamètre de particules Diphényl 250 * 2 mm et 3 µm de diamètre de particules Ethyl pyridine (EP) 100 * 2,1 mm et 1,5 µm de diamètre de particules Cyano (CN) 100 * 2,1 mm et 1,8 µm de diamètre de particules Silanol (Rx sil) 150 * 4,6 mm et 5 µm de diamètre de particules et 100 * 2,1 mm et 1,8 µm de diamètre de particules Fournisseur Agilent Thermo Supelco Waters Waters Waters Agilent Agilent Agilent Agilent Agilent Etude de l’activité anti-CHIKV d’Euphorbia de Corse Investigation d’Euphorbia amygdaloides subsp semiperfoliata Euphorbia amygdaloïdes subsp semiperfoliata Materiel végétal sec (m = 450 g) (LF-015) Extrait AcOEt (Zypertex) m = 30,4 g / σ = 6 % EC90 CHIKV < 0.8 μg / mL Évaluation de phorboids commerciaux connus pour leurs activité anti-HIV C13H 27 O O 12 13 1 H 10 Fractions (A-J) 4 Fraction I = 5,1 g EC90 CHIKV < 0.8 μg/mL Plusieurs étapes chromatographiques (!) 15 molécules isolées OAc O H OH 6 OH H EC50 CHIKV = 2.9 ± 0.3 nM SI = 1965 C9H 21 OH 20 O O C9H 21 O O P-12,13-DD EC50 CHIKV = 6.0 ± 0.9 nM SI = 686 OAc H OH Ester de jatrophane (σ = 0.0006 %) Jatrohemiketal EC50 CHIKV = 0.76 ± 0.14 μM/ SI = 208 TPA O OH H H H OH O OH H H OH Prostratin EC50 CHIKV = 2.7 ± 1.2 μM SI = 23 OH Nothias-Scaglia, L.-F.; Dumontet, V.; Neyts, J.; Roussi, F.; Costa, J.; Leyssen, R.; Litaudon, M.; Paolini, J. Fitoterapia 2015, (in press). Nothias-Scaglia, L.-F.; Retailleau, P.; Paolini, J.; Neyts, J.; Dumontet, V.; Roussi, F.; Leyssen, P.; Costa, J.; Litaudon, -M. J. Nat. Prod. 2014, 77 (6), 1505–1512. Nothias-Scaglia, L.-F.; Gallard J.-F.; Dumontet V.; Roussi F.; Costa J. Bogdan I. I.; Paolini J.; Litaudon M. J. Nat. Prod. 2015 (accepted). Bourjot, M.; Delang, L.; Nguyen, V. H.; Neyts, J.; Guéritte, F.; Leyssen, P.; Litaudon, M. J. Nat. Prod. 2012. Nothias-Scaglia, L.-F.; Pannecouque, C.; Renucci, F.; Delang, L.; Neyts, J.; Roussi, F.; Costa, J.; Leyssen, P.; Litaudon, M.; Paolini, J. J. Nat. Prod. 2015. Etude de l’activité anti-CHIKV d’Euphorbia de Corse Investigation d’Euphorbia amygdaloides subsp semiperfoliata : Récolte n°2 Euphorbia amygdaloïdes subsp semiperfoliata Materiel végétal sec (m = 370 g) (LF-023) 65 % Heptane / 35 % Acétone Molybdate sulfurique Extrait AcOEt (Zypertex) m = 24,7 g / σ = 6.7 % EC90 CHIKV < 0.8 μg / mL 4.2 g 2.4 g 10 Fractions (A-J) 2.0 g Analyse par SFC-MS/MS et génération de réseaux moléculaires. 5.3 g 1.7 g 1.8 g Extrait AcOEt Résultats validés comme CHIKV spécifiques par observation au microscope EC90 CHIKV en μg/ml KB à 10 μg/ml en % d’inhibition E F G H I J < 0,8 > 100 > 100 1,2 3,4 < 0,8 77 16 ± 13 % 0% 0% 0% 51 ± 6 % 45 ± 15 % 0% Prenols: diterpinoids Dideoxyphorbol Deoxyphorbol Jatrophane Analyses by LC with strong percentage of organics solvent 30 mL acétonitrile by one LC run 82 Collaboration with ICSN and University of Corte Choice of the column C18: 1 min Torus 1-AA: 3 min ZR carbon: 18 min Si: 7 min Hypercarb: 17 min Hypercarb Time (min) 0 3 13 17 20 21 23 EtOH (%) 3 3 10 20 20 3 3 Flow rate: 1.5 mL/min DDA analysis to attribute a peak to a compound 5 at 10 MS/MS spectra are necessary 50 20 s s 10 Our condition in DDA mode: MS 10 spectres/s MS/MS a maximum of 4 precursor ions per cycle MS MS/MS MS/MS MS/MS MS/MS 100 ms 250 ms 250 ms 250 ms 250 ms s until 16 spectra acquisitions in until 8 spectra MSMS acquisitions in MSMS Total operating time: 1.2 s between 2 scans Energie de collision … 5 80 671 611 83 60 40 20 0 Relative intensity (%) Relative intensity (%) 100 4 551 491 299 281 253 3 2 1 0 0 10 20 30 40 50 60 70 80 90 100 Colission energy (eV) 0 10 20 30 40 50 60 70 80 90 100 Colission energy (eV) 86 DDA analysis MS-1 scan (100ms) Perte théo: 88,0524 - iBuOH Perte exp: 88,0516 - TiglOH MS/MS-1 scan (250 ms) Perte théo: 100,0524 Perte exp: 100,0554 Choice of the column semiperfoliata - AcOH - iBuOH - TiglOH - BzOH - PhAcOH (-180.0423) - 3x AcOH (-180.0634) Etude de l’activité anti-CHIKV d’Euphorbia de Corse par réseaux moléculaires MS/MS Représentation des réseaux moléculaires (analyses SFC-qTOF) des fractions anti-CHIKV Etude de l’activité anti-CHIKV d’Euphorbia de Corse par réseaux moléculaires MS/MS Représentation avec calque m/z 480 650 820 m/z de l’ion précurseur Etude de l’activité anti-CHIKV d’Euphorbia de Corse par réseaux moléculaires MS/MS Ajout de spectres MS2 de références isolées de la même plante: - Esters de jatrophane du groupe A Etude de l’activité anti-CHIKV d’Euphorbia de Corse par réseaux moléculaires MS/MS Ajout de spectres MS2 de références isolées de la même plante: - Esters de jatrophane du groupe B Molecular network MS2 fingerprint m/z 313, 295, 285, ... Esters de deoxyphorbol ? Activité anti-CHIKV ? MS2 fingerprint m/z 311, 293, 283, ... Autre type d’esters de jatrophane ? TiglO OiBu 12 13 1 H 4 O MS2 fingerprint d’ester de jatrophane du group A m/z 327, 309, 299, ... MS2 fingerprint d’ester de jatrophane du group B m/z 313, 295, 285, ... H H OH 6 20 OH Molecular network For example: Red arrow corresponding to ∆m = 42.011 uma (acetate group) jatrophane ester A Latex Extraction totale Jatrophane ester B Etude de l’activité anti-CHIKV d’Euphorbia de Corse par réseaux moléculaires MS/MS Représentation de la répartition par fraction MS2 fingerprint m/z 313, 295, 285, ... Esters de deoxyphorbol ? Activité anti-CHIKV ? MS2 fingerprint m/z 311, 293, 283, ... Autre type d’esters de jatrophane ? Fraction G Fraction H Fraction I MS2 fingerprint d’ester de jatrophane du group A m/z 327, 309, 299, ... MS2 fingerprint d’ester de jatrophane du group B m/z 313, 295, 285, ... Etude de l’activité anti-CHIKV d’Euphorbia de Corse par réseaux moléculaires MS/MS Purification par SFC-semiprep, guidée par molecular networking MS/MS m/z 523.266 C29H40O7 abs int m/z 717.279 C34H46O15 m/z 483.235 m/z 675.263 C34H46O15 C26H36O7 min m/z 637.262 C33H42O11 m/z 521.251 C29H38O7 m/z 693.252 C35H42O13 TiglO OiBu 12 13 1 Fraction contenant groupe de jatrophane inconnu 4 O 6 H abs OH UV 230 nm OH 20 H O H OH TiglO Deuxième SFC-prep min H OiBu H O H 20 Aetiology: Annonaceae Environment: link with consumption of Annonaceae Edible fruits (as Annona muricata) Traditional medicine High consumption for all patients Neurotoxicity of acetogenins Lipophilic polyketides Highly cytotoxic Strong inhibitors of mitochondrial complex I Major safety concern for the FDA and ANSES What about the football world cup in Brazil ??? Grenoble 9 Avril 2015– David Touboul 97 Structural diversity Classification Polyoxygenated domain : Tetrahydrofurans, epoxides... 32/34 )m +/- substitutions Hydroxyls, ketones... ( )n γ-methyl-γlactone ( Types Bermejo, Nat. Prod. Rep. 2005 Grenoble 9 Avril 2015– David Touboul 98 Structural diversity Muricin-A MS study Goniothalamicin Muricartetrocins Intensity (counts x106) Limitations 1.5 EIC m/z 619 1.0 0.5 0.0 2 3 4 5 6 7 8 9 10 11 Time (min) Gigantetrocin-B Annonacin Arianacin Muricin-C Grenoble 9 Avril 2015– David Touboul 99 Structural diversity 100 80 60 40 20 0 Optimization of the collision energy Li+ Two values are retained : 60 and 80 eV 4 3 [M+Li-H2O]+ 3 [M+Li-CO2-2H2O]+ [M+Li-CO2]+ 2.0 1.5 2 1.0 1 0.5 0.0 0 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 [M+Li-CO2-H2O]+ Relative intensity (%) MS/MS study [M+Li]+ 3 [M+Li-CO2-3H2O]+ 1.5 2 1.0 1 1 0.5 0 0 0.0 0 20 40 60 80 100 0 20 40 60 80 100 2 0 20 40 60 80 100 80 X4-H2O 60 X4-2H2O 40 X4-3H2O 40 20 20 0 0 0 20 40 60 80 100 0 20 40 60 80 100 60 10 8 6 4 2 0 X4 X3 60 X2 4 3 2 1 0 0 20 40 60 80 100 3 40 2 20 1 0 0 20 40 60 80 100 Z1 X1 0 0 20 40 60 80 100 0 20 40 60 80 100 collision energy (eV) Grenoble 9 Avril 2015– David Touboul 100 60 eV 1400 80 eV X4-2H2O 10000 X4 12000 X4-H2O Structural diversity 1200 X4-3H2O 1000 800 Y1 X3 400 X2 X4 600 Z1 + [M+Li-H2+ O] [M+Li] [M+Li-CO2] X4-3H2O X3 400 X2 800 X4-2H2O 4000 X4-H2O + [M+Li-CO2-2H2O] + [M+Li-CO2-2H2O] + + [M+Li-CO2-H2O] 6000 Y1 Intensity (counts) 8000 200 0 0 120 160 200 240 280 320 360 400 440 480 520 560 600 m/z 120 160 200 240 280 320 360 400 440 480 520 560 600 m/z Grenoble 9 Avril 2015– David Touboul 101 A3 A3-H2O C1-H2O X3 A2 Z1 C1 X4 B1 Spectra acquired with an ion mobility mass spectrometer MOBICS project (LCP, Orsay, G. Van der Rest, P. Maitre) 102