BCM2003-H10 Protéomique
Transcription
BCM2003-H10 Protéomique
Protéomique Séance 1 Introduction aux données de protéomique et aux outils de recherche Professeur: Hervé Philippe Auxiliaire: Mathieu Courcelles BCM2003 Hiver 2010 - Protéomique BCM2003-H10 Protéomique ¾Démonstrateur: Mathieu Courcelles ¾Questions? ¾Via le tutorat en ligne (http://www.agorabcm.com/) ¾Disponibilités BCM2003 Hiver 2010 sur rendez-vous (email) 2 1 Horaire Séance 1 25 Mars ¾Introduction aux données de protéomique et aux outils de recherche Séance 2 1 Avril ¾ Phosphoprotéomique: À la recherche des modifications post-traductionnelles ¾ Séance 3 8 Avril ¾Séance Distribution du devoir ¾Mise 4 15 Avril en contexte des identifications ¾Remise du devoir ¾Temps et questions sur le mini-projet BCM2003 Hiver 2010 3 Application de la protéomique ¾Étudier le protéome à petite (une ou quelques protéines) ou grande échelle (centaines à milliers en même temps). ¾Comprendre la signalisation cellulaire, le développement. ¾Modifications post-traductionnelles (phosphorylation, acétylation/méthylation, ubiquitination, glycosylation, etc). ¾Isoformes et mutations. ¾Biomarqueurs pour cancer et maladies (analyse quantitative) BCM2003 Hiver 2010 4 2 Expérience typique de protéomique Extraction des protéines Digestion Trypsique Mélange de peptides MS Analyse des données HPLC Chromatographie liquide et spectrométrie de masse Identification / Quantification BCM2003 Hiver 2010 5 Comment fonctionne un spectromètre de masse? ¾Vidéos MALDI-TOF http://www.youtube.com/watch?v=OKxRx0ctrl0 Agilent Q-TOF http://www.youtube.com/watch?v=R_d-NI0fK7A Waters Q-TOF http://www.youtube.com/watch?v=zVgyz8felqo&feature=PlayList&p=72B2A72090F4AEDC&in dex=0&playnext=1 http://www.youtube.com/watch?v=ywO_0C0zaBE&feature=PlayList&p=72B2A72090F4AEDC &index=7 FT-ICR http://www.youtube.com/watch?v=A7QMkPYpZSA BCM2003 Hiver 2010 6 3 Identification des peptides Intensité relative MS Survey Scan masse / charge (m/z) Data dependent analysis BCM2003 Hiver 2010 7 Identification des peptides Intensité relative MS Survey Scan 1. Isolation d’un ion masse / charge (m/z) BCM2003 Hiver 2010 8 4 Identification des peptides Intensité relative MS Survey Scan 1. Isolation d’un ion 2. Fragmentation masse / charge (m/z) BCM2003 Hiver 2010 9 Identification des peptides Intensité relative MS Survey Scan 1. Isolation d’un ion 2. Fragmentation masse / charge (m/z) MS/MS Scan BCM2003 Hiver 2010 10 5 Identification des peptides MS/MS dataset (milliers) Interprétation automatisé des spectres Identification des peptides/protéines MS/MS Scan BCM2003 Hiver 2010 11 Détection des peptides Détection des ions peptidiques dans les données brutes pour extraire leur intensité Légende: Basse Itensité Haute Intensité MS Survey Scan BCM2003 Hiver 2010 12 6 Détection des peptides Région agrandite On peut voir différents ions peptidiques. BCM2003 Hiver 2010 13 Détection des peptides H1,2 C12,13 N14,15 O16,17,18 S32,33,34,36 Profile isotopique BCM2003 Hiver 2010 14 7 Détection des peptides ∆m/z = 1/z Sommet d’intensité et charge BCM2003 Hiver 2010 15 Détection des peptides Liste de peptides avec leur valeurs -m/z -temps de rétention -intensité BCM2003 Hiver 2010 16 8 Format de fichiers ¾Données brutes (format binaire propriétaire) (Agilent) ¾.raw (dossier) (Micromass MassLynx) ¾.raw (ThermoFinnigan Xcalibur) ¾.wiff ¾Liste de pics (Micromass MassLynx) ¾.mgf (Mascot generic format) ¾.dta (Sequest) ¾.mzData (XML) (HUPO Proteomics Standards Initiative (PSI) ) ¾.mzXML (Institute for Systems Biology ) ¾.mzML (effort pour combiner .mzData et .mzXML) ¾.pkl BCM2003 Hiver 2010 17 HUPO Proteomics Standards Initiative http://www.psidev.info/ BCM2003 Hiver 2010 18 9 Interprétation des spectres MS et MS/MS • Empreintes de masse peptidiques • – Mascot, Sequest, OMSSA, X!Tandem, PepSplice, Sonar, SALSA, Peptide Search, SCOPE, OLAV, MassMatrix, Zcore – Mascot, Profound, MS-Fit, Aldente, VEMS • Séquençage de novo (comparable à la méthode manuelle). Recherche d’ions MS/MS • Comparaison de spectres – X!Hunter, BiblioSpec, Bonanza, SpectraST – Peaks, VEMS, PepNovo, LutefiskXP, AUDENS, NovoHMM BCM2003 Hiver 2010 19 Pré-traitement des spectres MS/MS – Détermination de la charge du peptide précurseur – Ajustement de la masse du précurseur au pic mono-isotopique – Simplification du spectre pour faciliter l’interprétation automatisé • Enlever le bruit • Réduire les charges • Réduire les isotopes (si haute résolution) – Combinaison de spectres – Qualité des spectres MS/MS BCM2003 Hiver 2010 20 10 Données et outils pour le TP ¾ Données sur ESILBAC: ¾ ¾ /UDEM/COURS_BAC/BCM2003/dbcm2003/Proteomique/tp1_data Mascot ¾ http://mascot.iric.ca/mascot ¾ ¾ ¾ ¾ http://www.matrixscience.com Peaks Online ¾ ¾ http auth: usager: CHM3101, mot de passe: johnfenn usager: p0xxxxxx, mot de passe: temp2003 http://www.bioinfor.com:8080/peaksonline/ X! Hunter ¾ http://h201.thegpm.org/tandem/thegpm_hunter.html BCM2003 Hiver 2010 21 Empreintes de masse peptidiques Protéine MSFLSKLSQIRKSTTASKAQVQDPLPKKNDEEYSLLPKNYIRDEDPAVKR Digestion à la trypsine Peptides MSFLSK LSQIR K K NDEEYSLLPK STTASK NYIR AQVQDPLPK DEDPAVK R Spectrométrie de masse Spectre MS m/z BCM2003 Hiver 2010 22 11 Empreintes de masse peptidiques Peptides Séquences protéiques (db) Spectres MS Masses Observées Digestion in silico Masses Théoriques Comparaison Liste de peptides et protéines BCM2003 Hiver 2010 *Adaptation référence [1] 23 Base de données protéiques • Choisir une base de données qui contient les protéines d’intérêt mais qui ne soit pas trop grosse. • NCBI nr, IPI, Uniprot • • • • • Filtre par espèce 6 cadres de lectures Isoformes et polymorphismes Prédictions Instabilité des bases de donnés (insertion, délétion, modification des séquences) BCM2003 Hiver 2010 24 12 Spectrométrie de masse en tandem (MS/MS) • Les ions peptidiques sont fragmentés pour obtenir la séquence peptidique. • Analyse MS/MS avec un triple quadripôle Source MS (Full scan) Détecteur Source MS/MS Filtre de masse Fragmentation BCM2003 Hiver 2010 *Adaptation référence [1] 25 Fragmentation des peptides • Exemple de spectre MS/MS et tableau des fragments – L’espacement entre les pics permet de retrouver la séquence L RL D GL L D G L LR N Fragments b Y Fragments y Intensité relative (%) YN masse/charge BCM2003 Hiver 2010 26 13 Peaks - Séquençage de novo BCM2003 Hiver 2010 27 Mascot – Recherche d’ions MS/MS Peptides Séquences protéiques (db) Spectres MS/MS Fragments Observées Fragments Théoriques Digestion in silico Comparaison des masses des peptides et des masses des fragments Liste de peptides et protéines BCM2003 Hiver 2010 *Adaptation référence [1] 28 14 X!Hunter – Comparaison de spectres Spectre à interpréter Déterminer le % d’identité Base de données de spectres annotés BCM2003 Hiver 2010 29 Interprétation des spectres MS et MS/MS • Empreintes de masse peptidiques • Recherche d’ions MS/MS – – Mascot, Profound, MS-Fit, Aldente, VEMS • • Séquençage de novo (comparable à la méthode manuelle). Mascot, Sequest, OMSSA, X!Tandem, PepSplice, Sonar, SALSA, Peptide Search, SCOPE, OLAV, MassMatrix, Zcore Comparaison de spectres – X!Hunter, BiblioSpec, Bonanza, SpectraST – Peaks, VEMS, PepNovo, LutefiskXP, AUDENS, NovoHMM BCM2003 Hiver 2010 30 15 Comparaison des méthodes d’interprétation des spectres MS/MS • Différences importantes d’identifications de peptides entre les outils. • • • • M: Mascot O: OMSSA S: Sequest Z: Zcore Peptides identifiés chez la levure Proteomics. 2010 Jan;10(1):164-7. BCM2003 Hiver 2010 31 Références ¾Mascot Perkins. D., Pappin D., Creasy D., Cottrell J. (1999) Probability-based protein identification by searching sequence databases using mass spectrometry data. Electrophoresis 20(18), 3551-67 ¾Peaks Ma B, Zhang K, Hendrie C, Liang C, Li M, Doherty-Kirby A, Lajoie G (2003) PEAKS: powerful software for peptide de novo sequencing by tandem mass spectrometry. Rapid Commun Mass Spectrom. 17(20), 2337-42 ¾X!Hunter Craig R., Cortens J. C., Fenyo D., and Beavis R. C. (2006) Using annotated peptide mass spectrum libraries for protein identification. J. Proteome. Res. 5(8), 1843-1849 BCM2003 Hiver 2010 32 16