TD modélisation Fichier - Portail Pédagogique de l`Université d`Evry
Transcription
TD modélisation Fichier - Portail Pédagogique de l`Université d`Evry
Introduction à la bio-informatique TD modélisation des molécules moléculaires Exercice 1. Recherche des données structurales Informations sur les structures 2D et 3D des protéines Connectez-vous sur le portail suivant : http://www.uniprot.org/ Cherchez la protéine : erythropoietin Faites la recherche seulement pour l’espèce Homo sapiens Ouvrir la page descriptive de la protéine et étudier les données disponibles, en particulier les données structurales http://www.uniprot.org/uniprot/P01588 1) Quelles sont les informations données pour la structure secondaire ? 2) Quelles sont les informations données pour la structure 3D ? 3) Quelle méthode a été utilisée pour obtenir la structure 3D de la protéine ? 4) Combien de structures 3D sont associées à votre protéine ? 5) Y a-t-il des informations sur les interactions d'erythropoietin avec d'autres protéines ? Si oui, lesquelles ? 6) Avez-vous trouvé des informations sur les inter-actants ? Dans quelles bases de données ? 7) Faites la même chose avec les protéines suivantes : Hemoglobine (hemoglobin en anglais, vous pouvez utiliser subunit gamma-1 ) et Cytochrome c Exercice 2. Récupération d'une séquence protéique d’intérêt Recherche de similarité de séquences avec Blast Connectez-vous sur le site: http://www.uniprot.org/ Trouvez la séquence de la protéine erythropoietin http://www.uniprot.org/uniprot/P01588#sequences Sequence 1) Indiquez si la protéine présente un peptide signal : Fasta format Copier la séquence FASTA dans un fichier texte. Sélectionner la base de données PDB et appuyer sur le bouton BLAST 2) Combien de hits sont retournés ? (pour Homo Sapiens ?) Essayer maintenant en sélectionnant la base de données uniprotkb_swissprot 3) Combien de hits sont retournés ? (pour Homo Sapiens ?) Maintenant aller sur le site : http://blast.ncbi.nlm.nih.gov/Blast.cgi Choisir l'outil protein Blast(BlastP) Copier la séquence ou charger le fichier puis sélectionner la base de données nr Spécifier l'organisme (Homo Sapiens) 4) Combien de hits sont retournés ? 5) Quelle est la plus grande couverture d'alignement et quel est le plus grand pourcentage d’identité obtenu ? Est-ce le même hit qui présente les deux caractéristiques ? (pour toutes les bases de données utilisées) Exercice 3. Prédiction de structures secondaires Soumettre la séquence d'erythropoietin au serveur PRIPRED : http://bioinf.cs.ucl.ac.uk/psipred/ Cliquer sur le lien pour accéder au serveur Copier et coller la séquence à l'endroit indiqué Sélectionner l'option Predict Secondary Structure (PSIpred V3.3). Décliquer les options de filtrage Il est possible de donner votre e-mail universitaire pour recevoir les résultats Indiquer un nom pour le job (par exemple votre Nom_PSIPRED) Aller sur le site de Uniprot et comparer les résultats de PSIPRED avec la structure secondaire proposée par la site La structure trouvée avec PSIPRED est-elle en accord avec celle du site Uniprot ? (basée sur des expériences) Exercice 4. Prédiction de structures secondaires Connectez-vous sur le site: http://swissmodel.expasy.org/ Partie 1: modélisation par homologie: la mise en route. Modélisation de la glycosylase méthylpurine-ADN bactérien (AlkD, Uniprot AC: Q2PAD8) Connectez vous sur le site: http://www.uniprot.org/uniprot/Q2PAD8 Copier la séquence FASTA Connectez-vous sur le site: http://swissmodel.expasy.org/ Appuyer sur Start Modelling 1) Tout d'abord rechercher des templates appropriés pour modéliser la glycosylase méthylpurine-ADN. 2). Combien de templates différents trouvez-vous? Est-ce que les structures des templates diffèrent? Observez la visualisation des structures des templates putatifs dans View 3) Quel template utilisez-vous pour générer un modèle pour la protéine de glycosylase méthylpurine-ADN bactérien? 4) Construire un modèle d'homologie pour la glycosylase méthylpurine-ADN en utilisant l'un des templates disponibles. Comment est la qualité du modèle obtenu? Partie 2: Modélisation par homologie de la cycline A1 Dans la première partie des exercices pratiques, nous allons construire un modèle d'homologie pour la protéine humaine, cycline A1 (Swiss-Prot P78396 entrée). Connectez-vous sur le site: http://www.uniprot.org/uniprot/P78396 Copier la séquence FASTA Connectez-vous sur le site: http://swissmodel.expasy.org/ 1) regardez d'abord l'entrée Swiss-Prot pour en savoir plus sur la fonction de cette protéine. Y a-t-il des domaines protéiques décrits pour la cycline A1? 2) Maintenant, nous pouvons rechercher un template approprié pour la construction du modèle: Comment les différents templates diffèrent? Comment jugez-vous l'alignement entre la cible et le modèle? 3) Construire un modèle d'homologie pour la protéine cycline A1 humain en utilisant l'un des templates disponibles. Comment est la qualité du modèle obtenu?