TD – Comparaison de 2 séquences dans EMBOSS

Transcription

TD – Comparaison de 2 séquences dans EMBOSS
TD – Comparaison de 2 séquences dans
EMBOSS
EMBOSS : http://bips.u-strasbg.fr/EMBOSS/
1) Comparaison des séquences LECA_CRAFL et LEC4_GRISI
a) Comparez les séquences protéiques swissprot:LECA_CRAFL et swissprot:LEC4_GRISI
(lectins de plantes) avec le programme dottup (recherche de mots identiques) :
- avec mots de 10 aa (par défaut)
- avec mots de 3 aa
- avec mots de 2 aa.
Commentez les résultats.
b) Comparez les séquences par dotmatcher avec une taille de fenêtre (w) et une stringence (s)
de :
- w = 10 et s = 15
- w = 10 et s = 23 (valeurs par défaut)
- w = 30 et s = 23
- w = 50 et s = 23



Que pensez-vous de la comparaison effectuée avec w=10 et s=15 ?
Pourquoi y a-t-il plus de points pour w=30 et s=23 que pour w=50 et s=23 ?
Que pouvez-vous dire sur l'organisation en domaines des 2 protéines comparées ?
c) Alignement optimal local (programme Water)




Dans le programme water, quelles sont, par défaut, les pénalités de création et
d'extension de gaps pour les alignements de protéines ?
Aligner les 2 séquences par le programme Water (paramètres par défaut).
Comparer l’alignement avec les résultats de la comparaison par la matrice de point.
Serait-il judicieux d’effectuer un alignement global (programme Needle) ?
2) Comparaison d’une séquence avec elle-même
La séquence aef1_drome possède 4 doigts de zinc de type C2H2, situés dans la région Cterminale.
a) Représentez schématiquement le résultat d’une comparaison de cette séquence avec ellemême suivant la méthode de la matrice de points.
b) Effectuez la comparaison avec le programme dotmatcher (avec par exemple w=10, s=30).
Le résultat est-il en accord avec vos attentes ? Que fait apparaitre la comparaison ?
c) Affichez la séquence (showseq) et commentez.
1
3) Comparaison de myotubularines
Comparer protein:MTMR3_HUMAN (1198 aa) et protein:Q9W1Q6_DROME (689 aa) par :
1. la matrice de points (programme dotmatcher )
2. le programme water (alignement local)
3. le programme needle (alignement global)




Quelles sont les régions de similarité entre les deux protéines détectées par la matrice de
points ?
Comparer les résultats obtenus en local et en global. Pourquoi le score est-il plus faible
dans le cas de needle ?
Comment pourriez-vous améliorer l’alignement global ?
Que pouvez-vous dire sur le domaine C-terminal ? Comment pourriez-vous le
caractériser ?
2