Aufgabenblatt 4

Transcription

Aufgabenblatt 4
4. Übungsblatt “Einführung in die Bioinformatik” SS 2008
Prof. Dr. Daniel Huson und Juliane D. Klein
2. Mai 2008
Die Java-Dateien für diese Übung werden wieder auf unserer Webseite zur Verfügung gestellt.
Schicken Sie bitte die fertig implementierten Dateien an den jeweiligen Tutor:
Verena.Schattel bei gmx.de oder Robert.Krug bei gmx.net
1
Needleman-Wunsch mit Affinen Gapkosten (5 Punkte)
Bitte implementieren sie den Needleman-Wunsch Algorithmus mit affinen Gapkosten. Nutzen sie dazu zwei
Matrizen M und I wobei die Matrix I die beiden Matrizen Ix und Iy aus der Vorlesung ersetzt.
Implementieren sie dazu die Klasse NeedlemanWunschAffine unter Verwendung der Funktionen der Basisklasse NeedlemanWunschAffineBase. Nutzen sie für das Traceback die beiden Matrizen traceM und traceI und
füllen Sie diese mit den Werten HorizontalM, VerticalM, DiagonalM, HorizontalI, VerticalI und DiagonalI
aus der Basisklasse aus.
Kompilieren Sie das Programm zusammen mit den Java-Datein der Klassen FastA und FastABase aus der
vorigen praktischen Übung. Das Programm wird mit RunNeedlemanWunschAffine und den entsprechenden
Parametern gestartet.
2
Blast (2 Punkte)
Suchen Sie aus der NCBI Datenbank (www.ncbi.nlm.nih.gov) den Eintrag für den 5-Hydroxytryptamin 2A
Rezeptor des Menschen und speichern Sie die Proteinsequenz im FASTA-Format. Führen Sie mit der gespeicherten Sequenz eine BLAST-Suche nach ähnlichen Sequenzen in der nicht-redundanten Proteindatenbank
des NCBI durch. Gehen Sie dazu auf die NCBI-BLAST-Seite (www.ncbi.nlm.nih.gov/BLAST/). In wievielen
Organsimen wurde eine ähnliche Sequenz gefunden? In wievielen davon handelt es sich mit Sicherheit um
den 5-Hydroxytryptamin 2A Rezeptor? Welcher andere Typ des 5-Hydroxytryptamin Rezeptors wurde auch
gefunden?
Bitte schicken Sie den Lineage Report (unter Taxonomy Report) in einer Datei (report.txt) an Ihren Tutor.
3
BLAST (3 Punkte)
Bitte laden Sie sich von der NCBI Website das komplette Genom von Escherichia coli K12 im Fasta-Format
herunter. Laden Sie sich anschließend von der Website des European Bioinformatics Institute (www.ebi.ac.uk)
das gesamte Proteom von Yersinia pestis Antiqua als Multifasta-Datei herunter.
Sie erhalten Blast unter www.ncbi.nlm.nih.gov/BLAST/download.shtml. Installieren Sie es sich bitte lokal
auf Ihrem Rechner. In der Datei blast.txt ist beschrieben, wie man aus einer Fasta-Datei eine Blast-Datenbank
erstellt (mit formatdb) und Blast mit den gewünschten Parametern startet.
Wandeln Sie nun bitte Ihre Fasta-Datei des E. coli Genoms in eine Blast-Datenbank um. Blasten Sie Sie
anschließend die Multifasta-Datei des Y. pestis Proteoms gegen diese Datenbank. Beachten Sie hierbei ein
passendes Blastprogramm zu benutzen, was für Anfragen von Aminosäuresequenzen gegen eine Datenbank
aus Nukleotidsequenzen geeignet ist. Spezifizieren Sie Ihre Anfrage indem Sie einen Grenzwert von 10−17 für
den E-value angeben und als Ausgabe auch ein HTML Dokument anfordern.
Die gefundenen lokalen Alignments, die mit dem angegebenen Grenzwert für den E-value gefundenen wurden
könnten orthologen Bereichen entsprechen. Wieviele Orthologe hat in diesem Falle das Y. pestis Proteom
mit dem E. coli gemein?
Bitte schicken sie die Ausgabedatei (pesitis.html) an Ihren Tutor.