Aufgabenblatt 4
Transcription
Aufgabenblatt 4
4. Übungsblatt “Einführung in die Bioinformatik” SS 2008 Prof. Dr. Daniel Huson und Juliane D. Klein 2. Mai 2008 Die Java-Dateien für diese Übung werden wieder auf unserer Webseite zur Verfügung gestellt. Schicken Sie bitte die fertig implementierten Dateien an den jeweiligen Tutor: Verena.Schattel bei gmx.de oder Robert.Krug bei gmx.net 1 Needleman-Wunsch mit Affinen Gapkosten (5 Punkte) Bitte implementieren sie den Needleman-Wunsch Algorithmus mit affinen Gapkosten. Nutzen sie dazu zwei Matrizen M und I wobei die Matrix I die beiden Matrizen Ix und Iy aus der Vorlesung ersetzt. Implementieren sie dazu die Klasse NeedlemanWunschAffine unter Verwendung der Funktionen der Basisklasse NeedlemanWunschAffineBase. Nutzen sie für das Traceback die beiden Matrizen traceM und traceI und füllen Sie diese mit den Werten HorizontalM, VerticalM, DiagonalM, HorizontalI, VerticalI und DiagonalI aus der Basisklasse aus. Kompilieren Sie das Programm zusammen mit den Java-Datein der Klassen FastA und FastABase aus der vorigen praktischen Übung. Das Programm wird mit RunNeedlemanWunschAffine und den entsprechenden Parametern gestartet. 2 Blast (2 Punkte) Suchen Sie aus der NCBI Datenbank (www.ncbi.nlm.nih.gov) den Eintrag für den 5-Hydroxytryptamin 2A Rezeptor des Menschen und speichern Sie die Proteinsequenz im FASTA-Format. Führen Sie mit der gespeicherten Sequenz eine BLAST-Suche nach ähnlichen Sequenzen in der nicht-redundanten Proteindatenbank des NCBI durch. Gehen Sie dazu auf die NCBI-BLAST-Seite (www.ncbi.nlm.nih.gov/BLAST/). In wievielen Organsimen wurde eine ähnliche Sequenz gefunden? In wievielen davon handelt es sich mit Sicherheit um den 5-Hydroxytryptamin 2A Rezeptor? Welcher andere Typ des 5-Hydroxytryptamin Rezeptors wurde auch gefunden? Bitte schicken Sie den Lineage Report (unter Taxonomy Report) in einer Datei (report.txt) an Ihren Tutor. 3 BLAST (3 Punkte) Bitte laden Sie sich von der NCBI Website das komplette Genom von Escherichia coli K12 im Fasta-Format herunter. Laden Sie sich anschließend von der Website des European Bioinformatics Institute (www.ebi.ac.uk) das gesamte Proteom von Yersinia pestis Antiqua als Multifasta-Datei herunter. Sie erhalten Blast unter www.ncbi.nlm.nih.gov/BLAST/download.shtml. Installieren Sie es sich bitte lokal auf Ihrem Rechner. In der Datei blast.txt ist beschrieben, wie man aus einer Fasta-Datei eine Blast-Datenbank erstellt (mit formatdb) und Blast mit den gewünschten Parametern startet. Wandeln Sie nun bitte Ihre Fasta-Datei des E. coli Genoms in eine Blast-Datenbank um. Blasten Sie Sie anschließend die Multifasta-Datei des Y. pestis Proteoms gegen diese Datenbank. Beachten Sie hierbei ein passendes Blastprogramm zu benutzen, was für Anfragen von Aminosäuresequenzen gegen eine Datenbank aus Nukleotidsequenzen geeignet ist. Spezifizieren Sie Ihre Anfrage indem Sie einen Grenzwert von 10−17 für den E-value angeben und als Ausgabe auch ein HTML Dokument anfordern. Die gefundenen lokalen Alignments, die mit dem angegebenen Grenzwert für den E-value gefundenen wurden könnten orthologen Bereichen entsprechen. Wieviele Orthologe hat in diesem Falle das Y. pestis Proteom mit dem E. coli gemein? Bitte schicken sie die Ausgabedatei (pesitis.html) an Ihren Tutor.