prank
Transcription
prank
Séance 1 : L’alignement de séquences et la sélection des blocks conservés http://162.38.181.1/Pise/ http://frederic.delsuc.neuf.fr/fd_formation La reconstruction phylogénétique moléculaire 1. Organismes 2. Caractères 3. Méthodes L’alignement de séquences Dispose les séquences de manière à maximiser leur similitude => homologie primaire 1 site = 1 caractère N sites = N caractères ! 4 états ( A, C, G, T ) + 1 ( * ) Les méthodes basées sur les distances d A/B = 4/60 = 6,6% d A/C = 12/60 = 20,0 % Les méthodes basées sur les caractères L'information véhiculée par chaque site est évaluée de façon indépendante. Délétion diagnostique dans le gène BRCA1 des Afrotheria Tubulidentata Macroscelidea Tenrecidae Chrysochloridae Sirenia Proboscidea A F R O T H E R I A Hyracoidea Madsen et al. (2001). Nature 409:610-614. Exon 26 de l’apolipoprotein B (APOB) Délétion de 121 acides aminés Amrine-Madsen et al. (2003). Mol. Phylogenet. Evol. 28: 225-240 . XENARTHRA AFROTHERIA Murphy et al. (2007). Genome Res. 17: 413-421. Une comparaison des méthodes pour les protéines 1. MAFFT L-INS-I et ProbCons sont les deux programmes les plus performants 2. MAFFT est beaucoup plus rapide Nuin, Wang & Tillier (2006) BMC Bioinformatics 7: 471. Propriétés des différents programmes d’alignement multiple disponibles Edgar & Batzoglou (2006) Curr. Opin. Struct. Biol. 16: 368-373. Recommandations en fonction des jeux de données Edgar & Batzoglou (2006) Curr. Opin. Struct. Biol. 16: 368-373. Un biais systématique dans le positionnement des gaps CLUSTALW PRANK+F Golubchik et al. (2007) Mol. Biol. Evol. 24: 2433-2442. PRANK : une méthode basée sur le placement des indels en fonction de la phylogénie CLUSTALW PRANK+F http://www.ebi.ac.uk/goldman-srv/prank/prank/ Löytynoja & Goldman (2008) Science 320: 1632-1635. Alignements différents = Phylogénies différentes ? CLUSTALW PRANK+F Wong, Suchard & Huelsenbeck (2008) Science 319: 473-476. L’alignement des mêmes données à Pile ou Face donnent souvent des résultats différents ! Landan & Graur (2007) Mol. Biol. Evol. 24: 1380-1383 ; Martin, Roettger & Lockhart (2007). TIG 23: 478-480. Bali-Phy: simultaneous Bayesian inference of alignment and phylogeny http://www.biomath.ucla.edu/msuchard/bali-phy/ Suchard & Redelings (2006) Bioinformatics 22: 2047-2048. FSA: Fast Statistical Alignment http://fsa.sourceforge.net/ Bradley et al. (submitted) Gblocks : Elimination des régions d’alignement ambigu Paramètres: 1. Nombre minimum de séquences pour une position conservée [>N/2+1] 2. Nombre minimum de séquences pour une position flanquante [>N/2+1] 3. Nombre maximal de positions nonconservées contigües 4. Longueur minimale d’un block 5. Traitement des sites à indels : [tous exclus] ou [tous conservés] ou [conservés si moins de la moitié des séquences présentent un gap] http://molevol.cmima.csic.es/castresana/Gblocks.html Castresana (2000) Mol. Biol. Evol. 17: 540-552.