prank

Transcription

prank
Séance 1 : L’alignement de séquences
et la sélection des blocks conservés
http://162.38.181.1/Pise/
http://frederic.delsuc.neuf.fr/fd_formation
La reconstruction phylogénétique moléculaire
1. Organismes
2. Caractères
3. Méthodes
L’alignement de séquences
Dispose les séquences de manière à maximiser leur similitude
=> homologie primaire
1 site = 1 caractère
N sites = N caractères !
4 états ( A, C, G, T ) + 1 ( * )
Les méthodes basées sur les distances
d A/B = 4/60 = 6,6%
d A/C = 12/60 = 20,0 %
Les méthodes basées sur les caractères
L'information véhiculée par chaque site est évaluée de façon indépendante.
Délétion diagnostique dans le gène BRCA1 des Afrotheria
Tubulidentata
Macroscelidea
Tenrecidae
Chrysochloridae
Sirenia
Proboscidea
A
F
R
O
T
H
E
R
I
A
Hyracoidea
Madsen et al. (2001). Nature 409:610-614.
Exon 26 de l’apolipoprotein B (APOB)
Délétion de 121 acides aminés
Amrine-Madsen et al. (2003). Mol. Phylogenet. Evol. 28: 225-240 .
XENARTHRA
AFROTHERIA
Murphy et al. (2007). Genome Res. 17: 413-421.
Une comparaison des méthodes pour les protéines
1. MAFFT L-INS-I et ProbCons sont les deux programmes les plus performants
2. MAFFT est beaucoup plus rapide
Nuin, Wang & Tillier (2006) BMC Bioinformatics 7: 471.
Propriétés des différents programmes
d’alignement multiple disponibles
Edgar & Batzoglou (2006) Curr. Opin. Struct. Biol. 16: 368-373.
Recommandations en fonction des jeux de données
Edgar & Batzoglou (2006) Curr. Opin. Struct. Biol. 16: 368-373.
Un biais systématique dans le positionnement des gaps
CLUSTALW
PRANK+F
Golubchik et al. (2007) Mol. Biol. Evol. 24: 2433-2442.
PRANK : une méthode basée sur le placement
des indels en fonction de la phylogénie
CLUSTALW
PRANK+F
http://www.ebi.ac.uk/goldman-srv/prank/prank/
Löytynoja & Goldman (2008) Science 320: 1632-1635.
Alignements différents = Phylogénies différentes ?
CLUSTALW
PRANK+F
Wong, Suchard & Huelsenbeck (2008) Science 319: 473-476.
L’alignement des mêmes données à Pile ou Face
donnent souvent des résultats différents !
Landan & Graur (2007) Mol. Biol. Evol. 24: 1380-1383 ; Martin, Roettger & Lockhart (2007). TIG 23: 478-480.
Bali-Phy: simultaneous Bayesian inference
of alignment and phylogeny
http://www.biomath.ucla.edu/msuchard/bali-phy/
Suchard & Redelings (2006) Bioinformatics 22: 2047-2048.
FSA: Fast Statistical Alignment
http://fsa.sourceforge.net/
Bradley et al. (submitted)
Gblocks : Elimination des régions d’alignement ambigu
Paramètres:
1. Nombre minimum de séquences pour une
position conservée [>N/2+1]
2. Nombre minimum de séquences pour une
position flanquante [>N/2+1]
3. Nombre maximal de positions nonconservées contigües
4. Longueur minimale d’un block
5. Traitement des sites à indels : [tous
exclus] ou [tous conservés] ou
[conservés si moins de la moitié des
séquences présentent un gap]
http://molevol.cmima.csic.es/castresana/Gblocks.html
Castresana (2000) Mol. Biol. Evol. 17: 540-552.