Quelques définitions Arbre = réseau connexe non cyclique

Transcription

Quelques définitions Arbre = réseau connexe non cyclique
Quelques définitions
Arbre = réseau connexe non cyclique
noeud
branche
Réseau non connexe
non cyclique
Réseau connexe
cyclique
Réseau connexe
non cyclique
Jeong et al, Nature 2001
Qualité du réseau d’interactions
Très nombreuses interactions protéine/protéine
détectées par différentes méthodes
Pourquoi ?
1. Les méthodes sont prévues pour détecter des
interactions différentes (binaire pour le double
hybride, interactions fortes pour la protéomique, etc.)
2. Les méthodes se trompent (faux positifs, faux
négatifs)
Nécessité de valider les résultats
Qualité du réseau d’interactions
Construction d’un ensemble d’interactions validées manuellement
10 907 interactions impliquant 1308 protéines de la levure
Saccharomyces cerevisiae
(http://mips.gsf.de/proj/yeast/catalogues/complexes/index.html)
1. Coverage (couverture) : fraction des interactions de
référence analysées par une méthode donnée
2. Accuracy (précision) : fraction des interactions de
référence retrouvées par une méthode donnée
Von Mering et al, Nature (2002) 417:399-403
Qualité du réseau d’interactions
Von Mering et al, Nature (2002) 417:399-403
Qualité du réseau d’interactions
Von Mering et al, Nature (2002) 417:399-403
Qualité du réseau d’interactions
Von Mering et al, Nature (2002) 417:399-403
Qualité du réseau d’interactions
Filtrage : interactions détectées trois
fois pour le double-hybride, par exemple
Von Mering et al, Nature (2002) 417:399-403
http://string.embl.de/
Von Mering et al. (2005) Nucleic Acids Research, 33:D433–D437
Distance et Distance
caractéristique d’un réseau
• la distance d(u,v) est la
longueur du plus court
chemin connectant deux
noeuds, c-à-d le nombre
minimal de noeuds qu’il
faut traverser pour se
rendre d’un noeud u à un
noeud v
• la distance
caractéristique L =
meanu,v d(u,v) d’un graphe
est la longueur moyenne
du plus court chemin
connectant deux noeuds
http://mathworld.wolfram.com/GraphDistance.html
Diamètre d’un réseau
3
4
5
7
• le diamètre D = maxu,v d(u,v) d’un graphe est la
longueur du plus long des plus courts chemins
connectant deux noeuds, c’est-à-dire le nombre
maximal de noeuds qu’il faut traverser pour se rendre
d’un noeud u à un noeud v lorsque les retours,
détours et boucles sont interdits
http://mathworld.wolfram.com/GraphDiameter.html
Réseaux « Small-World »
• dans un réseau Small-World, la plupart des noeuds
sont voisins les uns des autres, c-à-d qu’il faut
traverser un petit nombre de noeuds pour se rendre
d’un noeud u à un noeud v
ex : WWW ; liens sociaux entre les êtres humains
formellement, on dit que son diamètre est petit (D ≤ 6)
• ces réseaux ont des distances caractéristiques
faibles
http://en.wikipedia.org/wiki/Small-world_network
Connectivité d’un réseau
• la connectivité K d’un réseau est le nombre
minimal de liens connectant deux noeuds u
et v
• formellement, c’est le nombre minimal de
noeuds qu’il faut supprimer pour déconnecter
le réseau
http://web.hamline.edu/~lcopes/SciMathMN/concepts/cevcon.html
Connectivité d’un noeud
• la connectivité K d’un noeud (protéine i) est le
nombre de liens émanant du noeud i
Exponential
Scale-free
HUB
Jeong et al, Nature 2000
Une autre représentation du réseau
6
3
7
4
8
2
5
9
1
1 2 3 4 5 6 7 8 9
1
X
X
2
X
X
3
X
4
X
X X
5 X
X X
6
X
7
X
X
8
X
X X
X
9 X
X
Après un algorithme de clustering
6
3
7
4
8
2
5
9
1
3 6 7
3
X
6 X
7
4
X
8
X
2
5
1
9
4 8 2 5 1 9
X X
X X
X
X X
X X
X
X X
X
X
X X
Modular organization of cellular networks
D
0
1
P - polarity
R - Ras related pathway
H - Highly osmotic conditions
M - Mating/filamentation
Rives AW et al. PNAS, 2003
Modular organization of cellular networks
- Modules
- Intermodular connections
Rives AW et al. PNAS, 2003
Recherche de modules
Gavin et al. (2006) Nature, doi:10.1038/nature04532
Recherche de modules
A(i,j) : indice de socio-affinité
ni;j|i=bait : nombre of fois où protéines i et j sont retrouvées quand I est étiquettée
prey
: nombre of proies récupérées quand i est un appât
i = bait
prey
: nombre de fois où protéines i and j sont copurifiées avec d’autres appâts.
i, j
n
n
Gavin et al. (2006) Nature, doi:10.1038/nature04532
Recherche de modules
Gavin et al. (2006) Nature, doi:10.1038/nature04532
Recherche de modules
Gavin et al. (2006) Nature, doi:10.1038/nature04532
Essentialité des gènes
Yu et al (2004) Trends in Genetics 20:227-231
Essentialité des gènes
Hubs : 1061 protéines qui ont le plus grand nombre d’interactions
Yu et al (2004) Trends in Genetics 20:227-231
Robustesse du réseau aux mutations
Jeong et al, Nature 2000
Robustesse du réseau aux mutations
Freeland et al. (2000) Mol. Biol. Evol. 17:511–518
Perspectives : combiner les réseaux
Kelley & Iteker (2005) Nature Biotechnology 23:561-566
Large-scale experimental methods for revealing
protein-protein interactions:
Yeast Two Hybrid Assay
AD
B
A
Reporter gene
DBD
DNA
Uetz P, et al. A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae.
Nature. 2000 Feb 10;403(6770):623-7.( 981 interactions, 1044 proteins )
Ito T, et al. A comprehensive two-hybrid analysis to explore the yeast protein interactome.
Proc Natl Acad Sci U S A. 2001 Apr 10;98(8):4569-74.( 4393 interactions, 3278 proteins )
Large-scale experimental methods for revealing
protein-protein interactions:
Tandem Affinity PurificationMass Spectrometry
Gavin AC, et al. Functional organization of the yeast proteome by
systematic analysis of protein complexes.
Nature. 2002 Jan 10; 415, 141-147.
( 31304 interactions, 1361 proteins )
Large-scale experimental methods for revealing
protein-protein interactions:
Tandem Affinity PurificationMass Spectrometry
Gavin AC, et al. Nature. 2006
( ~ 500 complexes, involving ~ 60% of yeast genes )
Large-scale experimental methods for revealing
protein-protein interactions:
• Yeast Two Hybrid ~6,400 interactions
• Pull-down ~42,000 interactions
• Overlap:
~400 interactions detected by all experiments
~2500 interactions detected by more than one experiment
Small overlap is due to:
• incomplete coverage of yeast interactome by large-scale screens
• limitations of experimental techniques (high false positive rates,
inability to capture interactions between certain classes of genes)
PCA
(Protein fragment Complementation Assays)
Screening
Screening
A
B
A B
Dynamics
Quantitation
Pharmacology
Pharmacology
Localization
Trafficking
Localization
Trafficking
Requirements for Network Visualization
Molecular interactions are detected directly.
Extremely high dynamic range
Genes are expressed in a relevant cellular context, in which
components of the underlying pathway exist.
Events induced by any pathway perturbation can be detected, linking
specific interactions to specific pathways.
Subcellular locations of protein complexes can be determined
unambiguously.
Can be scaled and require no specialized detection technology.
B
A
P1
Assay1
P1
Assay2
Module 3
Module 1
I/Io
A
Or
Ic/ In
Module 2
Module 1
Time
Module 2 Module 3
Assays
Module 1
Module 2
Module 3
P1
P2
P3

Documents pareils