Une boîte à outils basique pour l`analyse de la

Transcription

Une boîte à outils basique pour l`analyse de la
Une boîte à outils basique pour l’analyse de la
dynamique des réseaux croissants
Clémence Magnien, Mahendra Mariadassou, Camille Roth
[email protected], [email protected],
[email protected]
CREA - CNRS / Ecole Polytechnique
AlgoTel 2005 / 11-13 mai, Presqu’île de Giens
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
1 / 17
Plan
1
Définitions et méthodologie
2
Statistiques élémentaires
3
Statistiques liées aux degrés
Comparaison noeuds de faible/fort degré
Attachement préférentiel
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
2 / 17
Qu’est-ce qu’un réseau dynamique ?
Définition générale
Un réseau dans lequel des nœuds et des liens apparaissent et
disparaissent au cours du temps.
Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de
collaborations, Réseaux d’amitié, Réseaux de contacts sexuels,
Interactions de protéines, Réseaux linguistiques...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
3 / 17
Qu’est-ce qu’un réseau dynamique ?
Définition générale
Un réseau dans lequel des nœuds et des liens apparaissent et
disparaissent au cours du temps.
Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de
collaborations, Réseaux d’amitié, Réseaux de contacts sexuels,
Interactions de protéines, Réseaux linguistiques...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
3 / 17
Qu’est-ce qu’un réseau dynamique ?
Définition générale
Un réseau dans lequel des nœuds et des liens apparaissent et
disparaissent au cours du temps.
Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de
collaborations, Réseaux d’amitié, Réseaux de contacts sexuels,
Interactions de protéines, Réseaux linguistiques...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
3 / 17
Qu’est-ce qu’un réseau dynamique ?
Définition générale
Un réseau dans lequel des nœuds et des liens apparaissent et
disparaissent au cours du temps.
Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de
collaborations, Réseaux d’amitié, Réseaux de contacts sexuels,
Interactions de protéines, Réseaux linguistiques...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
3 / 17
Qu’est-ce qu’un réseau dynamique ?
Définition générale
Un réseau dans lequel des nœuds et des liens apparaissent et
disparaissent au cours du temps.
Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de
collaborations, Réseaux d’amitié, Réseaux de contacts sexuels,
Interactions de protéines, Réseaux linguistiques...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
3 / 17
Qu’est-ce qu’un réseau dynamique ?
Définition générale
Un réseau dans lequel des nœuds et des liens apparaissent et
disparaissent au cours du temps.
Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de
collaborations, Réseaux d’amitié, Réseaux de contacts sexuels,
Interactions de protéines, Réseaux linguistiques...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
3 / 17
Réseaux croissants
Problème:
Une myriade de statistiques élémentaires (vitesse
d’apparition/disparition de nouveaux nœuds/liens, durée de vie
moyenne, nombre d’apparition/disparition moyen, etc.)
Une solution possible: Se limiter aux réseaux croissants : les liens et
les nœuds apparaissent mais ne disparaissent jamais
Permet de réduire la complexité de l’analyse
Correspond aux données qu’on peut obtenir
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
4 / 17
Réseaux croissants
Problème:
Une myriade de statistiques élémentaires (vitesse
d’apparition/disparition de nouveaux nœuds/liens, durée de vie
moyenne, nombre d’apparition/disparition moyen, etc.)
Une solution possible: Se limiter aux réseaux croissants : les liens et
les nœuds apparaissent mais ne disparaissent jamais
Permet de réduire la complexité de l’analyse
Correspond aux données qu’on peut obtenir
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
4 / 17
Réseaux croissants
Problème:
Une myriade de statistiques élémentaires (vitesse
d’apparition/disparition de nouveaux nœuds/liens, durée de vie
moyenne, nombre d’apparition/disparition moyen, etc.)
Une solution possible: Se limiter aux réseaux croissants : les liens et
les nœuds apparaissent mais ne disparaissent jamais
Permet de réduire la complexité de l’analyse
Correspond aux données qu’on peut obtenir
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
4 / 17
Réseaux croissants
Problème:
Une myriade de statistiques élémentaires (vitesse
d’apparition/disparition de nouveaux nœuds/liens, durée de vie
moyenne, nombre d’apparition/disparition moyen, etc.)
Une solution possible: Se limiter aux réseaux croissants : les liens et
les nœuds apparaissent mais ne disparaissent jamais
Permet de réduire la complexité de l’analyse
Correspond aux données qu’on peut obtenir
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
4 / 17
Notre modèle: Réseaux croissants à gros grains
périodes
P1
Magnien, Mariadassou & Roth (CREA)
P2
P3
AlgoTel 2005
5 / 17
Notre modèle: Réseaux croissants à gros grains
périodes
P1
Magnien, Mariadassou & Roth (CREA)
P2
P3
AlgoTel 2005
5 / 17
Notre modèle: Réseaux croissants à gros grains
périodes
P1
Magnien, Mariadassou & Roth (CREA)
P2
P3
AlgoTel 2005
5 / 17
Notre modèle: Réseaux croissants à gros grains
périodes
P1
Magnien, Mariadassou & Roth (CREA)
P2
P3
AlgoTel 2005
5 / 17
Notre modèle: Réseaux croissants à gros grains
périodes
P1
P2
P3
Induit différents types de nœuds et de liens
Liens
totalement externes
Noeuds externes
Liens externes
Liens internes
Magnien, Mariadassou & Roth (CREA)
Noeuds internes
AlgoTel 2005
5 / 17
Réseaux empiriques
Réseau des acteurs (Source: www.imdb.com)
Nœuds : acteurs
Liens : deux acteurs sont liés s’ils ont joué dans un même film.
Réseau des échanges IP (Source: Metrosec - Metropolis)
Nœuds : machines sur l’Internet
Liens : deux machines liées si elles communiquent ensemble.
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
6 / 17
Réseaux empiriques
Réseau des acteurs (Source: www.imdb.com)
Nœuds : acteurs
Liens : deux acteurs sont liés s’ils ont joué dans un même film.
Réseau des échanges IP (Source: Metrosec - Metropolis)
Nœuds : machines sur l’Internet
Liens : deux machines liées si elles communiquent ensemble.
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
6 / 17
Réseaux empiriques
Réseau des acteurs (Source: www.imdb.com)
Nœuds : acteurs
Liens : deux acteurs sont liés s’ils ont joué dans un même film.
Réseau des échanges IP (Source: Metrosec - Metropolis)
Nœuds : machines sur l’Internet
Liens : deux machines liées si elles communiquent ensemble.
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
6 / 17
Réseaux empiriques
Réseau des acteurs (Source: www.imdb.com)
Nœuds : acteurs
Liens : deux acteurs sont liés s’ils ont joué dans un même film.
Réseau des échanges IP (Source: Metrosec - Metropolis)
Nœuds : machines sur l’Internet
Liens : deux machines liées si elles communiquent ensemble.
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
6 / 17
Réseaux empiriques
Réseau des acteurs (Source: www.imdb.com)
Nœuds : acteurs
Liens : deux acteurs sont liés s’ils ont joué dans un même film.
Réseau des échanges IP (Source: Metrosec - Metropolis)
Nœuds : machines sur l’Internet
Liens : deux machines liées si elles communiquent ensemble.
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
6 / 17
Réseaux empiriques
Réseau des acteurs (Source: www.imdb.com)
Nœuds : acteurs
Liens : deux acteurs sont liés s’ils ont joué dans un même film.
Réseau des échanges IP (Source: Metrosec - Metropolis)
Nœuds : machines sur l’Internet
Liens : deux machines liées si elles communiquent ensemble.
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
6 / 17
Choix de la granularité
Certains réseaux ont une granularité “naturelle” — d’autres non.
granularité trop petite : on perd la significativité
granularité trop grande : on perd la dynamique
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
7 / 17
Choix de la granularité
Certains réseaux ont une granularité “naturelle” — d’autres non.
granularité trop petite : on perd la significativité
granularité trop grande : on perd la dynamique
Idée: Choisir la plus petite période qui donne une régularité
90
160
80
140
70
120
60
100
50
80
40
60
30
40
20
20
10
0
0
250
500
1000
1500
2000
2500
3000
3500
4000
4500
0
0
500
1000
1500
2000
2500
3000
3500
4000
4500
0
500
1000
1500
2000
2500
3000
3500
4000
4500
700
600
200
500
150
400
300
100
200
50
100
0
0
500
Magnien, Mariadassou & Roth (CREA)
1000
1500
2000
2500
3000
3500
4000
4500
0
AlgoTel 2005
7 / 17
Analyse dynamique: rappels sur l’analyse statique
Jusqu’ici, il s’agit d’analyser
une photo sans s’intéresser
à son histoire...
L’analyse classique fournit beaucoup de paramètres pertinents:
Degré moyen et densité,
Distance moyenne (courte),
Coefficient de clustering (fort),
Distribution des degrés (hétérogène),
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
8 / 17
Analyse dynamique: rappels sur l’analyse statique
Jusqu’ici, il s’agit d’analyser
une photo sans s’intéresser
à son histoire...
L’analyse classique fournit beaucoup de paramètres pertinents:
Degré moyen et densité,
Distance moyenne (courte),
Coefficient de clustering (fort),
Distribution des degrés (hétérogène),
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
8 / 17
Analyse dynamique: rappels sur l’analyse statique
Jusqu’ici, il s’agit d’analyser
une photo sans s’intéresser
à son histoire...
L’analyse classique fournit beaucoup de paramètres pertinents:
Degré moyen et densité,
Distance moyenne (courte),
Coefficient de clustering (fort),
Distribution des degrés (hétérogène),
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
8 / 17
Analyse dynamique: rappels sur l’analyse statique
Jusqu’ici, il s’agit d’analyser
une photo sans s’intéresser
à son histoire...
L’analyse classique fournit beaucoup de paramètres pertinents:
Degré moyen et densité,
Distance moyenne (courte),
Coefficient de clustering (fort),
Distribution des degrés (hétérogène),
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
8 / 17
Analyse dynamique: rappels sur l’analyse statique
Jusqu’ici, il s’agit d’analyser
une photo sans s’intéresser
à son histoire...
L’analyse classique fournit beaucoup de paramètres pertinents:
Degré moyen et densité,
Distance moyenne (courte),
Coefficient de clustering (fort),
Distribution des degrés (hétérogène),
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
8 / 17
Analyse dynamique: rappels sur l’analyse statique
Jusqu’ici, il s’agit d’analyser
une photo sans s’intéresser
à son histoire...
L’analyse classique fournit beaucoup de paramètres pertinents:
Degré moyen et densité,
Distance moyenne (courte),
Coefficient de clustering (fort),
Distribution des degrés (hétérogène),
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
8 / 17
Analyse dynamique: rappels sur l’analyse statique
Jusqu’ici, il s’agit d’analyser
une photo sans s’intéresser
à son histoire...
L’analyse classique fournit beaucoup de paramètres pertinents:
Degré moyen et densité,
Distance moyenne (courte),
Coefficient de clustering (fort),
Distribution des degrés (hétérogène),
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
8 / 17
Évolution des quantités classiques
Première idée : regarder l’évolution de ces quantités au fil du temps.
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
9 / 17
Évolution des quantités classiques
Première idée : regarder l’évolution de ces quantités au fil du temps.
Première constatation : rien de très remarquable
Croissance relativement lisse
Degré moyen devient constant
Distribution des degrés stable
Coefficient de clustering devient vite constant
Indique un comportement standard résumé par l’étude statique?
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
9 / 17
Évolution des quantités classiques
Première idée : regarder l’évolution de ces quantités au fil du temps.
Première constatation : rien de très remarquable
Croissance relativement lisse
Degré moyen devient constant
Distribution des degrés stable
Coefficient de clustering devient vite constant
Indique un comportement standard résumé par l’étude statique?
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
9 / 17
Évolution des quantités classiques
Première idée : regarder l’évolution de ces quantités au fil du temps.
Première constatation : rien de très remarquable
Croissance relativement lisse
Degré moyen devient constant
Distribution des degrés stable
Coefficient de clustering devient vite constant
Indique un comportement standard résumé par l’étude statique?
֒→ Problème: On plaque une vision statique sur la dynamique
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
9 / 17
Évolution du nombre de nœuds et de liens des
différents types
Acteurs et IP
900000
800000
60000
Fully external links
External links
Internal links
Actor
External nodes
Internal nodes
Actor
50000
700000
600000
40000
500000
30000
400000
300000
20000
200000
10000
100000
0
4500
1900
1920
1940
1960
1980
4000
2000
0
6000
Fully external links
External links
Internal links
1900
1920
1940
1960
IP exch.
IP exch.
1980
2000
External nodes
Internal nodes
5000
3500
4000
3000
2500
3000
2000
2000
1500
1000
1000
500
0
0
50
100
150
200
250
Magnien, Mariadassou & Roth (CREA)
300
350
0
0
50
100
150
200
250
300
350
AlgoTel 2005
10 / 17
Statistiques liées aux degrés
Distribution des degrés hétérogène
Nœuds de faible degré
La masse du réseau
֒→ quantité à étudier :
fraction de nœuds de faible degré
Magnien, Mariadassou & Roth (CREA)
Nœuds de fort degré
Les exceptions
֒→ les étudier séparément :
évolution de leur degré
AlgoTel 2005
11 / 17
Nœuds de fort degré et degré maximal
30000
25000
30000
Rank = 1
Rank = 2
Rank = 3
Rank = 7
Rank = 10
Maximum degree
25000
20000
20000
15000
15000
10000
10000
5000
5000
Actor
Actor
0
1900
35000
30000
25000
1920
1940
1960
1980
2000
0
1900
1920
1940
1960
35000
Rank = 1
Rank = 2
Rank = 3
Rank = 5
Rank = 10
1980
2000
Maximum degree
30000
25000
20000
20000
15000
15000
IP exch.
10000
10000
5000
5000
0
50
100
150
200
250
300
Magnien, Mariadassou & Roth (CREA)
350
0
IP exch.
0
50
100
150
200
250
300
350
AlgoTel 2005
12 / 17
Fractions de nœuds de faible degré
1
1
D=1
D=3
D=5
D = 10
D = 15
D = 20
Actor
0.9
0.8
0.95
0.9
0.7
0.85
0.6
0.8
0.5
0.75
0.4
0.7
0.3
0.65
0.2
0.6
0.1
0.55
0
0.5
1900
1920
1940
1960
Magnien, Mariadassou & Roth (CREA)
1980
2000
D=1
D=3
D=5
D = 10
D = 15
0
IP exch.
50
100
150
200
250
300
350
AlgoTel 2005
13 / 17
Fractions de nœuds de faible degré
1
1
D=1
D=3
D=5
D = 10
D = 15
D = 20
Actor
0.9
0.8
0.95
0.9
0.7
0.85
0.6
0.8
0.5
0.75
0.4
0.7
0.3
0.65
0.2
0.6
0.1
0.55
0
0.5
1900
1920
1940
1960
1980
2000
D=1
D=3
D=5
D = 10
D = 15
0
IP exch.
50
100
150
200
250
300
350
Conclusion: comportement différent suivant le réseau observé.
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
13 / 17
Attachement préférentiel
Idée :
les nouveaux liens s’attachent à des nœuds existants
֒→ étudier les degrés de ces nœuds
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
14 / 17
Attachement préférentiel
Idée :
les nouveaux liens s’attachent à des nœuds existants
֒→ étudier les degrés de ces nœuds
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
14 / 17
Attachement préférentiel
Idée :
les nouveaux liens s’attachent à des nœuds existants
֒→ étudier les degrés de ces nœuds
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
14 / 17
Attachement préférentiel
Idée :
les nouveaux liens s’attachent à des nœuds existants
֒→ étudier les degrés de ces nœuds
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
14 / 17
Attachement préférentiel
Idée :
les nouveaux liens s’attachent à des nœuds existants
֒→ étudier les degrés de ces nœuds
Motivation : modèle Albert-Barábasi
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
14 / 17
Mesurer l’attachement préférentiel - 1
Choisir un nœud en fonction de son degré :
f (k)N(k)
P(k) = P∞
′
′
k ′ =1 f (k )N(k )
En pratique :
liens internes
liens externes
Mi (k)
M
Me (k)
Pˆe (k) =
M
On mesure :
Mi (k)
∼ f (k)
MN(k)
Me (k)
∼ f (k)
MN(k)
P̂i (k) =
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
15 / 17
Mesurer l’attachement préférentiel - 2
0.001
0.01
t = 1993
t = 1993
0.001
0.0001
0.0001
1e−05
1e−05
1e−06
1e−06
1e−07
1e−07
Actor
Actor
1e−08
1
10
100
1000
1
10000
1e−08
1
10
100
1000
0.1
t = 310
10000
t = 310
0.1
0.01
0.01
0.001
0.001
0.0001
0.0001
1e−05
1e−05
1e−06
IP exch.
1e−07
1
10
100
1000
10000
Magnien, Mariadassou & Roth (CREA)
100000
IP exch.
1e−06
1
10
100
1000
10000
100000
AlgoTel 2005
16 / 17
Conclusion
Présenter une méthodologie pour l’analyse de la dynamique
Perspectives
Trouver d’autres cas particuliers
Faire la comparaison à l’aléatoire
Passer aux réseaux dynamiques généraux
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
17 / 17
Conclusion
Présenter une méthodologie pour l’analyse de la dynamique
Perspectives
Trouver d’autres cas particuliers
Faire la comparaison à l’aléatoire
Passer aux réseaux dynamiques généraux
...
Magnien, Mariadassou & Roth (CREA)
AlgoTel 2005
17 / 17

Documents pareils