Une boîte à outils basique pour l`analyse de la
Transcription
Une boîte à outils basique pour l`analyse de la
Une boîte à outils basique pour l’analyse de la dynamique des réseaux croissants Clémence Magnien, Mahendra Mariadassou, Camille Roth [email protected], [email protected], [email protected] CREA - CNRS / Ecole Polytechnique AlgoTel 2005 / 11-13 mai, Presqu’île de Giens Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 1 / 17 Plan 1 Définitions et méthodologie 2 Statistiques élémentaires 3 Statistiques liées aux degrés Comparaison noeuds de faible/fort degré Attachement préférentiel Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 2 / 17 Qu’est-ce qu’un réseau dynamique ? Définition générale Un réseau dans lequel des nœuds et des liens apparaissent et disparaissent au cours du temps. Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de collaborations, Réseaux d’amitié, Réseaux de contacts sexuels, Interactions de protéines, Réseaux linguistiques... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 3 / 17 Qu’est-ce qu’un réseau dynamique ? Définition générale Un réseau dans lequel des nœuds et des liens apparaissent et disparaissent au cours du temps. Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de collaborations, Réseaux d’amitié, Réseaux de contacts sexuels, Interactions de protéines, Réseaux linguistiques... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 3 / 17 Qu’est-ce qu’un réseau dynamique ? Définition générale Un réseau dans lequel des nœuds et des liens apparaissent et disparaissent au cours du temps. Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de collaborations, Réseaux d’amitié, Réseaux de contacts sexuels, Interactions de protéines, Réseaux linguistiques... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 3 / 17 Qu’est-ce qu’un réseau dynamique ? Définition générale Un réseau dans lequel des nœuds et des liens apparaissent et disparaissent au cours du temps. Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de collaborations, Réseaux d’amitié, Réseaux de contacts sexuels, Interactions de protéines, Réseaux linguistiques... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 3 / 17 Qu’est-ce qu’un réseau dynamique ? Définition générale Un réseau dans lequel des nœuds et des liens apparaissent et disparaissent au cours du temps. Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de collaborations, Réseaux d’amitié, Réseaux de contacts sexuels, Interactions de protéines, Réseaux linguistiques... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 3 / 17 Qu’est-ce qu’un réseau dynamique ? Définition générale Un réseau dans lequel des nœuds et des liens apparaissent et disparaissent au cours du temps. Exemples: Graphe du Web, Internet, Réseaux pair-à-pair, Réseaux de collaborations, Réseaux d’amitié, Réseaux de contacts sexuels, Interactions de protéines, Réseaux linguistiques... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 3 / 17 Réseaux croissants Problème: Une myriade de statistiques élémentaires (vitesse d’apparition/disparition de nouveaux nœuds/liens, durée de vie moyenne, nombre d’apparition/disparition moyen, etc.) Une solution possible: Se limiter aux réseaux croissants : les liens et les nœuds apparaissent mais ne disparaissent jamais Permet de réduire la complexité de l’analyse Correspond aux données qu’on peut obtenir Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 4 / 17 Réseaux croissants Problème: Une myriade de statistiques élémentaires (vitesse d’apparition/disparition de nouveaux nœuds/liens, durée de vie moyenne, nombre d’apparition/disparition moyen, etc.) Une solution possible: Se limiter aux réseaux croissants : les liens et les nœuds apparaissent mais ne disparaissent jamais Permet de réduire la complexité de l’analyse Correspond aux données qu’on peut obtenir Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 4 / 17 Réseaux croissants Problème: Une myriade de statistiques élémentaires (vitesse d’apparition/disparition de nouveaux nœuds/liens, durée de vie moyenne, nombre d’apparition/disparition moyen, etc.) Une solution possible: Se limiter aux réseaux croissants : les liens et les nœuds apparaissent mais ne disparaissent jamais Permet de réduire la complexité de l’analyse Correspond aux données qu’on peut obtenir Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 4 / 17 Réseaux croissants Problème: Une myriade de statistiques élémentaires (vitesse d’apparition/disparition de nouveaux nœuds/liens, durée de vie moyenne, nombre d’apparition/disparition moyen, etc.) Une solution possible: Se limiter aux réseaux croissants : les liens et les nœuds apparaissent mais ne disparaissent jamais Permet de réduire la complexité de l’analyse Correspond aux données qu’on peut obtenir Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 4 / 17 Notre modèle: Réseaux croissants à gros grains périodes P1 Magnien, Mariadassou & Roth (CREA) P2 P3 AlgoTel 2005 5 / 17 Notre modèle: Réseaux croissants à gros grains périodes P1 Magnien, Mariadassou & Roth (CREA) P2 P3 AlgoTel 2005 5 / 17 Notre modèle: Réseaux croissants à gros grains périodes P1 Magnien, Mariadassou & Roth (CREA) P2 P3 AlgoTel 2005 5 / 17 Notre modèle: Réseaux croissants à gros grains périodes P1 Magnien, Mariadassou & Roth (CREA) P2 P3 AlgoTel 2005 5 / 17 Notre modèle: Réseaux croissants à gros grains périodes P1 P2 P3 Induit différents types de nœuds et de liens Liens totalement externes Noeuds externes Liens externes Liens internes Magnien, Mariadassou & Roth (CREA) Noeuds internes AlgoTel 2005 5 / 17 Réseaux empiriques Réseau des acteurs (Source: www.imdb.com) Nœuds : acteurs Liens : deux acteurs sont liés s’ils ont joué dans un même film. Réseau des échanges IP (Source: Metrosec - Metropolis) Nœuds : machines sur l’Internet Liens : deux machines liées si elles communiquent ensemble. Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 6 / 17 Réseaux empiriques Réseau des acteurs (Source: www.imdb.com) Nœuds : acteurs Liens : deux acteurs sont liés s’ils ont joué dans un même film. Réseau des échanges IP (Source: Metrosec - Metropolis) Nœuds : machines sur l’Internet Liens : deux machines liées si elles communiquent ensemble. Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 6 / 17 Réseaux empiriques Réseau des acteurs (Source: www.imdb.com) Nœuds : acteurs Liens : deux acteurs sont liés s’ils ont joué dans un même film. Réseau des échanges IP (Source: Metrosec - Metropolis) Nœuds : machines sur l’Internet Liens : deux machines liées si elles communiquent ensemble. Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 6 / 17 Réseaux empiriques Réseau des acteurs (Source: www.imdb.com) Nœuds : acteurs Liens : deux acteurs sont liés s’ils ont joué dans un même film. Réseau des échanges IP (Source: Metrosec - Metropolis) Nœuds : machines sur l’Internet Liens : deux machines liées si elles communiquent ensemble. Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 6 / 17 Réseaux empiriques Réseau des acteurs (Source: www.imdb.com) Nœuds : acteurs Liens : deux acteurs sont liés s’ils ont joué dans un même film. Réseau des échanges IP (Source: Metrosec - Metropolis) Nœuds : machines sur l’Internet Liens : deux machines liées si elles communiquent ensemble. Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 6 / 17 Réseaux empiriques Réseau des acteurs (Source: www.imdb.com) Nœuds : acteurs Liens : deux acteurs sont liés s’ils ont joué dans un même film. Réseau des échanges IP (Source: Metrosec - Metropolis) Nœuds : machines sur l’Internet Liens : deux machines liées si elles communiquent ensemble. Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 6 / 17 Choix de la granularité Certains réseaux ont une granularité “naturelle” — d’autres non. granularité trop petite : on perd la significativité granularité trop grande : on perd la dynamique Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 7 / 17 Choix de la granularité Certains réseaux ont une granularité “naturelle” — d’autres non. granularité trop petite : on perd la significativité granularité trop grande : on perd la dynamique Idée: Choisir la plus petite période qui donne une régularité 90 160 80 140 70 120 60 100 50 80 40 60 30 40 20 20 10 0 0 250 500 1000 1500 2000 2500 3000 3500 4000 4500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 0 500 1000 1500 2000 2500 3000 3500 4000 4500 700 600 200 500 150 400 300 100 200 50 100 0 0 500 Magnien, Mariadassou & Roth (CREA) 1000 1500 2000 2500 3000 3500 4000 4500 0 AlgoTel 2005 7 / 17 Analyse dynamique: rappels sur l’analyse statique Jusqu’ici, il s’agit d’analyser une photo sans s’intéresser à son histoire... L’analyse classique fournit beaucoup de paramètres pertinents: Degré moyen et densité, Distance moyenne (courte), Coefficient de clustering (fort), Distribution des degrés (hétérogène), ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 8 / 17 Analyse dynamique: rappels sur l’analyse statique Jusqu’ici, il s’agit d’analyser une photo sans s’intéresser à son histoire... L’analyse classique fournit beaucoup de paramètres pertinents: Degré moyen et densité, Distance moyenne (courte), Coefficient de clustering (fort), Distribution des degrés (hétérogène), ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 8 / 17 Analyse dynamique: rappels sur l’analyse statique Jusqu’ici, il s’agit d’analyser une photo sans s’intéresser à son histoire... L’analyse classique fournit beaucoup de paramètres pertinents: Degré moyen et densité, Distance moyenne (courte), Coefficient de clustering (fort), Distribution des degrés (hétérogène), ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 8 / 17 Analyse dynamique: rappels sur l’analyse statique Jusqu’ici, il s’agit d’analyser une photo sans s’intéresser à son histoire... L’analyse classique fournit beaucoup de paramètres pertinents: Degré moyen et densité, Distance moyenne (courte), Coefficient de clustering (fort), Distribution des degrés (hétérogène), ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 8 / 17 Analyse dynamique: rappels sur l’analyse statique Jusqu’ici, il s’agit d’analyser une photo sans s’intéresser à son histoire... L’analyse classique fournit beaucoup de paramètres pertinents: Degré moyen et densité, Distance moyenne (courte), Coefficient de clustering (fort), Distribution des degrés (hétérogène), ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 8 / 17 Analyse dynamique: rappels sur l’analyse statique Jusqu’ici, il s’agit d’analyser une photo sans s’intéresser à son histoire... L’analyse classique fournit beaucoup de paramètres pertinents: Degré moyen et densité, Distance moyenne (courte), Coefficient de clustering (fort), Distribution des degrés (hétérogène), ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 8 / 17 Analyse dynamique: rappels sur l’analyse statique Jusqu’ici, il s’agit d’analyser une photo sans s’intéresser à son histoire... L’analyse classique fournit beaucoup de paramètres pertinents: Degré moyen et densité, Distance moyenne (courte), Coefficient de clustering (fort), Distribution des degrés (hétérogène), ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 8 / 17 Évolution des quantités classiques Première idée : regarder l’évolution de ces quantités au fil du temps. Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 9 / 17 Évolution des quantités classiques Première idée : regarder l’évolution de ces quantités au fil du temps. Première constatation : rien de très remarquable Croissance relativement lisse Degré moyen devient constant Distribution des degrés stable Coefficient de clustering devient vite constant Indique un comportement standard résumé par l’étude statique? Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 9 / 17 Évolution des quantités classiques Première idée : regarder l’évolution de ces quantités au fil du temps. Première constatation : rien de très remarquable Croissance relativement lisse Degré moyen devient constant Distribution des degrés stable Coefficient de clustering devient vite constant Indique un comportement standard résumé par l’étude statique? Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 9 / 17 Évolution des quantités classiques Première idée : regarder l’évolution de ces quantités au fil du temps. Première constatation : rien de très remarquable Croissance relativement lisse Degré moyen devient constant Distribution des degrés stable Coefficient de clustering devient vite constant Indique un comportement standard résumé par l’étude statique? ֒→ Problème: On plaque une vision statique sur la dynamique Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 9 / 17 Évolution du nombre de nœuds et de liens des différents types Acteurs et IP 900000 800000 60000 Fully external links External links Internal links Actor External nodes Internal nodes Actor 50000 700000 600000 40000 500000 30000 400000 300000 20000 200000 10000 100000 0 4500 1900 1920 1940 1960 1980 4000 2000 0 6000 Fully external links External links Internal links 1900 1920 1940 1960 IP exch. IP exch. 1980 2000 External nodes Internal nodes 5000 3500 4000 3000 2500 3000 2000 2000 1500 1000 1000 500 0 0 50 100 150 200 250 Magnien, Mariadassou & Roth (CREA) 300 350 0 0 50 100 150 200 250 300 350 AlgoTel 2005 10 / 17 Statistiques liées aux degrés Distribution des degrés hétérogène Nœuds de faible degré La masse du réseau ֒→ quantité à étudier : fraction de nœuds de faible degré Magnien, Mariadassou & Roth (CREA) Nœuds de fort degré Les exceptions ֒→ les étudier séparément : évolution de leur degré AlgoTel 2005 11 / 17 Nœuds de fort degré et degré maximal 30000 25000 30000 Rank = 1 Rank = 2 Rank = 3 Rank = 7 Rank = 10 Maximum degree 25000 20000 20000 15000 15000 10000 10000 5000 5000 Actor Actor 0 1900 35000 30000 25000 1920 1940 1960 1980 2000 0 1900 1920 1940 1960 35000 Rank = 1 Rank = 2 Rank = 3 Rank = 5 Rank = 10 1980 2000 Maximum degree 30000 25000 20000 20000 15000 15000 IP exch. 10000 10000 5000 5000 0 50 100 150 200 250 300 Magnien, Mariadassou & Roth (CREA) 350 0 IP exch. 0 50 100 150 200 250 300 350 AlgoTel 2005 12 / 17 Fractions de nœuds de faible degré 1 1 D=1 D=3 D=5 D = 10 D = 15 D = 20 Actor 0.9 0.8 0.95 0.9 0.7 0.85 0.6 0.8 0.5 0.75 0.4 0.7 0.3 0.65 0.2 0.6 0.1 0.55 0 0.5 1900 1920 1940 1960 Magnien, Mariadassou & Roth (CREA) 1980 2000 D=1 D=3 D=5 D = 10 D = 15 0 IP exch. 50 100 150 200 250 300 350 AlgoTel 2005 13 / 17 Fractions de nœuds de faible degré 1 1 D=1 D=3 D=5 D = 10 D = 15 D = 20 Actor 0.9 0.8 0.95 0.9 0.7 0.85 0.6 0.8 0.5 0.75 0.4 0.7 0.3 0.65 0.2 0.6 0.1 0.55 0 0.5 1900 1920 1940 1960 1980 2000 D=1 D=3 D=5 D = 10 D = 15 0 IP exch. 50 100 150 200 250 300 350 Conclusion: comportement différent suivant le réseau observé. Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 13 / 17 Attachement préférentiel Idée : les nouveaux liens s’attachent à des nœuds existants ֒→ étudier les degrés de ces nœuds Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 14 / 17 Attachement préférentiel Idée : les nouveaux liens s’attachent à des nœuds existants ֒→ étudier les degrés de ces nœuds Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 14 / 17 Attachement préférentiel Idée : les nouveaux liens s’attachent à des nœuds existants ֒→ étudier les degrés de ces nœuds Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 14 / 17 Attachement préférentiel Idée : les nouveaux liens s’attachent à des nœuds existants ֒→ étudier les degrés de ces nœuds Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 14 / 17 Attachement préférentiel Idée : les nouveaux liens s’attachent à des nœuds existants ֒→ étudier les degrés de ces nœuds Motivation : modèle Albert-Barábasi Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 14 / 17 Mesurer l’attachement préférentiel - 1 Choisir un nœud en fonction de son degré : f (k)N(k) P(k) = P∞ ′ ′ k ′ =1 f (k )N(k ) En pratique : liens internes liens externes Mi (k) M Me (k) Pˆe (k) = M On mesure : Mi (k) ∼ f (k) MN(k) Me (k) ∼ f (k) MN(k) P̂i (k) = Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 15 / 17 Mesurer l’attachement préférentiel - 2 0.001 0.01 t = 1993 t = 1993 0.001 0.0001 0.0001 1e−05 1e−05 1e−06 1e−06 1e−07 1e−07 Actor Actor 1e−08 1 10 100 1000 1 10000 1e−08 1 10 100 1000 0.1 t = 310 10000 t = 310 0.1 0.01 0.01 0.001 0.001 0.0001 0.0001 1e−05 1e−05 1e−06 IP exch. 1e−07 1 10 100 1000 10000 Magnien, Mariadassou & Roth (CREA) 100000 IP exch. 1e−06 1 10 100 1000 10000 100000 AlgoTel 2005 16 / 17 Conclusion Présenter une méthodologie pour l’analyse de la dynamique Perspectives Trouver d’autres cas particuliers Faire la comparaison à l’aléatoire Passer aux réseaux dynamiques généraux ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 17 / 17 Conclusion Présenter une méthodologie pour l’analyse de la dynamique Perspectives Trouver d’autres cas particuliers Faire la comparaison à l’aléatoire Passer aux réseaux dynamiques généraux ... Magnien, Mariadassou & Roth (CREA) AlgoTel 2005 17 / 17