Gephi focus sur l`importation de données
Transcription
Gephi focus sur l`importation de données
Gephi focus sur l’importation de données Clément Levallois Gephi Support Team et professeur à l’EMLyon Business School (2014 -) V 1.0 – Nov. 2013 1 Note biographique • Formation initiale en économie et sciences de gestion, puis doctorat en histoire des sciences. • Je me suis tourné depuis 2008 vers les méthodologies digitales – – – – “data visualization”, analyse de réseaux, “natural language processing”, applications web, etc. Membre de la “Gephi Community Support” team Formateur Gephi certifié, créateur de plugins. https://marketplace.gephi.org/service/data-analysis/ • En poste à la Rotterdam School of Management (2008-2013), professeur à l’EMLyon à partir de 2014. • Contact et remarques: sur twitter @seinecle ou www.clementlevallois.net 2 Clement Levallois Réseau déjà formé? L’importation est directe 3 Clement Levallois Données formatées – sous format Excel - Via le data laboratory - Requiert d’avoir au minimum une liste de liens - Si aucune liste de nodes, ils seront créés automatiquement à partir des nodes mentionnés dans la liste de liens 4 Clement Levallois Erreurs fréquentes sur l’importation via le data lab: - Attention à l’en-tête des fichiers! Au minimum: - Liens: Source,Target - Nodes: Id,Label - Attention au format des champs! - Vérifiez que vos attributs numériques ne sont pas importés comme des String (texte), mais bien comme des nombres (Float, Double ou Integer) - Importation d’une liste de liens et une liste de nodes - Importer la liste de nodes en premier - Importation d’une liste de liens seule - Vérifiez que l’option « créez les nodes si absents » est bien activée 5 Clement Levallois Données non formatées - sous format Excel / CSV Le réseau formé par les auteurs et leurs agents littéraires Le réseau formé par les co-auteurs d’articles Le réseau formé par les coauteurs d’articles et les journaux où ils publient 6 Clement Levallois Gaze: calculateur de similarités Le réseau connectant universités, le lien étant + ou – fort en fonction des similarités des journaux où elles publient. Gaze peut être téléchargé sur www.clementlevallois.net 7 Clement Levallois Créer un réseau dynamique via le data laboratory • Avoir deux attributs pour les nodes: – Un attribut qui contient la date d’apparition du node – Un autre qui contient la date de disparition • Utiliser une fonction de fusion pour créer un intervalle de temps à partir de ces deux attributs (voir slide suivant) • Principe identique pour créer des liens dynamiques • Les limites sont importantes: il ne s’agit que de dynamique de la topologie, pas des attributs (qui restent figés). Et encore, la topologie n’évolue que peu (un node ne peut qu’apparaître puis disparaître). • C’est un cas où la programmation apporterait une flexibilité incomparable. 8 Clement Levallois La fonction “Merge columns” Sélectionner les deux colonnes qui 2. contiennent les dates de début et de fin pour le node (ou le lien) 1. 3. Sélectionner “Create time interval” Cliquer sur ce bouton. 9 Clement Levallois Dernière étape: “create time interval” Il est possible de laisser la date de début ou de fin vide Si vos données temporelles sont sous forme de date, soyez attentifs à fournir le format exact sous peine de crasher la création de réseau dynamique. Et c’est tout! Vous pouvez maintenant revenir à l’Overview, activer la timeline et animer le réseau. 10 Clement Levallois Prochaine étape: Gephi - fonctions avancées 11 Clement Levallois