Gephi focus sur l`importation de données

Transcription

Gephi focus sur l`importation de données
Gephi
focus sur l’importation de données
Clément Levallois
Gephi Support Team et professeur à l’EMLyon Business School (2014 -)
V 1.0 – Nov. 2013
1
Note biographique
•
Formation initiale en économie et sciences de gestion, puis doctorat en histoire des sciences.
•
Je me suis tourné depuis 2008 vers les méthodologies digitales
–
–
–
–
“data visualization”, analyse de réseaux, “natural language processing”, applications web, etc.
Membre de la “Gephi Community Support” team
Formateur Gephi certifié, créateur de plugins.
https://marketplace.gephi.org/service/data-analysis/
•
En poste à la Rotterdam School of Management (2008-2013), professeur à l’EMLyon
à partir de 2014.
•
Contact et remarques: sur twitter @seinecle ou www.clementlevallois.net
2
Clement Levallois
Réseau déjà formé?
L’importation est directe
3
Clement Levallois
Données formatées
– sous format Excel
- Via le data laboratory
- Requiert d’avoir au
minimum une liste de liens
- Si aucune liste de nodes,
ils seront créés
automatiquement à partir
des nodes mentionnés
dans la liste de liens
4
Clement Levallois
Erreurs fréquentes
sur l’importation via le data lab:
- Attention à l’en-tête des fichiers! Au minimum:
- Liens: Source,Target
- Nodes: Id,Label
- Attention au format des champs!
- Vérifiez que vos attributs numériques ne sont pas importés comme des
String (texte), mais bien comme des nombres (Float, Double ou
Integer)
- Importation d’une liste de liens et une liste de nodes
- Importer la liste de nodes en premier
- Importation d’une liste de liens seule
- Vérifiez que l’option « créez les nodes si absents » est bien activée
5
Clement Levallois
Données non formatées
- sous format Excel / CSV
Le réseau formé par
les auteurs et leurs
agents littéraires
Le réseau formé
par les co-auteurs
d’articles
Le réseau formé par les coauteurs d’articles et les
journaux où ils publient
6
Clement Levallois
Gaze: calculateur de similarités
Le réseau connectant
universités, le lien étant + ou
– fort en fonction des
similarités des journaux où
elles publient.
Gaze peut être téléchargé sur
www.clementlevallois.net
7
Clement Levallois
Créer un réseau dynamique
via le data laboratory
• Avoir deux attributs pour les nodes:
– Un attribut qui contient la date d’apparition du node
– Un autre qui contient la date de disparition
• Utiliser une fonction de fusion pour créer un intervalle de temps à partir
de ces deux attributs (voir slide suivant)
• Principe identique pour créer des liens dynamiques
• Les limites sont importantes: il ne s’agit que de dynamique de la topologie,
pas des attributs (qui restent figés). Et encore, la topologie n’évolue que
peu (un node ne peut qu’apparaître puis disparaître).
• C’est un cas où la programmation apporterait une flexibilité incomparable.
8
Clement Levallois
La fonction “Merge columns”
Sélectionner les deux colonnes qui
2. contiennent les dates de début et de fin
pour le node (ou le lien)
1.
3.
Sélectionner “Create time interval”
Cliquer sur ce bouton.
9
Clement Levallois
Dernière étape: “create time interval”
Il est possible de laisser
la date de début ou de
fin vide
Si vos données temporelles
sont sous forme de date,
soyez attentifs à fournir le
format exact sous peine de
crasher la création de
réseau dynamique.
Et c’est tout! Vous pouvez maintenant revenir à l’Overview, activer la timeline et animer le réseau.
10
Clement Levallois
Prochaine étape:
Gephi - fonctions avancées
11
Clement Levallois