Upload
laurent-beauguitte
View
767
Download
0
Embed Size (px)
Citation preview
Visualisation des réseaux
Visualisation de réseaux
Comment choisir un logiciel
Laurent Beauguitte
CNRS - UMR IDEES
20 mars 2017
Visualisation des réseaux
1 Visualisation de graphe : rappels sémiologiques de baseVariables visuellesLégende
2 Visualisation de réseauxDes principes de base aux force-directed layoutsRéseaux denses et grands réseaux
3 Choisir un logiciel
4 Démo : Cytoscape, R
Visualisation des réseaux
Introduction
Analyse de réseaux ne nécessite pas a priori de visualisation
Les images de réseaux sont le plus souvent ine�caces (pas demessage clair)
Fossé entre moyens techniques et capacités cognitives
Il n'existe pas de logiciel idéal. . .
Visualisation des réseaux
sémiologie
Le graphe comme image : exploration vs communication
Exploration
esthétique super�ue
légende inutile
plus les données sont complètes et précises, mieux c'est
Visualisation des réseaux
sémiologie
Le graphe pour communiquer
nécessité d'une légende claire, précise, complète
transparence sur l'outil et la méthode (quel logiciel ? quelalgorithme de visualisation ?)
plus le graphe re�ète vos données, moins il est lisible :sélection indispensable
Interactivité : communication sans message ou exploration ?
http://www.global-migration.info/ - *tous les liens ont été visités en mars 2017.
Visualisation des réseaux
sémiologie
Variables visuelles
Sémiologie graphique selon J. Bertin : trois implantations(ponctuelle, linéaire et surfacique) et six variables visuelles (forme,taille, valeur, couleur, orientation, texture ou grain).
http://margaux.ipt.univ-paris8.fr/vgodard/enseigne/carto2/memocart/mem12car.htm
Visualisation des réseaux
sémiologie
Variables visuelles
Pour les graphes : deux implantations (ponctuelle et zonale) etquatre variables pertinentes (orientation peu adaptée, grain en voiede disparition).
Selon Bertin (et les bertiniens orthodoxes):
variable taille = variables quantitatives absolues (stock)
valeur = variables quantitatives relatives (taux) et qualitativesordonnées (petit, moyen, grand)
couleur et forme = variable qualitative nominale
Visualisation des réseaux
sémiologie
Légende
Un graphe sans légende ne sert à rien. . .
source : http://agencephare.com/lanalyse-reseau/
Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Principes élaborés par J. Moreno (1934)
sommets les plus connectés au centre
sommets les moins connectés en périphérie
éviter les croisements de lien
longueur des liens équivalente pour des liens équivalents*
*très vite impossible pour des raisons géométriques
Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Légende claire
Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Développement de la SNA dans les années 70 : perte de qualitégraphique
Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Perte de qualité graphique durable. . . (Knoke, 1991)
Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Innovations majeures en écologie : souci clarté graphique et modereprésentation des propriétés des réseaux (graphique log-log)
1982 1987
Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Placements manuels puis automatiques (70s)
Premiers placements : aléatoire, géométrique (circle), basés sur despropriétés statistiques (analyse factorielle, MDS)
Apparition des force-based layouts dans les 90s : Kamadakawai(89), Fruchterman-Reingold (91)
Depuis 90s : développement capacités informatiques et dataviz(data visualisation)
http://�owingdata.com/2012/01/02/high-resolution-maps-of-science/
Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Exemples de spacialisation
extrait de Cruz et Tamassia, 2003
Exemples de spacialisation
extrait de Cruz et Tamassia, 2003
Réseaux denses et grands réseaux ne peuvent pas être représentéspar des graphes (techniquement si. . . )
Grandjean, 2015
Quelques options
visualiser autrement (distribution des degrés, matrice bloquée)
zoomer sur les lieux denses
passer du graphe à l'ego-network
Visualisation des réseaux
Visualisation de réseaux
Réseaux denses et grands réseaux
Henry et Fekete, 2008
Graphe ou matrice : déjà en 1946. . .
E. Forsyth and L. Katz, A Matrix Approach to the Analysis of Sociometric Data: Preliminary Report,Sociometry, 9(4): 340-347
Visualisation des réseaux
Visualisation de réseaux
Réseaux denses et grands réseaux
Combiner les approches
Visualisation mixte graphe - matrice (logiciel NodeTrix)
http://www.aviz.fr/wiki/uploads/Research/NodeTrix.png
Visualisation des réseaux
Visualisation de réseaux
Réseaux denses et grands réseaux
Coup de génie des physiciens (emprunté aux écologues) :graphiques révélant les propriétés du réseau
Moyenne des plus courts chemins et clustering coe�cient
(transitivité)Watts et Strogatz, 1998
Visualisation des réseaux
Visualisation de réseaux
Réseaux denses et grands réseaux
Moyenne des plus courts chemins et clustering coe�cient (transitivité)Watts et Strogatz, 1998
Visualisation des réseaux
Visualisation de réseaux
Réseaux denses et grands réseaux
Distribution des degrés
Albert et Barabási, 1999
Visualisation des réseaux
Choisir un logiciel
Des dizaines de logiciels existent et
il est impossible de connaître tous les logiciels ;
il est impossible de suivre leur actualité ;
maîtriser un logiciel est un processus (plus ou moins)chronophage.
Bilinguisme (français-anglais et SNA-physique-informatique)indispensable
Visualisation des réseaux
Choisir un logiciel
Critères pour e�ectuer un choix raisonné
critères liés à l'utilisateur ou à l'utilisatrice ;
critères liés aux données ;
critères liés aux traitements souhaités ;
critères liés au logiciel lui-même.
Visualisation des réseaux
Choisir un logiciel
Critères liés à l'utilisateur ou à l'utilisatrice
objectifs
système d'exploitation
libre / gratuit / payant
réseau personnel
degré de geekitude (de NodeXL à networkX)
connecté.e en permanence ou non
Visualisation des réseaux
Choisir un logiciel
Critères liés aux données (liste de logiciels non exhaustive)
taille et ordre du réseau à étudier
graphe simple (one-mode, pas de boucle, pas de liensmultiplexes)
graphe biparti (R, package bipartite et tnet)
graphe multiplexe (Cytoscape, R)
ego-network (Vennmaker, EgoNet, E-Net)
réseaux longitudinaux (Siena, RSiena, networkDynamic dansR)
réseaux spatiaux/planaires (QGis, Network Analyst dansArcGis, Pigale)
Visualisation des réseaux
Choisir un logiciel
Critères liés aux traitements à e�ectuer
visualisation (Cytoscape, Gephi, Tulip)
mesures standards (à peu près tous les logiciels. . . )
modéles statistiques (statnet dans R, PNet)
Visualisation des réseaux
Choisir un logiciel
Critères liés au logiciel
date de la dernière version (ex. Visone, mai 2011. . . )
portabilité entre OS
format de données
logiciel porté par une équipe ? une seule personne ?
Visualisation des réseaux
Choisir un logiciel
Format de données
pas de format universel
x formats spéci�ques (.net, .paj, .cysj. . . )
préférer format .csv, encodage utf-8 (avoir un bon éditeur detexte ! Notepad++, Geany, etc.)
une liste de sommets (Id, attributs)
une liste de liens (Origine, destination, attributs)
Visualisation des réseaux
Démo : Cytoscape, R
Deux logiciels libres, gratuits, multi-plateformes : interface vs script
Jeux de données
D. rerio (Zebra�sh interactome) - Cytoscape
Liens entre médias - igraph, package R, d'après KatyaOgnyanova
Plus un mini jeu de données (import) : une liste de liens, une listede sommets (.csv, encodage utf-8)
Visualisation des réseaux
Démo : Cytoscape, R
Figure mini jeu de données : simple, orienté, attributs liens etsommets