36

20170320logiciels

Embed Size (px)

Citation preview

Page 1: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Comment choisir un logiciel

Laurent Beauguitte

CNRS - UMR IDEES

20 mars 2017

Page 2: 20170320logiciels

Visualisation des réseaux

1 Visualisation de graphe : rappels sémiologiques de baseVariables visuellesLégende

2 Visualisation de réseauxDes principes de base aux force-directed layoutsRéseaux denses et grands réseaux

3 Choisir un logiciel

4 Démo : Cytoscape, R

Page 3: 20170320logiciels

Visualisation des réseaux

Introduction

Analyse de réseaux ne nécessite pas a priori de visualisation

Les images de réseaux sont le plus souvent ine�caces (pas demessage clair)

Fossé entre moyens techniques et capacités cognitives

Il n'existe pas de logiciel idéal. . .

Page 4: 20170320logiciels

Visualisation des réseaux

sémiologie

Le graphe comme image : exploration vs communication

Exploration

esthétique super�ue

légende inutile

plus les données sont complètes et précises, mieux c'est

Page 5: 20170320logiciels

Visualisation des réseaux

sémiologie

Le graphe pour communiquer

nécessité d'une légende claire, précise, complète

transparence sur l'outil et la méthode (quel logiciel ? quelalgorithme de visualisation ?)

plus le graphe re�ète vos données, moins il est lisible :sélection indispensable

Page 6: 20170320logiciels

Interactivité : communication sans message ou exploration ?

http://www.global-migration.info/ - *tous les liens ont été visités en mars 2017.

Page 7: 20170320logiciels

Visualisation des réseaux

sémiologie

Variables visuelles

Sémiologie graphique selon J. Bertin : trois implantations(ponctuelle, linéaire et surfacique) et six variables visuelles (forme,taille, valeur, couleur, orientation, texture ou grain).

http://margaux.ipt.univ-paris8.fr/vgodard/enseigne/carto2/memocart/mem12car.htm

Page 8: 20170320logiciels

Visualisation des réseaux

sémiologie

Variables visuelles

Pour les graphes : deux implantations (ponctuelle et zonale) etquatre variables pertinentes (orientation peu adaptée, grain en voiede disparition).

Selon Bertin (et les bertiniens orthodoxes):

variable taille = variables quantitatives absolues (stock)

valeur = variables quantitatives relatives (taux) et qualitativesordonnées (petit, moyen, grand)

couleur et forme = variable qualitative nominale

Page 9: 20170320logiciels

Visualisation des réseaux

sémiologie

Légende

Un graphe sans légende ne sert à rien. . .

source : http://agencephare.com/lanalyse-reseau/

Page 10: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Des principes de base aux force-directed layouts

Principes élaborés par J. Moreno (1934)

sommets les plus connectés au centre

sommets les moins connectés en périphérie

éviter les croisements de lien

longueur des liens équivalente pour des liens équivalents*

*très vite impossible pour des raisons géométriques

Page 11: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Des principes de base aux force-directed layouts

Légende claire

Page 12: 20170320logiciels
Page 13: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Des principes de base aux force-directed layouts

Développement de la SNA dans les années 70 : perte de qualitégraphique

Page 14: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Des principes de base aux force-directed layouts

Perte de qualité graphique durable. . . (Knoke, 1991)

Page 15: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Des principes de base aux force-directed layouts

Innovations majeures en écologie : souci clarté graphique et modereprésentation des propriétés des réseaux (graphique log-log)

1982 1987

Page 16: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Des principes de base aux force-directed layouts

Placements manuels puis automatiques (70s)

Premiers placements : aléatoire, géométrique (circle), basés sur despropriétés statistiques (analyse factorielle, MDS)

Apparition des force-based layouts dans les 90s : Kamadakawai(89), Fruchterman-Reingold (91)

Depuis 90s : développement capacités informatiques et dataviz(data visualisation)

Page 17: 20170320logiciels

http://�owingdata.com/2012/01/02/high-resolution-maps-of-science/

Page 18: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Des principes de base aux force-directed layouts

Exemples de spacialisation

extrait de Cruz et Tamassia, 2003

Page 19: 20170320logiciels

Exemples de spacialisation

extrait de Cruz et Tamassia, 2003

Page 20: 20170320logiciels

Réseaux denses et grands réseaux ne peuvent pas être représentéspar des graphes (techniquement si. . . )

Grandjean, 2015

Page 21: 20170320logiciels

Quelques options

visualiser autrement (distribution des degrés, matrice bloquée)

zoomer sur les lieux denses

passer du graphe à l'ego-network

Page 22: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Réseaux denses et grands réseaux

Henry et Fekete, 2008

Page 23: 20170320logiciels

Graphe ou matrice : déjà en 1946. . .

E. Forsyth and L. Katz, A Matrix Approach to the Analysis of Sociometric Data: Preliminary Report,Sociometry, 9(4): 340-347

Page 24: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Réseaux denses et grands réseaux

Combiner les approches

Visualisation mixte graphe - matrice (logiciel NodeTrix)

http://www.aviz.fr/wiki/uploads/Research/NodeTrix.png

Page 25: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Réseaux denses et grands réseaux

Coup de génie des physiciens (emprunté aux écologues) :graphiques révélant les propriétés du réseau

Moyenne des plus courts chemins et clustering coe�cient

(transitivité)Watts et Strogatz, 1998

Page 26: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Réseaux denses et grands réseaux

Moyenne des plus courts chemins et clustering coe�cient (transitivité)Watts et Strogatz, 1998

Page 27: 20170320logiciels

Visualisation des réseaux

Visualisation de réseaux

Réseaux denses et grands réseaux

Distribution des degrés

Albert et Barabási, 1999

Page 28: 20170320logiciels

Visualisation des réseaux

Choisir un logiciel

Des dizaines de logiciels existent et

il est impossible de connaître tous les logiciels ;

il est impossible de suivre leur actualité ;

maîtriser un logiciel est un processus (plus ou moins)chronophage.

Bilinguisme (français-anglais et SNA-physique-informatique)indispensable

Page 29: 20170320logiciels

Visualisation des réseaux

Choisir un logiciel

Critères pour e�ectuer un choix raisonné

critères liés à l'utilisateur ou à l'utilisatrice ;

critères liés aux données ;

critères liés aux traitements souhaités ;

critères liés au logiciel lui-même.

Page 30: 20170320logiciels

Visualisation des réseaux

Choisir un logiciel

Critères liés à l'utilisateur ou à l'utilisatrice

objectifs

système d'exploitation

libre / gratuit / payant

réseau personnel

degré de geekitude (de NodeXL à networkX)

connecté.e en permanence ou non

Page 31: 20170320logiciels

Visualisation des réseaux

Choisir un logiciel

Critères liés aux données (liste de logiciels non exhaustive)

taille et ordre du réseau à étudier

graphe simple (one-mode, pas de boucle, pas de liensmultiplexes)

graphe biparti (R, package bipartite et tnet)

graphe multiplexe (Cytoscape, R)

ego-network (Vennmaker, EgoNet, E-Net)

réseaux longitudinaux (Siena, RSiena, networkDynamic dansR)

réseaux spatiaux/planaires (QGis, Network Analyst dansArcGis, Pigale)

Page 32: 20170320logiciels

Visualisation des réseaux

Choisir un logiciel

Critères liés aux traitements à e�ectuer

visualisation (Cytoscape, Gephi, Tulip)

mesures standards (à peu près tous les logiciels. . . )

modéles statistiques (statnet dans R, PNet)

Page 33: 20170320logiciels

Visualisation des réseaux

Choisir un logiciel

Critères liés au logiciel

date de la dernière version (ex. Visone, mai 2011. . . )

portabilité entre OS

format de données

logiciel porté par une équipe ? une seule personne ?

Page 34: 20170320logiciels

Visualisation des réseaux

Choisir un logiciel

Format de données

pas de format universel

x formats spéci�ques (.net, .paj, .cysj. . . )

préférer format .csv, encodage utf-8 (avoir un bon éditeur detexte ! Notepad++, Geany, etc.)

une liste de sommets (Id, attributs)

une liste de liens (Origine, destination, attributs)

Page 35: 20170320logiciels

Visualisation des réseaux

Démo : Cytoscape, R

Deux logiciels libres, gratuits, multi-plateformes : interface vs script

Jeux de données

D. rerio (Zebra�sh interactome) - Cytoscape

Liens entre médias - igraph, package R, d'après KatyaOgnyanova

Plus un mini jeu de données (import) : une liste de liens, une listede sommets (.csv, encodage utf-8)

Page 36: 20170320logiciels

Visualisation des réseaux

Démo : Cytoscape, R

Figure mini jeu de données : simple, orienté, attributs liens etsommets