Upload
microsoft-decideurs-it
View
472
Download
0
Embed Size (px)
DESCRIPTION
L'avalanche de donnée numériques que ce soit dans le web, le cloud, au sein de l'entreprise numérique, dans la vie publique (OpenData) ou au coeur de la recherche médicale rend indispensable l'emergence de nouveaux outils pour visualiser, manipuler et comprendre les données. Une nouvelle discipline extremement créative issue de la recherche en analyse de données et en interaction homme-machine (IHM) propose ces nouveaux outils. Nous avons invité Jean-Daniel Fekete, directeur de recherche à l'INRIA, pour faire le point sur les tendances actuelles, tracer des perspectives et nous presenter les travaux de son equipe.
Citation preview
palais des congrès Paris
7, 8 et 9 février 2012
8 février 2012 Jean-Daniel FeketeDirecteur de RechercheINRIAwww.aviz.fr
InfoVis / DataViz : Donner du sens à la révolution Big Data
La quantité de données croît de 30% par an depuis 1999 (SIMS, Berkeley)
La quantité de données accessible a cru exponentiellement depuis 10 ans
La révolution Big Data
2005 2006 2007 2008 2009 2010 20110
400
800
1200
1600
2000Exabytes
[source: The Diverse and Exploding Digital Universe, IDC, 2008]
Les solutions de stockage croissent exponentiellementLes capteurs génèrent plus de données : Pollution, logs, température, photos, vidéos, etc.
Les données collectées sont mises en ligneLes données sont analysées et les analyses sont mises en ligneL’univers numérique explose : 2007 : 281 Exa-octets
(281 milliards de Giga-octets) 2010 : barrière du Zeta-octet
franchie 2011 : 1.8 Zeta-octets
La révolution Big Data
Pour gérer la croissance des données, de nouvelles infrastructures voient le jour : Cloud (Azure, Amazon, Google, etc.) NoSQL Grids
Elles restent un peu compliquées mais sont déjà adoptéesDe nouveaux services reposent sur ces infrastructures: Apple iClouds Windows Live Google DropBox FaceBook
Les technologies Big Data
“Big Data Is Not the Created Content,nor Is It Even Its Consumption —
It Is the Analysis of All the Data Surroundingor Swirling Around It”
[IDC IVIEW http://www.emc.com/collateral/analyst-reports/idc-extracting-value-from-
chaos-ar.pdf ]
La révolution Big Data ?
Where is the Life we have lost in living?Where is the wisdom we have lost in knowledge?Where is the knowledge we have lost in information?
-- from T.S. Eliot, "Choruses from 'The Rock'“
Comment : transformer des données en information ? utiliser l’information pour prendre des bonnes décisions et
apprendre de nouvelles connaissances avoir des réponses à des questions fondamentales dont on
n’a aucune idée aujourd’hui ?
Transformer le déluge de données en opportunités !
Data, Information, Knowledge, Wisdom
Le problèmeWeb, livres, articlesdonnées scientifiquesprix, liste de personnes,Cours de la bourseInformations
Données
Humain
Transfert
Vision: 100 MB/sAudition: <100 b/sHaptique/tactileOdoratGoût
Comment ?
Propriétés de la vision• Sens ayant la plus grande bande passante• Rapide, parallèle • Reconnaissance de formes• Pré-attentif• Etend les capacités cognitives et mémorielles• On pense visuellement
Super. Utilisons-la !
Utilisons la vision !
Utilisons la vision !
13
Principes de la visualisation d’information• L’œil et la perception humaine sont remarquablement adaptés à la reconnaissance de motifs visuels• La transformation de données abstraites en information visuelle permet d’utiliser cette aptitude• Parmi toutes les représentations possibles, seules quelques-unes « fonctionnent » :
– il faut les trouver et les répertorier• La psychologie nous donne une base d’explication : la perception préattentive (Triesman, 85)
– Sans effort– D’un coup d’œil– En temps constant
• Êtes-vous préattentifs ?
Perception préattentive (1)
Perception préattentive (2)
Perception préattentive • Beaucoup de caractéristiques visuelles peuvent être perçues préattentivement :
– Orientation de ligne/blob, longueur, épaisseur, taille, courbure, cardinalité, terminaisons, intersections, inclusion, teinte, clignotement, direction de mouvement, profondeur stéréoscopique, indices 3D, direction de l’éclairement
• Problèmes :– Les caractéristiques préattentive interfèrent entre elles
• On pensait même que toutes les caractéristiques préattentives étaient incompatibles entre elles– Les caractéristiques sont préattentives dans certaines limites
• 7 couleurs max (Healey, 96)• 2 ou 3 formes• Etc.
Perception préattentive (3)
Visualisation : exempleshttp://www.smartmoney.com/map-of-the-market/
18
Demo !
Des tables à 12 dimensions ?
20
InfoVis Co-authoring (K. Börner et al.)
Des réseaux sociaux toujours plus gros
En réalité, lorsqu’on visualise les données brutes …
22
Visualisation de réseau parmatrice d’adjacence
23
A
C
B D
A B C D
A
B
C
D
X
X
X X X
?
?
April 13, 2023 24Nathalie HenryExploring Social Networks with Matrix-Based Representations
Explore
Communicate
Plus de détails,plus de structure
Infovis Coauthorship (133 actors)
Du texte qui évolue : diffamationhttp://aviz.fr/diffamation/
it’s here
27
29
Voir des généalogies géantesGeneaQuilts
Relations
• marriage• parentales• propriétés - temporelles - autres
Relations
• marriage• parentales• propriétés - temporelles - autres
Individus
• Propriétés - temporelles - autres• relations complexes
Individus
• Propriétés - temporelles - autres• relations complexes
30
Visualisation GeneaQuiltsGeneaQuilts
Lorsque les données sont trop nombreuses, la visualisation seule ne suffit plus Limite de la perception, limites des écrans
Il faut combiner visualisation et analyse de donnéesC’est le domaine de la visualisation analytique ouVisual Analytics
L’interface graphique pilote à la fois la visualisation interactive et les analyses Ces analyses doivent se faire en temps réel
(any time) C’est l’utilisateur qui a le contrôle, pas les
algorithmes !
Visualisation Analytique
Plus de pixels pour plus de données pour plus de collaboration videotheque.inria.fr/videotheque/doc/635
L’analyse visuelle, couplée à d’autres analyses automatiques, permet de donner du sens au Big Data On trouve ce qu’on cherche On trouve aussi ce qu’on ne cherchait pas !
Plusieurs représentations sont possibles Mais beaucoup d’autres sont inefficaces et donc
nuisibles Les représentations spectaculaires ne sont pas
toujours efficaces
Utilisez la visualisation de données / information Donnez du sens à vous données !
Conclusion