Mettre de l'intelligence dans les donnees liees

Preview:

DESCRIPTION

Seminar at LIRIS, Lyon, France on 02/12/2014

Citation preview

METTRE DEL'INTELLIGENCEDANS LES DONNÉESLIÉESMATHIEU D'AQUIN - @MDAQUIN

KNOWLEDGE MEDIA INSTITUTE, THE OPENUNIVERSITY

Le web des données liées c'est bien....

Le web des données liées c'est bien....Pourvoir en faire quelques chose, c'est mieux !

LE WEB DES DONNÉES LIÉES C'EST BIEN....

LE WEB DES DONNÉES LIÉES C'EST BIEN....

EXEMPLE: DATA.OPEN.AC.UK

EXEMPLE: DATA.OPEN.AC.UKCours: 600 module de cours + nivaux, crédits, sujets, etc.Publications: 30,000 articles de recherche + auteurs,conférences, etc.Podcasts: 2220 podcasts video et 1500 podcats audio +liens vers les cours, etc.Ressources éducationnelles ouvertes: 640 unités +liens vers les cours, etc.Videos Youtube: 900 videos + liens vers les cours et leschecheursBâtiments: 100 Bâtiments + address et photosBibliothèque: 12,000 livres + liens vers les coursOthers...

EXEMPLE: DATA.OPEN.AC.UK

Applications: "Study at the OU", "OU Buildings", "OUAnywhere", "Facebook Course Profile", etc.

EXEMPLE: DATA.OPEN.AC.UK

Un autre exemple d'application, un peu moins simple : inscriptionaux course de différents sujets, a diffèrent endroits

PLUS D'INTELLIGENCE ?

Données Données liées Web Sémantique

EXEMPLE: RECOMMANDATIONVersion simple

EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...

EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...

EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...

EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO

d'Aquin etal, demo @ISWC 2012

EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO

EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO

EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Explaining Patterns with Linked Data

Tiddi et al. @ ESWC 2014 et COLD 2014

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Expliquer le déséquilibre entre l'éducation des hommes et des femmes dans diffèrents pays

Pays où les hommes ont plus d'éducation ; les femmes ; égalité

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Expliquer le déséquilibre entre l'éducation des hommes et des femmes dans diffèrents pays

Pays où les hommes ont plus d'éducation en jaune; les femmes en bleue; égalité

en verts

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

(i.e. un chemin de relations, et une valeur) qui sont les plusreprésentative du cluster (maximum F-Score).

Difficulté : On ne connaît pas le graphe à l'avance - il faut leconstruire au fur et à mesure de l'exploration

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Principe :Un algorithme A* qui recherche les règles de la formeX - p1 - p2-...- pn - valeur -> inCluster(X)

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Aider nous a evaluer Dedalo: linkedu.eu/dedalo/eval/

GOING METAPour exploiter les données du Web, il ne fait pas seulement

raisonner avec les données, mais aussi raisonner sur lesdonnées.

EXEMPLE : CATALOGUE LINKEDUP DE DONNÉES WEB LIEES ÀL'ENSEIGNEMENT

data.linkededucation.org/linkedup/catalog/

ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES

Avant alignement

ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES

Après alignement

d'Aquin et al. @ WebSci2013

ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES

Après alignement

POURQUOI C'EST IMPORTANT ?EXAMPLE DU "DATA HUB" DU PROJET MK:SMART

( )MKSMART.ORG

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Triangulation a partir de plusieurs capteurs

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Simple analyse statistique

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Simple analyse statistique

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

AU NIVEAU DU "DATA HUB"

ODRL pour la représentation structurées de licences de

données

POINT DE DÉPART : META-DONNÉESSTRUCTURÉES

DataNode pour la representation des relations entre jeux dedonnees -

POINT DE DÉPART : META-DONNÉESSTRUCTURÉES

http://purl.org/datanode/ns/

POINT DE DÉPART : META-DONNÉESSTRUCTURÉES

Permet la propagation de meta-caractéristiques comme lesdroits et conditions d'utilisation.

POINT DE DÉPART : META-DONNÉESSTRUCTURÉES

UN DERNIER EXEMPLE DERAISONNEMENT META

MESURER LE BIAIS DANS LE DONNÉES

Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different

from the population parameter of interest."

UN DERNIER EXEMPLE DERAISONNEMENT META

MESURER LE BIAIS DANS LE DONNÉES

Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different

from the population parameter of interest."Hypothèse : Toute donnée sur le web est biaisée - avoir

conscience de ce biais est important

UN DERNIER EXEMPLE DERAISONNEMENT META

MESURER LE BIAIS DANS LE DONNÉES

Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different

from the population parameter of interest."Hypothèse : Toute donnée sur le web est biaisée - avoir

conscience de ce biais est important.Mais comment mesurer un biais sans connaître la

population de référence?

MESURER LE BIAIS DANS LE DONNÉES

Compare les distributions de valeurs dans la projection dujeu de données à tester sur un jeu de données lié avec les

distributions dans l'ensemble du jeu de données.

Utilise le test de Student (test t) pour tester la significationdes différences de distributions.

Tiddi et al. @ EKAW 2014

MESURER LE BIAIS DANS LE DONNÉES

Sur cet exemple, S est la projection de LMDB (Linked MovieDatabase) sur DBpedia.

Tiddi et al. @ EKAW 2014

MESURER LE BIAIS DANS LE DONNÉESQuelques résultats peu surprenants...

Tiddi et al. @ EKAW 2014

MESURER LE BIAIS DANS LE DONNÉESEt d'autres un peu plus...

Tiddi et al. @ EKAW 2014

CONCLUSION / FUTUR

Le web sémantique avant:La promesse d'un web intelligent, avec du sens etdes raisonnements

Le web sémantique maintenant:Des données, des fois liées

Aller vers de nouvelles forme de raisonnement quis'adaptent aux caractéristiques des données liéeset qui font émerger le sens !

MERCI

Alessandro Adamou Enrico Daga Ilaria Tiddi

Shuangyan Liu Keerthi Thomas Enrico Motta

Recommended