117
SemWebPro 18/01/2011 1 Publier des données liées sur le Web Tutoriel Datalift Bernard Point – Atos Origin [email protected] François Scharffe – LIRMM/CNRS [email protected] Raphaël Troncy – Eurecom [email protected] Bernard Vatant – Mondeca [email protected] Avec l'aide de l'équipe de Datalift et le soutien de l'Agence Nationale de la Recherche

Datalift at SemWebPro

Embed Size (px)

DESCRIPTION

Tutoriel de publication des données sur le Web

Citation preview

Page 1: Datalift at SemWebPro

SemWebPro 18012011 1

Publier des donneacutees lieacutees sur le WebTutoriel Datalift

Bernard Point ndash Atos Originbernardpointatosorigincom

Franccedilois Scharffe ndash LIRMMCNRSfrancoisscharffeinriafr

Raphaeumll Troncy ndash Eurecomraphaeltroncyeurecomfr

Bernard Vatant ndash Mondecabernardvatantmondecacom

Avec laide de leacutequipe de Dataliftet le soutien de lAgence Nationale de la Recherche

SemWebPro 18012011 2

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 31 Introduction

SemWebPro 18012011 4

Datalift

Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web

Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de

publication - Deacutemontrer linteacuterecirct de publier ses

donneacutees

SemWebPro 18012011 5

Datalift

Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique

La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90

SemWebPro 18012011 6

Datalift

Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes

pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire

permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication

sur le web de donneacutees

SemWebPro 18012011 7

Datalift

Partenaires

Processus de publication

SemWebPro 18012011 8

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 2: Datalift at SemWebPro

SemWebPro 18012011 2

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 31 Introduction

SemWebPro 18012011 4

Datalift

Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web

Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de

publication - Deacutemontrer linteacuterecirct de publier ses

donneacutees

SemWebPro 18012011 5

Datalift

Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique

La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90

SemWebPro 18012011 6

Datalift

Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes

pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire

permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication

sur le web de donneacutees

SemWebPro 18012011 7

Datalift

Partenaires

Processus de publication

SemWebPro 18012011 8

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 3: Datalift at SemWebPro

SemWebPro 18012011 31 Introduction

SemWebPro 18012011 4

Datalift

Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web

Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de

publication - Deacutemontrer linteacuterecirct de publier ses

donneacutees

SemWebPro 18012011 5

Datalift

Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique

La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90

SemWebPro 18012011 6

Datalift

Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes

pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire

permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication

sur le web de donneacutees

SemWebPro 18012011 7

Datalift

Partenaires

Processus de publication

SemWebPro 18012011 8

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 4: Datalift at SemWebPro

SemWebPro 18012011 4

Datalift

Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web

Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de

publication - Deacutemontrer linteacuterecirct de publier ses

donneacutees

SemWebPro 18012011 5

Datalift

Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique

La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90

SemWebPro 18012011 6

Datalift

Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes

pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire

permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication

sur le web de donneacutees

SemWebPro 18012011 7

Datalift

Partenaires

Processus de publication

SemWebPro 18012011 8

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 5: Datalift at SemWebPro

SemWebPro 18012011 5

Datalift

Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique

La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90

SemWebPro 18012011 6

Datalift

Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes

pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire

permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication

sur le web de donneacutees

SemWebPro 18012011 7

Datalift

Partenaires

Processus de publication

SemWebPro 18012011 8

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 6: Datalift at SemWebPro

SemWebPro 18012011 6

Datalift

Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes

pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire

permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication

sur le web de donneacutees

SemWebPro 18012011 7

Datalift

Partenaires

Processus de publication

SemWebPro 18012011 8

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 7: Datalift at SemWebPro

SemWebPro 18012011 7

Datalift

Partenaires

Processus de publication

SemWebPro 18012011 8

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 8: Datalift at SemWebPro

Processus de publication

SemWebPro 18012011 8

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 9: Datalift at SemWebPro

Processus de publication

SemWebPro 18012011 9

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 10: Datalift at SemWebPro

SemWebPro 18012011 10

Sommaire

1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 11: Datalift at SemWebPro

SemWebPro 18012011 112 Seacutelection

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 12: Datalift at SemWebPro

SemWebPro 18012011 12

Les vocabulaires de mes amis hellip

Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees

Critegraveres drsquoutilisabiliteacute

Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip

Diffeacuterents types de vocabulaires

De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip

Les piliers du Linked Data Dublin Core FOAF SKOS

Bonnes et moins bonnes pratiques

Ex Programmes BBC vs legislationgovuk

Vocabulary of a Friend les vocabulaires en reacuteseau

Problegravemes linguistiques

Les vocabulaires existants sont en anglais agrave 99

Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 13: Datalift at SemWebPro

SemWebPro 18012011 13

Vous avez dit laquo vocabulaire raquo

hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)

Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)

et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement

et nommeacutes en langage naturel

Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 14: Datalift at SemWebPro

SemWebPro 18012011 14

Les vocabulaires pour les donneacutees lieacutees

Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)

bull pour des vocabulaires sans logique trop complexe OWL

bull pour des constructions logiques plus complexes

Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)

Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 15: Datalift at SemWebPro

SemWebPro 18012011 15

Qursquoest-ce qursquoun bon vocabulaire

Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN

donnent une ideacutee de lrsquoutilisation des vocabulaires

Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01

Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel

Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication

Flexibiliteacute et extensibiliteacute

Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 16: Datalift at SemWebPro

SemWebPro 18012011 16

Un vocabulaire crsquoest aussi une communauteacute

Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin

bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant

Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs

Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 17: Datalift at SemWebPro

SemWebPro 18012011 17

Types de vocabulaires

Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires

bull Dublin Core Vann cc REL Status

Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo

bull FOAF Event Time Org Ontology

Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance

bull Geonames Music Ontology WildLife Ontology

Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail

bull DBpedia Ontology Cyc Ontology SUMO

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 18: Datalift at SemWebPro

SemWebPro 18012011 18

Vocabulaires de meacutetadonneacutees

Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)

Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 19: Datalift at SemWebPro

SemWebPro 18012011 19

Vocabulaires de reacutefeacuterence

Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip

Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip

Exemples FOAF DCMI Type Organization Ontology Event Ontology

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 20: Datalift at SemWebPro

SemWebPro 18012011 20

Vocabulaires de domaine

Concernent un domaine de connaissance ou un meacutetier particulier

Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions

Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 21: Datalift at SemWebPro

SemWebPro 18012011 21

Vocabulaires laquo geacuteneacuteralistes raquo

Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia

Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 22: Datalift at SemWebPro

SemWebPro 18012011 22

Le Trio Gagnant

Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees

FOAF Prototype du vocabulaire laquo commun raquo

SKOS Un langage drsquoannotation et de repreacutesentation des concepts

Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 23: Datalift at SemWebPro

SemWebPro 18012011 23

Dublin Core

Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte

Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources

A reacuteutiliser systeacutematiquement

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 24: Datalift at SemWebPro

SemWebPro 18012011 24

Friend of a Friend (FOAF)

Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute

agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes

Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute

Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 25: Datalift at SemWebPro

SemWebPro 18012011 25

Exemples drsquoutilisation de FOAF

Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core

Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 26: Datalift at SemWebPro

SemWebPro 18012011 26

SKOS

Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts

Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core

Extensible pour des types de noms ou des relations seacutemantiques plus fines

INCONTOURNABLE

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 27: Datalift at SemWebPro

SemWebPro 18012011 27

Liaison entre vocabulaires

Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core

ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt

ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type

lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt

lt owlClassgt

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 28: Datalift at SemWebPro

SemWebPro 18012011 28

Bonnes (et moins bonnes) pratiques

Music OntologyProgrammes OntologyGeospeciesTaxonConcept

Exploration des ontologies hellip

Et aussi moins bonnes pratiques Exemple DBpedia ontology

bull Limite de la deacutemarche totalement laquo bottom up raquo

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 29: Datalift at SemWebPro

SemWebPro 18012011 29

Vocabulary of a Friend

httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets

du Linked Data CloudTravail en cours dans le cadre de Datalift

Navigation

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 30: Datalift at SemWebPro

SemWebPro 18012011 303 Conversion

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 31: Datalift at SemWebPro

SemWebPro 18012011 31

Les 4 Principes des Donneacutees Lieacutees

Tim Berners Lee [2006] (Design Issues)

1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)

2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation

3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI

4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 32: Datalift at SemWebPro

Publier des Donneacutees 5 eacutetoiles

SemWebPro 18012011 32

httpwwww3orgDesignIssuesLinkedDatahtml

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 33: Datalift at SemWebPro

Publier des Donneacutees 5 eacutetoiles

Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence

Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)

Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)

Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees

Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees

SemWebPro 18012011 33

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 34: Datalift at SemWebPro

URL Design et URL Pattern

Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis

hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)

SemWebPro 18012011 34

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 35: Datalift at SemWebPro

URL Design et URL Pattern

Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)

httpwwwlegislationgovukukpga198567dataxml

SemWebPro 18012011 35

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 36: Datalift at SemWebPro

Un peu drsquoabstraction

Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]

Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]

Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext

SemWebPro 18012011 36

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 37: Datalift at SemWebPro

Quid des autres secteurs

Education httpeducationdatagovukdocschool

Lrsquoorganisation httpreferencedatagovukdocdepartment

Transport httptransportdatagovukdocstation

SemWebPro 18012011 37

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 38: Datalift at SemWebPro

URI Pattern dans REST

Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources

Une URI de base httpwwwexamplecombookstore

Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123

Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks

SemWebPro 18012011 38

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 39: Datalift at SemWebPro

Repreacutesenter des eacuteveacutenements en LODE

39SemWebPro 18012011

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 40: Datalift at SemWebPro

Choisir des URIs pour les dimensions

Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory

Toutes les URIs sont deacutereacutefeacuterenccedilables

40SemWebPro 18012011

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 41: Datalift at SemWebPro

Et en France

LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045

SemWebPro 18012011 41

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 42: Datalift at SemWebPro

Un peu drsquoexplications

Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero

Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu

drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes

Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 43: Datalift at SemWebPro

Et si crsquoeacutetait agrave refaire

On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)

Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes

SemWebPro 18012011 43

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 44: Datalift at SemWebPro

Outils de conversion vers RDF

Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)

Des solutions pour tous les cas de figure hellip

SemWebPro 18012011 44

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 45: Datalift at SemWebPro

D2R Database to RDF mapping

D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec

SemWebPro 18012011 45

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 46: Datalift at SemWebPro

D2RQ Map

SemWebPro 18012011 46

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 47: Datalift at SemWebPro

D2RQ Map (preacuteambule)

SemWebPro 18012011 47

D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt

Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt

Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt

Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt

mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 48: Datalift at SemWebPro

D2RQ Map (creacuteation de tables)

SemWebPro 18012011 48

CREATE TABLE Conferences (ConfID int Name text Location text)

mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID

mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring

maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 49: Datalift at SemWebPro

Conversion et Publication

SemWebPro 18012011 49

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 50: Datalift at SemWebPro

Triplify Relational data to JSONRDF

Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify

Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover

SemWebPro 18012011 50

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 51: Datalift at SemWebPro

Triplify Relational data to JSONRDF

Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration

drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige

agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees

SemWebPro 18012011 51

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 52: Datalift at SemWebPro

Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute

bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets

les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles

R2RML Base de donneacutees vers RDF

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 53: Datalift at SemWebPro

Exemple

SemWebPro 18012011 53

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 54: Datalift at SemWebPro

Exemple

SemWebPro 18012011 54

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 55: Datalift at SemWebPro

Exemple

SemWebPro 18012011 55

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 56: Datalift at SemWebPro

Exemple

SemWebPro 18012011 56

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 57: Datalift at SemWebPro

SemWebPro 18012011 57

Premiegravere eacutetape transformation de la table des personnes

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

P_Table rdftype rrTriplesMap rrsubjectMap [

rrtermtype BlankNode rrcolumn ID

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate aname

]rrobjectMap [

rrcolumn Name ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ahomepage

]rrobjectMap [

rrcolumn Homepage rrtermtype IRI

] ] Creacutedits Ivan Herman

httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 58: Datalift at SemWebPro

SemWebPro 18012011 58

Deuxiegraveme eacutetape transformation de la table des livres

ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

B_Table rdftype rrTriplesMap rrsubjectMap [

rrtemplate httpisbnISBN ]rrpredicateObjectMap [

rrpredicateMap [rrpredicate atitle

]rrobjectMap [

rrcolumn Title ]

] rrpredicateObjectMap [

rrpredicateMap [rrpredicate ayear

]rrobjectMap [

rrcolumn Year ]

] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 59: Datalift at SemWebPro

SemWebPro 18012011 59

httphellipisbn000651409X

Ghosh Amitav httpwwwamitavghoshcom

The Glass Palace

2000

anameahomepage

aauthor

Troisiegraveme eacutetape lier les deux tables entre elles

ISBN Author Title 70006511409X id_xyz The Glass Palace 2000

ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom

B_Table a rrTriplesMap rrrefPredicateObjectMap [

rrrefPredicateMap [rrpredicate aauthor

]rrrefObjectMap [

rrparentTriplesMap P_Table rrjoinCondition

childAuthor = parentID ]

] ]

Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 60: Datalift at SemWebPro

Travailler sur des spreadsheets

SemWebPro 18012011 60

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 61: Datalift at SemWebPro

Google acquiert Freebase

SemWebPro 18012011 61

httpcodegooglecompgoogle-refine

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 62: Datalift at SemWebPro

Extension RDF agrave Google Refine

SemWebPro 18012011 62

Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Jens Bech Chief Risk Officer Asset Protection Agency

pound165000 -pound169999 No pension

Ion Dagtoglou Chief Invesment Officer

Asset Protection Agency

pound165000 -pound169999 No pension

Brian Scammell Chief Credit Officer

Asset Protection Agency

pound130000 -pound134999 4 days per week

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 63: Datalift at SemWebPro

Conversion en RDF souhaiteacutee

lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999

lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen

SemWebPro 18012011 63

Name Job Title Grade Organization

Annual pay rate - including

taxable benefits and allowances

Notes

Stephan Wilcke Chief Executive Officer

Asset Protection Agency

pound150000 -pound154999

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 64: Datalift at SemWebPro

Google Refine et RDF

SemWebPro 18012011 64

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 65: Datalift at SemWebPro

Google Refine et RDF

SemWebPro 18012011 65

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 66: Datalift at SemWebPro

Google Refine et RDF

SemWebPro 18012011 66

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 67: Datalift at SemWebPro

Publish My Data

SemWebPro 18012011 67

httppublishmydatacom

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 68: Datalift at SemWebPro

SemWebPro 18012011 684 Publication

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 69: Datalift at SemWebPro

SemWebPro 18012011 69

La publication RDF Store

Les Composants

Le stockage des donneacutees sans scheacutema dans les RDF Store

Identification de Graphe

Les Infeacuterences

SPARQL

Le deacutereacutefeacuterencement

Neacutegociation de contenu

Meacutethode et analyse des produits RDF Store

Les Mises agrave jour

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 70: Datalift at SemWebPro

SemWebPro 18012011 70

Les Composants de la publication

Point drsquoentreacuteeSPARQL

REST

StockageRDF

Alimentation

Alimentation

Alimentation

MoteurDrsquoinfeacuterences

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 71: Datalift at SemWebPro

SemWebPro 18012011 71

Un RDF Store est sans scheacutema applicatif

Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR

Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche

Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)

Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives

Gain en souplesse Alimentation

Alimentation

Alimentation

123

4

56

78

91110

14

1213

1516

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 72: Datalift at SemWebPro

SemWebPro 18012011 72

RDF Store La notion de Graphe

Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un

ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet

Identification de graphe)

Le Graphe est un rassemblement applicatif de triplets

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 73: Datalift at SemWebPro

SemWebPro 18012011 73

RDF Store Les Graphes Nommeacutes

1

23

4

5

6

7

8

9

1110

14

12

13

15

16

Opeacuteration de destruction sur un graphe

Porteacutee transactionnelleRequecirctes SPARQL

peuvent restreindre le peacuterimegravetre agrave des Graphes

A deacutefinir au moment de la conception des applications

Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 74: Datalift at SemWebPro

SemWebPro 18012011 74

RDF Store Les Infeacuterences

Geacuteneacuterer des triplets agrave partir drsquoautres triplets

Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc

Socrate est mortel Bernard est un informaticien les informaticiens sont des

humains donc

Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies

Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes

Promesse de levier du Web Seacutemantique

1

23

4

5

6

78

9

1110

14

12

13

1516

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 75: Datalift at SemWebPro

SemWebPro 18012011 75

RDF Store SPARQL

SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats

Variantes SPARQL 10 SPARUL (update) SPARQL 11

Point drsquoentreacuteeSPARQL

InterrogationRequecirctes

Sparql

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 76: Datalift at SemWebPro

SemWebPro 18012011 76

RDF Store Deacutereacutefeacuterencement

Notion drsquoidentifiants URI

Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip

Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG

Mais alors comment lier les donneacutees

En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement

Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch

httpdbpediaorgresourceDavid_Lynch

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 77: Datalift at SemWebPro

SemWebPro 18012011 77

Exemples de Deacutereacutefeacuterencement

Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction

Ou indirectement deacutereacutefeacuterenccedilables applicativement

Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par

Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)

Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)

ark12148bpt6k70861tf6

Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 78: Datalift at SemWebPro

SemWebPro 18012011 78

RDF Store neacutegociation de contenu

Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)

Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)

La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications

REST Navigation

HTMLRDF

applicationrdf+xml texthtml

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 79: Datalift at SemWebPro

Analyse des RDF Store la meacutethode QSOS

Qualification and Selection of Open Source Software

Projet Open Source sur des solutions open source

httpwwwqsosorg

Objectifs de QSOS

Qualifier des logiciels

Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres

Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin

QSOS fournit

Une meacutethode objective et formaliseacutee

Un reacutefeacuterentiel drsquoeacutetudes disponibles

Des outils facilitant le deacuteroulement de la meacutethode

79SemWebPro 18012011

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 80: Datalift at SemWebPro

SemWebPro 18012011 80

Analyse des RDF StoreDeacutefinition des critegraveres

Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute

Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API

PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et

complexe avec et sans infeacuterence

Les reacutesultats complets seront publieacutes (Datalift qsos)

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 81: Datalift at SemWebPro

SemWebPro 18012011 81

RDF Store Un extrait des eacutevaluations

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 82: Datalift at SemWebPro

SemWebPro 18012011 82

RDF Store La Mise agrave Jour

Pas plus de gestion de version native en RDF qursquoen SGBDR

On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets

(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche

Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 83: Datalift at SemWebPro

SemWebPro 18012011 83

Architecture drsquoalimentation exemple de Datalift

SPARQLEnd Point

REST

RDF depublication module

module

module

1

23

4

5

6

78

9

1110

14

12

13

1516

InterrogationNavigation

RDF depreacuteparation

SPARQLEnd Point

1

23

4

5

6

78

9

111012

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 84: Datalift at SemWebPro

SemWebPro 18012011 845 Interconnexion

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 85: Datalift at SemWebPro

SemWebPro 18012011 85

Web de donneacutees et interconnexions

Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute

par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de

seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens

deacutequivalence

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 86: Datalift at SemWebPro

SemWebPro 18012011 86

owlsameAs

indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au

rendez-vous

Autres types de liens owldifferentFrom rdfsseeAlso

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 87: Datalift at SemWebPro

SemWebPro 18012011 87

Comment interconnecter ses donneacutees

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 88: Datalift at SemWebPro

SemWebPro 18012011 88

Comment interconnecter ses donneacutees

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 89: Datalift at SemWebPro

SemWebPro 18012011 89

Comment interconnecter ses donneacutees

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 90: Datalift at SemWebPro

SemWebPro 18012011 90

Comment interconnecter ses donneacutees

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 91: Datalift at SemWebPro

SemWebPro 18012011 91

Comment interconnecter ses donneacutees

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 92: Datalift at SemWebPro

SemWebPro 18012011 92

Les outils critegraveres danalyse

Degreacute dautomaticiteacute

Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres

Techniques dalignement utiliseacutees

Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute

Autres techniques

Domaine loutil est-il speacutecifique agrave un certain domaine

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 93: Datalift at SemWebPro

SemWebPro 18012011 93

Les outils critegraveres danalyse

Ontologies

Loutil prend-il en compte les ontologies associeacutees aux donneacutees

Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes

Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies

Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees

Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees

Loutil effectue-t-il des traitements post-opeacuteratoire

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 94: Datalift at SemWebPro

SemWebPro 18012011 94

Les outils

RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB

LD-mapper Outil de liage pour lontologie de la musique

ODD Linker Outil de liage baseacute sur le langage SQL

RDF-AI Outil de liage et fusion de jeux de donneacutees

Silk et Silk LSL Outil de liage et language de specification de liens

Knofuss architecture Outil de liage et fusion de jeux de donneacutees

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 95: Datalift at SemWebPro

SemWebPro 18012011 95

Les outils

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 96: Datalift at SemWebPro

SemWebPro 18012011 96

Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=

httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=

httpdbpediaorgontology gtltPrefix id=gn namespace=

httpwwwgeonamesorgontology gt

ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt

ltDataSourcegt

ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt

ltDataSourcegt

ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3

verifyLinks=verify_linksn3mode=truncate gt

ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt

ltRestrictTogta rdftype dbpediaCity

ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt

ltRestrictTogtb rdftype gnP

ltRestrictTogtltTargetDatasetgtltLinkConditiongt

ltAVGgtltCompare metric=jaroSimilaritygt

ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt

ltComparegtltCompare metric=numSimilaritygt

ltParam name=num1 path=adbpediapopulationTotal gt

ltParam name=num2 path=bgnpopulation gtltComparegt

ltAVGgtltLinkConditiongt

ltInterlinkgtltSilkgt

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 97: Datalift at SemWebPro

SemWebPro 18012011 97

Ou trouver des liens

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 98: Datalift at SemWebPro

SemWebPro 18012011 98

Vers linterconnexion automatique

Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave

des meacutetadonneacutees attacheacutees aux ontologies

hellip Datalift y travaille

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 99: Datalift at SemWebPro

SemWebPro 18012011 996 Applications

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 100: Datalift at SemWebPro

SemWebPro 18012011 100

Visualiser vos donneacutees

Tabulator(CSAIL MIT)

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 101: Datalift at SemWebPro

SemWebPro 18012011 101

Visualiser vos donneacutees

Disco(Free Universityof Berlin)

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 102: Datalift at SemWebPro

SemWebPro 18012011 102

Visualiser vos donneacutees

Marbles(Free Universityof Berlin)

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 103: Datalift at SemWebPro

SemWebPro 18012011 103

Visualiser vos donneacutees

Zitgist(Zitgist LLC)

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 104: Datalift at SemWebPro

SemWebPro 18012011 104

Visualiser vos donneacutees

OpenLink Data Explorer(OpenLink Software)

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 105: Datalift at SemWebPro

SemWebPro 18012011 105

Visualiser vos donneacutees

RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria

httpe-culturemultimediannlsoftwareClioPatriashtml

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 106: Datalift at SemWebPro

SemWebPro 18012011 - 106

VisiNav

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 107: Datalift at SemWebPro

SemWebPro 18012011 - 107

Sigma

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 108: Datalift at SemWebPro

SemWebPro 18012011 - 108

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 109: Datalift at SemWebPro

SemWebPro 18012011 109

Nos Deacuteputeacutes FR

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 110: Datalift at SemWebPro

Quelques exemples ameacutericains

SemWebPro 18012011 110

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 111: Datalift at SemWebPro

Quelques exemples ameacutericains

SemWebPro 18012011 111

httpdata-govtwrpiedudemoUSForeignAiddemo-1554html

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 112: Datalift at SemWebPro

Des applications mobiles

SemWebPro 18012011 112

Linked Data Lite | the Web on Steroids 10 (iPhone)

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 113: Datalift at SemWebPro

Des applications mobiles

SemWebPro 18012011 113

Linked Data Lite | the Web on Steroids 10 (iPhone)

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 114: Datalift at SemWebPro

ASBOrometer

SemWebPro 18012011 114

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 115: Datalift at SemWebPro

Chercher un dentiste pregraves de chez vous

SemWebPro 18012011 115

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 116: Datalift at SemWebPro

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 116

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip
Page 117: Datalift at SemWebPro

Mashups hellip Mashups hellip Mashups hellip

SemWebPro 18012011 117

  • Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
  • Sommaire
  • Slide Number 3
  • Datalift
  • Datalift
  • Datalift
  • Datalift
  • Processus de publication
  • Processus de publication
  • Sommaire
  • Slide Number 11
  • Les vocabulaires de mes amis hellip
  • Vous avez dit laquo vocabulaire raquo
  • Les vocabulaires pour les donneacutees lieacutees
  • Qursquoest-ce qursquoun bon vocabulaire
  • Un vocabulaire crsquoest aussi une communauteacute
  • Types de vocabulaires
  • Vocabulaires de meacutetadonneacutees
  • Vocabulaires de reacutefeacuterence
  • Vocabulaires de domaine
  • Vocabulaires laquo geacuteneacuteralistes raquo
  • Le Trio Gagnant
  • Dublin Core
  • Friend of a Friend (FOAF)
  • Exemples drsquoutilisation de FOAF
  • SKOS
  • Liaison entre vocabulaires
  • Bonnes (et moins bonnes) pratiques
  • Vocabulary of a Friend
  • Slide Number 30
  • Les 4 Principes des Donneacutees Lieacutees
  • Publier des Donneacutees 5 eacutetoiles
  • Publier des Donneacutees 5 eacutetoiles
  • URL Design et URL Pattern
  • URL Design et URL Pattern
  • Un peu drsquoabstraction
  • Quid des autres secteurs
  • URI Pattern dans REST
  • Repreacutesenter des eacuteveacutenements en LODE
  • Choisir des URIs pour les dimensions
  • Et en France
  • Un peu drsquoexplications
  • Et si crsquoeacutetait agrave refaire
  • Outils de conversion vers RDF
  • D2R Database to RDF mapping
  • D2RQ Map
  • D2RQ Map (preacuteambule)
  • D2RQ Map (creacuteation de tables)
  • Conversion et Publication
  • Triplify Relational data to JSONRDF
  • Triplify Relational data to JSONRDF
  • R2RML Base de donneacutees vers RDF
  • Exemple
  • Exemple
  • Exemple
  • Exemple
  • Premiegravere eacutetape transformation de la table des personnes
  • Deuxiegraveme eacutetape transformation de la table des livres
  • Troisiegraveme eacutetape lier les deux tables entre elles
  • Travailler sur des spreadsheets
  • Google acquiert Freebase
  • Extension RDF agrave Google Refine
  • Conversion en RDF souhaiteacutee
  • Google Refine et RDF
  • Google Refine et RDF
  • Google Refine et RDF
  • Publish My Data
  • Slide Number 68
  • La publication RDF Store
  • Les Composants de la publication
  • Un RDF Store est sans scheacutema applicatif
  • RDF Store La notion de Graphe
  • RDF Store Les Graphes Nommeacutes
  • RDF Store Les Infeacuterences
  • RDF Store SPARQL
  • RDF Store Deacutereacutefeacuterencement
  • Exemples de Deacutereacutefeacuterencement
  • RDF Store neacutegociation de contenu
  • Analyse des RDF Store la meacutethode QSOS
  • Analyse des RDF Store Deacutefinition des critegraveres
  • RDF Store Un extrait des eacutevaluations
  • RDF Store La Mise agrave Jour
  • Architecture drsquoalimentation exemple de Datalift
  • Slide Number 84
  • Web de donneacutees et interconnexions
  • owlsameAs
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Comment interconnecter ses donneacutees
  • Les outils critegraveres danalyse
  • Les outils critegraveres danalyse
  • Les outils
  • Les outils
  • Exemple de speacutecification pour Silk
  • Ou trouver des liens
  • Vers linterconnexion automatique
  • Slide Number 99
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • Visualiser vos donneacutees
  • VisiNav
  • Sigma
  • Slide Number 108
  • Nos Deacuteputeacutes FR
  • Quelques exemples ameacutericains
  • Quelques exemples ameacutericains
  • Des applications mobiles
  • Des applications mobiles
  • ASBOrometer
  • Chercher un dentiste pregraves de chez vous
  • Mashups hellip Mashups hellip Mashups hellip
  • Mashups hellip Mashups hellip Mashups hellip