19
Évolution d’un système de publication de données techniques automobiles, modélisées en RDF François-Paul Servant [email protected] SemWeb.Pro 2015

ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

Embed Size (px)

Citation preview

Page 1: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

Évolution d’un système de publication de données techniques automobiles, modélisées en RDF

François-Paul Servant [email protected] SemWeb.Pro 2015

Page 2: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

! Début 2010 : ! mise en oper d’un système de publication des données et documents de la doc

technique APV Renault ! basé sur les technologies “semantic web”

! mi 2015 : ! coût pour supporter de nouvelles sources de données ? ! scalabilité ?

2

Page 3: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015 3

Sélection du véhicule (VIN)

Recherche : entité, code défaut, symptôme…

Page 4: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015 4

Liste des “documents” pour l’entité “filtre à air”

(pour le véhicule considéré)

Page 5: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015 5

Procédure de diagnostic

lien vers Manuel de Réparation

Page 6: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015 6

Manuel de Réparation

Page 7: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015 7

Pièce de Rechange

référence désignation

Page 8: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

RDF

8

identifies identifies

http://../xxx http://.../element/78dc:subject

has subject

identifies

“Air Filter”

Subject Property Value

Page 9: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

RDFisation des données sources (et modélisation du domaine)

9

DiagnosticPièces Manuels Réparations

Temps Main d'œuvre Systèmes Auteur

XML, XL, etc.

Triple store

etc...

ModélisationConversion en RDF

Données et modèle partageables

Page 10: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

Spécificité de la doc technique automobile

! Chaque document a une “Applicabilité” ! l’ensemble des véhicules pour lesquels il est pertinent ! une formule booléenne sur des valeurs de variables véhicules ! ne se représente pas bien avec le modèle relationnel

10

Page 11: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

API ?

! Documents about “air filter”, for my vehicle? ! http://.../element/78?veh=VF123...

! 2 composantes aux requêtes ! une query SPARQL standard :

! SELECT ?doc WHERE {?doc dc:subject element:78.}

! le véhicule ! typiquement identifié par son VIN ! à défaut, couples variable=valeur (du RDF)

11

Page 12: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

Schema de fonctionnement

12

Service Doc.

SPARQL Endpoint Service évaluation applicabilités

Triple store

BD description des veh.

Filtered RDF List of docs

http://.../?query=[SPARQL query]&vin=VF123...

vin=VF123…

Client

Page 13: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

! + une Api cliente en java (création des requêtes SPARQL) ! c’était bête ! ! il aurait mieux fallu créer les requêtes côté service

! mais ce n’est jamais qu’un peu de refactoring de code ! Quels autres changements ?

13

Page 14: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

5-6 ans plus tard…

! Plus “d’API SPARQL”, plus API cliente Java -> API REST ! Moins RDF / SPARQL centric, mais encore plus “Linked Data” ! “HyperMedia driven APIs” ! JSON-LD ! Hydra

! (au moins comme source d’inspiration) ! http://www.hydra-cg.com

! Lucene était utilisé de façon marginale -> SolR plus largement ! (y compris pour des choses qui étaient faites avec SPARQL/TripleStore)

! Performances ? ! Utilisation de représentations plus efficaces que RDF pour certaines données ! Indexations sur des paires de valeurs de propriétés

14

Page 15: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015 15

URI de “Filtre à Air”

Vehicle query param

Recherche de “Filtre à Air” pour “Laguna III”

Variables à définir pour statuer sur

l’applicabilité de certains docs

Page 16: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015 16

‘Air Filter’

A List Of Documents

The list of (document, applicability evaluation) pairs

Unknown variables

The vehicle

One (document, applicability evaluation) pair

Page 17: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

Linked Data

17

Une des variables manquantes

Une des valeurs possibles

Même recherche, avec cette valeur

sélectionnéele client suit des liens, c'est le serveur qui crée les requêtes

Page 18: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

Linked Data : une limite

! formulaires ! voir Hydra (templated links)

! http://www.hydra-cg.com

18

Page 19: ÉVolution d'un système de publication de données techniques automobiles, modélisées en rdf

SemWeb.pro 2015

Conclusion : éléments techniques déterminants

! Architecture "REST / Linked Data" ! architecture web pour les données ! construction d'une IHM avec un minimum d'effort : en gros, afficher les données

retournées, et les liens qui y sont inclus ! garantit la qualité des requêtes ! scalabilité

! Modélisation des concepts et entités du domaine ! JSON-LD ! RDF

! intelligibilité des données publiées ! agrégation des données de sources diverses ! mais peut avoir un coût en termes de performances

19