Modélisation, environnements sémantiques et Web de données

Preview:

DESCRIPTION

Presentation International Society for Knowledge Organization 8/06/2010

Citation preview

muriel.foulonneau@tudor.lu 1Juin 2010

Modélisation, environnements sémantiques et Web de données

Muriel FoulonneauCentre de Recherche Public Henri Tudor

Luxembourg

séminaire ISKO juin 2010

Sémantique?

2

Objectif

ä La représentation des donnéesä De la forme traditionnelle à

une publication avec les technologies sémantiques

ä Partagerä Les descriptions mais aussi

leur sens et les associations

3

Juin 2010 muriel.foulonneau@tudor.lu

Les métadonnées assurent l’interopérabilité sémantique

muriel.foulonneau@tudor.lu

ä L’interopérabilité est la capacité pour 2 systèmes de dialoguer entre eux

ä J’ai besoinl D’un langage communl D’un interpréteur

01-04-04

- “01-04-04”

- c’est un mois

- 01=“Jan”

Knowledge Organization

Systems

5

Les terminologies

ä Les vocabulaires contrôlésä Réduire l’ambiguité du langage naturel lorsque l’on décrit et

recherche des informations.ä Composé de termes utilisés pour représenter un conceptä Problèmes

l Des particularités du langage naturel posent des problèmes (synonymes et ambiguité)

Différents termes (synonymes) peuvent représenter le même concept. Le même terme (homographes) peut représenter différents concepts.

6

Différents types de terminologies

ä Liste contrôlée non hiérarchiséeä Taxonomie et système de classification (avec

organisation hiérarchique)ä Thésaurus

ä Équivalenceä Hiérarchique (termes génériques/spécifiques)ä Association (voir aussi)

ä => Pour intégrer des synonymes dans des recherches, élargir des recherches, naviguer, représenter, …

7

Listes de termes

ä Pour permettre de gérer les ambiguités. ä Des fichiers d’autorité comportent des variantes d’un

nom.ä Les glossaires sont des listes de termes avec leurs

définitions dans un domaine spécifiqueä Dictionnaires, ils incluent différentes acceptions d’un

terme, ils sont présentés de manière alphabétique, avec éventuellement des informations sur l’origine du terme

ä “Gazetteers” avec des noms de lieux, leur position etcä “Synonym Rings” pour étendre des requêtes de

manière transparente

8

Taxonomies

ä Organisation hiérarchique de catégoriesä Généralement utilisées pour classifier

9http://biodiversite.wallonie.be/cgi/sibw.esp.list2.pl?VAR=Mammiferes

Autorités sujet

ä Listes contrôlées de sujetä Ex Rameau, LCSH, MeSHä Permettent souvent des compositionsä Peuvent inclure des sous-catégories

10

Thésaurus

ä Pour de la rechercheä Ensemble limité de relations entre les termes

ä Equivalence (synonymes) ä Hiérarchique (termes génériques / spécifiques)

l générique (sous-classe/super-classe), instance (classe/instance) et partitive (tout-partie)

ä Association (voir aussi).

11

Systèmes de classification

ä Similaires à des taxonomiesä Visent à l’exhaustivité et en principe les concepts ne se

recouvrent pas (appartenance exclusive).ä Systèmes énumératifs (tous les concepts sont

explicites) ou synthétiques (des règles permettent des combinaisons de concepts)

ä Les facettesprésentes desclassifications selon des dimensions qui s’excluent mutuellement

12

Les bases lexicales

ä Des relations plus riches que celles des thésaurus, éventuellement spécifiques à chaque baseä Ex. WordNet inclut homonymie, antonymie, synonymie

13

http://wordnetweb.princeton.edu/perl/webwn?s=mill&sub=Search+WordNet&o2=&o0=1&o7=&o5=&o1=1&o6=&o4=&o3=&h=

Les ontologies

ä Modélisation d’un domaine avec des classes, des instances, des attributs, des sous-classes, … et de nombreuses relations spécifiques.

ä Ex. CIDOC-CRM (Martin Doerr, Stephen Stead http://cidoc.ics.forth.gr/docs/crm_for_imperial_2009.ppt)

P11 participated in E7 Activity

“Crimea Conference”

E65 Creation Event

E38 Image

P86 falls within

P7 took place at

P67 is referred to by

E52 Time-SpanFebruary 1945

P82 at some time within

E39 Actor

E39 Actor

E53 Place7012124

Folksonomies

ä Pour indexation par une communauté d’utilisateursä cinema people vs movie people (C. Shirky)

15

http://www.flickr.com/photos/tags/

RDF Crash course

16

Technologies sémantiques

ä RDF

ä Classes et instances

17

Alice CNRS

http://moi/est_employee_par

Alice Dupont

foaf:name

Alice CNRS

http://moi/est_employee_par

Foaf:person

Foaf:organization

Moi:research_organizationrdf:type

rdf:type

rdfs:subclass_of

Les règles

ä Je peux par exemple définir que ä Si foaf:person http://moi/est_employee_par Foaf:organizationä Et Foaf:organization http://moi/localisation x

=> Alors foaf:person http://moi/localisation x

18

Alice CNRS

http://moi/est_employee_par

Foaf:person

Foaf:organization

Moi:research_organizationrdf:type

rdf:typehttp://moi/localisation

Paris

La transitivité

19

Alice Charles

http://moi/a_le_meme_age_que

Hugues

Alice Charles

foaf:knowsfoaf:knows

Hugues

http://moi/a_le_meme_age_que

foaf:knows

Syntaxes

ä RDF/XML

ä Turtle

ä etc

20

<rdf:RDF xmlns:rdf=‘http://www.w3.org/1999/02/22-rdf-syntax-ns# ’ xmlns:dc=‘http://purl.org/dc/elements/1.1/’>

<rdf:Description rdf:about=‘urn:isbn:0596002637’> <dc:title>Practical RDF</dc:title> </rdf:Description>

</rdf:RDF>

<rdf:RDF xmlns:rdf=‘http://www.w3.org/1999/02/22-rdf-syntax-ns# ’ xmlns:dc=‘http://purl.org/dc/elements/1.1/’>

<rdf:Description rdf:about=‘urn:isbn:0596002637’> <dc:title>Practical RDF</dc:title> </rdf:Description>

</rdf:RDF>

@prefix dc: <http://purl.org/dc/elements/1.1> .<urn:isbn:0596002637> dc:title ‘Practical RDF’ .

@prefix dc: <http://purl.org/dc/elements/1.1> .<urn:isbn:0596002637> dc:title ‘Practical RDF’ .

Source Alistair Miles, SKOS Core Tutorial, DC-2005 Madrid

W3C SKOS

Simple Knowledge Organization System

21

SKOS

ä Structure de baseä skos:Concept

ä Etiquetage lexicalä skos:prefLabel, skos:altLabel, skos:hiddenLabel

ä Etiquetage symboliqueä skos:prefSymbol, skos:altSymbol

ä Documentationä skos:definition, skos:note, skos:example, skos:scopeNote,

skos:historyNote, skos:editorialNote, skos:changeNote

ä Relations sémantiquesä skos:broader, skos:narrower, skos:related

22

Structure de base

ä Concept scheme permet de décrire tous les systèmes de terminologiesä Thesaurus, système de classification, autorités, vocabulaires

contrôlés ...

ä Il est défini comme un ensemble de concepts, éventuellement avec des propriétés et des relations avec d’autres concepts

ä Concept

23

Concept Scheme

24

Skos:Concept

25Source Alistair Miles

Labels lexicaux

26

Source Alistair Miles

Multilingues

27

Source Alistair Miles

Labels symboliques

28

Source Alistair Miles

Les relations

ä Broader, Narrower, Related

http://www.w3.org/2004/02/skos/http://www.w3.org/2004/02/skos/

Questions liées à la transitivité

ä Problème si skos:related était transitifä ex:renaissance skos:related ex:humanism. ä ex:humanism skos:related ex:philosophicalAnthropologyä ex:philosophicalAnthropology skos:related

ex:philosophyOfMindä ex:philosophyOfMind skos:related ex:cognitiveScience.

30

http://www.w3.org/2004/02/skos/http://www.w3.org/2004/02/skos/

Propriétés de mapping

ä skos:mappingRelation ä skos:closeMatch ä skos:exactMatch ä skos:broadMatchä skos:narrowMatch ä skos:relatedMatch

31

Exemple de Skosification Rameau

http://rameau.bnf.fr/informations/pdf/journee2008/rameau_skos.pdf

Exemple SKOS

ä Issu de LCSHä http://id.loc.gov/authorities/sj96005060.rdf

33

Linked Data

34

Construire le Web de données

ä Des données sous forme de RDF statements

ä Identification des ressources via des HTTP URIs « dé-référençables »ä Il doit être possible de cliquer et obtenir de l’informationä Distinction « information resources » (lien vers la ressource)

and « non information resources » (redirection vers une ressource d’intérêt)

ä Représentations multiples des ressourcesä Au moins RDF/XMLä Négociation de contenu

35Dublin Core

Une source de données

ä Il est préférable d’utiliser des relations vers des sources de données externes (ex: dbpedia)

36

http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/

Fusion de graphes

37

http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/

Lier des graphes a posteriori

ä Si une ressource est désignée avec 2 URIs différentes dans 2 sources de données différentesä Il est possible d’ajouter une équivalence entre les URIs grâce à

owl:sameAs

38

<http://dbpedia.org/resource/Berlin> owl:sameAs

<http://sws.geonames.org/2950159/>

Publier des données sur des terminologies

39

Une publication orientée service

40

http://www.viaf.org/

Des points d’accès alternatifs

ä Header de la page LCSHä Contient des relations alternate et searchä http://id.loc.gov/authorities/

41

SKOS en RDFa

ä Les données sont encodées dans la page HTMLä http://id.loc.gov/authorities/

42

SKOS de

ä Christianity – History http://id.loc.gov/authorities/sj96005060.rdf

ä Semantic Web http://id.loc.gov/authorities/sh2002000569#concept

43

SKOS-XML de Christianity – History

ä Issu de LCSHä http://id.loc.gov/authorities/sj96005060.rdf

44

Des métadonnées classiques au

monde sémantique

45

Dublin Core: différentes ères

ä Des métadonnées simples pour les ressources Webä Orientées « discovery »ä Faire mieux que l’anarchieä 15 éléments

ä Des « qualifiers »ä Dctermsä Qualifiers (ex hasVersion) ou de premier niveau (ex. audience)

ä Des profils d’applicationsä DC Collection, DC Education, DC Library etcä Des terminologiesä Des termes pour indiquer les terminologies

46

Vers une structure sémantique

ä Une structure différenteä Ex avec les qualifiers de DC:Relation

l Replaces, requiresl hasVersion, isPartOf

ä Le DCAM et la Singapour Frameworkä Un modèle de donnéesä Des propriétés

Þ objectif: rendre le modèle compatible avec le Web sémantique, avec un modèle modulaire Þ dcterms:title

47

Un registry

48

http://dcmi.kc.tsukuba.ac.jp/dcregistry/

Représentations multiples d’une ressource

49

Vocabulary encoding scheme

50

Syntax encoding scheme

51

Structures et activités du DCMI

ä Usage Board, Advisory Boardä Des communautés et des task groupsä Les conférences

ä Un task group KOS pour décrire les KOS

ä SWAP validé comme DC AP

52

Comment rendre une terminologie sémantique?

ä La skosifier?ä Le modèleä Rendre explicites un certain nombre de relationsä L’encoder (et la valider)

ä La référencer et l’exposer: linked data, registries, repositories…ä S’assurer que les collections référencent correctement la

terminologie

53

Des terminologies sur le Web sémantique

ä Partageä Modèle décentraliséä L’exploitation des ressources sur le Web

via de simples liens

ä Descriptions non ambigües, pour les machinesä Le principe 1 – 1ä Faut-il penser comme une machine?

l problèmes de validité, fiabilité, autorité, qualité

ä Modèles d’inférences

54

Références

ä CRM tutorial at Imperial College, UK, May 22, 2009 .Martin Doerr, Steve Stead, The CIDOC CRM, a Standard for the Integration of Cultural Information http://cidoc.ics.forth.gr/docs/crm_for_imperial_2009.ppt

ä Alistair Miles, SKOS Core Tutorial, DC Conference 2005, Madridä Douglas Tudhope, Traugott Koch, Rachel Heery, Terminology Services

and Technology  - JISC state of the art review http://www.ukoln.ac.uk/terminology/TSreview-jisc-final-Sept.html

ä Chris Bizer , Richard Cyganiak, Tom Heath How to Publish Linked Data on the Web, 2007, http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/

ä http://ivan-herman.name/2009/05/01/library-of-congress-subject-headings-in-skos-on-line/

ä http://dublincore.org/documents/abstract-model/ä Clay Shirky, Ontology is Overrated: Categories, Links, and Tags

http://www.shirky.com/writings/ontology_overrated.htmlä Thierry Boucher, Le vocabulaire Rameau en SKOS,

http://rameau.bnf.fr/informations/pdf/journee2008/rameau_skos.pdf

55

Recommended