47
Mercredi 26 novembre 2008 1 Master Web Intelligence ICM - Option Informatique 2008/2009 Web Sémantique Philippe Beaune ENSM-SE/G2I/SMA mailto : [email protected]

Master Web Intelligence ICM - Option Informatique …beaune/websem/cours2008_2009/... · Coûts financiers et temporels ... Les objets dénotés (sa définition en extension) Mercredi

Embed Size (px)

Citation preview

Mercredi 26 novembre 2008 1

Master Web IntelligenceICM - Option Informatique

2008/2009

Web Sémantique

Philippe BeauneENSM-SE/G2I/SMA

mailto : [email protected]

Mercredi 26 novembre 2008 2

Plan du cours●Ontologies

● Définitions, exemples● Représentations● Construction / ingénierie● Utilisations

Mercredi 26 novembre 2008 3

Histoire●Problèmes de réalisation des Systèmes Experts (bases de connaissances) :

● Complexité● Coûts financiers et temporels● Ré-utilisabilité● Variété des langages de représentation● Composabilité● Inter-opérabilité● Etc …

● KSE (DARPA, 1990) : ne plus faire « from scratch », mais par assemblage de composants réutilisables ; ...

Mercredi 26 novembre 2008 4

Définitions●Ontologies (philo) : partie de la métaphysique qui s'applique à l'être en tant qu'être, indépendamment de ses déterminations particulières●Taxinomie (didact) : étude théorique des bases, lois, règles, principes, d'une classification●Taxinomie : classification d'éléments●Ontologie (IC) : ensemble des objets reconnus comme existant dans le domaine. Construire une ontologie c'est aussi décider de la manière d'être et d'exister des objets

Mercredi 26 novembre 2008 5

Définitions (suite)●Ontologie (Gruber, 93) : spécification explicite d'une conceptualisation

● Spécification explicite : donc avec un langage● Conceptualisation : structuration des concepts

●Ontologie (Borst, 97) : spécification formelle d'une conceptualisation partagée●Concept : désigné de 3 façons :

● Son nom● Sa signification (sa définition en intension)● Les objets dénotés (sa définition en extension)

Mercredi 26 novembre 2008 6

Exemple

●Voiture, auto, automobile, tacot, ...●Véhicule de transport automobile conçu et aménagé pour le transport d'un petit nombre de personnes●La 2CV 234 DD 42, la clio truc 543 YA 42, etc...

Mercredi 26 novembre 2008 7

Relations●Une «relation» peut s'exprimer par son nom, son intension, son extension :

● «auteur»● personne qui crée une oeuvre● Hugo est l'auteur de Notre Dame de

Paris et Chateaubriand de Mémoires d'outre-tombe, ...

●Généralisation (subsomption), spécialisation, composition, ..., est fabriqué en, possède, ...

Mercredi 26 novembre 2008 8

Objectifs des ontologies

●Permettre un traitement symbolique des connaissances, but premier de l'IA, rejoint celui du Web Sémantique.●Faire faire des traitements automatiques à des logiciels au sein du Web pour faire interopérer des machines ou des machines et des humains.

Mercredi 26 novembre 2008 9

Rôle des ontologies

●Vocabulaire, structuration et exploitation des méta-données●Représentation pivot pour l'intégration de sources de données hétérogènes●Décrire les Services Web●...

Mercredi 26 novembre 2008 10

Philippe Martin, Griffith University «Introduction to ontologies»

An ontology is a list of formal terms, i.e. identifiers for categories of objects, plus machine-understandable statements defining a formal meaning for these terms, in other words, some of their characteristics or inter-relations, rules or constraints of use. These statements permit some semantic checking on the manual introduction of new statements and some logical inferencing to generate new statements, e.g. for information retrieval purposes.

Relational database schemas may be viewed as simple forms of ontologies but, although some dependency relations are represented, semantic relations between the terms (column names) are most often not explicited, and hence knowledge representation and inferencing is very limited. In most knowledge-based systems (KBSs), the users are allowed to add new categories, relations, rules or constraints. This dynamic modification of the ontology, and the (potential) complexity of the knowledge representations and inferencing, may be the reasons why so few large-scale KBSs have been built [...]

Mercredi 26 novembre 2008 11

Autre définition

●Guarino :En IA, une ontologie représente un

artefact d’ingénierie constitué par un vocabulaire spécifique utilisé pour décrire une certaine réalité, accompagné d’un ensemble d’hypothèses implicites concernant la signification des mots de ce vocabulaire

Mercredi 26 novembre 2008 12

... C'est ... Ce n'est pas ...

Mercredi 26 novembre 2008 13

Formalisations●cf. Nicola Guarino (http://www.loa-cnr.it/)

● Espace de domaine = <D,W> où D est un domaine, et W un ensemble d'états (ou mondes possibles)

● Relation conceptuelle : ρn : W → 2Dn

● Une conceptualisation pour D : <D,W,R >où R est un ensemble de relations conceptuelles

sur <D,W>●cf. aussi Thomas R. Gruber

http://ksl-web.stanford.edu/people/gruber/

Mercredi 26 novembre 2008 14

Exercices●Interprétation :

● Fred saw the plane flying over Zürich● Fred saw the mountain flying over Zürich

●Synonymie :● Propos destiné à faire rire● Assemblage de feuilles imprimées

●Homonymie :● Quantité relativement grande et d'un seul tenant

d'une matière● Marteau à tête lourde et sans panne● Parties conductrices d'un appareil par lequel

s'effectue le retour du courant au générateur● Grandeur fondamentale liée à la quantité de matière

que contient un corps

Mercredi 26 novembre 2008 15

Différents types d'ontologies

Top-level ontology

Domain ontology Task ontology

Application ontology

Concepts très générauxindépendants du problème(espace, temps, événement,action, ...)

[Guarino]

Concepts très spécifiquescorrespondant aux rôlesjoués par les entités dudomaine dans une certaineactivité

Vocabulaires générauxd'un domaine (médecine,automobile, ...)

Mercredi 26 novembre 2008 16

Exemples d'ontologies●Ontologies générales :

● Wordnet / EuroWordNet● The Upper Cyc Ontology● IEEE Standard Upper Ontology

●Ontologies de domaine● UMLS, RETSINA, Dublin Core, KA2, ...

●Méta-ontologies● Semantic Translation, RDFT, Evolution

Ontology

Mercredi 26 novembre 2008 17

WordNet

●http://www.cogsci.princeton.edu/~wn/index.shtml●WordNet® is an online lexical reference system whose design is inspired by current psycholinguistic theories of human lexical memory. English nouns, verbs, adjectives and adverbs are organized into synonym sets, each representing one underlying lexical concept. Different relations link the synonym sets.

Mercredi 26 novembre 2008 18

UMLS

●Unified Medical Language System●http://umlsks.nlm.nih.gov●NLM's Unified Medical Language System (UMLS) project develops and distributes multi-purpose, electronic "Knowledge Sources" and associated lexical programs. System developers can use the UMLS products to enhance their applications -- in systems focused on patient data, digital libraries, Web and bibliographic retrieval, natural language processing, and decision support. Researchers will find the UMLS products useful in investigating knowledge representation and retrieval questions.

Mercredi 26 novembre 2008 19

UMLS (suite)

●Metathesaurus●Réseau sémantique●NLP tools●Knowledge Source Server●MetamorphoSys

Mercredi 26 novembre 2008 20

Dublin Core - 1●http://dublincore.org/●The Dublin Core Metadata Initiative is an open forum engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models.●The Dublin Core metadata standard is a simple yet effective element set for describing a wide range of networked resources. The Dublin Core standard includes two levels: Simple and Qualified. Simple Dublin Core comprises fifteen elements; Qualified Dublin Core includes an additional element, Audience, as well as a group of element refinements (also called qualifiers) that refine the semantics of the elements in ways that may be useful in resource discovery

Mercredi 26 novembre 2008 21

Dublin Core - 2

●L'ontologie de Dublin Core comprend des éléments tels que :

● Title● Creator● Subject● Description● Publisher● Contributors● Date● ...

Mercredi 26 novembre 2008 22

RETSINASEMANTIC WEB CALENDAR AGENT

●http://www.daml.ri.cmu.edu/Cal/●The Retsina Semantic Web Calendar Agent provides interoperability between RDF based calendar descriptions on the web, and Personal Information Manager (PIM) Systems such as Microsoft's Outlook. Schedules and events can be described on the web in RDF, using existing ontologies such as the Hybrid iCal-like RDF Schema or the Dublin Core ontology, and linked to individual's contact information described, for example, at their home page. The Retsina Semantic Web Calendar Agent, consists of a Distributed Meeting Scheduling Engine and the RETSINA Semantic Web Calendar Parser. The agent assists in organising and scheduling meetings between several individuals, and coordinates these based on existing schedules maintained by MS Outlook.

Mercredi 26 novembre 2008 23

RSS (RDF Site Summary)

●Description extensible de méta-données●Application XML●L'ontologie est très simple :

● Un channel : title, link, description, language ; il est composé d'items :

● Un item : title, link, description, pubDate, ...

Mercredi 26 novembre 2008 24

Plan du cours●Ontologies

● Définitions, exemples● Représentations● Construction / ingénierie● Utilisations

Mercredi 26 novembre 2008 25

Paradigmes de représentation●Thésaurus●Taxinomies●UML (représentation graphique, AGL)●Modèle étendu E/R (diagrammes)●Frames●Logiques (des prédicats, de description, ...)●Réseaux sémantiques●Topic Maps●RDF et RDFS, OWL, ...●...

Mercredi 26 novembre 2008 26

Thésaurus●Graphes dont les arcs sont étiquetés●Arcs : similarité, proximité, synonymie, ...●Pas d'instances●Pas moyen de représenter des concepts un peu compliquéssoprano

definition The highest category of female (or artificial male) voice.

broader term(s) vocalist, singer

narrower term(s) lyric soprano, dramatic soprano, coloratura soprano

related term(s) mezzo-soprano, treble

Mercredi 26 novembre 2008 27

Topic Maps (1)●Les cartes topiques (ou cartes de thèmes, en anglais Topic Maps) sont un outil très général de représentation des connaissances, dont le but est d'agréger autour d'un point unique d'indexation (appelé topic) toutes les informations disponibles concernant un sujet donné, et de relier ces points par un réseau sémantique de relations appelées associations. [Wikipedia]●Standardisation ISO●Application XML : XTM●But :

● Gérer la surabondance d'informations● Construire des réseaux de connaissances sur

n'importe quelles ressources● Structurer l'information

Mercredi 26 novembre 2008 28

Topic Maps (2)●A Topic Map defines three main sorts of information: ●Topics, which are things or concepts that you're interested in●and their names●Associations, which help you relate one topic to another, and therefore help you to navigate around your subject of interest and ●Occurrences, which are information resources that relate to the topics. You can use them to locate books, articles, files, web pages and other relevant resources.

Mercredi 26 novembre 2008 29

Topic Maps (3)Gorda Sound see North SoundLittle Dix Bay .................... 89North Sound ....................... 90Road Harbour see also Road Town ... 73Road Town ...................... 69,71Spanish Town ................... 81,82Tortola ........................... 67Virgin Gorda ...................... 77

cf. « The Topic Maps Handbook» :http://www.empolis.com/downloads/empolis_TopicMaps_Whitepaper20030206.pdf

Mercredi 26 novembre 2008 30

Exemple

●L'ontologie des pizza, en OWL, fournie avec Protégé ...

Mercredi 26 novembre 2008 31

Plan du cours●Ontologies

● Définitions, exemples● Représentations● Construction / ingénierie● Utilisations

Mercredi 26 novembre 2008 32

De l'artisanat à l'ingénierie

●Jusqu'au milieu des années 90 : artisanat (ou presque), approches dispersées

●1996 : 1er workshop « Ontological Engineering »

●Depuis : des techniques, des méthodes, des méthodologies pour la construction d'ontologies, leurs réutilisations, … (Cyc, On-To-Knowledge, Methontology, ...)

Mercredi 26 novembre 2008 33

Conception : principes

[Thomas R. Gruber]

●Clarté : être objectif, pas d'ambiguïté, doc●Cohérence : chasser les contradictions●Extensibilité : spécialisation incrémentale●Minimiser le biais du codage : knowledge level●cf. aussi l'engagement ontologique

Mercredi 26 novembre 2008 34

Processus de construction

[Mae

dche

& S

taab

]

Mercredi 26 novembre 2008 35

Étude de faisabilité

●Les systèmes de KM ne fonctionnent correctement que s'ils sont bien intégrés dans l'organisation●Plusieurs facteurs (autres que technologiques) déterminent la réussite●S'inspirer de Common KADS●Bien délimiter le domaine●Identifier les personnes impliquées

Mercredi 26 novembre 2008 36

Démarrage (cf. Common KADS)●Établir un document de spécifications :

● Domaine, objectif, sources de connaissances disponibles, utilisateurs potentiels, cas d'utilisations, applications

●Analyser les sources de connaissances (où sont les compétences ? Quels concepts sont pertinents ? Y a-t-il d'autres ontologies utilisables ? ...)●Prototype (concepts et relations les plus importants)

Mercredi 26 novembre 2008 37

Raffinement

●Acquisition de la connaissance auprès des experts du domaine et de leurs documents●(Semi-)formalisation (DL, RDF, ...) :

● des choix à faire : l'âge d'une personne est une une caractéristique ? un concept ? ... ?

●Développement et raffinement de l'ontologie cible

Mercredi 26 novembre 2008 38

Évaluation

●Vérifier le document de spécifications●Tester avec une application cible●Dépoyer l'ontologie

Mercredi 26 novembre 2008 39

Maintenance et évolutions

●Les choses changent : les conditions et les spécifications de l'ontologie aussi :

● Qui s'occupe de la maintenance ?● Comment est-ce fait ?

●Comment évoluent les applications qui utilisent l'ontologie ?

● Quels outils, méthodes, ... ?

Mercredi 26 novembre 2008 40

Réutilisation des ontologies

●C'est l'idée de départ●En fait difficile car une ontologie est construite dans l'objectif d'une tâche précise●Travaux sur les « upper-ontologies »

Mercredi 26 novembre 2008 41

exemple de cycle de vie

MaintenanceMaintenance

Detection

Evaluation

⁄⁄⁄⁄

Pla

nnin

g

Specification

Acq

uisi

tion

Inte

grat

ion

ConceptualizationFormalization

Implementation

Diffusion

Use

Evolution

Building

[Gandon & al.]

Mercredi 26 novembre 2008 42

Des outils existent (1)

●OntoEdit / OntoKick●KAON●Protégé-2000●OilEd●VerticalNet Ontology Builder●WebOde●....

Mercredi 26 novembre 2008 43

Des outils existent (2)

[Staab]

Mercredi 26 novembre 2008 44

Encore de nombreux travaux

●Ontology learning (from texts, from schemata, ...)●Ontology matching, alignment, merging●Ontology evaluation (vérification, validation, complétude, concision, cohérence, ...)●....

Mercredi 26 novembre 2008 45

Plan du cours●Ontologies

● Définitions, exemples● Représentations● Construction / ingénierie● Utilisations

Mercredi 26 novembre 2008 46

Domaines d'utilisations ●Intelligence Artifielle●Web Sémantique●E-commerce, modélisation d'entreprise●Gestion des connaissances (compétences)●Workflow, TCAO●Extraction d'informations, recherche d'informations●e-learning●Ingénierie des bases de données●Traduction, NLP●SMA, Ambiant Intelligence,●.............

Mercredi 26 novembre 2008 47

De nombreuses sources biblioLocalement :

Jérôme Euzenat(INRIA, Grenoble)

Fabien Gandon(INRIA, Sophia)

.....