Upload
vuongkiet
View
213
Download
0
Embed Size (px)
Citation preview
Mercredi 26 novembre 2008 1
Master Web IntelligenceICM - Option Informatique
2008/2009
Web Sémantique
Philippe BeauneENSM-SE/G2I/SMA
mailto : [email protected]
Mercredi 26 novembre 2008 2
Plan du cours●Ontologies
● Définitions, exemples● Représentations● Construction / ingénierie● Utilisations
Mercredi 26 novembre 2008 3
Histoire●Problèmes de réalisation des Systèmes Experts (bases de connaissances) :
● Complexité● Coûts financiers et temporels● Ré-utilisabilité● Variété des langages de représentation● Composabilité● Inter-opérabilité● Etc …
● KSE (DARPA, 1990) : ne plus faire « from scratch », mais par assemblage de composants réutilisables ; ...
Mercredi 26 novembre 2008 4
Définitions●Ontologies (philo) : partie de la métaphysique qui s'applique à l'être en tant qu'être, indépendamment de ses déterminations particulières●Taxinomie (didact) : étude théorique des bases, lois, règles, principes, d'une classification●Taxinomie : classification d'éléments●Ontologie (IC) : ensemble des objets reconnus comme existant dans le domaine. Construire une ontologie c'est aussi décider de la manière d'être et d'exister des objets
Mercredi 26 novembre 2008 5
Définitions (suite)●Ontologie (Gruber, 93) : spécification explicite d'une conceptualisation
● Spécification explicite : donc avec un langage● Conceptualisation : structuration des concepts
●Ontologie (Borst, 97) : spécification formelle d'une conceptualisation partagée●Concept : désigné de 3 façons :
● Son nom● Sa signification (sa définition en intension)● Les objets dénotés (sa définition en extension)
Mercredi 26 novembre 2008 6
Exemple
●Voiture, auto, automobile, tacot, ...●Véhicule de transport automobile conçu et aménagé pour le transport d'un petit nombre de personnes●La 2CV 234 DD 42, la clio truc 543 YA 42, etc...
Mercredi 26 novembre 2008 7
Relations●Une «relation» peut s'exprimer par son nom, son intension, son extension :
● «auteur»● personne qui crée une oeuvre● Hugo est l'auteur de Notre Dame de
Paris et Chateaubriand de Mémoires d'outre-tombe, ...
●Généralisation (subsomption), spécialisation, composition, ..., est fabriqué en, possède, ...
Mercredi 26 novembre 2008 8
Objectifs des ontologies
●Permettre un traitement symbolique des connaissances, but premier de l'IA, rejoint celui du Web Sémantique.●Faire faire des traitements automatiques à des logiciels au sein du Web pour faire interopérer des machines ou des machines et des humains.
Mercredi 26 novembre 2008 9
Rôle des ontologies
●Vocabulaire, structuration et exploitation des méta-données●Représentation pivot pour l'intégration de sources de données hétérogènes●Décrire les Services Web●...
Mercredi 26 novembre 2008 10
Philippe Martin, Griffith University «Introduction to ontologies»
An ontology is a list of formal terms, i.e. identifiers for categories of objects, plus machine-understandable statements defining a formal meaning for these terms, in other words, some of their characteristics or inter-relations, rules or constraints of use. These statements permit some semantic checking on the manual introduction of new statements and some logical inferencing to generate new statements, e.g. for information retrieval purposes.
Relational database schemas may be viewed as simple forms of ontologies but, although some dependency relations are represented, semantic relations between the terms (column names) are most often not explicited, and hence knowledge representation and inferencing is very limited. In most knowledge-based systems (KBSs), the users are allowed to add new categories, relations, rules or constraints. This dynamic modification of the ontology, and the (potential) complexity of the knowledge representations and inferencing, may be the reasons why so few large-scale KBSs have been built [...]
Mercredi 26 novembre 2008 11
Autre définition
●Guarino :En IA, une ontologie représente un
artefact d’ingénierie constitué par un vocabulaire spécifique utilisé pour décrire une certaine réalité, accompagné d’un ensemble d’hypothèses implicites concernant la signification des mots de ce vocabulaire
Mercredi 26 novembre 2008 13
Formalisations●cf. Nicola Guarino (http://www.loa-cnr.it/)
● Espace de domaine = <D,W> où D est un domaine, et W un ensemble d'états (ou mondes possibles)
● Relation conceptuelle : ρn : W → 2Dn
● Une conceptualisation pour D : <D,W,R >où R est un ensemble de relations conceptuelles
sur <D,W>●cf. aussi Thomas R. Gruber
http://ksl-web.stanford.edu/people/gruber/
Mercredi 26 novembre 2008 14
Exercices●Interprétation :
● Fred saw the plane flying over Zürich● Fred saw the mountain flying over Zürich
●Synonymie :● Propos destiné à faire rire● Assemblage de feuilles imprimées
●Homonymie :● Quantité relativement grande et d'un seul tenant
d'une matière● Marteau à tête lourde et sans panne● Parties conductrices d'un appareil par lequel
s'effectue le retour du courant au générateur● Grandeur fondamentale liée à la quantité de matière
que contient un corps
Mercredi 26 novembre 2008 15
Différents types d'ontologies
Top-level ontology
Domain ontology Task ontology
Application ontology
Concepts très générauxindépendants du problème(espace, temps, événement,action, ...)
[Guarino]
Concepts très spécifiquescorrespondant aux rôlesjoués par les entités dudomaine dans une certaineactivité
Vocabulaires générauxd'un domaine (médecine,automobile, ...)
Mercredi 26 novembre 2008 16
Exemples d'ontologies●Ontologies générales :
● Wordnet / EuroWordNet● The Upper Cyc Ontology● IEEE Standard Upper Ontology
●Ontologies de domaine● UMLS, RETSINA, Dublin Core, KA2, ...
●Méta-ontologies● Semantic Translation, RDFT, Evolution
Ontology
Mercredi 26 novembre 2008 17
WordNet
●http://www.cogsci.princeton.edu/~wn/index.shtml●WordNet® is an online lexical reference system whose design is inspired by current psycholinguistic theories of human lexical memory. English nouns, verbs, adjectives and adverbs are organized into synonym sets, each representing one underlying lexical concept. Different relations link the synonym sets.
Mercredi 26 novembre 2008 18
UMLS
●Unified Medical Language System●http://umlsks.nlm.nih.gov●NLM's Unified Medical Language System (UMLS) project develops and distributes multi-purpose, electronic "Knowledge Sources" and associated lexical programs. System developers can use the UMLS products to enhance their applications -- in systems focused on patient data, digital libraries, Web and bibliographic retrieval, natural language processing, and decision support. Researchers will find the UMLS products useful in investigating knowledge representation and retrieval questions.
Mercredi 26 novembre 2008 19
UMLS (suite)
●Metathesaurus●Réseau sémantique●NLP tools●Knowledge Source Server●MetamorphoSys
Mercredi 26 novembre 2008 20
Dublin Core - 1●http://dublincore.org/●The Dublin Core Metadata Initiative is an open forum engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models.●The Dublin Core metadata standard is a simple yet effective element set for describing a wide range of networked resources. The Dublin Core standard includes two levels: Simple and Qualified. Simple Dublin Core comprises fifteen elements; Qualified Dublin Core includes an additional element, Audience, as well as a group of element refinements (also called qualifiers) that refine the semantics of the elements in ways that may be useful in resource discovery
Mercredi 26 novembre 2008 21
Dublin Core - 2
●L'ontologie de Dublin Core comprend des éléments tels que :
● Title● Creator● Subject● Description● Publisher● Contributors● Date● ...
Mercredi 26 novembre 2008 22
RETSINASEMANTIC WEB CALENDAR AGENT
●http://www.daml.ri.cmu.edu/Cal/●The Retsina Semantic Web Calendar Agent provides interoperability between RDF based calendar descriptions on the web, and Personal Information Manager (PIM) Systems such as Microsoft's Outlook. Schedules and events can be described on the web in RDF, using existing ontologies such as the Hybrid iCal-like RDF Schema or the Dublin Core ontology, and linked to individual's contact information described, for example, at their home page. The Retsina Semantic Web Calendar Agent, consists of a Distributed Meeting Scheduling Engine and the RETSINA Semantic Web Calendar Parser. The agent assists in organising and scheduling meetings between several individuals, and coordinates these based on existing schedules maintained by MS Outlook.
Mercredi 26 novembre 2008 23
RSS (RDF Site Summary)
●Description extensible de méta-données●Application XML●L'ontologie est très simple :
● Un channel : title, link, description, language ; il est composé d'items :
● Un item : title, link, description, pubDate, ...
Mercredi 26 novembre 2008 24
Plan du cours●Ontologies
● Définitions, exemples● Représentations● Construction / ingénierie● Utilisations
Mercredi 26 novembre 2008 25
Paradigmes de représentation●Thésaurus●Taxinomies●UML (représentation graphique, AGL)●Modèle étendu E/R (diagrammes)●Frames●Logiques (des prédicats, de description, ...)●Réseaux sémantiques●Topic Maps●RDF et RDFS, OWL, ...●...
Mercredi 26 novembre 2008 26
Thésaurus●Graphes dont les arcs sont étiquetés●Arcs : similarité, proximité, synonymie, ...●Pas d'instances●Pas moyen de représenter des concepts un peu compliquéssoprano
definition The highest category of female (or artificial male) voice.
broader term(s) vocalist, singer
narrower term(s) lyric soprano, dramatic soprano, coloratura soprano
related term(s) mezzo-soprano, treble
Mercredi 26 novembre 2008 27
Topic Maps (1)●Les cartes topiques (ou cartes de thèmes, en anglais Topic Maps) sont un outil très général de représentation des connaissances, dont le but est d'agréger autour d'un point unique d'indexation (appelé topic) toutes les informations disponibles concernant un sujet donné, et de relier ces points par un réseau sémantique de relations appelées associations. [Wikipedia]●Standardisation ISO●Application XML : XTM●But :
● Gérer la surabondance d'informations● Construire des réseaux de connaissances sur
n'importe quelles ressources● Structurer l'information
Mercredi 26 novembre 2008 28
Topic Maps (2)●A Topic Map defines three main sorts of information: ●Topics, which are things or concepts that you're interested in●and their names●Associations, which help you relate one topic to another, and therefore help you to navigate around your subject of interest and ●Occurrences, which are information resources that relate to the topics. You can use them to locate books, articles, files, web pages and other relevant resources.
Mercredi 26 novembre 2008 29
Topic Maps (3)Gorda Sound see North SoundLittle Dix Bay .................... 89North Sound ....................... 90Road Harbour see also Road Town ... 73Road Town ...................... 69,71Spanish Town ................... 81,82Tortola ........................... 67Virgin Gorda ...................... 77
cf. « The Topic Maps Handbook» :http://www.empolis.com/downloads/empolis_TopicMaps_Whitepaper20030206.pdf
Mercredi 26 novembre 2008 31
Plan du cours●Ontologies
● Définitions, exemples● Représentations● Construction / ingénierie● Utilisations
Mercredi 26 novembre 2008 32
De l'artisanat à l'ingénierie
●Jusqu'au milieu des années 90 : artisanat (ou presque), approches dispersées
●1996 : 1er workshop « Ontological Engineering »
●Depuis : des techniques, des méthodes, des méthodologies pour la construction d'ontologies, leurs réutilisations, … (Cyc, On-To-Knowledge, Methontology, ...)
Mercredi 26 novembre 2008 33
Conception : principes
[Thomas R. Gruber]
●Clarté : être objectif, pas d'ambiguïté, doc●Cohérence : chasser les contradictions●Extensibilité : spécialisation incrémentale●Minimiser le biais du codage : knowledge level●cf. aussi l'engagement ontologique
Mercredi 26 novembre 2008 35
Étude de faisabilité
●Les systèmes de KM ne fonctionnent correctement que s'ils sont bien intégrés dans l'organisation●Plusieurs facteurs (autres que technologiques) déterminent la réussite●S'inspirer de Common KADS●Bien délimiter le domaine●Identifier les personnes impliquées
Mercredi 26 novembre 2008 36
Démarrage (cf. Common KADS)●Établir un document de spécifications :
● Domaine, objectif, sources de connaissances disponibles, utilisateurs potentiels, cas d'utilisations, applications
●Analyser les sources de connaissances (où sont les compétences ? Quels concepts sont pertinents ? Y a-t-il d'autres ontologies utilisables ? ...)●Prototype (concepts et relations les plus importants)
Mercredi 26 novembre 2008 37
Raffinement
●Acquisition de la connaissance auprès des experts du domaine et de leurs documents●(Semi-)formalisation (DL, RDF, ...) :
● des choix à faire : l'âge d'une personne est une une caractéristique ? un concept ? ... ?
●Développement et raffinement de l'ontologie cible
Mercredi 26 novembre 2008 38
Évaluation
●Vérifier le document de spécifications●Tester avec une application cible●Dépoyer l'ontologie
Mercredi 26 novembre 2008 39
Maintenance et évolutions
●Les choses changent : les conditions et les spécifications de l'ontologie aussi :
● Qui s'occupe de la maintenance ?● Comment est-ce fait ?
●Comment évoluent les applications qui utilisent l'ontologie ?
● Quels outils, méthodes, ... ?
Mercredi 26 novembre 2008 40
Réutilisation des ontologies
●C'est l'idée de départ●En fait difficile car une ontologie est construite dans l'objectif d'une tâche précise●Travaux sur les « upper-ontologies »
Mercredi 26 novembre 2008 41
exemple de cycle de vie
MaintenanceMaintenance
Detection
Evaluation
⁄⁄⁄⁄
Pla
nnin
g
Specification
Acq
uisi
tion
Inte
grat
ion
ConceptualizationFormalization
Implementation
Diffusion
Use
Evolution
Building
[Gandon & al.]
Mercredi 26 novembre 2008 42
Des outils existent (1)
●OntoEdit / OntoKick●KAON●Protégé-2000●OilEd●VerticalNet Ontology Builder●WebOde●....
Mercredi 26 novembre 2008 44
Encore de nombreux travaux
●Ontology learning (from texts, from schemata, ...)●Ontology matching, alignment, merging●Ontology evaluation (vérification, validation, complétude, concision, cohérence, ...)●....
Mercredi 26 novembre 2008 45
Plan du cours●Ontologies
● Définitions, exemples● Représentations● Construction / ingénierie● Utilisations
Mercredi 26 novembre 2008 46
Domaines d'utilisations ●Intelligence Artifielle●Web Sémantique●E-commerce, modélisation d'entreprise●Gestion des connaissances (compétences)●Workflow, TCAO●Extraction d'informations, recherche d'informations●e-learning●Ingénierie des bases de données●Traduction, NLP●SMA, Ambiant Intelligence,●.............