51
Jérôme Champavère jerome.champavere @ lifl.fr http://www.grappa.univ-lille3.fr/~champavere/?page=Enseignement De la représentation des connaissances au Web sémantique

Jérôme Champavère jerome.champavere @ lifl - …champavere/Enseignement/... · Normalisation par le W3C : XML, RDF, RDFS, ... Langage: alphabet (ensemble de symboles) et procédé

Embed Size (px)

Citation preview

Jérôme Champavère

jerome.champavere @ lifl.fr

http://www.grappa.univ-lille3.fr/~champavere/?page=Enseignement

De la représentation des connaissances au Web sémantique

Web sémantique—

Aperçu

Web sémantique

● Entièrement fondé sur le Web “classique”, c'est-à-dire un moyen de publier et de consulter des documents

● Informations formalisées pouvant être traitées automatiquement par des agents logiciels

● Annotation du contenu, définition de propriétés et de relations

● Normalisation par le W3C : XML, RDF, RDFS, OWL, …

Représentation des connaissances—

Fondements théoriquesdu Web sémantique

Connaissance ?

● Fait, manière de connaître.La connaissance d’un objet : conscience ; compréhension, représentation.Connaissance de choses nouvelles : découverte.Connaissance sensorielle ; connaissance intuitive : impression, intuition, sensation, sentiment.Connaissance exacte, profonde : certitude.

● (Avoir connaissance de) : être informé de.

● Faculté de connaître propre à un être vivant : intelligence.

● Fait de sentir, de percevoir : conscience, sentiment.

● (Les connaissances) : ce qui est connu ; ce que l’on sait pour l’avoir appris.

Représentation des connaissances ?

● Définition Wikipédia (FR) : ensemble d'outils et de technologies destinés à représenter et organiser le savoir humain pour l'utiliser et le partager

● Sciences cognitives : comment les humains stockent et traitent l'information

● IA : stocker les connaissances de sorte que des programmes peuvent la traiter

● Objectifs :● Modèles formels de représentation des connaissances● Traiter des informations au niveau sémantique● Simuler le raisonnement humain par le biais de mécanismes

d'inférence

Vision (partielle) de l'IA selon Turing

Qu'est-ce qu'une représentation ?

Représentation = Approximation

● Représentation : structure de symboles pour décrire un modèle du monde dans le contexte d'une tâche particulière

● Exemple de la carte et du territoire dans la recherche d'itinéraire : les détails inutiles sont ignorés

Fondements logiques

● Modèles de représentation des connaissances généralement issus de la logique mathématique

● Manipulation de connaissances explicites :● Langage formel de représentation (symboles)● Compromis efficacité/expressivité

Système formel (1)

● Syntaxe :● Langage : alphabet (ensemble de symboles) et procédé de

formation d'expressions (grammaire)● Système de déduction : règles pour construire de nouvelles

formules à partir d'axiomes (vérités arbitraires)

● Sémantique● Règles de valuation pour associer une valeur (vrai ou faux) à

toute formule du langage● Généralement compositionnelle : l'interprétation de la formule

x=(y+3)/z dépend de celle de x, de =, de y, etc.● Remarque : le langage naturel n'est pas compositionnel (le sens

de l'expression « tout à l'heure » ne provient pas de la composition du sens de « tout », « à » et « l'heure »)

Système formel (2)

● Correction : tout ce qui est déductible à partir des axiomes est vrai (théorèmes)

● Complétude : tout ce qui est vrai peut être déduit à partir des axiomes

● Décidabilité : étant donnée une formule, il existe un procédé de calcul (algorithme) qui permet de dire en temps fini si c'est un théorème ou non

Logique propositionnelle

● Système formel décidable dont la sémantique est compositionnelle

● Inconvénients● Temps de décision exponentiels● Expressivité limitée

Table de vérité pour la formuleP → (Q → R)

P Q R Q → R P → (Q → R)

V V V V V

F V V V V

V F V V V

F F V V V

V V F F F

F V F F V

V F F V V

F F F V V

● 2³=8 interprétations possibles● N'est pas un théorème (<P=V,Q=V,R=F>)

Logique du premier ordre

● Relations entre objets● Prédicats : lion(x) = “x est un lion”● Quantificateurs : x (lion(x) → roi (x)) = “tous ∀

les lions sont des rois”, y (félin(y) roi(y)) = ∃ ∧“certains félins sont des rois”

Langage naturel

● Contexte : “Regarde !”● Ambiguïté : “En posant l'assiette sur la table, il

la cassa”● Sens commun● Sémantique (≠ de sens) non compositionnelle :

« tout à l'heure »

Logiques non classiques

● Logique temporelle : “le lion est mort après le coucher du soleil”

● Théorie des probabilités : “le lion est peut-être mort”

● Logique floue : “beaucoup de lions sont des rois”

Compromis expressivité/efficacité

● Restreindre la logique pour avoir des algorithmes déductifs complets et rapides

● Abandonner l'exigence de complétude

Ontologies—

Représentation des connaissancesà base de catégories et d'objets

Systèmes experts

● Représentations à base de faits et de règles● Mycin : système de diagnostic médical● Problèmes spécifiques● Fonctionnement éloigné des capacités du

cerveau humain : inférence rapide, connaissances peu expressives

Ontologies

● Représentation des connaissances basée sur les objets et les catégories● Simulation des modèles de représentation interne

du savoir humain● Sciences cognitives : sous quelles formes sont

stockées les connaissances dans la mémoire et comment sont-elles utilisées dans le raisonnement

● Bases de connaissances généralistes● But : requêtes sur un vaste de champ du savoir

humain

Ontologie informatique

● Représentation des propriétés générales de ce qui existe dans un formalisme supportant un traitement rationnel

● Concepts abstraits (principes, idées, objets, temps, espace, …) et relations

● Organisation hiérarchique● Partage et échange des connaissances

Ontologie supérieure (Cyc)

Ontologie de domaine

Catégories

● « — Tu connais un restaurant proche ?— Il y a une pizzeria au coin de la rue.— Merci. »

● La première personne généralise sa requête au concept de restaurant, catégorie la plus abstraite recevant toutes les formes de réponses acceptables

● La seconde déduit qu'une pizzeria est un restaurant, sa réponse est donc pertinente

RelationsMembre et SousEnsemble

● Objet cours c● Sous-classes (catégories) CoursModélisation,

CoursInfo● Relations :

● Membre(c,CoursModélisation), ouc ∈ CoursModélisation : “c est un cours de modélisation”

● SousEnsemble(CoursModélisation,CoursInfo), ou CoursModélisation ⊂ CoursInfo

Héritage

● Toutes les instances de la catégorie Nourriture sont comestibles

● Fruits est une sous-classe de Nourriture, Pommes est une sous-classe de Fruits

● Alors toutes les pommes sont comestibles : les pommes, individuellement, héritent de la propriété de comestibilité, parce qu'elles appartiennent à la catégorie Nourriture

Propriétés

● Définition de propriétés en logique du premier ordre

● x ∈ Pommes → Comestible(x) : toutes les instances de la classe Pommes sont comestibles

● x ∈ Pommes ∧ Couleur(x) = vert pomme ∧ Taille(x) = moyen ∧ Goût(x) = acidulé

→ x ∈ GrannySmith

Taxonomies

● Ontologies constituées uniquement des relations Membre et SousEnsemble

● Structure hiérarchique pour organiser des connaissances catégorielles sous forme de relations de sous-classes

● Classification

Wikipédia

Réseaux sémantiques—

Représentation graphique des connaissances

Réseaux sémantiques

● Graphes● Nœuds = concepts● Arcs = relations

(généralement binaires)

Graphes conceptuels

Intérêt des réseaux sémantiques

● Représentation graphique directement interprétable par l'humain

● Formalisme directement exploitable par une machine

● Expressivité parfois supérieure à la logique du premier ordre

● Limite : difficile de fournir des explications sur leur raisonnement

Wordnet

Logiques de description

Web sémantique—

Application de la représentationdes connaissances

Vision de T. Berners-Lee

● Développement du Web possible avec des standards (TCP/IP, HTTP, HTML)

● Première génération d'Internet : pages écrites à la main

● Génération actuelle : contenu généré automatiquement (PHP), interactions humain-humain et humain-machine

● Prochaine génération :● Favoriser l'accès aux ressources pour un traitement automatique

par des agents logiciels● Espace d'échange d'informations entre agents (logiciels et

humains)

Principes

● Tout objet du Web possède une étiquette qui le représente fidèlement

● Toute étiquette peut être lue par les agents logiciels et humains

● La sélection d'une étiquette par un agent rend accessible l'objet en tant que ressource

● Objets : page Web, site, service, média, etc.● Étiquette (= métadonnée) : information sur les

données décrivant les connaissances contenues dans les ressources

Architecture

RDF

● Ressource Description Framework● Format d'échange XML utilisé pour la

représentation des connaissances● Langage de base du Web sémantique● Triplets (ressource,propriété,valeur) pour

décrire les objets

Exemple

Syntaxe abrégée etreprésentation graphique

Autres langages

● RDF Schema permet de définir des vocabulaires (descriptions d'ontologies) destinés à structurer des ressources RDF en classes/sous-classes et propriétés

● OWL permet de définir des ontologies en étendant les possibilités de RDFS

● SPARQL est un langage de requêtes pour RDF

Friend Of A Friend(FOAF)

Couches supérieures

● Pas encore normalisées, voire idées à développer

● RIF (Rule Interchange Format), Unification Logic et Proof : couche logique du Web sémantique

● Cryptography et Trust : gestion de la sécurité des données

● Web sémantique encore en cours de réalisation

Exercices

Devinette enfantine

● Un homme regarde un portrait et déclare : « De frère et de sœur je n'ai point, mais le père de cet homme est le fils de mon père. » Qui est l'homme sur le portrait ?

● Formaliser ce problème en logique du première ordre en utilisant les constantes moi, cet_homme et mon_père, et les prédicats Père et Fils

Taxonomie du sport

● Définir une hiérarchie à partir des concepts suivants : Athléthisme, Course, Football, FootballAméricain, Natation, NatationSynchronisée, Patinage, PatinageArtistique, PatinageDeVitesse, Relai, Ski, Sport, SportArtistique, SportCollectif, SportDeBalle, SportIndividuel, Tennis.

Réseau sémantique

● Quels sont les concepts ? Quels sont les objets ?

● Quelle est la couleur du vélo de Lilian

● Peut-on dire que Lilian apprécie l'opéra Don Giovanni ?