Annotations s©mantiques pour la localisation de ressources par des graphes ©tiquet©s

  • View
    22

  • Download
    0

Embed Size (px)

DESCRIPTION

Annotations sémantiques pour la localisation de ressources par des graphes étiquetés. Michel Chein LIRMM (Université Montpellier 2 et CNRS ). Une annotation : qu’est-ce que c’est ? (1). Annotation de quelque chose  : annotation et ressource (« document enrichment ») - PowerPoint PPT Presentation

Text of Annotations s©mantiques pour la localisation de ressources par des graphes ©tiquet©s

  • Annotations smantiques pour la localisation de ressources par des graphes tiquetsMichel CheinLIRMM (Universit Montpellier 2 et CNRS )

    COSI'07, Oran, juin 2007

  • Une annotation: quest-ce que cest? (1)

    Annotation de quelque chose: annotation et ressource (document enrichment)Annotation et metadonnes objectives et subjectivesAnnotation smantique : pas seulement contenu, mais aussi commentaire, remarque, usage, (ex. dans Annotea rdf:type Annotation a 7 sous-classes prdfinies : Advice, Change, Comment, Example, Explanation, Question, et SeeAlso)

    COSI'07, Oran, juin 2007

  • Une annotation: quest-ce que cest? (2)

    Annotation = connaissance sur une ressource : annotation sur des annotations ( lauteur de lannotation #33 est un imbcile, lauteur de la ressource R11 a t financ par lauteur de lannotation #12, )Base dannotationssur un ensemble de ressources annotations formelles, ressources informelles (textes, images, videos,) ou formelles (BdD, base dannotations, base de composants, ), entre base de connaissances et index sophistiqu

    COSI'07, Oran, juin 2007

  • Comment reprsenter des annotations ? (1)Il ny a pas de sens dans une annotation smantique seulement des connaissances au sens IA, i.e. des structures de donnes auxquelles un tre humain peut donner un sens, les mettre en relation avec le monde relKnowledge-based (souvent restreint ontology-based) semantic mark-up

    COSI'07, Oran, juin 2007

  • Comment reprsenter des annotations ? (2)Annotations reprsentes dans un langage formel de reprsentation de connaissances (sinon les annotations ne sont que des documents en langue naturelle ex. rsums), ontologies ( domain ontologies et pas visual descriptor ontology ou multimedia structure ontology)connaissances non explicites dans les ressources (pour complter des annotations)contextes (ce qui est suppos connu du lecteur) contraintes (pour assurer une certaine cohrence des annotations)Pour pouvoir faire des raisonnements (dduction et autres) : rponses une requte, compltion dune annotation, vrification de contraintes,

    COSI'07, Oran, juin 2007

  • Quelques autres questions importantes

    liens ressources/annotations : deux bases une de ressources et une dannotations, ou annotation dans les ressourcesconstruction : manuelle, automatique, assiste, outil pour parcourir et fractionner les ressources construction/usage collectif/individuel de la base dannotationsqui construit les connaissances du systme (ontologies)?qui construit les annotations(spcialistes dun domaine, spcialiste de documentation, tout le monde, ) ?

    COSI'07, Oran, juin 2007

  • Pourquoi des annotations: quoi a sert?Catgorisation, Certification Recherche dinformation Semantic annotation is a specific metadata generation and usage schema, aiming to enable new information access methods and to extend the existing ones. (Kiryakov)Publication assisteslectionner des parties de documents, les rutiliser pour construire un nouveau document mulimdia (recontextualisation)Valeur ajoute aux ressources

    COSI'07, Oran, juin 2007

  • Et le web smantique ?Ajouter des connaissances (RDF) aux documents du webEtendre HTML pour dcorer un document HTML par des connaissances (semantic XHTML, langage XTiger au dessus dAmaya)Notre approche est meilleure que RDF mais

    COSI'07, Oran, juin 2007

  • tout aussi insatisfaisante que RDF pour le web smantique !

    COSI'07, Oran, juin 2007

  • Ce dont je vais parlerun langage permettant de dfinir des annotations smantiques, des contraintes, des rgles (e.g. connaissances implicites), et des requtes une mthodologie pour aider construire des annotationsun mot sur les algorithmes de recherche tout doit tre simple construire et comprendre (y compris les raisonnements, i.e. le pourquoi des rponses fournies) car Nimporteki doit pouvoir construire des annotations et utiliser le systme

    COSI'07, Oran, juin 2007

  • Equipe RCR Le modle est bas sur un modle de reprsentation de connaissances dvelopp au LIRMM depuis 1992 M.-L. Mugnier, M. Leclre, O. Haemmerl, B.Carbonneill, O. Guinaldo, E. Salvat, D. Genest, J.-F. Baget, et des outils COGITO, COGITANT, COGUI, A. Gutierrez, N. MoreauUtiliss dans des applications en annotation et RI dans le cadre de divers projets:MOGADOR (recherche documentaire, ABES et BNF)OPALES (annotations de vidos, INA et MSH)SAPHIR (annotations de vidos pour publication assiste, INA et MSH)LOGOS (annotations de tout type de documents pour e-learning)EIFFEL (RI tourisme)

    COSI'07, Oran, juin 2007

  • COSI'07, Oran, juin 2007

  • COSI'07, Oran, juin 2007

  • COSI'07, Oran, juin 2007

  • Lanalyse du discours assiste par ordinateur : concepts, mthodes, outils

    COSI'07, Oran, juin 2007

  • COSI'07, Oran, juin 2007

  • Une requte simple212Couleur : RougeObjetChat2Chat : GarfieldCanapsur 111Couleur : RougeBouteilleCoussinLait3212Gdonc Q se dduit de G (et du vocabulaire)21proche12Qattr.

    COSI'07, Oran, juin 2007

  • Smantique logiqueainsi que les formules du vocabulaire traduisant les ordres partiels

    COSI'07, Oran, juin 2007

  • Exemple dontologie simpleUniverselEtreVivantDocumentImageVidoPersonneHommeFemmeJournalisteestAuteurDe(Personne,Document)estRalisateurDe(Personne,Vido)PPDA Journalistehttp://www.icones.bg/ic37.jpg ImageXXX

    COSI'07, Oran, juin 2007

  • COSI'07, Oran, juin 2007

  • OntologieUne ontologie (simple) GC :Tc un ensemble de types de concepts ordonns B ensemble densembles de types de concepts interdits Tr un ensemble de types de relations ordonnsSr : TrTc* dfinissant la signature des relations I un ensemble dindividus ontologiques

    COSI'07, Oran, juin 2007

  • Exemple (Rgles) Tout chercheurest membre d'une quipe La relation 'collabore' est symtrique ChercheurmembreEquipeR1PersonPersoncollcollR2 x (Chercheur (x) y Equipe(y) membre(x,y)) x y ( coll(x,y) coll(y,x))

    COSI'07, Oran, juin 2007

  • Exemple (Contraintes)BureauaffaffPersonPersonEquipeContrainte ngative"Synergie inter-quipes"BureauaffaffPersonPersonEquipemembremembreContrainte positive "Cloisonnement"

    COSI'07, Oran, juin 2007

  • Langage de donnes et de requtesFondamentalement des graphes bipartis tiquetsUne classe de sommets reprsentant des entits (analogie: mots-cls)lautre classe des relations entre ces entits (analogie: relations smantiques entre les mots-cls, agent, instrument, )les tiquettes sont ordonnes (spc./gn.)Pourquoi des graphes tiquets?un langage utilisable par des non informaticiens, facilement visualisablesuffisamment riche et extensiblebons algorithmes

    COSI'07, Oran, juin 2007

  • Project:PResearcherResearcher:KResearcher:JOffice:#124OfficenearQuery Q Fact GmemberPersonPersonmemberProjectProjectQ: Are there people working together, who are each member of a project?worksWithworksWithmembermember

    COSI'07, Oran, juin 2007

  • Project:PResearcherResearcher:KResearcher:JOffice:#124OfficemembermemberworksWithQuery Q Fact GmemberworksWithPersonPersonmemberProjectProject

    COSI'07, Oran, juin 2007

  • Homomorphisme de graphes Un homomorphisme h de G=(VG, EG) dans H=(VH,EH) est une application de VG dans VH qui prserve les arcs : si (x,y) est dans EG, alors (h(x),h(y)) est dans EH abcd312 Homomorphisme de graphes bipartis tiquets ajoutentdes conditions sur la structure et sur les tiquettes labelsGH

    COSI'07, Oran, juin 2007

  • Spcialisation/Gnralisationrelation de prordre sur les SGsG H (H G)

    ssi il existe un homomorphisme de G dans H TTTTTTTG est plus gnral que H H est plus spcifique que G

    COSI'07, Oran, juin 2007

  • Base logiqueVocabulaire S t < t r < rSGspredicats, constantes x t(x) t(x) x1... xk r(x1,..., xk) r(x1,..., xk) ( , ) fbfsConsistance: si G H alors F(G) est dductible de F(H), F(S)Compltude: si F(G) est dductible de F(H), F(S) alors G H le SG modle est quivalent au fragment FOL( , ) (on peut se dbarasser des quantificateurs universels)F Homomorphisme quivalent la dductionF

    COSI'07, Oran, juin 2007

  • Problmes quivalentsHom de graphes tiquets Etant donns deux SGs G et H, H G?Hom dhypergraphes tiquetsHom de structure relationnelleCSP Un rseau de contraintes est-il satisfiable?Inclusion de requtes conjonctives Etant donnes deux requtes conjonctives Q et Q, Q contient-elle Q ?Dduction dans le fragment positif, conjonctif et existentiel de FOL

    COSI'07, Oran, juin 2007

  • Une extension : la ngation atomiqueDeux problmes de dcision fondamentaux : Dduction (Q se dduit-il de la base B?) Existence d'une rponse (B contient-elle une rponse dfinie Q?)Sur les SGs ces problmes sont les mmesAvec ngation ce nest plus le cas

    COSI'07, Oran, juin 2007

  • Cube : A Cube : B Cube : C Cube Objet GCBAExistence d'une rponse : nonDduction : ouiQ[hypothse du monde ouvert](correspond la dduction en logique intuitionniste) ?Ngation atomique dans les SGs

    COSI'07, Oran, juin 2007

  • Une autre extension : les graphes typs embotsles graphes sont typs par un type dannotation (e.g. contenu, thme, rhtorique, commentaire, )le vocabulaire est dcompos en modules, un module dfinit le vocabulaire utilisable pour un type dannotationstructure hirarchique : on peut mettre une bote (un graphe) dans une bote (un sommet concept)

    COSI'07, Oran, juin 2007

  • Diffrents contenus smantiquesLe contenu smantique dune annotation peut tre dcrit selon plusieurs domainesRhtoriquePragmatiqueThmatiqueMdiasMatiresAVTournagePhysiqueA tout domaine est associ une ontologie (de domaine)Contrainte Les graphes dans un type dembotement sont construits en utilisant uniquement le vocabulaire de lontologie de domaine associe ce t