Donner du sens à des documents semi-
structurés : De la construction d'ontologies
à l'annotation sémantique
À l’heure du web des données :
1. Donner du sens à des documents pour des logiciels
2. Pourquoi des ontologies ?
3. Comment ? apports du traitement automatique des langues
4. Annotation sémantique, extraction d’information : convergences
5. Web des données : nouveaux enjeux, problèmes connus
Oct 2012 - IST De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles 1
Nathalie Aussenac-Gilles, DR CNRS, [email protected]
1 - Donner du sens à des
documents pour des logiciels
Qu’est que cela signifie ?
… à l’heure du web sémantique
… avec des ontologies
… à l’heure du web des données
Oct 2012 - IST 2 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Donner du sens à des documents numériques
Rendre accessible à un programme leur “contenu”
… les informations, les connaissances que l’humain y reconnait
… pour les traiter en tenant compte de ce contenu
Oct 2012 - IST 3 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
<CV>
<nom>
</nom>
<adresse>
</adresse>
<experience>
</experience>
<formation>
</formation>
</CV>
href
href
Description documentaire
Schemas et DTD pour unifier
… à l’heure du web sémantique
Normaliser les tags et faire référence à une ontologie pour
échanger, comparer, mettre en relation
Être précis, se mettre d’accord sur le sens
Raisonner, exploiter des connaissances non explicites
Oct 2012 - IST 4 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
<CV>
P1 rdf:Type foaf:person
P1 foaf:name ”ڎڻڇ”
P1 foaf:adress ”ڦڀڤڎڻڇ”
Expe1 rdf:Type onto:experience
P1 onto:aExperience Expe1
….
</CV>
Onto:collaboreAvec
dc:estAuteurDe
Onto
Foaf
Oct 2012 - IST 5 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Comment produire les annotations ?
Oct 2012 - IST 6 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Comment produire les annotations ? Indexation classique
3rd European Semantic Web Conference (ESWC2006)
The 3rd Annual European Semantic Web Conference (ESWC2006) will be held in Budva, Montenegro from the 11th - 14th June, 2006.
It will present the latest results in research and application in Semantic Web technologies (including knowledge markup languages, Semantic Web services, ontology management and more).
ESWC 2006 will also feature a special industry-oriented event providing European industry with an opportunity to become even more familiar with these technologies. It will offer a tutorial program, focusing on the latest in Semantic Web technologies.
Comment produire les annotations ? Indexation classique -> indexation sémantique
Oct 2012 - IST 7 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Europe
Semanti
Web
Confere
Annual
Europe
Semanti
Web
Confere
Budva
Montene
present
results
Researc
Applica
Semanti
Web
Technol
Includi
Knowled
Markup
Languag
Semanti
Web
Service
Ontolog
managem
Feature
Special
Industr
Oriente
event
…
European [geographic area:Europe]
Semantic
Web [semantic Web]
Conference [conference]
Annual
European [geographic area:Europe]
Semantic
Web
Conference [conference]
Budva [City:Budva]
Montene [geographic area:Montenegro]
present [to present]
results [result]
Research [research]
Application [application]
Semantic
Web [semantic Web]
Technology [technology]
Including [to include]
Knowledge [knowledge]
Markup
Language [Markup Language]
Semantic
Web [semantic Web]
Service
Ontology [Ontology]
management [management]
Feature [to feature]
Special
Industrial [industrial]
Oriented
Event [event]
…
Oct 2012 - IST 8 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Comment produire les annotations ?
Une représentation sémantique de la page web
… à l’heure du web des données
2 défis
Extraire les triplets
Les associer à des données existantes
Oct 2012 - IST 9 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
<CV>
(hasValue,”ڎڻڇ”, foaf:name)
(hasValue,”ڦڀڤڎڻڇ”,foaf:adress)
(rdf:Type, P1, foaf:person)
(rdf:Type, Expe1, onto:experience)
(onto:aExperience, P1, Expe1)
….
</CV>
Onto:collaboreAvec
dc:estAuteurDe
Onto
Foaf
Reconnaître des données existantes
Des mots à des triplets
spécifiques
De triplets à des classes,
des types
Des triplets à des
instances
Reconciliation d’instances
Alignement de concepts
Oct 2012 - IST 10 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
2 – Pourquoi des ontologies ?
Nécessité de référentiels pour relier les données entre elles
Nécessité de la formalisation pour raisonner
Oct 2012 - IST 11 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Est-ce la fin des ontologies ?
===========================================
1st International Workshop on
Ontology Engineering in a Data-Driven World – OEDW 2012
Full-day workshop at EKAW 2012 (Galway, Ireland)
October 8th or 9th, 2012
http://granvia.dia.fi.upm.es/oedw2012/
===========================================
* Motivation*
- Is the current data-driven world going to kill ontologies?
- Are we navigating towards a shallow Web of Data? * Topics *
- Guidelines, methods, and tools for Linked Data engineering
- Methods for ontology/vocabulary reuse in the Linked Data context
- Methods and techniques for ontology/vocabulary mapping and alignment in
the Linked Data context
- Guidelines, methods, and tools for RDB to RDF mappings
- Life cycle management in the context of Linked Data
- Creation of knowledge out of Linked Open Data
- Ontology/vocabulary repositories
- Empirical findings and statistics about ontologies underlying Linked Data
…
Oct 2012 - IST 12 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Nécessité de référentiels pour lier les données
Enjeux pour lier les données
Reconnaître la même instance dans le même document
Reconnaître la même classe dans une collection
Reconnaître la même instance dans une collection
Phénomènes linguistiques associés
Calcul de références
Polysémie (quel est le sens d’une occurrence de terme ? Quel
type sémantique lui associer ?)
Synomymie (savoir qu’on parle de la même entité ou du même
concept avec des termes différents)
Oct 2012 - IST 13 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Geonames:city ??:books
Ontologies : motivations
Réutilisation
Partage de la connaissance et communication
Interopérabilité entre différents SBC
Échange de connaissances entre systèmes
Premières initiatives
Infrastructure comme support à la réutilisation de connaissance
«Knowledge Sharing Effort », ONTOLINGUA,...
INTERLINGUA (KIF) comme langage pivot pour la traduction
d’un langage vers un autre
Oct 2012 - IST 15 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Ontologies : historique
Ontologie PHILO. Partie de la métaphysique qui s’applique à l’être en
tant qu’être, indépendamment de ses déterminations particulières
(Le Petit Robert).
Taxinomie 1.DIDACT. Étude théorique des bases, lois, règles,
principes, d’une classification. 2. Classification d’éléments (Le Petit
Robert).
Taxinomies en sciences naturelles
Depuis Aristote : essence des choses,
points communs et différences
Triangle sémiotique : signe, référant, référé
Oct 2012 - IST 16 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Référé Forme Dénomme
Refère à évoque
Concept
“Jaguar“
[Odwen, Richards, 1923]
référant
signe
Oct 2012 - IST 17
Ontologies en Ingénierie des Connaissances
Modèles des connaissances d’un domaine pertinentes pour une
application, une tâche donnée
Conceptualisation de ces connaissances en classes génériques, relations
et règles
Application de principes de normalisation, de « bonne construction » et/ou
référence à des classes ontologiques
Réseau sémantique + axiomes
Ontologie Spécification normalisée représentant les classes des
objets reconnus comme existant dans le domaine. Construire
une ontologie, c’est aussi décider d’une manière d’être et
d’exister des objets.
FORME
FOND
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
D’un formulation linguistique à une représentation
formelle (1)
Oct 2012 - IST 18 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
D’un formulation linguistique à une représentation
formelle : si on utilisait une ontologie ? (2)
Oct 2012 - IST 19 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Une ontologie permet de typer les données (3)
Oct 2012 - IST 20 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Une ontologie pour repérer les ambigüités (4)
Exploiter les contraintes de l’ontologie formelle
Oct 2012 - IST 21 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Une ontologie pour définir avec précision (5)
Oct 2012 - IST 22 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
:NationalitéFrançaise rdfs:subClassOf :nationalité
:français#1 rdf:type :NationaliteFrançaise
Autres intérêts d’utiliser une ontologie (5)
Représenter les connaissances sous une forme plus
synthétique (ex des proprités)
Pouvoir définir des classes par leurs propriétés :
Définir “journaliste français”
Oct 2012 - IST 23 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
:Homme rdfs:subClassOf :Personne
:Femme rdfs:subClassOf :Personne
:apourProfession rdfs:domain :Personne rdfs:range :Profession
Regroupe les 2 définitions
:apourProfession rdfs:domain :Homme rdfs:range :Profession
:apourProfession rdfs:domain :Homme rdfs:range :Profession
Soit p tel que :
Personne(p) et (p : apourProfession :journaliste) et
(p :apourNationalité :NationalitéFrançaise),
alors :JournalisteFrançais(p)
Ontologie vs thésaurus
Oct 2012 - IST 24 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Thésaurus SRLF et de la SFAR
hémopéritoine
Oct 2012 - IST 25
Liens
Hiérarchie de relation Hiérarchie de concepts
Ontologie vs thésaurus
ETAT_PATHOLOGIQUE
ETAT_PATHOLOGIQUE_LOCAL
LESION
adénopathie
…
épanchement
épanchement gazeux
épanchement liquidien
épanchement de pus
épanchement hématique
LESION (LOCALISATION) ANATOMIE
LOCALISATION
à_côté_de
à_l'extérieur_de
au_dessus_de
…
au_niveau_de
ANATOMIE
…
ANA_TISSU_ENVEL
capsule
duremère
mésentère
peau
…
péritoine
hémopéritoine : « épanchement hématique localisé au niveau du péritoine »
épanchement hématique (au_niveau_de) péritoine
Concept défini
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 26
Hiérarchie de relations Hiérarchie de concepts
Ontologie vs thésaurus
LESION
épanchement
fracture
LESION (LOCALISATION) SITUATION
LOCALISATION
à_côté_de
à_l'extérieur_de
au_dessus_de
…
au_niv_de
…
SITUATION
angle
base
bord
SITUATION (OBJET) ANATOMIE_OBJET
OBJET
…
DE
…
ANATOMIE_OBJET
OS
crâne
fracture à la base du crâne
fracture (au_niveau_de) base (DE) crâne
Liens
Concept défini
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Une ontologie respecte des principes de
structuration … en principe …
Fixer préalablement et précisément (Guarino 94)
– les engagements ontologiques généraux : point de vue
– les catégories de haut-niveau : appellations et significations (DOLCE)
– le processus de raffinement de ces engagements et définitions des
catégories
– la spécialisation de ces catégories
Déterminer une ontologie revient à fixer la signification
attendue des primitives d’un domaine (Guarino 96)
– les primitives n’existent pas en tant que telles dans un domaine
d’expertise
Oct 2012 - IST 27 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 28
Modéliser, c’est faire des choix
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
1. Quelle différence entre patient et
patiente ?
2. Un concept « primitif » (patient), deux
caractéristiques différentes,
différenciant ainsi les deux concepts
« définis ».
3. La différence est
explicitement liée à un
attribut (sexe) dont la
valeur diffère.
Principes de normalisation d’Archonte (Bachimont 2000)
Principes de différenciation Point commun entre 1 concept et son père
Différence entre 1 concept et son père
Points communs entre 1 concept et ses frères
Différences entre un concept et ses frères
Les différences ne sont pas forcément
représentées à l’aide de propriétés mais au
moins par des commentaires
Oct 2012 - IST 29 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Ontologies - Quelques exemples en 2006
Ontologies générales ou génériques (haut niveau) WordNet / EuroWordNet, http://www.cogsci.princeton.edu/~wn
The Upper Cyc Ontology, http://www.cyc.com/cyc-2-1/index.html
IEEE Standard Upper Ontology, http://suo.ieee.org/
DOLCE, http://www.loa-cnr.it/ontologies/DLP_397.owl
LRI-Core: a core ontology for law
Ontologies de domaine ou spécifiques à des applications RDF Site Summary RSS, http://groups.yahoo.com/group/rss-dev/files/schema.rdf
UMLS, http://www.nlm.nih.gov/research/umls/
RETSINA Calendering Agent, http://ilrt.org/discovery/2001/06/schemas/ical-full/hybrid.rdf
AIFB Web Page Ontology, http://ontobroker.semanticweb.org/ontos/aifb.html
Web-KB Ontology, http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
Dublin Core, http://dublincore.org/
Meta-Ontologies Semantic Translation, http://www.ecimf.org/contrib/onto/ST/index.html
Evolution Ontology, http://kaon.semanticweb.org/examples/Evolution.rdfs
Ontologies au sens large Agrovoc, http://www.fao.org/agrovoc/
Art and Architecture Thesaurus, http://www.getty.edu/research/tools/vocabulary/aat/
UNSPSC, http://eccma.org/unspsc/
DTD standardizations, e.g. HR-XML, http://www.hr-xml.org/
Oct 2012 - IST 30 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Ontologies pour le web des données DBPedia, une ontologie à l’échelle du web !
Construction à partir des Info-box de Wikipedia
Extraction d’information à partir de documents semi-structurés
L’ontologie 359 classes
800 object properties
859 datatype properties
116 specialized datatype properties
45 owl:equivalentClass, 31 owl:equivalentProperty mappings
La base de connaissances (pour l’anglais) = 3.77 million things 2.35 million are classified in a consistent Ontology
764,000 persons, 573,000 places, 333,000 creative works (including 112,000 music albums, 72,000 films and 18,000 video games), 192,000 organizations (including 45,000 companies and 42,000 educational institutions), 202,000 species and 5,500 diseases.
Versions disponibles en 111 langues = 20.8 million things, out of which 10.5 mio are interlinked with concepts from the English DBpedia.
http://wiki.dbpedia.org/About
Oct 2012 - IST 34 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Vocabulaires pour le web des données
Dmoz The Open Directory Project is the largest, most comprehensive human-edited directory of the Web. It is constructed and maintained by a vast, global community of volunteer editors.
Associé au web2.0 et à l’annotation collaborative
Organiser les rubriques, les catégories d’annotation
structure.rdf.u8.gz - category hierarchy information
http://www.dmoz.org
Freebase Freebase is an open, Creative Commons licensed graph database with
more than 23 million entities. An entity is a single person, place, or thing.
Freebase connects entities together as a graph.
Structure : données structurées selon un SCHEMA en domaines / types (concepts) / properties
Pas vraiment de sémantique des types
Oct 2012 - IST 35 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Ontologies pour le web sémantique
Écrites en OWL ou RDFs
Accessibles sur le web
Identifiants : URI
Importent d’autres ontologies
<owl:Class rdf:ID= “wineOnto:Winery”/>
<owl:Class rdf:ID= wineOnto:PotableLiquid »/>
<owl:Class rdf:ID="Wine">
<rdfs:subClassOf rdf:resource="food:PotableLiquid"/>
<rdfs:label xml:lang="en">wine</rdfs:label>
<rdfs:label xml:lang="fr">vin</rdfs:label> ...
</owl:Class>
Oct 2012 - IST 36 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
3 – Comment ? Apports du TAL
Le problème : donner du sens à des documents
Hypothèses :
c’est articuler langue et représentations sémantiques
les représentations sémantiques sont mieux définies dans
une ontologie
L’approche : extraire des informations/connaissances des textes
Les outils : logiciels de Traitement Automatique des langues
Oct 2012 - IST 37 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Construire vs peupler une ontologie
Oct 2012 - IST 38 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Construction d‘ontologie
Analyse linguistique pour extraire des
prédicats (catégories, attributs,
propriétés) à partir de textes
Peuplement d‘ontologie
Extraire des indices linguistiques
d’instances de concepts de
l’ontologie
Annoter
Extraire Classes & Relations
Extraire (Annoter)
Instances
Ontology Population
Knowledge Base Generation
Ontology Learning
Ontology Creation & Development Construction d‘ontologie
Identifier des indices de prédicats
(catégories, attributs, propriétés)
Décider de leur représentation dans
l’ontologie
Construire vs peupler une ontologie
Classes
Propriétés des classes
Relations binaires
Personne
PereDe ou MereDe
GrandParentDe
AppartientMemeFamilleQue
Oct 2012 - IST 39 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Je crée l’ontologie Je décris des instances
Classes / propriétés connues
Personne
PereDe; MereDe
GrandParentDe
Instances identifiées
Hugo, René, Rosie
Relations entre instances
GrandPereDe(René, Hugo)
MereDe(Rosie,Hugo)
PereDe(René, Rosie)
Hugo est heureux que son grand-père René l’accompagne pour
retrouver sa mère Rosie.
Les textes pour construire ou peupler
Construire le schéma
Peupler par des instances
Oct 2012 - IST 40 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Indices
linguistiques
Ontologie
RTO : ressource termino-ontologique
Où stocker les indices linguistiques ??
Et les patrons/ logiciels pour les trouver ?
Indices
linguistiques
Ontologie
RTO
Instances
Trouver les formulations linguistiques
Oct 2012 - IST 41 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
système
L'échographie abdominale retrouve une contusion splénique et un hémopéritoine. Traumatisme abdominal avec une fracture de rate et un
hémopéritoine abondant, ayant nécessité une splénectomie en urgence. Un nouvel état de choc apparaît associé à syndrome
compartimentaire abdominal (hémopéritoine + hématome rétropéritonéal)) justifiant la laparotomie exploratrice. L'évacuation de
l'hémopéritoine ne permet pas de mettre en évidence une cause nette au saignement ;Instabilité hémodynamique initiale, avec TA 80 / 60
et fréquence cardiaque à 120 / min en relation avec des pertes sanguines sur les foyers de fractures (échographie abdominale normale,
absence d‘ hémopéritoine ou de lésion viscérale intrapéritonéale évidente)).deux échographies abdominales successives un
hémopéritoine évolutif, sans pneumopéritoine, ainsi qu'un décollement péricardique postérieur.un traumatisme thoraco-abdominal avec
fracture des arcs postérieurs des 7e, 8e et 9e côtes droites, contusion hépatique au niveau des segments VI-VII, hémopéritoine de
moyenne abondance, contusion splénique,Instabilité hémodynamique nécessitant remplissage, transfusion de culots globulaires, PFC et
plaquettes dans le cadre d'un hémopéritoine sur fracture du bassin.
texte
épanchement hématique (au_niveau_de) péritoine
Ressource
ANATOMIE LESION LOCALISATION
hémopéritoine
CONCEPT
terme
Trouver les variantes de formulation
Oct 2012 - IST 42 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
sevrage en noradrénaline le 23 / 10. Stabilité cardiorespiratoire, le sevrage de la Noradrénaline est fait à J5 de la
réintervention et l'extubation est réalisée à J6. Evolution favorable avec sevrage rapide en Noradrénaline le 20 / 06 /
99. Stabilité hémodynamique initiale correcte avec sevrage progressif en Noradrénaline obtenu à J3. Les suites du
choc hypovolémique hémorragique sont simples, avec sevrage de noradrénaline à J3 et extubation à J2. L'évolution
est alors favorable avec Instauration d'une corticothérapie ayant permis un sevrage rapide de la Noradrénaline, La
patiente est sevrée de noradrénaline le 16 / 06 / 00. Le patient est sevré de Noradrénaline le 13 / 05 / 00. La
Noradrénaline est sevrée dans la nuit du 20 au 21 / 01. Après remplissage vasculaire par 1000 cc de Plasmion et
1000 cc d'Elohes, la Noradrénaline est rapidement sevrée
sevrage (OBJET) Noradrénaline
RTO
système
texte
sevrage en noradrénaline sevrage de la noradrénaline
sevrage Adj? [de|en] la? noradrénaline
sevré de noradrénaline
noradrénaline être Adv? sevré
sevrage_Noradrénaline
CONCEPT
termes
patrons
Couches de TAL pour construire une ontologie (Buitelaar, EACL 2006)
Oct 2012 - IST 43 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Séquence de mots (texte)
Termes
Synonymes (multilingues)
Concepts
Hiérarchie de concepts
Autres relations
Schémas d’axiomes
{père, papa, géniteur}
{mari, conjoint, époux}
Personne, père, père adoptif,
enfant, grand-parent
C:père = {René,…}, {personne qui a 1 enfant}
PèreAdoptif est_un père
personne est_un êtreVivant
Axiomes, règles
estParentDe(Personne, personne) ;
habiteDans(personne, ville)
Disjoint(personne, ville)
Toute personne a au plus 1 mère
Extraire des termes
Termes
Unité lexicale complexe qui fait sens dans le domaine
Candidats
Père connaissance
Père adoptif acquisition de connaissances
Père adoptif de l’enfant Acquisition de K du domaine
. Acquisition de connaissances du jour
Difficultés
Trop de candidats : comment sélectionner ?
Quels sont les bons termes pour mon ontologie ?
Notion de termhood (« termitude ») = importance, représentativité
du candidat dans le domaine
Oct 2012 - IST 44 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Techniques pour identifier des termes
Linguistiques
= caractériser la syntaxe des termes par des patrons
N, N prep det N, Adj N; N adj, …
Exploiter les frontières : det, prep, verbes
Exploiter les noms propres, mots vides …
Statistiques
Co-occurrences, segments répétés
Comparaison de la fréquence dans le corpus % à la langue
générale
Hybrides
Utiliser les statistiques pour filtrer les termes
Combiner patrons + co-occurrences pour trouver des candidats
Oct 2012 - IST 45 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Extracteurs de termes « linguistiques »
Patrons appris sur corpus annoté : ANA (Daille)
Frontières négatives Lexter ( Bourigault, 2000)
Patrons exploitant les dépendances grammaticales :
SYNTEX (Bourigault, 2003)
Oct 2012 - IST 46 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
TermoStat (Drouin, 2007) : ex de patrons
TermoStat Web
http://olst.ling.umontreal.ca/~drouinp/termostat_web/
Oct 2012 - IST 47 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Termostat : score de spécificité
Oct 2012 - IST 48 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Termostat : Critères de sélection des termes
Fréquence Spécificité
Relations syntaxiques entre termes /productivité
Oct 2012 - IST 49 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 50 De la construction d'ontologies à l'annotation sémantique -
N. Aussenac-Gilles
Couches de TAL pour construire une ontologie
Séquence de mots (texte)
Termes
Synonymes (multilingues)
Concepts
Hiérarchie de concepts
Autres relations
Schémas d’axiomes
{père, papa, géniteur}
{mari, conjoint, époux}
Personne, père, père adoptif,
enfant, grand-parent
C:père = {René,…}, {personne qui a 1 enfant}
Axiomes, règles
estParentDe(Personne, personne) ;
habiteDans(personne, ville)
Disjoint(personne, ville)
Toute personne a au plus 1 mère
PèreAdoptif est_un père
personne est_un êtreVivant
Recherche de synonymes en français
Ressources exploitables Dictionnaires de synonymes (Dicosyn (U. de Caen, ~200 000
couples)
Ressources lexicales (Synset de Wordnet)
Logiciel SYNOTERM (Hamon, 2006) : Exploiter la structure des termes et des dictionnaires de
synonymes + vérifier en corpus:
Si A et B sont synonymes,
Si NA et NB existent en corpus
Alors proposer NA synonyme de NB
Problème : la relation de synonymie est contextuelle Identifier des relations de synonymie pertinentes
pour le domaine
pour l’application
Oct 2012 - IST 51 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Synonymie inter-langue
Techniques statistiques
Clustering
Classer les termes selon leur distribution
2 termes sont groupés dans une classe s’ils sont utilisés dans les
mêmes contextes
Classification
Associer des candidats termes à des classes déjà définies
Exploiter des corpus parallèles
Même texte exprimé dans 2 langues
Oct 2012 - IST 52 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Couches de TAL pour construire une ontologie (Buitelaar, EACL 2006)
Oct 2012 - IST 53 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Séquence de mots (texte)
Termes
Synonymes (multilingues)
Concepts
Hiérarchie de concepts
Autres relations
Schémas d’axiomes
{père, papa, géniteur}
{mari, conjoint, époux}
Personne, père, père adoptif,
enfant, grand-parent
C:père = {René,…}, {personne qui a 1 enfant}
Axiomes, règles
estParentDe(Personne, personne) ;
habiteDans(personne, ville)
Disjoint(personne, ville)
Toute personne a au plus 1 mère
PèreAdoptif est_un père
personne est_un êtreVivant
Typologie des méthodes de structuration
Méthodes structurelles Exploitent sur la structure syntaxique interne des candidats
termes («endotermes»)
Composition syntaxique
Variation morpho-syntaxique, lexicale
Méthodes contextuelles Exploitent les contextes de co-occurrence des candidats termes
(«exotermes»)
Locales : une relation extraite pour une occurrence
Patrons
Globales : des relations extraites à partir d’un ensemble d’occurrences
Cooccurrence statistique
Analyse distributionnelle
Oct 2012 - IST 54 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Méthode structurelle : dépendance syntaxique
Dépendance syntaxique
Chaque terme complexe se décompose en une Tête et une
Expansion
Séries paradigmatiques
Oct 2012 - IST 55 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
ontologie ~
---- disponible
---- définie
---- explicite
---- formelle
---- référentielle
---- régionale
---- résultante
---- spécialisée
---- universelle
T ---- concepteur
---- conception
---- construction
---- maintenance
---- raffinement
---- structure
---- usage
---- validation
---- vérification
~ de base de connaissance
E
« Tous les Nom Adj sont des Nom » est faux
Oct 2012 - IST 56 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
38 syndrome septique
35 syndrome infectieux
29 Syndrome alvéolaire
28 syndrome dépressif
27 syndrome confusionnel
23 syndrome de défaillance
19 syndrome bilatéral
18 syndrome inflammatoire
17 Syndrome fébrile
16 syndrome de défaillance multiviscérale
14 syndrome pyramidal
14 syndrome alvéolaire bilatéral
14 Syndrome abdominal
14 syndrome occlusif
11 syndrome de sevrage
… …
SYNDROME
SYNDROME_CLINIQUE
anasarque
apnée du sommeil
…
syndrome bronchique
syndrome cave
syndrome confusionnel
…
SYNDROME_MIXTE
état de mort encéphalique
rhabdomyolyse
…
syndrome de défaillance multiviscérale
syndrome de détresse respiratoire aiguë
…
SYNDROME_PARACLINIQUE
syndrome alvéolaire
syndrome alvéolo-interstitiel
…
CT : syndrome ~ Taxinomie de concepts
Méthode structurelle : variation
Principe général (Daille, 2009)
Si
CT1 = [ A B1 ]
CT2 = [ A B2 ]
Et
B1 REL B2
Alors
CT1 REL CT2
Exemples
Variation morphosyntaxique
transférer en réanimation transfert en réanimation
patient transféré transfert du patient
Variation lexicale
hausse de la température augmentation de la température
Oct 2012 - IST 57 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Variation morphosyntaxique
Type de relations
verbe – nom (transférer un = transfert du)
nom – adjectif (transfert de / transférable)
…
Méthodes exogènes : avec ressources lexicales
Celex
Verbaction (ERSS, N. Hathout) : verbe – nom
Méthodes endogène : sans ressource externe Règles de troncation + validation sur corpus
Oct 2012 - IST 58 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Variation morphosyntaxique : des résultats
Une productivité réduite, mais des résultats fiables
Corpus REA : environ 200 couples SV-SN
arrêter les antibiotiques, arrêt des antibiotiques, antibiotiques arrêtés
drainer un pneumothorax, drainage du pneumothorax
lever une atélectasie, levée de l’atélectasie
Corpus Code Civil : environ 100 couples SV-SN
le conseil de famille autorise, autorisation du conseil de famille
établir la filiation, filiation établie
révoquer la donation, révocation de la donation, donation révoquée
Oct 2012 - IST 59 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Couches de TAL pour la construction
d’ontologies (Buitelaar, EACL 2006)
Oct 2012 - IST 60 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Séquence de mots (texte)
Termes
Synonymes (multilingues)
Concepts
Hiérarchie de concepts
Autres relations
Schémas d’axiomes
{père, papa, géniteur}
{mari, conjoint, époux}
Personne, père, père adoptif,
enfant, grand-parent
C:père = {René,…}, personne qui a 1 enfant}
Axiomes, règles
estParentDe(Personne, personne) ;
habiteDans(personne, ville)
Disjoint(personne, ville)
Toute personne a au plus 1 mère
PèreAdoptif est_un père
personne est_un êtreVivant
Méthodes contextuelles locales :
patrons de relation
Exemples : un … est un … qui
tous les …, sauf …,
… et …
Problèmes Généralités vs. spécificité (domaine, type de textes)
Relations
Patrons
Prétraitements : quels indices exploiter ?
Lexique, POS, relations syntaxiques SUJET-OBJET…,
Valider des patrons généraux
Cf. Cameléon
Acquérir des patrons spécifiques
Technique itérative (Hearst, 1992)
Apprentissage automatique
Oct 2012 - IST 61 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Méthodes contextuelles globales :
cooccurrence
Méthodes classiques en informatique documentaire
Création automatique de thesaurus
Cooccurrence statistique
1er ordre
Les unités qui cooccurrent avec le mot pivot dans une fenêtre
donnée (phrase, paragraphe, +- n mots)
2ème ordre
Les unités qui ont les mêmes cooccurrents que le mot pivot
Oct 2012 - IST 62 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Méthode contextuelle globale :
analyse distributionnelle
Analyse distributionnelle (Zellig S. HARRIS)
Deux termes sont rapprochés s’ils apparaissent dans les mêmes
contextes syntaxiques.
Oct 2012 - IST 63 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
ontologie taxinomie
insertion dans ~
classer dans ~
structurer ~
organisation de ~
réaliser ~
contextes
Analyse distributionnelle :
choix méthodologiques
Analyse syntaxique en entrée
syntagmes nominaux / syntagmes verbaux
Données (unités rapprochées, contexte)
structures élémentaires / structures complexes
Mesures de proximité
Jaccard / Jaccard pondéré / …
Types de regroupement
Couples / classes / cliques / …
Oct 2012 - IST 64 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Logiciels
Extraction de relations
Caméléon -> démo
Terminoweb http://termino.iit.nrc.ca/index.jsp
Chaînes de traitements
text2Onto http://ontoware.org/projects/text2onto/
Un projet européen : NEON http://www.neon-project.org/
Un projet pour le français : DAFOE http://dafoe4app.fr/
Oct 2012 - IST 65 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Couches de TAL pour la construction
d’ontologies (Buitelaar, EACL 2006)
Oct 2012 - IST 66 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Séquence de mots (texte)
Termes
Synonymes (multilingues)
Concepts
Hiérarchie de concepts
Autres relations
Schémas d’axiomes
{père, papa, géniteur}
{mari, conjoint, époux}
Personne, père, père adoptif,
enfant, grand-parent
C:père = {René,…}, personne qui a 1 enfant}
Axiomes, règles
estParentDe(Personne, personne) ;
habiteDans(personne, ville)
Disjoint(personne, ville)
Toute personne a au plus 1 mère
Si Pere(x,y) et Pere(y,z) alors GrandPere(X,Z)
PèreAdoptif est_un père
personne est_un êtreVivant
Oct 2012 - IST 67
4 - Annotation sémantique,
extraction d’information :
convergences
La diversité des annotations
L’annotation de documents textuels : de la langue aux
représentations formelles
Quelques logiciels d’annotation
À l’heure du web des données
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Annotations et méta-données
Annotation comme objet Information associée à une page existante
Information manipulable par un système informatique
Information qui peut être séparée des données annotées
Annotation vs méta-donnée vs index Méta-donnée
Plutôt normalisée, catégories définies a priori et souvent séparée du document (fichier à part)
Ex : Dublin Core
Annotation
Plutôt liée au domaine, définie A LA MAIN ou automatiquement, APRES création du document, complète le document
Index
Plutôt lié au contenu, calculé AUTOMATIQUEMENT à partir du document (APRES création), stocké à part, se substitue au document
Oct 2012 - IST 68 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 69
Emprunté à Y. Prié, cours M2R 2005-2006
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 71 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Processus d’annotation sémantique
2 types d’annotations Associer des concepts à tout le document ou à chaque
paragraphe (annotation conceptuelle)
Localiser précisément les mots correspondant aux concepts (annotation sémantique)
2 types de processus / de logiciels Manuel : interface pour « poser » des annotations (ex: Magpie,
Notator)
Automatique : logiciel de production d’un index sémantique
Oct 2012 - IST 72 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Annotation sémantique de documents textuels
Annotation comme processus
But
Construire une représentation de chaque document
formée de concepts (et de relations entre concepts)
Les indices linguistiques comme pivots
Retrouver des traces linguistiques de concepts /
d’instances de concepts / dans les textes
Retrouver des traces linguistiques de relations
Oct 2012 - IST 73 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Indices
linguistiques
Processus d’annotation sémantique
Indices pour annoter termes importants ou mots clés
présents dans l’ontologie
= étiquettes des concepts (labels ou Id)
Annoter Enregistrer les concepts
associés
Résultat de l’annotation (suivant les approches) Liste de concepts
Liste d’instances de concepts
Graphe de concepts
Graphe d’instances de concepts
Oct 2012 - IST 74 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Graphe d’annotation
Graphe de relations entre
instances
Graphe connexe
Ensemble de triplets
conformes au modèle de
l’ontologie
Oct 2012 - IST 75 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Processus d’annotation
Ex de difficultés
Ontologie : concept « rouler » > comment reconnaître roulage ?
Ontologie : concepts « perte de puissance » et « puissance » :
comment choisir « perte de puissance » ?
Ontologie : « perte de puissance » EST-UN « problème » : faut-il
annoter avec le concept le plus spécifique ? Le plus générique ?
Les deux ?
Phrase : (à haut régime) :
parenthèses: faut-il en tenir compte ? Comment les interpréter ?
Fin de phrase : comment savoir que « haut régime » est associé au
moteur et pas à « autoroute » ?
Oct 2012 - IST 76 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Processus d’annotation : fonctions de TAL
essentielles
Calculer la distance entre 2 termes
Distances entre chaînes de caractères (dist lexicales)
Basée sur des n-grammes, souvent 3-grammes : chat et chaton ont
en commun {cha, hat} (mesure de Lin, 1998)
Distance d’édition (Levenshtein, 1996)
E(T1,T2) = nbre d’opérations pour passer de T1 à T2
String matching (Maedche et Staab, 2002)
Distances entre termes composés de plusieurs mots
Distance entre vecteurs de mots
Oct 2012 - IST 77 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Couches de TAL pour l’annotation
sémantique (Buitelaar, EACL 2006)
Oct 2012 - IST 78 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Séquence de mots (texte)
Termes
Synonymes (multilingues)
Concepts
Hiérarchie de concepts
Autres relations
Schémas d’axiomes
{père, papa, géniteur}
{mari, conjoint, époux}
Personne, père, père adoptif,
enfant, grand-parent
C:père = {René,…}, personne qui a 1 enfant}
Axiomes, règles
estParentDe(Personne, personne) ;
habiteDans(personne, ville)
Disjoint(personne, ville)
Toute personne a au plus 1 mère
PèreAdoptif est_un père
personne est_un êtreVivant
Annotation sémantique avec TextAnnot http://themat2i.univ-pau.fr:8080/TextAnnot-WWW/index.jsp
Le processus Projette les termes de la RTO des fiches à annoter
indexation avec le moteur Lucène
distance entre termes basée sur des trigrammes
Génère des instances de termes
Pour chaque terme, génère une instance DU (seul) concept associé
Met en relation les instances de concepts reconnus lorsque les termes sont proches dans la même phrase
Les met en relation avec le type de relation proposé dans l’ontologie
Le résultat Graphe d’instances, connexe
Ensemble de triplets d’instances ajoutées à l’ontologie
Oct 2012 - IST 79 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Annotation sémantique avec TextAnnot http://themat2i.univ-pau.fr:8080/TextAnnot-WWW/index.jsp
Oct 2012 - IST 80 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 81
Cycle de vie des annotations
Nouveaux documents Nouveaux concepts
Nouvelle terminologie
Gestion des évolutions des annotations
Assurer la cohérence entre ontologie / annotation et corpus
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Outils d’annotation
Annotation en RDF Annotea
W3C
Protocole de transfert d’annotation vers/de un serveur central
Un schéma minimal, extensions possibles, classement des topics
Implémentations : Amaya
Annotation sémantique en RDFs CREAM (CREAting Metadata)
Framework pour l’annotation / édition
Notion de méta-données relationnelle (ie. basées sur les ontologies)
Ontomat
http://annotation.semanticweb.org/tools/ontomat
Annotation sémantique à l’aide de graphes conceptuels Web Knowledge Base – http://www.webkb.org/
Oct 2012 - IST 82 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 83
CREAM
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
KIM (Kyriakov et al., 2004)
But = annoter des pages web
Implémentation = plug-in du navigateur
Mise à disposition d’une ontologie “générale” qui renvoie
à des noms propres (lieux, personnes, entreprises, etc)
Disponible à http://www.ontotext.com/kim
Oct 2012 - IST 84 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 85
KIM
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 86 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 87 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 88 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 89 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
5 – à l’heure du web des données
Nouveaux enjeux
Associer données et ontologies
Annoter avec des ontologies peuplées de données
Extraire des données pour annoter
Annoter pour naviguer
Nouveauté
Quantité, disponibilité des données
Continuité des problèmes linguistiques
Ambigüité, références, variation, …
Oct 2012 - IST 90 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
DBPedia Spotlight
Début en Juin 2010, réalisé par les chercheurs du Web Based
Systems Group de la Free University of Berlin
Disponible pour l’anglais, internationalisation en cours
Open source web service
Spotting: Keyphrase Extraction and Named Entity Recognition
Desambiguation : choisit la bonne classe en fonction du contexte
Annotation : retourne les résultats de l’annotation avec le “meilleur” concept pour
chaque expression annotée
Candidats : retourne toutes les possibilités d’annotation de chaque expression
http://dbpedia-spotlight.github.com/demo/#
Oct 2012 - IST 91 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
DBpedia Spotlight is a tool for annotating mentions of DBpedia resources
in text, providing a solution for linking unstructured information sources to
the Linked Open Data cloud through DBpedia.
http://en.wikipedia.org/wiki/DBpedia_Spotlight
Oct 2012 - IST 92 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Fred : extraire et annoter par des graphes
FRED http://wit.istc.cnr.it/stlab-tools/fred/
analyse des phrases en langage naturel
bien formées en anglais (verbe)
produit des fragments d'ontologies et de données liées
en RDF/OWL
Principes
reconnaissance des relations du verbe (FrameNet et VerbNet)
représentation logique compatible avec DRT (discourse
representation theory)
application de patrons de conception d'ontologie (ontology design
patterns) pour bien former les fragments
Analyseurs utilisés
C&C http://svn.ask.it.usyd.edu.au/trac/candc
Boxer http://svn.ask.it.usyd.edu.au/trac/candc/wiki/boxer
Oct 2012 - IST 93 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 94 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 95 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 96 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 97 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Tipalo : extraire des graphes locaux
Tipalo http://wit.istc.cnr.it/stlab-tools/tipalo/
But :
générer un graphe d’entités d’une page Wikipedia
Sorte « d’annotation » de la page
Graphe RDF composé de rdf:type, rdfs:subClassOf, owl:sameAs,
et owl:equivalentTo
Méthode
Utilise FRED
Affecte automatiquement un type aux entités nommées
Oct 2012 - IST 98 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
http://en.wikipedia.org/wiki/Isabelle_Huppert
Oct 2012 - IST 99 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 100 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Annoter pour naviguer via les données
Aemoo http://wit.istc.cnr.it/aemoo/index.html
But : recherche exploratoire sur le Web.
Entrée : des mots clés
Résultat : réseau autour de cette entité
Sources exploitées :
Les textes de Wikipedia, Twitter, et Google News
Plus riche que DBpedia (qui représente seulement 7de
Wikipedia).
Oct 2012 - IST 101 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Aemoo n’aime que les entités, pas les classes
Oct 2012 - IST 102 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Aemoo aime bien les entités
Oct 2012 - IST 103 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Inquire : intelligent textbook http://www.aaaivideos.org/2012/inquire_intelligent_textbook/
Ontologie de 5000
concepts
Editeur de graphes
Annotation
manuelle
Oct 2012 - IST 104 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Inquire : annotation par des graphes
Oct 2012 - IST 105 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Inquire : interrogation
Oct 2012 - IST 106 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Le graphe / concept réponse
Oct 2012 - IST 107 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Afficher la réponse : document reconstruit
Oct 2012 - IST 108 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Discussion: web des données, web sémantique
Le web des données
Plus de données
Format homogène
Processus continu d’enrichissement
L’espoir / l’illusion : plus réaliste que le web sémantique
Annotations plus faciles
Ressources disponibles pour annoter, couvrant tout domaine
Faire émerger du sens de la quantité
La réalité
Typer les données
Assurer des passerelles entre données (aligner, associer)
Les problèmes d’annotation demeurent
Oct 2012 - IST 109 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Oct 2012 - IST 110
Convergences : les difficultés qui demeurent
Sur les données pour annoter Relier les données => les typer => ontologies
Ontologie => point de vue sur le document
Extraire des triplets vs donner du sens
Sur l’annotation en général Statut des annotations, droits % documents et auteurs
Qui annote, quand, pour qui
Place, stockage des annotations
Sur l’annotation sémantique Orientation des interprétations, des usages, requêtes etc.
Gestion des évolutions
Guidage par le document (et adaption du schéma) vs par l’ontologie
De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles
Convergences : les difficultés qui demeurent
Outils d’annotation Automatisation => articulation lexique-ontologie et/ou TAL
Architectures différentes selon usage prévus
En pleine expansion
Nécessite des développements en apprentissage et TAL
Ce que je n’ai pas développé : exploiter le web 2.0
Les tags sont-ils des annotations ?
Méta-données ? Mots-clés ou pense-bête ?
Quel rapport à l’objet documentaire taggé ?
Folksonomies pour construire / remplacer les ontologies
Oct 2012 - IST 111 De la construction d'ontologies à l'annotation sémantique - N. Aussenac-Gilles