Upload
semwebpro
View
253
Download
1
Embed Size (px)
DESCRIPTION
De nos jours dans les secteurs commerciaux et financiers, la veille électronique d’articles économiques est cruciale. Maintenir une veille efficace implique de cibler les articles à consulter, car la charge d’information est importante. Pour répondre à cette problématique, nous proposons un système novateur de recommandation d’articles, car il s’appuie sur l’intégration d’une description sémantique des items et des profils basés sur une modélisation ontologique des connaissances. Notre approche s’établit sur l’adéquation de la recommandation aux besoins des utilisateurs. Pour cela, nous avons mené une enquête auprès des clients-lecteurs pour définir les critères qui pourraient permettre la personnalisation du contenu de la revue. Les résultats de l’enquête ainsi que la connaissance des experts du domaine ont permis de mettre en avant les trois critères principaux suivants : les Thèmes (principaux évènements économiques traités dans l’article), les secteurs économiques dont traitent l’article, et les Localisations. Les développements réalisés dans le cadre de ce projet se composent des trois axes suivants. Le premier axe se caractérise par le développement d’une architecture sémantique pour l’annotation, l’indexation de documents, le profilage des clients, et finalement la recommandation de revues économiques. Le deuxième axe résident dans l’ontologie de domaine réalisée en coopération avec les documentalistes de la société Actualis. Cette ontologie constitue la connaissance métier permettant l’annotation et l’indexation des articles économiques. Le dernier axe se compose du moteur de recommandation exploitant la connaissance métier afin de calculer une similarité asymétrique entre chaque article économique indexé et chaque profil utilisateur. Suites au retour d’expériences fournies par le prototype développé l’année précédente, nous avons pu mettre en production un outil fonctionnel commercialisé depuis début février. Les technologies employées dans l’architecture technique de la solution en production se composent de triplestores pour stocker les connaissances, les documents, les profils, et interaction utilisateurs, etc. Le modèle de données sémantiques se traduit par l’usage des langages RDF et OWL-DL. Les contraintes logiques de ce second sont exploitées à son maximum dans le processus de classification hiérarchique multiétiquette et automatique des documents dans un modèle prédictif ontologique.
Citation preview
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Laboratoire LE2I – UMR CNRS 6306 – Université de Bourgogne
Système de recommandation sémantique de news économiques pour la veille économique
5 Novembre 2014 |Paris
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Le Web sémantique
« Le web sémantique ne fonctionnera jamais ! »
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Sciences de la nutrition
Physique
Théologie
Numérique
Botanique
Politique
Agriculture
Culture
Le Web sémantique
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Le Web sémantique
Semantic Error 409 – Ontology Not Found
You’ve encountered a " Ontology Not Found" error while trying to access a semantic term grounded on the University of Burgundy Laboratory LE2I Cheksem web server.
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Le Web sémantique
13 ans après … « La pile technologique du Web sémantique »
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Approche Symbolique Approche Numérique
• Taille, Dimension, poids • Couleur, Type de matériaux • Valeur financière
• Espaces et usages • Organisation architecturale • Confort, dessert et facilités d’accès
Evaluation quantitative entre éléments spécifiques
Evaluation qualitative Sémantique sur un environnement
SEMIOTIQUE
Positionnement
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Point de vue sémiotique :
Sémiotique: étudie le processus de signification c’est-à-dire la production, la codification et la communication de signes.
• Syntaxe: un ensemble de signes qui font sens pour des humain, pas pour la machine • Sémantique: relation entre les signes et des entités du monde réel • Pragmatique: quels signes sont utilisés dans quel but ? • Social : qui utilise quels signes.
Positionnement
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
L’entreprise Actualis Sarl …
Introduction
8
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Introduction
L’existant
Les clients n’ont pas tous les mêmes besoins.
Les clients ont besoin d’accéder rapidement à l’information.
Experts veille Rédacteurs Clients
Articles
Clients
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Introduction
10
Le besoin
Objectif, donner la bonne information au bon client.
Experts veille Rédacteurs
Client Articles
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Les Acteurs et Processus
Vocabulaire(s) contrôlé(s)
Introduction
11
Je comprends les besoins des clients
Je sais ce que je veux Je sais qualifier l’information
Experts veille Rédacteurs
Experts Vente Profilage
Client
1001001001010100 ?
Processus de recommandation
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Quelles connaissances ?
12
Vocabulaires contrôlés
Choix des critères (facettes)
Questionnement des clients et des experts
Principaux : Secteur, Thème, Localisation, Date
Secondaires: Temporalité, Taille de l’entreprise, Type de site
Gestion du vocabulaire contrôlé général (Localisation)
Recoupement vocabulaire existant (INSEE IGN, Geonames)
Mise en place de connaissances géospatiales dans l’ontologie
Gestion du vocabulaire contrôlé métier (Secteur, Thème)
Extraction des qualificatifs (folksonomie)
Recherche de vocabulaires existants (NAF, Eurovoc, Delphes, etc)
Création des thésaurus
12
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Architecture
13
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
14
Le produit – interface cliente
Ch
rist
op
he
CR
UZ
chri
sto
ph
e.cr
uz@
u-b
ou
rgo
gne.
fr -
Eq
uip
e d
e p
roje
t C
hec
ksem
– L
abo
rato
ire
Elec
tro
niq
ue
Info
rmat
iqu
e et
Imag
e
(LE2
I –
UM
R C
NR
S 63
06)
IUT
Dijo
n-A
uxe
rre
– U
niv
ersi
té d
e B
ou
rgo
gne,
BP
47
87
0, 2
10
78
Dijo
n C
ed
ex, F
ran
ce
Laboratoire LE2I – UMR CNRS 6306 – Université de Bourgogne