15
Christophe CRUZ [email protected] - Equipe de projet Checksem – Laboratoire Electronique Informatique et Image (LE2I – UMR CNRS 6306) IUT Dijon-Auxerre – Université de Bourgogne, BP 47870, 21078 Dijon Cedex, France Laboratoire LE2I – UMR CNRS 6306 – Université de Bourgogne Système de recommandation sémantique de news économiques pour la veille économique 5 Novembre 2014 |Paris

Système de recommandation sémantique de news économiques pour la veille économique

Embed Size (px)

DESCRIPTION

De nos jours dans les secteurs commerciaux et financiers, la veille électronique d’articles économiques est cruciale. Maintenir une veille efficace implique de cibler les articles à consulter, car la charge d’information est importante. Pour répondre à cette problématique, nous proposons un système novateur de recommandation d’articles, car il s’appuie sur l’intégration d’une description sémantique des items et des profils basés sur une modélisation ontologique des connaissances. Notre approche s’établit sur l’adéquation de la recommandation aux besoins des utilisateurs. Pour cela, nous avons mené une enquête auprès des clients-lecteurs pour définir les critères qui pourraient permettre la personnalisation du contenu de la revue. Les résultats de l’enquête ainsi que la connaissance des experts du domaine ont permis de mettre en avant les trois critères principaux suivants : les Thèmes (principaux évènements économiques traités dans l’article), les secteurs économiques dont traitent l’article, et les Localisations. Les développements réalisés dans le cadre de ce projet se composent des trois axes suivants. Le premier axe se caractérise par le développement d’une architecture sémantique pour l’annotation, l’indexation de documents, le profilage des clients, et finalement la recommandation de revues économiques. Le deuxième axe résident dans l’ontologie de domaine réalisée en coopération avec les documentalistes de la société Actualis. Cette ontologie constitue la connaissance métier permettant l’annotation et l’indexation des articles économiques. Le dernier axe se compose du moteur de recommandation exploitant la connaissance métier afin de calculer une similarité asymétrique entre chaque article économique indexé et chaque profil utilisateur. Suites au retour d’expériences fournies par le prototype développé l’année précédente, nous avons pu mettre en production un outil fonctionnel commercialisé depuis début février. Les technologies employées dans l’architecture technique de la solution en production se composent de triplestores pour stocker les connaissances, les documents, les profils, et interaction utilisateurs, etc. Le modèle de données sémantiques se traduit par l’usage des langages RDF et OWL-DL. Les contraintes logiques de ce second sont exploitées à son maximum dans le processus de classification hiérarchique multiétiquette et automatique des documents dans un modèle prédictif ontologique.

Citation preview

Page 1: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Laboratoire LE2I – UMR CNRS 6306 – Université de Bourgogne

Système de recommandation sémantique de news économiques pour la veille économique

5 Novembre 2014 |Paris

Page 2: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Le Web sémantique

« Le web sémantique ne fonctionnera jamais ! »

Page 3: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Sciences de la nutrition

Physique

Théologie

Numérique

Botanique

Politique

Agriculture

Culture

Le Web sémantique

Page 4: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Le Web sémantique

Semantic Error 409 – Ontology Not Found

You’ve encountered a " Ontology Not Found" error while trying to access a semantic term grounded on the University of Burgundy Laboratory LE2I Cheksem web server.

Page 5: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Le Web sémantique

13 ans après … « La pile technologique du Web sémantique »

Page 6: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Approche Symbolique Approche Numérique

• Taille, Dimension, poids • Couleur, Type de matériaux • Valeur financière

• Espaces et usages • Organisation architecturale • Confort, dessert et facilités d’accès

Evaluation quantitative entre éléments spécifiques

Evaluation qualitative Sémantique sur un environnement

SEMIOTIQUE

Positionnement

Page 7: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Point de vue sémiotique :

Sémiotique: étudie le processus de signification c’est-à-dire la production, la codification et la communication de signes.

• Syntaxe: un ensemble de signes qui font sens pour des humain, pas pour la machine • Sémantique: relation entre les signes et des entités du monde réel • Pragmatique: quels signes sont utilisés dans quel but ? • Social : qui utilise quels signes.

Positionnement

Page 8: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

L’entreprise Actualis Sarl …

Introduction

8

Page 9: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Introduction

L’existant

Les clients n’ont pas tous les mêmes besoins.

Les clients ont besoin d’accéder rapidement à l’information.

Experts veille Rédacteurs Clients

Articles

Clients

Page 10: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Introduction

10

Le besoin

Objectif, donner la bonne information au bon client.

Experts veille Rédacteurs

Client Articles

Page 11: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Les Acteurs et Processus

Vocabulaire(s) contrôlé(s)

Introduction

11

Je comprends les besoins des clients

Je sais ce que je veux Je sais qualifier l’information

Experts veille Rédacteurs

Experts Vente Profilage

Client

1001001001010100 ?

Processus de recommandation

Page 12: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Quelles connaissances ?

12

Vocabulaires contrôlés

Choix des critères (facettes)

Questionnement des clients et des experts

Principaux : Secteur, Thème, Localisation, Date

Secondaires: Temporalité, Taille de l’entreprise, Type de site

Gestion du vocabulaire contrôlé général (Localisation)

Recoupement vocabulaire existant (INSEE IGN, Geonames)

Mise en place de connaissances géospatiales dans l’ontologie

Gestion du vocabulaire contrôlé métier (Secteur, Thème)

Extraction des qualificatifs (folksonomie)

Recherche de vocabulaires existants (NAF, Eurovoc, Delphes, etc)

Création des thésaurus

12

Page 13: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Architecture

13

Page 14: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

14

Le produit – interface cliente

Page 15: Système de recommandation sémantique de news économiques pour la veille économique

Ch

rist

op

he

CR

UZ

chri

sto

ph

e.cr

uz@

u-b

ou

rgo

gne.

fr -

Eq

uip

e d

e p

roje

t C

hec

ksem

– L

abo

rato

ire

Elec

tro

niq

ue

Info

rmat

iqu

e et

Imag

e

(LE2

I –

UM

R C

NR

S 63

06)

IUT

Dijo

n-A

uxe

rre

– U

niv

ersi

té d

e B

ou

rgo

gne,

BP

47

87

0, 2

10

78

Dijo

n C

ed

ex, F

ran

ce

Laboratoire LE2I – UMR CNRS 6306 – Université de Bourgogne