Création d une ontologie de recommandation de film

Embed Size (px)

DESCRIPTION

ceci est les slides du projet de creation de systeme de recommandation de film a l'aide du modéle d'ontologie et des outils comme JENA API et Protégé..

Citation preview

  • quipe ACASA

    THME

    1

    Construction dune Ontologie pour laRecommandation de Films un

    Utilisateur

    Latifa Baba-Hamed, Soltani Rda et Sabri KamelUniversit dOran, Facult des Sciences, Dpartement

    [email protected]

    IC 2010: Atelier GBPOnto 08 juin 2010

  • Plan de travail Introduction

    Les systmes de recommandation

    Les ontologies

    Architecture gnrale du systme

    Construction de lontologie Dfinition des classes et de la hirarchie des classes

    Dfinition des proprits des classes

    Conclusion et perspectives2

  • Introduction

    Une ontologie est la spcification duneconceptualisation dun domaine de connaissances,cest--dire, quil est possible de classifier deslments dun domaine donn par concepts et sous-concepts et de crer tout type de relations entre leslments et les concepts.

    Nous construisons une ontologie pour filtrer desrequtes utilisateur dans le domaine du cinma.

    3

  • DfinitionUn systme de filtrage (ou systme derecommandation), est un systme qui collecte,slectionne, classifie et suggre lutilisateur lesinformations qui rpondent vraisemblablement sesintrts long terme.

    Types de systmes de filtrage Filtrage collaboratif Filtrage bas sur le contenu

    Les systmes de filtrage

    4

  • Filtrage collaboratif Il compare les utilisateurs entre eux sur la base de leurs

    jugements passs pour crer des communauts, etchaque utilisateur reoit les documents jugs pertinentspar sa communaut.

    Filtrage bas sur le contenuIl compare les nouveaux documents au profil delutilisateur, et recommande ceux qui sont les plusproches. Cette classe de systmes utilise des mesuresde similarit pour dfinir le degr de ressemblanceentre concepts.

    Les systmes de filtrage

    5

  • Les systmes de filtrage

    6

    Mystre Horreur FilmNoir

    Thriller

    Comdie Romance Musical

    Drame

    Film

    Approches bases sur les arcs

    0.120.09

    0.21

    Approches bases sur les nuds Approches hybrides Approches bases sur lespace vectoriel

    Mesure de Wu & Palmer :Mesure de Lin :Distance (c1, c2) = CI (c1) + CI (c2) (2.CI (PPG (c1, c2)))

    Mesure de Jiang & Conrath :

    Classification des mesures de similarit

    N2

    N1

    N

    PPG:PlusPeAtGnralisant

    CI(c)=log(P(c))

    Avec:

    MesuredePearson: Avec:

  • Les ontologiesDegr

    dabstraction

    Ontologiesglobales

    Ontologiesde domaine

    Ontologiesdapplication

    Conceptsgnraux

    Spcialisationdes concepts

    gnraux

    Spcialisationdes rles des

    concepts

    7Types dontologies

  • Mthodologie de construction Spcifier l'application Organiser les termes en utilisant les mtas

    catgories Affiner l'ontologie et la structurer

    8

    Les ontologies

  • Les ontologies

    Le langage OWLOWL (w3c : http://www.w3.org) est une reprsentationen XML bas sur la syntaxe RDF dune ontologie. Ilpermet de dfinir des ontologies.

    Sous-langages dOwl

    9

    OWL Full

    OWL DL

    OWLLite

  • Structure dune ontologie crite en OWL

    Les ontologies

    10

    En-ttes d'une ontologie

    Corps dune ontologie Classes Proprits Instances

    Espaces de nommage

    Ontologie

  • 11

    Architecture Gnrale du Systme

  • 12

    Architecture Gnrale du SystmeDescriptif du profil utilisateur Le profil de lutilisateur est reprsent par un ensemble de

    prdicats pondrs: {(P1, w1), (P2, w2), }. Un prdicat est de la forme o: attribut est un lment du profil, est un oprateur de comparaison, valeur est une valeur au domaine de lattribut du profil. Par exemple: P1 : Un utilisateur U1 qui a une grande prfrence pour les films

    daction peut attribuer ce prdicat une pondration (poids)w1=0,9 par exemple.

    Le profil de lutilisateur U1 sera donc constitu des pairesdlments : (P1, w1), (P2, w2), etc.

    Nous procdons de la mme faon pour reprsenter ledescriptif dun film.

  • 13

    Construction de lontologieNotre application ncessite une ontologie de films, qui doitnous permettre de calculer le degr de ressemblance entredes genres de films (ie faire le matching entre les genres defilms prfrs par un utilisateur et les genres associs unfilm donn [Soltani & Sabri, 2009]) dans le but derecommander une liste de films un utilisateur.

    Nous pouvons limiter le domaine de notre ontologie auxgenres de films, aux proprits des films et leurs valeurs.

  • 14

    Construction de lontologieDfinition des classes et de la hirarchie des classes

    Recensement de tous les genres de films en sinspirant desdonnes des sources IMDb (site : http://www.imdb.com/) , etMovieLens (site : http://movielens.umn.edu/).Classement des genres de films en classes et sous-classesformant ainsi une hirarchie de classes ayant pour racine la classeFilm.Ces classes constituent les concepts de notre ontologie.Nous avons retenu 18 genres de films : Aventure, Action, Dessin-Anims, Enfant, Manga, Comdie, Documentaire, Drame, Fantastique, Film-Noir,Horreur, Musical, Mystre, Romance, Science-Fiction, Thriller, Guerre, Western.Pour tablir la hirarchie des classes, nous avons procd dehaut en bas en commenant par les concepts les plus gnraux eten terminant par la spcialisation des concepts.

  • Western AcAon FantasAqueGuerre SciFi Mystre Horreur FilmNoir Manga DessinAnim

    Comdie MusicalRomance

    Aventure Documentaire Thriller Enfant Drame

    Film

    Reprsentation hirarchique de lontologie des films

    Construction de lontologie

    15

  • 16

    Construction de lontologieDfinition des proprits des classes

    Il existe deux types de proprits :les proprits dobjet (qui permettent de relier des instances dautres instances),les proprits de type de donne (qui permettent de relier desindividus des valeurs de donnes).

    Une proprit dobjet est une instance de la classeowl:ObjectProperty.

    Une proprit de type de donnes est une instance de la classeowl:DatatypeProperty.

    Les deux classes owl:ObjectProperty et owl:DatatypePropertysont des sous-classes de la classe Property. Classement desgenres de films en classes et sous-classes formant ainsi unehirarchie de classes ayant pour racine la classe Film.

  • 17

    Construction de lontologie

    Eagle EyeFilm- Acteurs- Ralisateur- Scnaristes- Anne-de-Production- Pays- Dure

    - Michelle Monaghan,- D.J. Caruso- John Glenn,- 2008- U.S.A, Allemagne- 1h 54min

    Proprits des concepts de lontologie

    Dfinition des proprits des classes Nous navons utilis, dans notre cas, que des proprits de type

    (pas de proprits dobjet). Une proprit type peut faire correspondre un type aux

    instances de la classe. Par exemple, la proprit Anne-de-Production (resp. Acteurs) fait

    correspondre aux instances de la classe Film le type entier positif (resp.le type chaine de caractres) reprsentant lanne de production (resp. laliste des acteurs) du film.

  • Dfinition de restriction sur les proprits Nous pouvons galement exprimer des restrictions

    sur les proprits.Exemple: - le fait quun film doit avoir une seule anne de

    production (exprime avec Protg comme :Anne-de-Production exactly 1).

    - Le fait quun film doit avoir deux ralisateurs aumaximum (exprime par : Ralisateur max 2).

    Construction de lontologie

    18

  • Environnement de dveloppement JBuilder 2005 Protg (http://protege.stanford.edu/) Jena (http://jena.sourceforge.net/)

    Construction de lontologie

    19

  • Conclusion et Perspectives

    20

    La mthode de construction de lontologie est manuelle

    La difficult de laccs lontologie de films existantenous a empchs de la rutiliser, ce qui nous a amens construire notre propre ontologie.

    Notre systme est facilement adaptable dautresontologies de produits diffrents de films, comme parexemple les livres.

    Lvaluation de notre systme est en cours de validation.

  • 21