42
1 13/05/07 LIST – DTSI – Service Réalité virtuelle, Cognitique et Interfaces sensorielles Extraction d’informations Extraction d’informations géographiques géographiques à partir du Web. à partir du Web. Applications pour la recherche et Applications pour la recherche et l’annotation d’images l’annotation d’images 18/09/200 8 * CEA LIST ** Télécom Bretagne [email protected] Adrian Popescu*,**

LIST – DTSI – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

  • Upload
    alyson

  • View
    63

  • Download
    1

Embed Size (px)

DESCRIPTION

Extraction d’informations géographiques à partir du Web. Applications pour la recherche et l’annotation d’images. Adrian Popescu*,**. * CEA LIST ** Télécom Bretagne [email protected]. LIST – DTSI – Service Réalité virtuelle, Cognitique et Interfaces sensorielles. - PowerPoint PPT Presentation

Citation preview

Page 1: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

113/05/07LIST – DTSI – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

Extraction d’informations géographiques Extraction d’informations géographiques à partir du Web.à partir du Web.

Applications pour la recherche et Applications pour la recherche et l’annotation d’imagesl’annotation d’images

18/09/2008

* CEA LIST** Télécom Bretagne

[email protected]

Adrian Popescu*,**

Page 2: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

213/05/007DTSI 18/09/2008

Plan de la présentation

État de l’art Structuration automatique d’un thésaurus géographique Recherche d’images géo-référencées Annotation d’images géo-référencées

Page 3: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

313/05/007DTSI

Points de départ

Grande quantité d’informations géographiques présentes sur le Web

~ trois millions de nouvelles images géo-référencées sur Flickr par mois

Émergence très rapide du Web mobile Le domaine géographique se prête bien à une

structuration des connaissances Constitution manuelle des bases de données

géographiques (très) coûteuse Thésaurus géographiques utiles dans une variété

d’applications

$, €, £, ¥

Page 4: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

413/05/007DTSI

Un exemple d’utilisation

Page 5: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

513/05/007DTSI

ETAT DE L’ART

Page 6: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

613/05/007DTSI

Bases de données géographiques

Définition (Hill, 1999)Élément = (nom, coordonnées, type)

Structure Organisation hiérarchique – au minimum trois niveaux

de détail Notre Dame de Paris est une cathédrale

Inclusion spatiale Notre Dame de Paris Paris Île de France

France Pas considérée dans la définition de Hill

Peu (ou pas) d’information spatiale Exemples

Geonames ~ 6000000 éléments Alexandria Digital Library ~ 5000000 éléments

Page 7: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

713/05/007DTSI

Bases de données géographiques existantes

Dans leur grande majorité, constituées manuellement Utilisation de bases de données préexistantes

USGS (United States Geological Survey) Couverture très variable selon les pays

Cas de Geonames :

La variabilité de la couverture est fortement problématique pour des applications grand public

Pays Éléments dans Geonames (approx.)

Etats-Unis 2000000

France 145000

Roumanie 24000

Page 8: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

813/05/007DTSI

Constitution automatique des bases de données géographiques

TagMaps (Rattenbury, 2007)http://tagmaps.research.yahoo.com/

Analyse statistique multi-échelle du corpus géo-référencé de Flickr

Extraction de toponymes Extraction de coordonnées Association d’une mesure de pertinence

Critique Précision de 85% pour un rappel de 50% Pas de structuration conceptuelle et spatiale

Page 9: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

913/05/007DTSI

Autres travaux

Projet SPIRIT (UE) Catégorisation de pages Web ayant une composante

géographique Constitution d’ontologies du domaine

Projet TRIPOD (UE) Constitution d’ontologies du domaine Applications multimédia

Annotation spatiale d’images (sans traitement d’images)

DBPedia – extraction des pages géo-référencées de Wikipédia (Auer, 2007)

http://dbpedia.org Noms géographiques + coordonnées

Page 10: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1013/05/007DTSI

Recherche d’images géo-référencées

Exploitation du géo-référencement afin d’améliorer la qualité des résultats

CBIR (O’Hare, 2005) Clustering multimodal (Kennedy, 2008)

Panoramio – plateforme de partage d’images géo-référencées

> 6 000 000 d’images Validation des photographies Utilisée dans Google Earth

et Google Maps

Flickr > 50 000 000 d’images Pas de validation Utilisé dans World Explorer

(avec TagMaps) (Ahern, 2007)

Page 11: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1113/05/007DTSI

Recherche d’images - World Explorer

Page 12: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1213/05/007DTSI

Annotation d’images géo-référencées

Flickr « machine tags» Recommandation ZoneTag (Naaman, 2007) basée sur la

la proximité spatiale ou temporelle Recommandation basée sur la co-occurrence de tags dans

une grande collection d’images (> 50 millions)

Traitement du contenu des images Souvent mentionné (O’Hare Exploitation du géo-

référencement afin d’améliorer la qualité de l’annotation Peu utilisé (Chevallet, 2005), (Lim, 2007)

Page 13: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1313/05/007DTSI

Annotation automatique - SnapToTell

Annotation automatique d’images géo-référencées (Chevallet, 2005), (Lim, 2007)

STOIC 101 database Images de Singapore 101 objets, 5278 Images

Descripteurs de bas niveau globaux (Chevallet, 2005) Descripteurs de bas niveau globaux et locaux (Lim,

2007) Détection des régions « discriminantes » dans les

images Combinaison de descripteurs + géo-référencement

92% de réussite sur 100 images (88% sans géo-référencement)

Page 14: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1413/05/007DTSI

Application – e-tourisme

Page 15: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1513/05/007DTSI

STRUCTURATION AUTOMATIQUE

D’INFORMATIONS GEO-REFERENCEES

Page 16: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1613/05/007DTSI

Gazetiki - constitution automatique d’un thésaurus géographique

Adaptation de méthodes de TAL et statistiques pour le domaine géographique

Respect de la définition de la structure d’un thésaurus de (Hill, 1999)

Traitement des informations provenant de sources d’informations hétérogènes

Approche multilingue anglais, français, allemand, néerlandais, espagnol, italien

Page 17: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1713/05/007DTSI

Objectifs et défis

Extraction Noms géographiques (multilingue) Coordonnées géographiques Catégories parent Mesure de pertinence Entités englobantes Synonymes intra- et inter-langues

Extension du modèle de (Hill, 1999)Élément = (nom, coordonnées, type, pertinence, entité

englobante, synonymes)Défis

Automatisation du processus Équilibre précision – couverture Obtention de données brutes (libres de droits) Intégration en une seule base

Page 18: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1813/05/007DTSI

Sources de données

GeoNames

???

Page 19: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

1913/05/007DTSI

Extraction de noms géographiques

Titres de Wikipédia Articles avec des coordonnées (~ 240000 pour l’anglais) Articles sans coordonnées mais pertinents pour le domaine

géographique (~ 38000 pour l’anglais)

Règles dans Panoramio

Page 20: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2013/05/007DTSI

Extraction des coordonnées

Wikipédia – utilisation de 31 motifs introduisant les coordonnées

Panoramio – moyennes des coordonnées des images représentatives – Traian Square

Longitude :21.2478

Latitude : 45.757

Page 21: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2113/05/007DTSI

Vocabulaire géographique

Basé sur les catégories géographiques de GeonamesElimination de certaines catégories inintéressantes pour les

applications grand public Base militaire, etc.

Ajout d’autres catégories Divisions administratives: quarter, city, arrondissement etc. Folly, dolmen etc.

Traduction semi-automatique des catégoriesSection « traduction »Vérification manuelle

Environ 300 éléments traduits en six langues

Page 22: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2213/05/007DTSI

Catégorisation - Wikipédia

Première phrase

Infobox + section « Catégories » + première phrase Procédure de vote + statistiques du Web

Catégorisation multilingue Procédure de vote + statistiques du Web

Page 23: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2313/05/007DTSI

Panoramio – catégorisation basée sur les résultats moteur de recherche

Statistiques

sur les

catégories

géographiques

Utilisation de

« définitions »

Page 24: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2413/05/007DTSI

Classement des entités

Utile en recherche d’informations Mesure statistique exploitant le géo-référencement

et les résultats d’un moteur de recherche Panoramio - popularité

nombre d’images x nombre d’utilisateurs Moteur de recherche (Alltheweb)

nombre de documents Priorité donnée à Panoramio

Résultats Villes : London, Venice, Paris, Barcelona Autres : Eiffel Tower, Tower Bridge, Niagara Falls, Golden

Gate Bridge

Page 25: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2513/05/007DTSI

Inclusion spatiale – en cours

Traian Square Timisoara Timis Roumanie? Traitement de motifs (TAL) Raisonnement spatial

Déduction de la forme et de la surface des divisions administratives

Panoramio, Flickr - villes, départements, régions Geonames – pays

Comparaison des coordonnées Pour un couple de coordonnées,

trouver les entités l’incluant

Page 26: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2613/05/007DTSI

Utilité de l’inclusion spatiale

Désambiguïsation des noms géographiques ambigus

Parthenon (Athens) -> temple Parthenon(??) -> museum Pathenon (Brussels) -> restaurant

Expansion automatique des requêtes avec des noms géographiques ambigus

Raisonnement spatialReprésentation diversifiée des divisions

administratives par leur entités contenues

Page 27: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2713/05/007DTSI

Synonymie - à faire

Intra-langueExtraction des noms alternatifs de Wikipédia

Centre Pompidou = Musée National d’Art Contemporain

Extraction d’acronymes à partir du Web Musée National d’Art Contemporain = MNAC

Inter-languesExtraction des traductions de Wikipédia

Musée d’Orsay = Orsay Museum AutrementPour deux noms géographiques

Si coordonnées très proches ET parties de noms communes synonymes

Si coordonnées très proches ET même catégorie synonymes

Page 28: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2813/05/007DTSI

Évaluation de Gazetiki

Extraction des entités ~90% de précision Erreurs fréquentes

Adjectif + concept géographique

Catégorisation Wikipédia en anglais 95% Confirmés par une évaluation

multilingue Panoramio (Web) 90%

Page 29: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

2913/05/007DTSI

Évaluation de Gazetiki

Positionnement des éléments extraits à partir de Panoramio

La majorité des éléments à moins de 200 m des coordonnées dans Geonames

Classement « Gold standard » -

TripAdvisor Comparaison avec

TagMaps Meilleurs résultats dans 11

cas sur 15

Page 30: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3013/05/007DTSI

APPLICATIONS: RECHERCHE

D’IMAGES GEO-REFERENCEES

Page 31: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3113/05/007DTSI

ThemExplorer – recherche d’images géo-référencées

Gazetiki = (Geonames + Wikipédia + Panoramio) Images géo-référencées de Flickr + images

complémentaires de Google Images Navigation selon des catégories géographiques

Possibilité de sélectionner les catégories intéressantes

Recherche par le contenu dans des espaces conceptuellement cohérents

Définis par les noms géographiques Descripteurs globaux (couleur/texture) et locaux (sacs de

mots visuels)

Page 32: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3213/05/007DTSI

ThemExplorer - vue générale

Démo

Page 33: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3313/05/007DTSI

ThemExplorer - vue détaillée

Démo

Page 34: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3413/05/007DTSI

Résultats

Tests de précision 6 utilisateurs; 20 images

Limitation du CBIR Spatiale vs. spatiale + mots clef

Fusion des descripteurs Globaux (LEP) Locaux (BAG) Globaux + locaux

Test avec 8 utilisateurs ThemExplorer vs. World Explorer ++ modes de navigation proposés ++ couverture de Gazetiki -- doublons

Page 35: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3513/05/007DTSI

APPLICATIONS: ANNOTATION

D’IMAGES GEO-REFERENCEES

Page 36: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3613/05/007DTSI

Annotation automatique d’images géo-référencées d’objets connus

Création automatique d’une base de référence Objets bien représentés dans Panoramio (> 15 images) Téléchargement d’images à partir de Panoramio et Flickr

(limitée à 500 images per objet) Filtrage de la base – adaptation de k-PP

Annotation des images Mise en place d’un algorithme d’annotation basé en deux

étapes sur k-PP Utilisation de la base de référence Création d’une base de test diversifiée

Simulation d’une situation réelle 736 images (50% bonnes – 50% fausses)

Page 37: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3713/05/007DTSI

Re-classement

Page 38: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3813/05/007DTSI

Annotation

Page 39: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

3913/05/007DTSI

Résultats – précision/couverture

Page 40: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

4013/05/007DTSI

Répartition des erreurs

Étape 1 vs. étape 2 Distribution dans

des classes génériques

Page 41: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

4113/05/007DTSI

Recherche future

Compléter le thésaurus Finir la catégorisation, l’inclusion spatiale et la synonymie Ajouter des nouvelles dimensions

Pertinentes pour certaines catégories géographiques

Mettre en valeurs les nouvelles dimensions du thésaurus en recherche et annotation d’images

Modifier l’algorithme d’annotation d’images Prise en compte de la distribution spatiale des images

Mettre en place une application de « e-Tourisme » proactive et personnalisable

Page 42: LIST – DTSI  – Service Réalité virtuelle, Cognitique et Interfaces sensorielles

4213/05/007DTSI

Références

(Ahern, 2007) Ahern, S., Naaman, M., Nair, R. and Yang, J. 2007.  World Explorer: Visualizing Aggregate Data from Unstructured Text in Geo-Referenced Collections. In Proc. of JCDL 2007 (Vancouver, Canada, June 2007).

(Chevallet, 2005) Chevallet, J.-P., Lim, J.-H., Leong, M.-K. Object Identification and Retrieval from Efficient Image Matching. Snap2Tell with STOIC dataset. In Proc. of AIRS (Jeju Island, Korea, 2005).

(Hill, 1999)

(Kennedy, 2008)

(Lim, 2007) Lim, J.-H., Li, Y., You, Y., Chevallet, J.-P. Scene Recognition with Camera Phones for Tourist Information Access. In Proc. of IEEE ICME (Beijing, China, 2007).

(Naaman, 2007) Ames, M., Naaman, M. Why We Tag: Motivation for Annotation in Mobile and Online Media. In Proc of SIGCHI Conference on Human Factors in Computing Systems. San Jose, CA, USA, 2007.

(O’Hare, 2005) O’Hare N., Gurrin, C., Smeaton A. F., Jones G. F. G. 2005. Combination of content analysis and context features for digital photograph retrieval. In. Proc. of EWIMT 2005.

(Rattenbury, 2007)

SPIRIT project page

TRIPOD project page