53
Hervé Goëau 25 mai 2009 Structuration de collection d’images par apprentissage actif crédibiliste 1

Hervé Goëau

  • Upload
    vidal

  • View
    22

  • Download
    4

Embed Size (px)

DESCRIPTION

Hervé Goëau. Structuration de collection d’images par apprentissage actif crédibiliste . 25 mai 2009. Motivations. Valoriser des fonds de collections d’images Contexte INA : Photothèque Contexte « grand public » : collections personnelles de photographies. Plan Introduction - PowerPoint PPT Presentation

Citation preview

Page 1: Hervé Goëau

Hervé Goëau

25 mai 2009

Structuration de collection d’images par apprentissage actif crédibiliste

1

Page 2: Hervé Goëau

2

MotivationsValoriser des fonds de collections d’images• Contexte INA : Photothèque• Contexte « grand public » : collections personnelles de photographies

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion Bateaux

Plage

Montagnes

Famille

Page 3: Hervé Goëau

3

Systèmes existants1. Manuel

+expressivité, ergonomie

- fastidieux

2. Automatique

+ productivité

- satisfaction

3. Semi-automatique

+ expressivité, contrôle utilisateur

- peut être fastidieux

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 4: Hervé Goëau

4

Objectifs et contraintes

• Semi-automatique

• Collections vierges

• Satisfaction totale de l’utilisateur- Capturer ses intentions- Diminuer sa charge de travail

• Une ou plusieurs catégories par image

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 5: Hervé Goëau

5

Proposition

Choix d’une stratégie de sélection

Sélection active

d’images

Utilisateur

Modélisation et synthèse de

la connaissance

Nouvel état des étiquettes

Images étiquetées

Images non

étiquetées

Interface homme machine

Liste(s) d’images

Etats de connaissance

Interactions

Etiquetages

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 6: Hervé Goëau

6

Modélisation et synthèse de la connaissance

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 7: Hervé Goëau

7

Problématique

« plages »« monuments »

« éléphants »

? ?

?

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

? Ø

Page 8: Hervé Goëau

8

Contenus visuels

Croyance que u appartient à la même classe de lq ?

Fossé sémantique? Appartenances multiples?Combinaisons ? 

Non étiquetée u Étiquetée lq

Descriptions couleurs, orientations

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 9: Hervé Goëau

9

Fonction de croyances (1/3)

Cadre de discernement :

Espace puissance :

conflit doute

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Modèle des Croyances Transférables [Smets94]

Distribution de masses (KnnEv [Denoeux95]) :

Page 10: Hervé Goëau

10

Fonction de croyances (2/3)

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Knn « négatifs »

Adaptation locale des fonctions de croyances

Paramètre f : croyance aux frontières des classes

Page 11: Hervé Goëau

11

Fonction de croyances (3/3)

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Paramètre f : gestion des croyances aux frontières des classes

u

Page 12: Hervé Goëau

12

Combinaison de témoignages

• Problème : masse sur la proposition ?

• Règle de combinaison conjonctivePlan

IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 13: Hervé Goëau

13

Transfert de masses

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 14: Hervé Goëau

Multi-classe

• produit des cadres de discernement « locaux »

Exemple pour 2 classes : 4 hypothèses

Combinaison des distributions de masses l’opérateur « d’extension vide » [Smets93]

14

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 15: Hervé Goëau

15

Multi-descripteur

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 16: Hervé Goëau

16

Modélisation de la connaissance : bilan

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Extension du KnnEv

connaissance détaillée : • Appartenance une ou plusieurs classes• Non appartenances• Doutes et conflit• Adaptation locale

Page 17: Hervé Goëau

17

Sélection active d’imagesPlan

IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 18: Hervé Goëau

18

Apprentissage actif

• Classer les échantillons les plus « informatifs »

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

« Vérité terrain »Modèle idéalt0

Page 19: Hervé Goëau

19

Apprentissage actif

• Classer les échantillons les plus « informatifs »

Adéquation ?

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

t0

Stratégie 1 Stratégie 2

t1t2t3t4

• Pour l’apprentissage • Pour l’utilisateur

Page 20: Hervé Goëau

Stratégies de sélections

- rejet en distance

- positives

localesglobale

- ambigües

Transformation pignistique [Smets05] PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

20

Hypothèses :

Page 21: Hervé Goëau

21

Stratégie du plus positif

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Recherche des étiquettes les plus

probables

Premiers sélectionnés

Derniers sélectionnés

Page 22: Hervé Goëau

22

Stratégie du plus rejeté en distance

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Exploration de nouveaux

contenus visuels

Premiers sélectionnés

Derniers sélectionnés

Page 23: Hervé Goëau

23

Stratégie du plus localement ambigu

Désambigüisation des classes 2 à 2

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Premiers sélectionnés

Derniers sélectionnés

Page 24: Hervé Goëau

24

Sélection active d’images : bilan

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Expression des stratégies usuelles avec le MCT

Stratégies complémentaires pour identifier et cerner les classes

Page 25: Hervé Goëau

25

Interface homme-machinePlan

IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 26: Hervé Goëau

26

Proposition automatique d’étiquette(s)

Exemple à 3 classes

Etiquetage sans rejetsEtiquetage avec rejet en distanceEtiquetage avec rejet en ambigüitéou étiquetage multiple sans rejetsEtiquetage avec rejetsou étiquetage multiple avec rejet en distance

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 27: Hervé Goëau

27

Interface et démonstration

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 28: Hervé Goëau

28

EvaluationsPlan

IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 29: Hervé Goëau

29

Classification automatique et multi-étiquetage

scene-classification [Boutell04]6 classes Corel1,08 étiquettes/image1211 apprentissage / 1196 test

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 30: Hervé Goëau

30

Caractérisation des stratégies (1/3)

5x100 images CorelClasses visuellement homogènesPlan

IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Evolution

Nombre final de mauvaises propositions

Effort de l’utilisateur

Page 31: Hervé Goëau

31

Caractérisation des stratégies (2/3)

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

f = 0,4

Page 32: Hervé Goëau

32

Caractérisation des stratégies (3/3)

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

f = 0,7

Page 33: Hervé Goëau

33

Combinaison avec des métadonnées

Combinaison avec des informations imprécises et partiellesEx : date de prise de cliché

1820 photographies, 24 appareils, 6 événements temporels

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion Préparatifs Séance photos Mairie Cérémonie Soirée Lendemain

Page 34: Hervé Goëau

34

Combinaison avec des métadonnées

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 35: Hervé Goëau

35

Evaluation avec utilisateur

Documentaliste responsable de la Photothèque InaMéthodologie « penser à haute voix » [Nielson92]Téléfilm Borgia

↗ Une même classe avec contenus visuels différents ↗ Réorganisation à volonté des classes ↗ Prise en main de l’interface ↗ Adéquation avec usage

↘ Prise en main des stratégies non immédiate

Suggestions :- Vue d’ensemble pour initialisation des classes- Hiérarchie

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 36: Hervé Goëau

36

Conclusion

Verrous levés : • Satisfaction totale• Peu d’échantillons• Multi-étiquetage• Tout type de collections d’images

Cadre de formalisation : • Classification, stratégies, décisions• Modélisation du doute et du conflit• Echelle

Souplesse :• Gestion des classes : modification/création/suppression à la volé• Ajout de nouveaux descripteurs de contenus et métadonnées

Prototype : tests opérationnels

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 37: Hervé Goëau

37

Perspectives (1/3)

• Optimisations et autres tests :

- Adaptation automatique des fonctions de croyances

- Descripteurs (locaux) et métriques

- Classifieurs de base

• Semi-supervisé :

- Structuration partielle de très grandes bases d’images

- Structuration de vidéos

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 38: Hervé Goëau

38

Perspectives (2/3)

• Combinaison/alternance de stratégies

plus de propositions correctes

améliorer le confort de l’utilisateur

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

1 MR, X MP

Page 39: Hervé Goëau

39

Perspectives (3/3)

• Organisations hiérarchiques

Formalisation de « sur-classes » et « sous-classes »

Multi-étiquetage sur différents niveaux hiérarchiques

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 40: Hervé Goëau

40

Merci pour votre attention

PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion

Page 41: Hervé Goëau

41

Compléments

Page 42: Hervé Goëau

42

DESCRIPTEURS MPEG7 (1/2)

Descripteur Nombre de corrections finalHrgb 33Hhsv 33Cced 35Scd 35Cfct 37Hlab 39Hluv 46Horient 54MPEG7cld 58MPEG7ehd 68MPEG7scd 399

5x100 images CorelDescripteurs standards (Rummager )Stratégie du plus rejeté en distance MRk=5,f=0.7,distance de Bhattacharya

Page 43: Hervé Goëau

43

DESCRIPTEURS MPEG7 (2/2)

5x100 images CorelDescripteurs standards (Rummager )Stratégie du plus rejeté en distance MRk=5,f=0.7,distance de Bhattacharya

Page 44: Hervé Goëau

44

Fusion précoce et tardive

Page 45: Hervé Goëau

Réglage automatique du paramètre f

Page 46: Hervé Goëau

Influence du paramètre f

Page 47: Hervé Goëau

47

Transformation d’étiquettes

PT3

PT4

PT6

Page 48: Hervé Goëau

48

Structuration de vidéos (1/4)

Page 49: Hervé Goëau

Structuration de vidéos (2/4)

Page 50: Hervé Goëau

Structuration de vidéos (3/4)

Page 51: Hervé Goëau

Structuration de vidéos (4/4)

Page 52: Hervé Goëau

52

Stratégie orientée classe Vue locale

Page 53: Hervé Goëau

53

Stratégie orientée classe Vue globale