Etude de mod èles variationnels et apprentissage de ...zeng/phddefence.pdf · Transformée de Fourier Petit, moyen, grand Paramètre définissant les dictionnaires Zones intéressantes

Page 1

ZENG Tieyong, PhD Defense

Université Paris Nord

EtudeEtude de modde modèèles les variationnelsvariationnels

et apprentissage de dictionnaireset apprentissage de dictionnaires

ZENG Tieyong

Oct. 9, 2007

Page 2



Introduction

� Restauration/débruitage d’images

� Seuillage par ondelettes

� Modèle de Rudin-Osher-Fatemi

� Modèle

� NL-means

� K-SVD

� Représentations parcimonieuse

� Basis pursuit

� Matching Pursuit, OMP

� Décomposition d’images

� Modèle de R.O.F, Modèle de Meyer

� Analyse en composantes morphologiques (MCA)

Modèles variationnels + Dictionnaire

Page 3



Plan

� Dictionnaire et modèle

� Représentations parcimonieuses

� Résolution du Basis Pursuit

� Etude de deux modèles d’optimisation

� MP shrinkage

� Une approche statistique pour l‘apprentissage de dictionnaires

� Conclusion

Page 4



Le modèle

Nous considérons le problème du débruitage, une image est observée en présence

de bruit,

où:

image idéale

bruit blanc Gaussien

On voudrait résoudre ce problème par le modèle

pour un dictionnaire et la variation totale discrète:

avec

Introduction-Dictionnaire-Basis Pursuit-Stabilité-MP shrinkage-Apprentissage-Conclusion

Page 5



Résolution du modèle

Méthode de pénalisation

où

Algorithme de descente de gradient à pas optimal


Page 6



Problème principal: choisir

� Dictionnaires non invariant par translations

� Dictionnaire de paquets d‘ondelettes, 2002 F.Malgouyres

� Dictionnaire de curvelettes, 2002 E.Candes & F.Guo

� Nouvelle approche

� Dictionnaire invariant par translations

Considérer un sous-ensemble fini de

Pour tout et , on définit

Enfin, on utilise le dictionnaire


Page 7



Dictionnaires de Gabor

Filtre de Gabor

Gabor I

Gabor IIGabor III

Curvelet

Transformée de Fourier

Petit, moyen, grand

Zones intéressantesParamètre définissant les dictionnaires


Page 8



Expériences

Image bruitée curvelet moyen Gabor II moyen

PSNR - 26.88

PSNR - 20.81

Gabor II, III: presque isotrope!

Presque les mêmes!

Zone 1

Zone 2 Gabor III, II


Page 9



Post-traitement pour l’algorithme

K-SVD

La performance de débruitage constitue l’état de l’art

Efface peu de détail

Perd un peu de texture


L’algorithme K-SVD suppose que tous les patches d’images naturelles peuvent être

représentés parcimonieusement dans un dictionnaire . Pour restaurer

à partir de l’image bruitée

cette méthode essaie de résoudre un problème de minimisation:

Page 10



Combien d'itérations pour la

pénalisation du .

ROF k=1

Choisir k au maximum de TV !

TV: bruit+texture/structure


Le modèle peut retrouver les

informations perdues rapidement.

Nombre d’itération k

Page 11



Algorithme de post-traitementIntroduction-Dictionnaire-Basis Pursuit-Stabilité-MP shrinkage-Apprentissage-Conclusion

Choisir kmaximisant TV

Résultat de K-SVD

Dictionnaire de Gabor II

On peut proposer un algorithme de post-traitement

Page 12



Expériences

+7.90db +8.49db

+4.89db

Image bruitée

Post-traitement

Niveau du bruit


Page 13



Analyse du modèle

Supposons que est la solution du modèle

En utilisant la théorie de l'optimisation, nous savons qu’il existe un vecteur de Kuhn-

Tucker

tel que:

Quand le dictionnaire contient seulement un élément ,

il est intéressant de choisir:

Dictionnaire ad-hoc


Courbure de l’image Lenna

Page 14



Expérience sur le dictionnaire

ad-hoc

Débruitage avec le dictionnaire ad-hocROF


Page 15



Expérience en décomposition

d'image

Composante « texte »

Image idéale Image bruitée

Dictionnaire

Composante « fond »

ROF


Page 16



Expérience en débruitage d’image

dictionnaire

ROF

Mécanisme:


Page 17



Plan

� Dictionnaire pour le modèle




� MP shrinkage


� Conclusion

Page 18



Variante du Basis Pursuit

Données: une image , un dictionnaire

But : chercher une représentation parcimonieuse

� Modèle du Basis Pursuit

pour

� Nouvelle variante

pour

But

Construire un algorithme efficace pour résoudre cette variante sous

conditions :

A.

B.

Pourquoi la nouvelle variante ?


Page 19



Formulation duale et

algorithme de point proximal

Le problème pré-dual pour est

On voudrait le résoudre par une méthode qui calcule également un de ses vecteurs

de Kuhn-Tucker . Ce dernier est une solution de

L'algorithme de point proximal prend la forme

pour une séquence croissante et le convexe

Les résultats généraux sur l'algorithme de point proximal garantiront que

converge vers la solution de (P).

Que peut-on dire pour des vecteurs correspondants de Kuhn-Tucker ?


Page 20



L'algorithme principal

Nous écrivons:

où

Nous proposons l'algorithme suivant :

On peut montrer que :


Page 21



Aspects importants

� On peut calculer exactement:

� On peut calculer exactement:

� Le gradient de f est Lipschitz !

Il existe une constante telle que pour tous les , dans , on a toujours:


Page 22



Algorithme d'Uzawa

Nous pouvons résoudre la maximisation

par l’algorithme de gradient projeté à pas constant.

Pour trouver le

la méthode d'Uzawa s’écrit:


la régle d’Armijo

Page 23



Description des expériences

Nous utilisons le dictionnaire de cosinus locaux qui est symétrique, invariant par translations

Pour évaluer la convergence,

A. Mesure de parcimonie

B. Mesure de régularité

C. Mesure de fidélité aux données

D. Temps

correspondant à une décomposition et à une recomposition dans le dictionnaire


Page 24



Algorithme de descente

parallèle sur les coordonnées

L’algorithme de descente parallèle sur les coordonnées (PCD) résout le modèle du Basis

Pursuit par

Seuillage Itératif (IT)

choisit toujours


Page 25



Comparaison de la mesure de

fidélité aux donnéesIntroduction-Dictionnaire-Basis Pursuit-Stabilité-MP shrinkage-Apprentissage-Conclusion

Mesure de fidélité aux données

Page 26



Comparaison de la mesure de

régularitéIntroduction-Dictionnaire-Basis Pursuit-Stabilité-MP shrinkage-Apprentissage-Conclusion

Mesure de régularité

Page 27



Comparaison de mesure de

parcimonie Introduction-Dictionnaire-Basis Pursuit-Stabilité-MP shrinkage-Apprentissage-Conclusion

Mesure de parcimonie

Page 28



Deux modèles d’optimisation

dans

Nous considérons deux modèles:

où est un dictionnaire fini dans et


Supposons que est normalisé, on cherche une

représentation parcimonieuse d’une image bruitée:

où

Page 29



Résultats de stabilité

Résultat similaire pour


La cohérence mutuelle d’un dictionnaire normalisé est définie comme

Page 30



MP shrinkage hilbertien

� Fonction de seuillage générale

� Contrôlée par

� Contrôlée strictement par

� Le saut est défini comme: Seuillage dur


Seuillage douxSeuillage durIdentitéGarrote non-négativeFirm shrinkageSeuillage généralisé

Page 31



Données : Un espace de Hilbert , une image bruitée

un dictionnaire , fini, normalisé

But: chercher une représentation parcimonieuse

MP shrinkage

On propose un algorithme:


MP shrinkageMP

Seuillage par ondelettes

Page 32



Aspects théoriques sur le MP

shrinkageIntroduction-Dictionnaire-Basis Pursuit-Stabilité-MP shrinkage-Apprentissage-Conclusion

� Théorème 2. Si la fonction est contrôlée par . Alors

converge quand m tend à .

Soient:

� Théorème 3. Si le saut de la fonction est strictement positif, alors le

MP shrinkage s’arrête automatiquement après au plus de

itérations, où est la partie entière.

� Théorème 4. Si la fonction est strictement contrôlée par . Alors quand

, converge à la projection . Précisément, il existe une

constante tels que:

� Théorème 5. Si la fonction est contrôlée par . Alors

Page 33



ExpérienceIntroduction-Dictionnaire-Basis Pursuit-Stabilité-MP shrinkage-Apprentissage-Conclusion

PSNR en fonction du nombre d’itérations M pour le seuillage doux et divers

Page 34



Plan

� Dictionnaire pour le modèle




� MP shrinkage


� Conclusion

Page 35



Approche statistique pour

l’apprentissage de dictionnaires

On note:

le tore discret support des images

l’espace des images

une famille d’atomes locaux générant le dictionnaire

translation des atomes sur le plan

Nous considérons le modèle génératif suivant :

où

variable de Bernoulli, i.i.d, drapeau: présence/absence

coefficient aléatoire , i.i.d, intensité

bruit blanc

But: étant donné , apprendre


Page 36



Deux modèles : BEM et BGM

� Le modèle du Bernoulli-Exponentielle (BEM)

est de loi exponentielle

La vraisemblance complète

� Le modèle de Bernoulli-Gaussien (BGM)est de loi gaussienne


l’espace des paramètres

l’espace des paramètres

Page 37



Problème d'identifiabilité

On se pose une question:

Peut-on distinguer deux distributions sur Y données par deux paramètres différents ?

Pour les deux modèles: sous conditions faibles, OUI !

� BEM

Relation d'équivalence: si et

modulo une permutation sur les indices

Prop. Si sont différentes, alors le BEM est identifiable dans

� BGM

Résultat similaire.


Page 38



De la vraisemblance aux MCMC

L'approche de maximum de vraisemblance calcule

La méthode EM est itérative

où est la loi a posteriori de (X, B) sachant Y

avec Z est le facteur de normalisation et est la mesure dominante.

(E)-step, (M)-step

Nous pouvons approcher la loi a posteriori par MCMC:

On génère une chaîne de Markov ergodique associée à


Page 39



Champ moyen pour BGM

difficile à calculer

Champ moyen: on approche par un produit de lois sur et

Considérer l’ensemble des lois produits sur et telles que

est de loi Bernoulli

est de loi

Ensuite nous prenons

où K est la divergence de Kullback-Leibler.


Page 40



L’équation de point fixe et

mise à jour du paramètre

Pour la divergence de Kullback-Leibler, la loi optimale satisfait une équation de

point fixe

Ensuite, l'étape de mise à jour du paramètre est donnée par

Par conséquent, on a:


Page 41



Expériences

MCMC

Champ moyen

Ensemble d’apprentissage

Dictionnaire idéal


Page 42



Expériences sur le champ

moyen

Exemples dans l’ensemble

d’apprentissage

Dictionnaire idéal

Champ moyen


Page 43



Expériences sur le champ

moyenIntroduction-Dictionnaire-Basis Pursuit-Stabilité-MP shrinkage-Apprentissage-Conclusion

Dictionnaire idéal Le champ moyen

Page 44



Conclusion et discussion

MécanismeMécanisme

Variante du BP

Variante du BP

Post-traitement

Post-traitement

MP shrinkage

Méthode d’optimisation

Dict. inv. par trans. Modèle de

Autre dictionnaire de

type Gabor

En utilisant

la courbureDécomposition d’images

Plus d’images

Vitesse de

convergence

Comparaison avec des

méthodes itératives

Représentations parcimonieuses Apprentissage

de dictionnaires

Image naturelle

Débruitage

DictionnaireDictionnaire


Parcimonie

Page 45



Merci!

Page 46



Gabor filtre

Page 47



Détails de K-SVD

Page 48



Régle d’Armijo

Le principe de cet algorithme (pour la maximisation) est de définir

L'algorithme emploie la mise à jour

où pour un fixé et pour le premier nombre entier non

négatif m tel que

pour

Nous avons limité notre recherche à

et prenons:

Page 49



Lenna pour post-traitement

Page 50



Algorithme d’acceptation-rejet

Soit une loi d’intérêt de densité et une loi de proposition de densité telle que

sur le support de . Alors, on peu simuler suivant avec l’algorithme suivant

Page 51



Champ moyen pour image

naturelle

Documents

Etude de mod èles variationnels et apprentissage de ...zeng/phddefence.pdf · Transformée de Fourier Petit, moyen, grand Paramètre définissant les dictionnaires Zones intéressantes