87
Mod` eles bay´ esiens pour l’apprentissage non supervis´ e Fran¸ cois Caron INRIA Bordeaux Sud Ouest Equipe CQFD Jeudi 23 octobre 2008 Fran¸coisCaron (INRIA Bordeaux) Apprentissage non supervis´ e 23 octobre 2008 1 / 39

F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Modeles bayesiens pour l’apprentissage non supervise

Francois Caron

INRIA Bordeaux Sud OuestEquipe CQFD

Jeudi 23 octobre 2008

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 1 / 39

Page 2: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

2 Modeles bayesiens non parametriques

3 Algorithme MCMC

4 Classification non supervisee dynamique

5 Conclusion

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 2 / 39

Page 3: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

2 Modeles bayesiens non parametriques

3 Algorithme MCMC

4 Classification non supervisee dynamique

5 Conclusion

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 3 / 39

Page 4: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Apprentissage non supervise

Ensemble de donnees z1, z2, . . . , zn

Estimer un parametre inconnu ! a partir des donnees

Reduction de dimension, classification . . .

Objectif : prediction, interpretabilite, compression. . .

Approche bayesienne

! A priori sur le parametre inconnu !! Distribution a posteriori de ! conditionnellement aux donnees

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 4 / 39

Page 5: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Apprentissage non supervise

Ensemble de donnees z1, z2, . . . , zn

Estimer un parametre inconnu ! a partir des donnees

Reduction de dimension, classification . . .

Objectif : prediction, interpretabilite, compression. . .

Approche bayesienne

! A priori sur le parametre inconnu !! Distribution a posteriori de ! conditionnellement aux donnees

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 4 / 39

Page 6: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Apprentissage non supervise

Ensemble de donnees z1, z2, . . . , zn

Estimer un parametre inconnu ! a partir des donnees

Reduction de dimension, classification . . .

Objectif : prediction, interpretabilite, compression. . .

Approche bayesienne

! A priori sur le parametre inconnu !! Distribution a posteriori de ! conditionnellement aux donnees

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 4 / 39

Page 7: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Apprentissage non supervise

Ensemble de donnees z1, z2, . . . , zn

Estimer un parametre inconnu ! a partir des donnees

Reduction de dimension, classification . . .

Objectif : prediction, interpretabilite, compression. . .

Approche bayesienne

! A priori sur le parametre inconnu !! Distribution a posteriori de ! conditionnellement aux donnees

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 4 / 39

Page 8: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Apprentissage non supervise

Ensemble de donnees z1, z2, . . . , zn

Estimer un parametre inconnu ! a partir des donnees

Reduction de dimension, classification . . .

Objectif : prediction, interpretabilite, compression. . .

Approche bayesienne

! A priori sur le parametre inconnu !! Distribution a posteriori de ! conditionnellement aux donnees

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 4 / 39

Page 9: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Apprentissage non supervise

Ensemble de donnees z1, z2, . . . , zn

Estimer un parametre inconnu ! a partir des donnees

Reduction de dimension, classification . . .

Objectif : prediction, interpretabilite, compression. . .

Approche bayesienne

! A priori sur le parametre inconnu !

! Distribution a posteriori de ! conditionnellement aux donnees

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 4 / 39

Page 10: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Apprentissage non supervise

Ensemble de donnees z1, z2, . . . , zn

Estimer un parametre inconnu ! a partir des donnees

Reduction de dimension, classification . . .

Objectif : prediction, interpretabilite, compression. . .

Approche bayesienne

! A priori sur le parametre inconnu !! Distribution a posteriori de ! conditionnellement aux donnees

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 4 / 39

Page 11: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification non supervisee

Ensemble de donnees z1, z2, . . . , zn

Classer ces donnees en groupes partageant des caracteristiquessimilaires

Estimer le centroıd de chaque groupe

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 5 / 39

Page 12: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification non supervisee

Ensemble de donnees z1, z2, . . . , zn

Classer ces donnees en groupes partageant des caracteristiquessimilaires

Estimer le centroıd de chaque groupe

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 5 / 39

Page 13: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification non supervisee

Ensemble de donnees z1, z2, . . . , zn

Classer ces donnees en groupes partageant des caracteristiquessimilaires

Estimer le centroıd de chaque groupe

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 5 / 39

Page 14: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification non supervisee

Ensemble de donnees z1, z2, . . . , zn

Pour chaque donnee k, k = 1, . . . , n, estimer la variable de classeck = j , j = 1, 2 . . .

Estimer le centroıd Uj , j = 1, 2, . . . de chaque groupe

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 6 / 39

Page 15: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de potentiels d’actionLewicki,Network : Comput. Neural Syst., 1998

Brefs potentiels d’action enregistres par une micro-electrode

Objectif : classer les signaux afin d’attribuer chaque potentiel a unneurone particulier

Nombre de neurones inconnu, bruit de fond

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 7 / 39

Page 16: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de potentiels d’actionLewicki,Network : Comput. Neural Syst., 1998

Brefs potentiels d’action enregistres par une micro-electrode

Objectif : classer les signaux afin d’attribuer chaque potentiel a unneurone particulier

Nombre de neurones inconnu, bruit de fond

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 7 / 39

Page 17: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de potentiels d’actionLewicki,Network : Comput. Neural Syst., 1998

Brefs potentiels d’action enregistres par une micro-electrode

Objectif : classer les signaux afin d’attribuer chaque potentiel a unneurone particulier

Nombre de neurones inconnu, bruit de fond

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 7 / 39

Page 18: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de sequences d’expression de genesMedvedovic and Sivaganesan, Bioinformatics, 2002.

Puces a ADN : donnees d’expression de gene pour plusieurs genes etplusieurs conditions experimentales

Classification de genes avec des sequences d’expression similaires

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 8 / 39

Page 19: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de sequences d’expression de genesMedvedovic and Sivaganesan, Bioinformatics, 2002.

Puces a ADN : donnees d’expression de gene pour plusieurs genes etplusieurs conditions experimentales

Classification de genes avec des sequences d’expression similaires

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 8 / 39

Page 20: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification non supervisee

Nombre de partitions pour n donnees : nombre de Bell

Nombre de donnees 2 5 10 100 200Nombre de Bell 2 52 115975 4.7! 10115 6! 10275

Nombre de donnees important : mise a l’echelle

Bruit de fond

Dimension des donnees

Autres parametres/hyperparametres inconnus

Nombre de groupes inconnu

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 9 / 39

Page 21: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 22: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 23: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 24: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 25: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 26: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 27: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 28: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 29: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 30: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 31: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 32: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithmes de clusteringJohnson, 1967. MacQueen, 1967.

Clustering hierarchique

K-means

Clustering base sur un modele

! Approche bayesienne (empirique)! Parametrique/non parametrique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 10 / 39

Page 33: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Clustering base sur un modele

Reformuler comme un probleme d’estimation densite

Donnees z1, . . . , zn i.i.d. selon une distribution inconnue F

Exemple : Melange de distributions gaussiennes

F =K!

j=1

"jN (·|µj ,!j)

ou"

j "j = 1

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 11 / 39

Page 34: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification basee sur un modeleDempster et al., 1977

F est suppose etre un melange de distributions F ="K

j=1 "j f (·|Uj)

U1, . . . ,UK sont les centroıds des clusters

"1, . . . ,"K sont les tailles relatives des clusters ("K

j=1 "j = 1) de tellefacon que Pr(ck = j) = "j

f (·) est la forme parametrique d’un cluster (e.g. gaussienne demoyenne et matrice de covariance inconnues)

Objectif : Estimer ! = {U1:K , "1:K} etant donne z1:n

Approche bayesienne empirique : maximiserp(z1:n|!) =

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Algorithme Expectation-Maximization

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 12 / 39

Page 35: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification basee sur un modeleDempster et al., 1977

F est suppose etre un melange de distributions F ="K

j=1 "j f (·|Uj)

U1, . . . ,UK sont les centroıds des clusters

"1, . . . ,"K sont les tailles relatives des clusters ("K

j=1 "j = 1) de tellefacon que Pr(ck = j) = "j

f (·) est la forme parametrique d’un cluster (e.g. gaussienne demoyenne et matrice de covariance inconnues)

Objectif : Estimer ! = {U1:K , "1:K} etant donne z1:n

Approche bayesienne empirique : maximiserp(z1:n|!) =

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Algorithme Expectation-Maximization

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 12 / 39

Page 36: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification basee sur un modeleDempster et al., 1977

F est suppose etre un melange de distributions F ="K

j=1 "j f (·|Uj)

U1, . . . ,UK sont les centroıds des clusters

"1, . . . ,"K sont les tailles relatives des clusters ("K

j=1 "j = 1) de tellefacon que Pr(ck = j) = "j

f (·) est la forme parametrique d’un cluster (e.g. gaussienne demoyenne et matrice de covariance inconnues)

Objectif : Estimer ! = {U1:K , "1:K} etant donne z1:n

Approche bayesienne empirique : maximiserp(z1:n|!) =

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Algorithme Expectation-Maximization

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 12 / 39

Page 37: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification basee sur un modeleDempster et al., 1977

F est suppose etre un melange de distributions F ="K

j=1 "j f (·|Uj)

U1, . . . ,UK sont les centroıds des clusters

"1, . . . ,"K sont les tailles relatives des clusters ("K

j=1 "j = 1) de tellefacon que Pr(ck = j) = "j

f (·) est la forme parametrique d’un cluster (e.g. gaussienne demoyenne et matrice de covariance inconnues)

Objectif : Estimer ! = {U1:K , "1:K} etant donne z1:n

Approche bayesienne empirique : maximiserp(z1:n|!) =

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Algorithme Expectation-Maximization

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 12 / 39

Page 38: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification basee sur un modeleDempster et al., 1977

F est suppose etre un melange de distributions F ="K

j=1 "j f (·|Uj)

U1, . . . ,UK sont les centroıds des clusters

"1, . . . ,"K sont les tailles relatives des clusters ("K

j=1 "j = 1) de tellefacon que Pr(ck = j) = "j

f (·) est la forme parametrique d’un cluster (e.g. gaussienne demoyenne et matrice de covariance inconnues)

Objectif : Estimer ! = {U1:K , "1:K} etant donne z1:n

Approche bayesienne empirique : maximiserp(z1:n|!) =

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Algorithme Expectation-Maximization

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 12 / 39

Page 39: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification basee sur un modeleDempster et al., 1977

F est suppose etre un melange de distributions F ="K

j=1 "j f (·|Uj)

U1, . . . ,UK sont les centroıds des clusters

"1, . . . ,"K sont les tailles relatives des clusters ("K

j=1 "j = 1) de tellefacon que Pr(ck = j) = "j

f (·) est la forme parametrique d’un cluster (e.g. gaussienne demoyenne et matrice de covariance inconnues)

Objectif : Estimer ! = {U1:K , "1:K} etant donne z1:n

Approche bayesienne empirique : maximiserp(z1:n|!) =

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Algorithme Expectation-Maximization

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 12 / 39

Page 40: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification basee sur un modeleDempster et al., 1977

F est suppose etre un melange de distributions F ="K

j=1 "j f (·|Uj)

U1, . . . ,UK sont les centroıds des clusters

"1, . . . ,"K sont les tailles relatives des clusters ("K

j=1 "j = 1) de tellefacon que Pr(ck = j) = "j

f (·) est la forme parametrique d’un cluster (e.g. gaussienne demoyenne et matrice de covariance inconnues)

Objectif : Estimer ! = {U1:K , "1:K} etant donne z1:n

Approche bayesienne empirique : maximiserp(z1:n|!) =

#nk=1 p(zk |!) =

#nk=1

"Kj=1 "j f (zk |Uj)

Algorithme Expectation-Maximization

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 12 / 39

Page 41: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

2 Modeles bayesiens non parametriques

3 Algorithme MCMC

4 Classification non supervisee dynamique

5 Conclusion

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 13 / 39

Page 42: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Cadre Bayesien

Parametre ! et observations z

Distribution a priori p(!) et vraisemblance p(z |!)Distribution a posteriori obtenue par le theoreme de Bayes

p(!|z) =p(!)p(z |!)

p(z)

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 14 / 39

Page 43: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Markov Chain Monte Carlo

En general impossible de determiner analytiquement p(!|z)

! Dimension importante! Pas de forme parametrique simple (e.g. gaussienne...)

Developpement des methodes de Monte Carlo

Comment obtenir des echantillons !(1),!(2), . . . , !(N)

approximativement distribues selon p(!|z) ?

! = {!1, . . . , !p}

Echantillonneur de Gibbs

Pour i = 1, . . . ,N,

Pour k = 1, . . . , p, echantillonner !(i)k selon

p(!k |!(i)1 , . . . , !(i)

k!1, !(i!1)k+1 , . . . , !(i!1)

p , z)

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 15 / 39

Page 44: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Estimation de densite bayesienne (parametrique)

Donnees z1, . . . , zn i.i.d. selon une distribution inconnue F

F est un melange de distributions F ="K

j=1 "j f (·|Uj)

Cadre bayesien complet : distributions a priori sur les poids et lescentroıds

"1:K " D(#

K, . . . ,

#

K)

Uj " G0 pour j = 1, . . . ,K

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 16 / 39

Page 45: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Estimation de densite bayesienne (parametrique)

Modele hierarchique

"1:K " D(#

K, . . . ,

#

K)

Uj " G0 pour j = 1, . . . ,K

Pour k = 1, . . . , n

ck " "1:K

zk |ck ,U1:K " f (·|Uck )

Objectif : Estimer p("1:K ,U1:K , c1:n|z1:n)

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 17 / 39

Page 46: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Modele hierarchique non parametriqueProcessus de Dirichlet a melange

Limite du modele parametrique quand K #$Modele bayesien hierarchique

"1:K " D(#

K, . . . ,

#

K)

Uj " G0 pour j = 1, . . . ,K

Pour k = 1, . . . , n

ck " "1:K

zk |ck ,U1:K " f (·|Uck )

F prend la forme d’un melange infini (denombrable)F =

""j=1 "j f (·|Uj)

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 18 / 39

Page 47: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Modele hierarchique non parametriqueProcessus de Dirichlet a melange

Distribution a deux parametres sur F

# > 0 regle la taille relative des clusters :

! Si ## 0, un cluster de taille % 1! Si ##$, infinite de clusters de poids similaires

G0 est la distribution a priori sur les centroıds des clusters

Non parametrique : Le nombre d’inconnues (clusters) augmente avecles donnees

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 19 / 39

Page 48: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Simulations

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 20 / 39

Page 49: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Simulations

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 20 / 39

Page 50: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Simulations

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 20 / 39

Page 51: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

2 Modeles bayesiens non parametriques

3 Algorithme MCMC

4 Classification non supervisee dynamique

5 Conclusion

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 21 / 39

Page 52: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois

Poids "1:", centroıds des clusters U1:", variables d’allocation c1:n

Integration analytique selon les parametres (de dimension infinie)"1:" et calculer Pr(ck |c1:k!1)

processus du restaurant chinois

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 22 / 39

Page 53: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 23 / 39

Page 54: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 23 / 39

Page 55: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 23 / 39

Page 56: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois

Une donnee k est associee

! a un cluster existant avec une probabilite proportionnelle au nombre dedonnees associees a ce cluster

! a un nouveau cluster avec une probabilite proportionnelle a #

E"et de clustering

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 24 / 39

Page 57: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Echantillonneur de Gibbs

Sous certaines conditions, on peut egalement integrer selon les Uj

Objectif : Obtenir des echantillons c(1)1:n , c(2)

1:n , . . . , c(N)1:n

approximativement distribues selon Pr(c1:n|z1:n)

Echantillonneur de Gibbs pour la classification non supervisee

Pour i = 1, . . . ,N,

Pour k = 1, . . . , n, echantillonner c(i)k selon

Pr(ck |c(i)1 , . . . , c(i)

k!1, c(i!1)k+1 , . . . , c(i!1)

n , z1:n)

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 25 / 39

Page 58: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Echantillonneur de Gibbs

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 26 / 39

Page 59: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Echantillonneur de Gibbs

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 26 / 39

Page 60: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Echantillonneur de Gibbs

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 26 / 39

Page 61: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Echantillonneur de Gibbs

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 26 / 39

Page 62: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Echantillonneur de Gibbs

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 26 / 39

Page 63: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Methodes bayesiennes non parametriques pour laclassification non superviseeResume

Base sur un modele : la forme parametrique d’un cluster doit etredefinie (e.g. gaussienne, etc.)

Approche bayesienne

! Distribution a priori sur la taille relative des clusters (#)! Distribution a priori sur les centroıds des clusters (G0)

Nombre de clusters inconnu et estime a partir des donnees

Algorithmes de simulation e#caces

Bruit de fond/autres parametres inconnus peuvent etre pris en compte

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 27 / 39

Page 64: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

2 Modeles bayesiens non parametriques

3 Algorithme MCMC

4 Classification non supervisee dynamique

5 Conclusion

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 28 / 39

Page 65: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Classification non supervisee dynamique

Clustering statique : hypothese d’echangeabilite des donneesz1, . . . , zn

Si les donnees sont obtenues sequentiellement, cette hypothese peutetre trop forte

Nombre de clusters, les centroıds/tailles des clusters peuvent evolueren fonction du temps

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 29 / 39

Page 66: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Clustering dynamique

Ensemble de donnees zk,n k = 1, . . . , n, t = 1, . . . ,T

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 30 / 39

Page 67: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Clustering dynamique

Ensemble de donnees zk,n k = 1, . . . , n, t = 1, . . . ,T

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 30 / 39

Page 68: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de pics neuronauxBar-Hillel et al., J. of Neuroscience Methods, 2006

Brefs potentiels d’action enregistres par une micro-electrodeObjectif : classer les signaux afin d’attribuer chaque potentiel a unneurone particulierDerive de l’electrode, evolution des formes des pics et du bruit defond...

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 31 / 39

Page 69: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Exemple : Classification de pics neuronauxBar-Hillel et al., J. of Neuroscience Methods, 2006

Brefs potentiels d’action enregistres par une micro-electrodeObjectif : classer les signaux afin d’attribuer chaque potentiel a unneurone particulierDerive de l’electrode, evolution des formes des pics et du bruit defond...

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 31 / 39

Page 70: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois dynamique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 32 / 39

Page 71: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois dynamique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 32 / 39

Page 72: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois dynamique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 32 / 39

Page 73: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois dynamique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 32 / 39

Page 74: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois dynamique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 32 / 39

Page 75: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Processus du restaurant chinois dynamique

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 32 / 39

Page 76: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Algorithme

On peut dans certains cas integrer egalement les centroıds des clusters

Echantillons pour approcher Pr(c1:n,1:T |z1:n,1:T )

Algorithmes de Monte Carlo e#caces hors et en ligne

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 33 / 39

Page 77: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Simulation

Donnees simulees avec bruit de fond

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 34 / 39

Page 78: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Maladie de la fievre aphteuse

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 35 / 39

Page 79: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Maladie de la fievre aphteuse

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 35 / 39

Page 80: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Sommaire

1 Introduction

2 Modeles bayesiens non parametriques

3 Algorithme MCMC

4 Classification non supervisee dynamique

5 Conclusion

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 36 / 39

Page 81: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

ConclusionMethodes bayesiennes non parametriques : Processus de Dirichlet

Base sur un modele : forme parametrique d’un cluster

Bayesien : distribution a priori sur les centroıds/taille des clusters

Non parametrique : Nombre de clusters est directement estime apartir des donnees

Algorithmes de Monte Carlo e#caces pour estimer ces modeles

Versions statiques/dynamiques

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 37 / 39

Page 82: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

ConclusionMethodes bayesiennes non parametriques : Processus de Dirichlet

Base sur un modele : forme parametrique d’un cluster

Bayesien : distribution a priori sur les centroıds/taille des clusters

Non parametrique : Nombre de clusters est directement estime apartir des donnees

Algorithmes de Monte Carlo e#caces pour estimer ces modeles

Versions statiques/dynamiques

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 37 / 39

Page 83: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

ConclusionMethodes bayesiennes non parametriques : Processus de Dirichlet

Base sur un modele : forme parametrique d’un cluster

Bayesien : distribution a priori sur les centroıds/taille des clusters

Non parametrique : Nombre de clusters est directement estime apartir des donnees

Algorithmes de Monte Carlo e#caces pour estimer ces modeles

Versions statiques/dynamiques

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 37 / 39

Page 84: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

ConclusionMethodes bayesiennes non parametriques : Processus de Dirichlet

Base sur un modele : forme parametrique d’un cluster

Bayesien : distribution a priori sur les centroıds/taille des clusters

Non parametrique : Nombre de clusters est directement estime apartir des donnees

Algorithmes de Monte Carlo e#caces pour estimer ces modeles

Versions statiques/dynamiques

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 37 / 39

Page 85: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

ConclusionMethodes bayesiennes non parametriques : Processus de Dirichlet

Base sur un modele : forme parametrique d’un cluster

Bayesien : distribution a priori sur les centroıds/taille des clusters

Non parametrique : Nombre de clusters est directement estime apartir des donnees

Algorithmes de Monte Carlo e#caces pour estimer ces modeles

Versions statiques/dynamiques

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 37 / 39

Page 86: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

Bibliographie

F. Caron, M. Davy, A. DoucetGeneralized Polya Urn for time-varying Dirichlet Process MixturesInternational Conference on Uncertainty in Artificial Intelligence, 2007.

A.P. Dempster, N.M. Laird and D.B. RubinMaximum Likelihood from Incomplete Data via the EM algorithmJournal of the Royal Statistical Society, 1977.

T. FergusonA Bayesian analysis of some nonparametric problems,The annals of statistics, vol. 1, pp. 209-230, 1973.

R.M. NealMarkov chain sampling methods for Dirichlet process mixture models,Journal of Computational and Graphical Statistics, 9 :249-265, 2000

C. Robert et G. CasellaMonte Carlo statistical Methods,Springer-Verlag, 1999.

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 38 / 39

Page 87: F ranücois Ca ron - Inriapeople.bordeaux.inria.fr/pierre.delmoral/slides-caron.pdf · F ranücoi s Ca ron (INR IA Bo rdeaux) App renti ssage non sup ervi s«e 23 o cto bre 2008 9

The end

Merci pour votre attention

Francois Caron (INRIA Bordeaux) Apprentissage non supervise 23 octobre 2008 39 / 39