Sylvain Daudé DEA ATIAM Modèle statistique de la voix à structure optimisée pour la...

Preview:

Citation preview

Sylvain Daudé

DEA ATIAM

Modèle statistique de la voixà structure optimisée

pour la caractérisationdes phénomènes dynamiques

Stage réalisé au LIA sous la directionde MM. Bonastre et Linarès

Contexte

• Traitement automatique de la parole

• Modélisation statistique de la parole– MMG en R.A.L.– MMC en R.A.P

• Dynamique de la parole– durée, séquentialité, synchronie– variations spectrales– importance dans le signal de parole

Problématique• Apprentissage du modèle

– MMG : peu d'information dynamique– MMC : de l'information dynamique dans les

transitions, mais…• peu prise en compte lors de l'apprentissage

• modèles de durée infructueux

Objectif : prendre en compte les infos dynamiques dans le modèle

Méthode : des données au modèle

Caractères statistiques+ infos dynamiques

Analyse

Modèle

Correspondance

Données

+ d’infosInterprétation ?

Construction du modèle

MMG MMC

...

Diminution du nombre d’états

Info dynamique dans les MMC ?

• transitions :séquentialité, durée

• regroupement d’états :synchronie : « vraie » distribution d’un caractère acoustique

Vrais. Vrais.

tEtat 1

tEtat 2

Etat 1+2 « vraie » distribution

Stratégies de regroupement

• Similarité des entrées-sorties :séquentialité, synchronie des chemins parallèles

• Eloignement des entrées-sorties :bifurcations, asynchronie des chemins parallèles

• Information mutuelle : synchronie

• Transitions mutuelles : linéaire, séquentialité

Les résultats

128 127 117 107 97 87 77 67 57 47 37 27 17 7 1Nombre d'états du modèle

-0,5

-0,4

-0,3

-0,2

-0,1

0

0,1

0,2

0,3

0,4

Ec

art

p/r

au

ha

sa

rd (

log

V)

Transitions mutuelles

Proximité de profilsEloignement de profilsInformation mutuelle

Conclusion

• Meilleurs modèles :

– séquentialité ou synchronie portées par le modèle

– réestimation des transitions

• Gain en complexité

• Meilleure modélisation de l’information dynamique

Perspectives

• Améliorations

– Concilier synchronie et séquentialité

– Modèles de durée

• Estimation de la qualité

• Application musicale

Des questions ? (1)

D E A

Meilleurchemin

Trame 1 Trame 2 Trames 3, 4, 5

Trames 6, 7Trame 8Trame 9

Vraisemblancestrame / état

Vraisemblancedu MMC

Information mutuelle :

),( )()(

),(log),(),(

ba ji

ijij

bpap

bapbapjiI

Des questions ? (2)

t

Vrais.

Etat 1t

Vrais.

Etat 2

Etat 1+2 « vraie » distribution

Recommended