12
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

Embed Size (px)

Citation preview

Page 1: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

Codage de la parole à très bas débit avec des unités ALISP

avec les partenaires du projet SYMPATEX :

ENSTELAN InformatiqueThomson => Thales

Page 2: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

1.3 Pourquoi développer des codeurs à très bas débit

Trouver les limites de la compression de la parole(sans sa compréhension)

Applications pratiques : Répondeurs automatiques sans bandes magnétiques Archivage et «boîtes noires » Communication sur des canaux à bas débits Codage redondant en télédiffusion

But à atteindre : Débit moyen de 100-500 bps Indépendant du locuteur, de la langue,

de l’environnement

Page 3: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

2. Principes généraux des codeurs à très bas débit < 400 bps

Nommées aussi codeurs segmentaux ou codeurs par indexation

Nécessitent l’utilisation de : Méthodes de reconnaissance

Quelles unités de reco utiliser ? Méthodes de synthèse

Quelles unités de synthèse utiliser ? Données à transmettre :

Indices des unités de parole reconnus Informations prosodique

Utiliser des unités ALISP

Page 4: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

2. 2 Le prix à payer

Complexité croissante Retard au décodage Mémoire plus importante Sensibilité aux erreurs de transmission Sensibilité au bruit ?

Page 5: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

3. Motivations pour utiliser ALISP

Permet un codage à très bas débit Développement de nouveaux outils pour la

recherche en phonétique Intègre le paradigme d’analyse par la synthèse Applications en reconnaissance de la parole

indépendante de la langue Identification de la langue Amélioration de la qualité de la parole

transmise, débruitage

Page 6: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

3.2 Cas idéal versus cas actuel

ALISP devrait permettre idéalement un codage Indépendant du locuteur Indépendant de la langue Indépendant de l’environnement

Réalité : On commence par résoudre le cas

dépendant du locuteur Premiers résultats pour le codage

indépendant du locuteur

Page 7: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

4. Méthodes de synthèse

Cas monolocuteur : commencer avec la LPC => résultats mauvais Nouvelle methode de concatention de segments

dans des zones de stabilité spectrale, avec synthèse préalable avec Harmonic Noise Model (HNM)

Cas indépendant du locuteur : avec la LPC => résultats comparables au cas

mono-locuteur pas encore appliquée des méthodes de synthèse

HNM

Page 8: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

5. Resultats monolocuteur sur « BU corpus »

codage méthode ALISP (HNM) unités de synthèse correspondantes aux modèles HMM

synthèse HNM

original

choix des unités de synthèse à partir des transcriptions phonétiques concaténation des formes d’onde

Page 9: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

6. Expériences indépendantes du

locuteur sur BREF

Cas indépendant du locuteur : suffisamment de données parole d’un échantillon représentatif pour les données d’ entraînement et d’un autre ensemble de locuteurs disjoints pour le test (codage)

Exemple mono-locuteur , synthèse LPC, sur Bref

Exemple indépendant du locuteur, synthèse LPC

Page 10: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

6.3 Correspondance Alisp phones, Bref

Page 11: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

Conclusions et perspectives

améliorer l’intelligibilité et la qualité choix d’unités compatibles pour

le codage et la synthèse à partir du texte rendre le codeur indépendant du

locuteur et de la langue restituer l’identité du locuteur

Page 12: Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

Et à plus longs termes...

• utiliser la technique ALISP de codage avec

des références étiquetées phonétiquement

pour faciliter la reconnaissance automatique

de la parole

• expérimenter le codage ALISP en vérification du locuteur