Upload
emma-lacaze
View
107
Download
3
Embed Size (px)
Citation preview
Codage de la parole à très bas débit avec des unités ALISP
avec les partenaires du projet SYMPATEX :
ENSTELAN InformatiqueThomson => Thales
1.3 Pourquoi développer des codeurs à très bas débit
Trouver les limites de la compression de la parole(sans sa compréhension)
Applications pratiques : Répondeurs automatiques sans bandes magnétiques Archivage et «boîtes noires » Communication sur des canaux à bas débits Codage redondant en télédiffusion
But à atteindre : Débit moyen de 100-500 bps Indépendant du locuteur, de la langue,
de l’environnement
2. Principes généraux des codeurs à très bas débit < 400 bps
Nommées aussi codeurs segmentaux ou codeurs par indexation
Nécessitent l’utilisation de : Méthodes de reconnaissance
Quelles unités de reco utiliser ? Méthodes de synthèse
Quelles unités de synthèse utiliser ? Données à transmettre :
Indices des unités de parole reconnus Informations prosodique
Utiliser des unités ALISP
2. 2 Le prix à payer
Complexité croissante Retard au décodage Mémoire plus importante Sensibilité aux erreurs de transmission Sensibilité au bruit ?
3. Motivations pour utiliser ALISP
Permet un codage à très bas débit Développement de nouveaux outils pour la
recherche en phonétique Intègre le paradigme d’analyse par la synthèse Applications en reconnaissance de la parole
indépendante de la langue Identification de la langue Amélioration de la qualité de la parole
transmise, débruitage
3.2 Cas idéal versus cas actuel
ALISP devrait permettre idéalement un codage Indépendant du locuteur Indépendant de la langue Indépendant de l’environnement
Réalité : On commence par résoudre le cas
dépendant du locuteur Premiers résultats pour le codage
indépendant du locuteur
4. Méthodes de synthèse
Cas monolocuteur : commencer avec la LPC => résultats mauvais Nouvelle methode de concatention de segments
dans des zones de stabilité spectrale, avec synthèse préalable avec Harmonic Noise Model (HNM)
Cas indépendant du locuteur : avec la LPC => résultats comparables au cas
mono-locuteur pas encore appliquée des méthodes de synthèse
HNM
5. Resultats monolocuteur sur « BU corpus »
codage méthode ALISP (HNM) unités de synthèse correspondantes aux modèles HMM
synthèse HNM
original
choix des unités de synthèse à partir des transcriptions phonétiques concaténation des formes d’onde
6. Expériences indépendantes du
locuteur sur BREF
Cas indépendant du locuteur : suffisamment de données parole d’un échantillon représentatif pour les données d’ entraînement et d’un autre ensemble de locuteurs disjoints pour le test (codage)
Exemple mono-locuteur , synthèse LPC, sur Bref
Exemple indépendant du locuteur, synthèse LPC
6.3 Correspondance Alisp phones, Bref
Conclusions et perspectives
améliorer l’intelligibilité et la qualité choix d’unités compatibles pour
le codage et la synthèse à partir du texte rendre le codeur indépendant du
locuteur et de la langue restituer l’identité du locuteur
Et à plus longs termes...
• utiliser la technique ALISP de codage avec
des références étiquetées phonétiquement
pour faciliter la reconnaissance automatique
de la parole
• expérimenter le codage ALISP en vérification du locuteur