14
SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Embed Size (px)

Citation preview

Page 1: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

SafeSound

Stage de DESS IRR à Risø, un laboratoire national

danois04/2003 – 09/2003Alexandre Alapetite

Page 2: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Intégration

Risø1956 : utilisation du nucléaire1985 : arrêt du nucléaireDiversité de recherches

DanemarkLangueCulture

Page 3: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Le projet « SafeSound »

Sujet principal du stageIntégration d’une interface homme/machine audio dans des cockpits d’avions

Sortie son 3DReconnaissance vocale

Page 4: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Reconnaissance vocale

Peu de compétence dans le département en reconnaissance vocaleNuance, un système utilisé par TNO, un partenaire du projetNécessité de trouver un système de reconnaissance vocale

Ceux que je connaissais déjàCeux disponibles à l’essai sur Internet

Page 5: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Microsoft Speech Agent API 4

Personnage 3DAnimationsSynthèse vocalePlusieurs languesReconnaissance vocale

Pas très adaptéReconnaissance vocale dépasséePeu commode d’utilisation (clavier)

Page 6: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

VoiceXML 1.0

Très standardFacile à mettre en oeuvreUtilisation avec IBM WebSphere Studio 5 et Voice Toolkit 4.1

Orienté téléphonieLourdCher

Page 7: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Microsoft Speech SDK 5.1

Intégré à Windows, libre utilisationFacile à intégrer et à programmerLéger et souple d’utilisationBonnes performances

ApprentissageDifférents types de grammairePhonétique

Système retenu

Page 8: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Nuance 8.0

Système utilisé par TNOAtouts indispensables

Liste des n meilleurs choix

Orienté téléphonieLourdCher

Page 9: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Applications

Radar1 : avec SAPI 5.1

Conception de grammaire

2 : avec NuanceExpertise de grammaire

RadioAvec Nuance

Expertise de grammaire

Navigateur Internet

Page 10: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Navigateur Internet multi-modal

Clavier, souris, mais aussi reconnaissance vocale, suivi oculaire, etc.Étude théorique, mais aussi utile

Personnes handicapéesSystèmes sans clavier ni sourisAutres situations (cuisine, …)

Page 11: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Intégration dans Mozilla

Meilleur choix de navigateurDynamique et actuelSources en libre accèsRespectueux des standards

Extension XULApplication VB avec SAPI 5.1

Page 12: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Système vocal

Page 13: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Emploi du temps

Utilisation de mon tempsAvril-Mai : étude des systèmes vocauxJuin : applications pour des démosJuillet : étude des standards InternetJuillet-Août : navigateur InternetSeptembre : rapport

Page 14: SafeSound Stage de DESS IRR à Risø, un laboratoire national danois 04/2003 – 09/2003 Alexandre Alapetite

Conclusion

Riche au niveau compétencesHomme/machineMilieux à risques, sécurité

Riche au niveau culturelDébouchés intéressants