45
MASTER GI 2 MASTER GI 2 ème ème année année VoiceXML VoiceXML & & serveurs vocaux serveurs vocaux 2003/2004 2003/2004 Jérôme LAFON Jérôme LAFON [email protected] [email protected] INTRODUCTION INTRODUCTION VOICEXML VOICEXML Caractéristique Caractéristique s Avantages Avantages Inconvénients Inconvénients syntaxe syntaxe Exemples de Exemples de code code RECONNAISSANCE RECONNAISSANCE VOCALE VOCALE fonctionnement fonctionnement 2 types de 2 types de moteurs moteurs DOMAINES DOMAINES D’APPLICATION D’APPLICATION SERVEURS VOCAUX SERVEURS VOCAUX Caractéristique Caractéristique s Points à Points à vérifier vérifier L’OFFRE L’OFFRE COMMERCIALE COMMERCIALE CONCLUSION

MASTER GI 2 ème année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

  • Upload
    romeo

  • View
    30

  • Download
    2

Embed Size (px)

DESCRIPTION

INTRODUCTION VOICEXML Caractéristiques Avantages Inconvénients syntaxe Exemples de code RECONNAISSANCE VOCALE fonctionnement 2 types de moteurs DOMAINES D’APPLICATION SERVEURS VOCAUX Caractéristiques Points à vérifier L’OFFRE COMMERCIALE CONCLUSION. MASTER GI 2 ème année - PowerPoint PPT Presentation

Citation preview

Page 1: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

MASTER GI 2MASTER GI 2ème ème annéeannée

VoiceXMLVoiceXML&&

serveurs vocauxserveurs vocaux

2003/20042003/2004

Jérôme LAFONJérôme LAFON

[email protected]@laposte.net

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 2: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Introduction

Un marché porteurUn marché porteur Actuellement: 1.5 milliards téléphonesActuellement: 1.5 milliards téléphones Un milliard de téléphones mobiles vendu Un milliard de téléphones mobiles vendu

par an d'ici 2004par an d'ici 2004 3 milliards de min de communications en 3 milliards de min de communications en

2002 en France sur des services vocaux2002 en France sur des services vocaux En 2004: plus de mobiles que de fixesEn 2004: plus de mobiles que de fixes GSM (9.6 Kbps) vers GPRS (144 Kbps) GSM (9.6 Kbps) vers GPRS (144 Kbps)

puis UMTS (2 Mbps)puis UMTS (2 Mbps) WAP: augmentation des services WAP: augmentation des services

disponiblesdisponibles

l’internet vocal  commence à trouver l’internet vocal  commence à trouver sa placesa place

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 3: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: Caractéristiques VoiceXML est aux services vocaux ce que le VoiceXML est aux services vocaux ce que le

langage HTML est aux services WEB.langage HTML est aux services WEB.

Langage à baliseLangage à balise Début de voiceXML en 1995 avec AT&TDébut de voiceXML en 1995 avec AT&T VoiceXML 1.0 défini par VoiceXML Forum (600 VoiceXML 1.0 défini par VoiceXML Forum (600

entreprises) en mars 2000entreprises) en mars 2000 Validation en mai 2000 par le W3C, Validation en mai 2000 par le W3C, Sortie de VoiceXML 2.0 en février 2003 (obligation Sortie de VoiceXML 2.0 en février 2003 (obligation

de suivre une grammaire)de suivre une grammaire) conçue pour "l'internet vocal". conçue pour "l'internet vocal". Son but: Son but:

description de dialogues avec l'utilisateurdescription de dialogues avec l'utilisateur utilisation des ressources du web.utilisation des ressources du web. Analogie HTML/VoiceXML:Analogie HTML/VoiceXML:

E/S avec HTML: web browser avec affichage, clavier, E/S avec HTML: web browser avec affichage, clavier, sourissouris

E/S avec VoiceXML: voice browser avec sortie audio E/S avec VoiceXML: voice browser avec sortie audio (synthétisée ou enregistrée), entrée audio et DTMF(synthétisée ou enregistrée), entrée audio et DTMF

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 4: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML décrit l'interaction homme-machine fournie par des systèmes fournissant une réponse vocale et plus précisément:

•Sortie audio synthétisée (TTS)•Sortie audio enregistrée (TTS)•Reconnaissance vocale en entrée (ASR)•Reconnaissance de signaux DTMF en entrée•Enregistrement de l’entrée•Contrôle du dialogue•Opérations téléphonique: transfert d’appel et déconnexion

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: Caractéristiques

Page 5: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: Avantages

VoiceXML tire profit de plusieurs VoiceXML tire profit de plusieurs tendances:tendances:

La croissance du Web et de ses La croissance du Web et de ses possibilités. possibilités.

Améliorations de la reconnaissance Améliorations de la reconnaissance vocale.vocale.

Améliorations de la synthèse vocale.Améliorations de la synthèse vocale. La diffusion du WWW au delà de La diffusion du WWW au delà de

l'ordinateur de bureau.l'ordinateur de bureau.

parc installé considérableparc installé considérable Augmentation de la bande passante et Augmentation de la bande passante et

de la QoS sur Internet -> transfert de de la QoS sur Internet -> transfert de l’audio sur le Web optimisél’audio sur le Web optimisé

Développement rapide d’applications Développement rapide d’applications VoiceXML grâce à des éditeurs XML VoiceXML grâce à des éditeurs XML spécialisés.spécialisés.

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 6: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: Avantages

Le marché potentiel en 2005:Le marché potentiel en 2005: Les applications vocales généreront 45 Les applications vocales généreront 45

Milliards d’Euros de revenusMilliards d’Euros de revenus Les portails vocaux généreront 1.8 Milliards Les portails vocaux généreront 1.8 Milliards

d’Euros de revenusd’Euros de revenus Les portails vocaux compteront 300 millions Les portails vocaux compteront 300 millions

d’utilisateursd’utilisateursLignes téléphoniques dans le monde

(en Millions - Source : ITU)

574 606 645692

740794

848906

970

23 34 55 91145

214

319

472

650

0

200

400

600

800

1000

1200

1992 1993 1994 1995 1996 1997 1998 1999 2000

Fixes

Mobiles

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 7: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: Avantages

Le langage est standardisé permettant: Le langage est standardisé permettant: une pérennité des investissements une pérennité des investissements une interopérabilité garantie avec les une interopérabilité garantie avec les

autres services web autres services web une souplesse quant aux recours à des une souplesse quant aux recours à des

prestataires (développeurs, prestataires (développeurs, hébergeurs,…) pour faire face à un pic hébergeurs,…) pour faire face à un pic de volume ou d’activité de volume ou d’activité

Le ROI augmenteLe ROI augmente Coût moyen par appel (humain) : 2 à 5 Coût moyen par appel (humain) : 2 à 5

EurosEuros Coût moyen par appel (ASR) : 0.1 à Coût moyen par appel (ASR) : 0.1 à

0.3 Euros0.3 Euros

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 8: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: Avantages

Avantages par rapport au Avantages par rapport au Wap/XHTML:Wap/XHTML:

Taille réduite de l’écran d’un mobileTaille réduite de l’écran d’un mobile Difficulté de se déplacer en regardant Difficulté de se déplacer en regardant

l’écran d’un mobilel’écran d’un mobile

Souplesse pour l’utilisateurSouplesse pour l’utilisateur Dialogue dirigéDialogue dirigé Dialogue mixteDialogue mixte

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 9: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: Inconvénients

Difficulté de décrire une Difficulté de décrire une information complexe vocalementinformation complexe vocalement

S’appuie sur des technologies S’appuie sur des technologies pouvant engendrer des erreurspouvant engendrer des erreurs

Langage interprétéLangage interprété

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 10: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: Syntaxe

Utilisation d’une grammaire:Utilisation d’une grammaire: Spécifie les mots et phrases que Spécifie les mots et phrases que

l’utilisateur peut dire l’utilisateur peut dire

Obligatoire depuis voiceXML 2.0Obligatoire depuis voiceXML 2.0

2 types2 types ABNF (Augmented BNF)ABNF (Augmented BNF) XMLXML

2 modes en entrée:2 modes en entrée: VoixVoix DTMFDTMF

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 11: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

grammaire XML : entête

ABNF ABNF # ABNF 1.0 ISO-8859-1; # ABNF 1.0 ISO-8859-1; language en; language en; mode voice; mode voice; root $topRule;root $topRule;

XML XML <?xml version="1.0" encoding="ISO-8859-<?xml version="1.0" encoding="ISO-8859-

1"?> <grammar version="1.0" 1"?> <grammar version="1.0" xmlns="http://www.w3.org/2001/06/gramxmlns="http://www.w3.org/2001/06/grammar" xml:lang="en" mar" xml:lang="en"

mode="voice" mode="voice" root="topRule"root="topRule">> Extension: ABNF: Extension: ABNF: .gram.gram et et .grxml.grxml pour les pour les

grammaires XML grammaires XML

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 12: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

grammaire XML : exemples

ABNFABNF$name = $firstName $lastName;$name = $firstName $lastName; $firstName = Jonathan $firstName = Jonathan || Jeff; Jeff; $lastName = Eisenzopf $lastName = Eisenzopf || Franklin Franklin || Smith; Smith;

XMLXML <rule id="Name"><rule id="Name"> <ruleref uri="#firstName"/> <ruleref uri="#firstName"/> <ruleref uri="#lastName"/><ruleref uri="#lastName"/> </rule> </rule> <rule id="firstName"><rule id="firstName"> <one-of> <one-of> <item>Jonathan</item> <item>Jeff</item> <item>Jonathan</item> <item>Jeff</item> </one-of></one-of> </rule></rule> <rule id="lastName"> <rule id="lastName"> <one-of> <item>Eisenzopf</item> <one-of> <item>Eisenzopf</item>

<item>Franklin</item> <item>Smith</item><item>Franklin</item> <item>Smith</item> </one-of> </one-of> </rule> </rule>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 13: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Grammaires: suite

Possibilité de:Possibilité de: Rendre les symboles non terminaux et Rendre les symboles non terminaux et

terminaux optionnelsterminaux optionnels$name = $name = [[um um [[yeah wellyeah well]]]] ([([my name ismy name is]] | |

[[I'mI'm])]) $firstName $firstName [[$lastName$lastName]];;

Spécifier le nombre de fois que l’on désire Spécifier le nombre de fois que l’on désire avoir un symboleavoir un symbole

0 ou plus -> $mood = I am very 0 ou plus -> $mood = I am very <0-><0-> happy; happy;

1 ou plus -> $mood = I am very 1 ou plus -> $mood = I am very <1-><1-> happy; happy;

Un intervalle -> $eat = Please Un intervalle -> $eat = Please <1-5><1-5> eat eat your food; your food;

Un nombre exact -> $eat = Please Un nombre exact -> $eat = Please <5><5> eat your food; eat your food;

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 14: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Grammaires et interprétation sémantique

Ajout ou pas d’une interprétation sémantique au Ajout ou pas d’une interprétation sémantique au moment de la reconnaissancemoment de la reconnaissance

ExempleExemple En entrée l’utilisateur dit: « I would like a coca En entrée l’utilisateur dit: « I would like a coca

cola and three large pizzas with pepperoni and cola and three large pizzas with pepperoni and mushrooms »mushrooms »

Module ASR & grammaire génère l’info Module ASR & grammaire génère l’info sémantique:sémantique:

{ { drink: "coke" drink: "coke" pizza: pizza:

{{ number: "3" number: "3"

size: "large« size: "large«  topping: [ "pepperoni" "mushrooms" ] topping: [ "pepperoni" "mushrooms" ]

}} } }

Sinon voiceXML utilise la chaîne de caractère brut Sinon voiceXML utilise la chaîne de caractère brut reconnue.reconnue.

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 15: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: balises

Tout document VoiceXML doit Tout document VoiceXML doit commencer par:commencer par:

< ?xml version="1.0"?> < ?xml version="1.0"?> < vxml version="2.0">< vxml version="2.0">

Les principales balises et leur Les principales balises et leur utilité:utilité:

<form>: ségmente le document VXML. Est <form>: ségmente le document VXML. Est responsable d’exécuter une partie du responsable d’exécuter une partie du dialoguedialogue

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 16: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

<menu>: permet à l’utilisateur de <menu>: permet à l’utilisateur de choisir.choisir.

Ex:Ex:

<menu> <menu>

<choice <choice next="http://www.sports.example.com/vxml/start.vxmlnext="http://www.sports.example.com/vxml/start.vxml"> <grammar src="sports.grxml" "> <grammar src="sports.grxml" type="application/srgs+xml"/> Sports type="application/srgs+xml"/> Sports

</choice> </choice>

<choice <choice next="http://www.weather.example.com/intro.vxml"> next="http://www.weather.example.com/intro.vxml"> <grammar src="weather.grxml" <grammar src="weather.grxml" type="application/srgs+xml"/> Weather type="application/srgs+xml"/> Weather

</choice> </choice>

</menu> </menu>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: balises

Page 17: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Dans <form> on trouve 2 types de balises:Dans <form> on trouve 2 types de balises: Récupération des informations Récupération des informations

utilisateurutilisateur <field><field> ASR et DTMF avec une grammaire ASR et DTMF avec une grammaire <record><record> enregistrement de l’utilisateur enregistrement de l’utilisateur <transfer><transfer> - transfert l’utilisateur vers un - transfert l’utilisateur vers un

autre posteautre poste <object><object> - invoque un objet spécifique à la - invoque un objet spécifique à la

plateforme pour traiter l’entrée utilisateurplateforme pour traiter l’entrée utilisateur <subdialog><subdialog> - appel un dialog (<form> - appel un dialog (<form>

ou <menu>)ou <menu>)

Taches ne traitant pas l’entrée Taches ne traitant pas l’entrée utilisateurutilisateur

<block><block> - enferme une séquence - enferme une séquence d’opérations de traitement et d’annonced’opérations de traitement et d’annonce

<initial><initial> - commence un dialogue mixte - commence un dialogue mixte

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: balises

Page 18: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Autres balises utiles:Autres balises utiles:

<prompt>:<prompt>: annonce un message à annonce un message à l’utilisateur l’utilisateur

<grammar>: <grammar>: spécifie la grammaire utiliséespécifie la grammaire utilisée

<if>, <else>, & <elseif>: <if>, <else>, & <elseif>: les tests les tests traditionnelstraditionnels

<var>: <var>: déclaration d’une variabledéclaration d’une variable

<assign>: <assign>: modification de la valeur d’une modification de la valeur d’une variable variable

<audio>:<audio>: permet de remplacer le TTS par permet de remplacer le TTS par un son enregistré un son enregistré

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: balises

Page 19: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

EvènementsEvènementsVoiceXML fournit un mécanisme de VoiceXML fournit un mécanisme de

manipulation d’évènements.manipulation d’évènements.Si l’utilisateur :Si l’utilisateur :

ne répond pasne répond pas ne parle pas correctementne parle pas correctement demande de l’aidedemande de l’aide

La plateforme lance un évènement:La plateforme lance un évènement:

<catch> permet de traiter cet évènement<catch> permet de traiter cet évènement<throw> permet de lancer un évènement<throw> permet de lancer un évènement

Ex:Ex:<catch event="error"><catch event="error"><prompt>Caught an error event</prompt><prompt>Caught an error event</prompt></catch> </catch>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: balises

Page 20: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Autres balises utiles:Autres balises utiles:<goto>: <goto>: déplacement vers:déplacement vers:

Une autre balise à l’intérieur de la form:Une autre balise à l’intérieur de la form: <goto nextitem=« nom_item" /><goto nextitem=« nom_item" />

Une autre <form> à l’intérieur du même Une autre <form> à l’intérieur du même doc:doc:

<goto next="#form_id" /><goto next="#form_id" /> Un autre document:Un autre document:

<goto next="http://url.fr/doc.vxml" <goto next="http://url.fr/doc.vxml" />/>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: balises

Page 21: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

VoiceXML: Exemples

Exemple 1: une application TTSExemple 1: une application TTS

<?xml version="1.0"?><?xml version="1.0"?>

<vxml version="2.0"> <vxml version="2.0">

<form id="auteur"> <form id="auteur">

<block> <block>

<prompt> Hello </prompt> <prompt> Hello </prompt>

</block> </block>

< /form> < /form>

< /vxml> < /vxml>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 22: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Exemple 1bis: une application qui Exemple 1bis: une application qui joue un fichier audiojoue un fichier audio

<?xml version="1.0"?><?xml version="1.0"?>

<vxml version="2.0"> <vxml version="2.0">

<form id="auteur"> <form id="auteur">

<block> <block>

<prompt> Hello </prompt> <prompt> Hello </prompt>

<audio src="http:…/audio/hello.wav"><audio src="http:…/audio/hello.wav">

</block> </block>

< /form> < /form>

< /vxml> < /vxml>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: Exemples

Page 23: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Exemple 2: récupérer des Exemple 2: récupérer des informations utilisateurinformations utilisateur

<form id="getPhoneNumber"> <form id="getPhoneNumber">

<field name="PhoneNumber"><field name="PhoneNumber">

<prompt>What's your phone <prompt>What's your phone number?</prompt>number?</prompt>

<grammar src="../grammars/phone.gram" <grammar src="../grammars/phone.gram" type="application/srgs+xml" />type="application/srgs+xml" />

<help> Please say your ten digit phone <help> Please say your ten digit phone number. </help>number. </help>

</field> </field>

</form></form>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: Exemples

Page 24: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Exemple 3: utilisation de <goto>:Exemple 3: utilisation de <goto>:

<form id="getPhoneNumber"> <form id="getPhoneNumber">

<field name="PhoneNumber" type="phone" > <field name="PhoneNumber" type="phone" >

<prompt>What's your phone number?</prompt><prompt>What's your phone number?</prompt>

<grammar src="../grammars/phone.gram" <grammar src="../grammars/phone.gram" type="application/srgs+xml" />type="application/srgs+xml" />

<help> Please say your ten digit phone number. </help><help> Please say your ten digit phone number. </help>

</field></field>

<block><block>

<goto next="#pizzaType"> </block><goto next="#pizzaType"> </block>

</form></form>

<form id="pizzaType"><form id="pizzaType">

<field name="pizzaTopping" > <field name="pizzaTopping" >

<prompt>What type of pizza do you want?</prompt><prompt>What type of pizza do you want?</prompt>

<grammar src="../grammars/pizzas.gram" <grammar src="../grammars/pizzas.gram" type=""application/x-jsgf"/> type=""application/x-jsgf"/>

</field></field>

</form></form>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: Exemples

Page 25: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Utilisation de if/else/elseifUtilisation de if/else/elseif<if cond="amount < 29.95"><if cond="amount < 29.95"><goto next="#debit"/><goto next="#debit"/><else /><else /><prompt>You are out of cash. </prompt><prompt>You are out of cash. </prompt></if></if>

Déclaration-modification de Déclaration-modification de variables:variables:

<var name="myvar" expr="'hi'" /> <var name="myvar" expr="'hi'" /> <assign name="myvar" expr="10" /><assign name="myvar" expr="10" />

Utilisation d’une variable:Utilisation d’une variable:<prompt> <prompt>

I just wanted to sayI just wanted to say<value expr="myvar" /> <value expr="myvar" />

</prompt></prompt>

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: Exemples

Page 26: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

ApplicationApplication multi-documents:multi-documents:

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: Exemples

Page 27: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Avantages d’une application multi-Avantages d’une application multi-documents:documents:

Avoir un contexte globalAvoir un contexte global Grouper logiquement les dialogues (type, Grouper logiquement les dialogues (type,

fonctionnalité…)fonctionnalité…) Découper les grosses applications -> gain Découper les grosses applications -> gain

en temps de chargementen temps de chargement

Conditions nécessaires au bon Conditions nécessaires au bon fonctionnement d’une telle fonctionnement d’une telle applicationapplication

existence d’un document « root »existence d’un document « root » Chaque document non « root » doit Chaque document non « root » doit

inclure cette ligne:inclure cette ligne:

<vxml version="2.0" <vxml version="2.0" application="pizza.vxml" > application="pizza.vxml" >

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

VoiceXML: Exemples

Page 28: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

ASR: Fonctionnement

Schéma généralSchéma général

point commun à tous les transcripteurs: point commun à tous les transcripteurs: le phonèmele phonème

Fichier audio

Moteur de reconnaissance vocale

Modèles acoustiques

Dictionnaire si Transcription textuelle

Modèles de langage si Transcription textuelle

Transcription textuelleouTranscription phonémique

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 29: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Modèle acoustique : détermination du Modèle acoustique : détermination du contextecontexte

qualité du fichier audio qualité du fichier audio Type de voixType de voix parole ou bruit….parole ou bruit…. Segmentation de l’audio selon les Segmentation de l’audio selon les

orateursorateurs

Modèle de langage: reconnaissance Modèle de langage: reconnaissance des motsdes mots

Modèle n-gramme (actuellement bi ou Modèle n-gramme (actuellement bi ou tri-gramme)tri-gramme)

n-bestn-best

ASR: Fonctionnement INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 30: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Différents types:Différents types:

Avec apprentissageAvec apprentissage Utilisation d’un large dictionnaireUtilisation d’un large dictionnaire 95% de taux de reconnaissance95% de taux de reconnaissance Utilisation en dictée vocaleUtilisation en dictée vocale Traitement temps réelTraitement temps réel Bon marchéBon marché Phase d’apprentissagePhase d’apprentissage Ex: Dragon, ViaVoice…Ex: Dragon, ViaVoice…

Sans apprentissage avec large Sans apprentissage avec large dictionnairedictionnaire

Environ 85% de taux de reconnaissance en Environ 85% de taux de reconnaissance en environnement non bruitéenvironnement non bruité

Beaucoup moins rapide que le temps réel Beaucoup moins rapide que le temps réel Coût élevéCoût élevé Ex: MediaspeechEx: Mediaspeech

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

ASR: Types

Page 31: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Sans apprentissage avec dictionnaire Sans apprentissage avec dictionnaire restreintrestreint

Plus de 90% de taux de reconnaissancePlus de 90% de taux de reconnaissance Coût élevéCoût élevé Ex: philsoft ASR engine, SpeechWorksEx: philsoft ASR engine, SpeechWorks

Inconvénient de ces 3 catégories: Mise à jour Inconvénient de ces 3 catégories: Mise à jour indispensable du dictionnaire (noms propres…)indispensable du dictionnaire (noms propres…)

Sans apprentissage, sans dictionnaireSans apprentissage, sans dictionnaire Traitement rapideTraitement rapide Pas de MAJ du dicoPas de MAJ du dico Possibilité de reconnaître les noms propres, de Possibilité de reconnaître les noms propres, de

lieuxlieux Solution propriétaire: moteur de recherche et Solution propriétaire: moteur de recherche et

fichiers générésfichiers générés Recherches basées sur la phonétique-Recherches basées sur la phonétique-

>tolérence>tolérence Coût très élevéCoût très élevé Ex: Fast TalkEx: Fast Talk

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

ASR: Types

Page 32: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

ASR et VoiceXML

ASR utilisé avec VoiceXML: sans ASR utilisé avec VoiceXML: sans apprentissage, dictionnaire restreintapprentissage, dictionnaire restreint

Architecture d’un moteur de reco. Architecture d’un moteur de reco. Vocale au service de voiceXML:Vocale au service de voiceXML:

entrée audio

Moteur de reconnaissance vocale

Modèles acoustiques

grammaire Modèles de langage

Transcription textuelle

[Ajout de données sémantiques]

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 33: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Domaines d’applications

Apporte le contenu et les Apporte le contenu et les applications du Web sur le applications du Web sur le téléphonetéléphone Consultation d’informationsConsultation d’informations MessagerieMessagerie V-CommerceV-Commerce Portails Intranets d’entreprisesPortails Intranets d’entreprises

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 34: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Domaines d’applications

Services téléphoniques:Services téléphoniques: Annuaire, mise en relation …Annuaire, mise en relation …

applications mains-libres:applications mains-libres: Téléphone en voiture: emails, agenda, Téléphone en voiture: emails, agenda,

contactscontacts Citroën C3Citroën C3

Systèmes embarquésSystèmes embarqués Systèmes de navigationSystèmes de navigation Fonctionnalités activées par la voixFonctionnalités activées par la voix

Personnes avec un handicapPersonnes avec un handicap Accès au Web pour les déficients visuelsAccès au Web pour les déficients visuels Guidage d’outils par la voixGuidage d’outils par la voix

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 35: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Serveurs vocaux

Définition:Définition: serveur informatique adapté à la serveur informatique adapté à la

téléphonie professionnelle téléphonie professionnelle But:But:

gérer automatiquement un grand nombre gérer automatiquement un grand nombre d'appels téléphoniques entrants et d'appels téléphoniques entrants et sortants.sortants.

Interface entre Internet et le Interface entre Internet et le réseau téléphoniqueréseau téléphonique

Compatible VoiceXMLCompatible VoiceXML -> pérennité et -> pérennité et interopérabilité des applicationsinteropérabilité des applications

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 36: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Serveurs vocaux

Critères à prendre en compte:Critères à prendre en compte: Plateforme ouverte/flexiblePlateforme ouverte/flexible

supporter une palette étendue de supporter une palette étendue de technologiestechnologies

interopérabilité interopérabilité Ajouts de fonctionnalités par la suite Ajouts de fonctionnalités par la suite

(ASR…)(ASR…) Performante et redimensionnement Performante et redimensionnement

Temps de latenceTemps de latence Service facturéService facturé Utilisation de caches(TTS par exemple)Utilisation de caches(TTS par exemple) capacité de redimensionnement capacité de redimensionnement

Standardisée Standardisée Enlève l’obsolescence des développements Enlève l’obsolescence des développements interopérabilité interopérabilité

Capable de minimiser les délais de Capable de minimiser les délais de développement développement

Facile à superviser Facile à superviser

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 37: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

TELISMA Voice Distributed FrameworkTELISMA Voice Distributed Framework

Plateforme comprend:Plateforme comprend:

ASR: Telisma Philsoft ASR engine 3.2 ASR: Telisma Philsoft ASR engine 3.2  TTS: connecteur pour logiciel compatible SAPITTS: connecteur pour logiciel compatible SAPI interpréteur VoiceXML 2.0interpréteur VoiceXML 2.0

Compatible avec les grammaires XML et ABNFCompatible avec les grammaires XML et ABNF

Adaptation parole/bruitAdaptation parole/bruit

Processus distribuéProcessus distribué Hot PlugHot Plug Load balancingLoad balancing SNMP pour la supervision du traitementSNMP pour la supervision du traitement

Offre commerciale INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 38: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

OS:OS: Windows NT/2000, Solaris, Windows NT/2000, Solaris, LinuxLinux

API:API: C/C++ C/C++

Offre commerciale INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 39: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

IDYLIC Phonic Telecom Voice IDYLIC Phonic Telecom Voice PlatformPlatform

Plateforme vocale complète:Plateforme vocale complète: Modules ASR (Telisma PhilSoft) et TTS Modules ASR (Telisma PhilSoft) et TTS

(Elan Tempo): (Elan Tempo): Perfs: 30 à 120 appels simultanés par Perfs: 30 à 120 appels simultanés par

serveurserveur Sortie: TTS et fichiers audioSortie: TTS et fichiers audio Utilisation d’un cache pour fichiers audioUtilisation d’un cache pour fichiers audio Administration webAdministration web Module permettant de lancer des alertes Module permettant de lancer des alertes

par mailpar mail

OS: Windows NT4/2000OS: Windows NT4/2000

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Offre commerciale

Page 40: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

IDYLIC Phonic Telecom Voice IDYLIC Phonic Telecom Voice PlatformPlatform

ArchitectureArchitecture

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Offre commerciale

Page 41: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Voice Genie ServerVoice Genie Server membre du voiceXML forummembre du voiceXML forum

Utilisation des moteurs ASR et TTS du Utilisation des moteurs ASR et TTS du marché:marché:

AT&T WatsonAT&T WatsonBBNBBN HARK and Byblos HARK and ByblosNuance 8Nuance 8SpeechWorks' OSR 1.1SpeechWorks' OSR 1.1Telisma Telisma

AT&T Natural VoicesAT&T Natural VoicesScansoftScansoftSpeechWorks SpeechifySpeechWorks SpeechifySVOX  SVOX 

Genie IDEGenie IDE

OS:OS: Linux Linux

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Offre commerciale

Page 42: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

NuanceNuance Voice Platform Voice Platform Fait partie du voiceXML forumFait partie du voiceXML forum Technologie ASR et TTS de Nuance (Nuance 8.0 & Technologie ASR et TTS de Nuance (Nuance 8.0 &

Nuance Vocalizer 3.0)Nuance Vocalizer 3.0) Nuance 8: Nuance 8: Précision de 97%, Technologie « say

anything » Authentification vocale avec le module Nuance Authentification vocale avec le module Nuance

Verifier 3.0 Verifier 3.0 3 composants:3 composants:

Nuance Conversation ServerNuance Conversation Server Interpreteur voiceXMLInterpreteur voiceXML Interface avec le reseau telephonique et Interface avec le reseau telephonique et

InternetInternet Nuance Management StationNuance Management Station

administration et analyse du système SNMP

Nuance Application EnvironmentNuance Application Environment Diminue le temps de developpementDiminue le temps de developpement

Compatible avec les serveurs d’application: Compatible avec les serveurs d’application: BEA WebLogic, IBM Websphere et Apache Tomcat

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Offre commerciale

Page 43: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Architecture distribuée avec load balancing

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Offre commerciale

Nuance Voice PlatformNuance Voice Platform

Page 44: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Conclusion

La reconnaissance vocale arrive à La reconnaissance vocale arrive à maturitématurité

Marché idéal pour des applications Marché idéal pour des applications vocalesvocales

VoiceXML est une technologie VoiceXML est une technologie applicable dans de multiples domainesapplicable dans de multiples domaines

VoiceXML rénove le réseau VoiceXML rénove le réseau téléphonique téléphonique Nouveaux usages, nouveaux servicesNouveaux usages, nouveaux services

VoiceXML est le standard de-factoVoiceXML est le standard de-facto Supporté par plus de 600 entreprisesSupporté par plus de 600 entreprises Basé sur les technologies de l’InternetBasé sur les technologies de l’Internet Adopté par les développeurs du WebAdopté par les développeurs du Web

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION

Page 45: MASTER GI 2 ème  année VoiceXML & serveurs vocaux 2003/2004 Jérôme LAFON j.lafon@laposte

Références

•http://www.w3.org/TR/voicexml20/

•www.voicexml.org•http://www.developer.com/voice/article.php/1565381 (grammaire)•http://developpeur.journaldunet.com/tutoriel/xml/021025xml_voicexmlgrammaire1.shtml (grammaire)

•www.neteconomie.com

•www.serveur-vocal.org/d%E9finition-serveur-vocal.htm

•http://0franc.free.fr/telephonie/mobile/gsm.htm

•http://www.convergeonline.com/voicexml.html

•http://www.dexem.fr

•www.voicegenie.com

•www.telisma.com

•http://www.idylic.com/voice/xml/server/phonic.htm

•http://www.nuance.com/prodserv/nvp.html

INTRODUCTIONINTRODUCTION

VOICEXMLVOICEXML CaractéristiqueCaractéristique

ss AvantagesAvantages InconvénientsInconvénients syntaxesyntaxe Exemples de Exemples de

codecode

RECONNAISSANRECONNAISSANCE VOCALECE VOCALE

fonctionnementfonctionnement 2 types de 2 types de

moteursmoteurs

DOMAINES DOMAINES D’APPLICATIOND’APPLICATION

SERVEURS SERVEURS VOCAUXVOCAUX

CaractéristiqueCaractéristiquess

Points à vérifierPoints à vérifier

L’OFFRE L’OFFRE COMMERCIALECOMMERCIALE

CONCLUSIONCONCLUSION