26
[email protected] eBread - applicazione di lettura per dislessici https://www.mivoq.it/ Giulio Paci <[email protected]>

tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · [email protected] eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

https://www.mivoq.it/

Giulio Paci <[email protected]>

Page 2: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Proponente: chi siamo?

Text To Speech

Page 3: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Proponente: chi siamo?

Crea la tua voce

Real Speech

MIVOQServer

PersonalizedSynthetic Speech

Page 4: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Proponente: storia

I Competizioni per Startup/Progetti d’impresaI Start CUP Veneto (2012): primo postoI Rebound (2012): selezionatiI PNI (2012): finalistiI Natiper (2016): primo posto

I Spin-off del Consiglio Nazionale delle Ricerche (CNR) (2013)

I Fondata (2013)I Progetti

I FI-Content 2 (2014): partner ufficialiI IMPACT Accelerator (2015): percorso completatoI Impact Hub Milano (2016): percorso iniziato

Page 5: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Capitolato

Oggetto

Page 6: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Capitolato

Problema

Page 7: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Capitolato

Soluzione

Page 8: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Capitolato

Soluzione

Page 9: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Capitolato

Obiettivi di Mivoq

I App utile che utilizzi Sintesi Vocale

I Utilizzare parte del codice → opensource

I Interfaccia Multimodale (combinare audio e testo)

Page 10: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Capitolato

Vincoli tecnologici

I Piattaforma Android

I Motore di sintesi FA-TTSI Tecnologie di terze parti

I Accedere al contenuto testualeI Visualizzare il contenuto

Page 11: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Elementi di sfida

Sfida 1: Realizzare App funzionante

Integrare interfaccia multimodale interattiva

Lettore di audiolibri(es.: lettore di ePub)

Applicazione di messaggistica(es.: client Telegram)

Page 12: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Elementi di sfida

Sfida 2: Estendere Android TextToSpeech

Applicazione oltre i limiti di Android TextToSpeech.

http://developer.android.com/reference/android/speech/tts/TextToSpeech.html

Limiti superabili usando FA-TTS.

Page 13: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Elementi di sfida

Text To Speech

TESTO TTS

VOCE

PARAMETRI:Lingua, Stile,Sesso, Età, Voce, ...

Page 14: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

Elementi di sfida

Text To Speech

TESTO TTS

VOCE

PARAMETRI:Lingua, Stile,Sesso, Età, Voce, ...

METADATI:Fonemi,Visemi,Durate, ...

Page 15: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler

http://mediafi.org/

Page 16: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - Caratteristiche

FA-TTS: Flexible and Adaptive Text To Speech

I TTS fornito come servizio SaaS

I con supporto per: Inglese, Italiano, Tedesco, Francese, . . .

I basato sul server opensource MaryTTS: bug fixes,miglioramenti vari, moduli personalizzati e voci personalizzate,nuove API HTTP

I Flexible: permette di cambiare lo stile della voce

I Adaptive: permette di replicare una voce specifica

Page 17: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - Installazione ed Uso

Istruzioni per Installazione e Uso

I Le informazioni ufficiali sono disponibili suhttp://mediafi.org/

I Per i piu impazienti. . .https://registry.hub.docker.com/u/fic2/fatts/

I Launch FA-TTS

docker run -d -p 59125:59125 fic2/fatts

I Andate su http://localhost:59125/ e buondivertimento!

Page 18: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get capabilities information: Version

curl --get http://localhost:59125/info/version

{"fa_tts_api_version":"0.0.1","vendor":"Mivoq SRL","product":"FA-TTS (MaryTTS server)","specification":"5.2-SNAPSHOT","implementation":{

"revision":"5beaed"}

}

Page 19: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get capabilities information: Available languages

curl --get http://localhost:59125/info/locales/all

{"locales":[

"de","en","en_US","fr","it",...

],next: ...

}

Page 20: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get capabilities information: Available voices 1

curl --get http://localhost:59125/info/voices/all

{"voices":[

{"id":"upmc-pierre-hsmm","locales":["fr"],"gender":"male"

},...

],"next": ...

}

Page 21: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get capabilities information: Available voices 2

curl --get http://localhost:59125/info/voices/locale/it

{"voices":[

{"id":"istc-speaker_internazione-hsmm","locales":["it"],"gender":"male"

},...

],"next": ...

}

Page 22: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get capabilities information: Voice capabilities

curl --get http://localhost:59125/info/voice/cmu-slt-hsmm/inputs/all

{"inputs":[

{"id":"TEXT"},...

]}

Page 23: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get capabilities information: Voice capabilitiescurl --get http://localhost:59125/info/voice/cmu-slt-

hsmm/outputs/all

{"outputs":[

{"id":"AUDIO","formats":[

{"id":"WAVE_FILE"},{"id":"AU_FILE"},{"id":"AU_STREAM"},{"id":"AIFF_FILE"}

]}

]}

Page 24: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get capabilities information: Voice capabilities

curl --get http://localhost:59125/info/voice/cmu-slt-hsmm/styles/all

{"styles":[

{"id":"sad"},{"id":"happy"},...

]}

Page 25: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get capabilities information: Voice capabilities

curl --get http://localhost:59125/info/voice/cmu-slt-hsmm/effects/all

{"effects":[]

}

Page 26: tech@mivoq - UniPDtullio/IS-1/2016/Progetto/C4p.pdf · 2016. 11. 4. · tech@mivoq.it eBread - applicazione di lettura per dislessici Proponente: storia I Competizioni per Startup/Progetti

[email protected]

eBread - applicazione di lettura per dislessici

FA-TTS Specific Enabler - API

API: get speech!

curl --get http://localhost:59125/say \--data input[type]=TEXT \--data input[locale]=it \--data-urlencode input[content]="Hello world." \

\--data output[type]=AUDIO \--data output[format]=WAVE_FILE \

\--data voice[gender]="neutral" \--data-urlencode voice[name]="istc-

speaker_internazione-hsmm" \--data utterance[style]="sad" \

| aplay