Tecnologies de la parla

tecnologies

La parla és el mitjà més natural d’interacció com a interfície entre humans i màquines, tenint en compte totes les seves variacions possibles. El xatbots són un dels tipus d’aplicatius possibles. A banda, en la parla existeixen altres factors com poden ser els trets personals com el gènere i l’edat. Tot i això, aquestes varietats de maneres de parlar, suposen al mateix temps una barrera d’entrada. Per superar-les i facilitar l’adaptació d’aquestes tecnologies cal treballar prèviament en la creació de:

Per a poder implementar tecnologies de la parla
com a interfície entre humans i màquines es
treballarà en la generació i actualització de:

MODELS GRANS DE SÍNTESI DE LA PARLA (TTS)
RECONEIXEMENT DE LA PARLA (STT)
TRADUCCIÓ AUTOMÀTICA PARLA A PARLA (MT S2S)

LA RECERCA D’AINA ES FOCALITZA EN:

Investigar i ampliar el catàleg dels models de les tecnologies de la parla a les arquitectures noves i d’impacte.

Desenvolupar models de STT multillengua, per transcriure enregistraments multilingües.

Desenvolupar models TTS per fer transferència de parlant i de llengua, base pel doblatge automàtic.

Entrenar models específics a domini (producció audiovisual, telefonia, conversacional).

Fomentar la presència i continuïtat del català a les tecnologies i entorns més populars de la comunitat de programari lliure.

Altres models d’aprenentatge automàtic machine learning.