Aquest diumenge 17 d’agost, la nova edició del congrés Interspeech dona el seu tret de sortida. És la conferència anual més important en l’àmbit de les technologies de veu. Fins allà, es desplaçarà una part de l’equip tècnic del Projecte Aina per a presentar i compartir els darrers desenvolupaments tecnològics. El congrés se celebra a Rotterdam i durant 4 dies reuneix investigadors d’arreu del món amb el lema “Ciencia i Tecnologia de Veu justa i inclusiva”.
Optimització de recursos i l’impuls de la seva adopció
Es tracta d’una fita clau pel Projecte en la qual es reconeix l’interès científic de la recerca portada a terme per l’equip tècnic. En concret, durant la conferència es presentaran aspectes clau com la millora de les tècniques de síntesi de veu o l’estudi sobre com funcionen els models en escenaris on es canvia de llengua en una mateixa conversa. A més, aquest darrer repte, conegut com a “code-switching” en la comunitat científica representa un dels elements crucials que afecten el rendiment de les tecnologies de veu en entorns bilingües o multilingües.
De fet, investigadors/es del Projecte Aina treballen amb empreses i institucions per facilitar l’adopció dels recursos generats en el marc del Projecte i disponibles a l’Aina Kit. És en el marc d’aquest procés d’adopció en què la millora de processos com el code-switching juga un paper fonamental. Al mateix temps es considera un dels aspectes clau per assegurar un bon rendiment dels models.
En aquest sentit, el congrés serà una oportunitat també per a apropar altres línies de recerca com és la integració dels models d’Aina en l’àmbit dels videojocs. Des de l’equip tècnic s’estudia com a través de les tecnologies de font oberta –open source– generades pel Projecte es pot assolir una interacció íntegrament en català i que permeti a l’usuari gaudir de l’experiència dels videojocs amb tecnologies d’Aina. Es tracta d’una recerca que es va donar a conèixer en l’última edició del congrés SAGA i que va ser rebuda amb gran interès per part de tota la comunitat.
Durant el congrés, es presenten les següents publicacions científiques:
- Optimizing ASR for Catalan-Spanish Code-Switching: A Comparative Analysis of Methodologies
- Evaluating Speech Enhancement Performance Across Demographics and Language
- Towards Domain-Specific Spoken Language Understanding for a Catalan Voice-Controlled Video Game
Les sessions i ponències al llarg del congrés són una gran oportunitat per intercanviar l’experiència entre la comunitat científica, al mateix temps que s’exploren noves òptiques pel desenvolupament de futurs recursos de llenguatge en català a través de Projectes com Aina, impulsat per la Generalitat de Catalunya i desenvolupat pel Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS).