L’Institut d’Estudis Aranesi (IEA-AALO) cedirà dades de veu, text i metadades al Barcelona Supercomputing Center (BSC-CNS). Uns recursos claus a través dels quals Aina desenvoluparà models lingüístics, per primer cop, també en aranès. Ambdues entitats signen un acord clau per la incorporació de la llengua occitana en els sistemes d’intel·ligència artificial desenvolupats pel Projecte Aina. La Unitat de Tecnologies del Llenguatge del centre és l’equip que coordina el projecte.

Aina i Institut Estudis Aranesi

La col·laboració preveu que el BSC pugui pre-processar les dades per tal d’integrar-les al corpus d’Aina. Els datasets que estan disponibles a Hugging Face són fonamentals per l’entrenament dels models i de les Tecnologies del Llenguatge (TL). Serà a través d’aquest recursos, quan Aina desenvoluparà model lingüístics també en aranès.

A través d’aquesta visió transversal dels models lingüístics Aina vol esdevenir una eina crucial per l’impuls de llengües amb pocs recursos digitals.

Per l’Institut d’Estudis Aranesi es tracta “d’un pas que pot comportar un avanç important per al desenvolupament de tecnologies en llengua occitana que puguin facilitar l’estudi i anàlisi lingüístic així com una major difusió i foment de la llengua a través d’aplicacions de redacció de textos o correcció automàtica, entre altres”, segons Jèp de Montoya, president de l’IEA-AALO.

El Projecte Aina liderat pel Barcelona Supercomputing Center i finançat per la Generalitat de Catalunya, expandeix així el seu ventall de col·laboracions, més enllà del català. A través d’aquesta visió transversal dels models lingüístics Aina vol esdevenir una eina crucial per l’impuls de llengües amb pocs recursos digitals. Precisament els sistemes d’intel·ligència artificial ofereixen una possibilitat única d’enfortir la presència dels low resources languages a l’àmbit digital.

Tots els recursos desenvolupats per Aina, com el model Flor 6.3B, estan disponibles a l’Aina KIT

Projecte Aina | Comunicació i premsa
press.languagetech@bsc.es

17 de gener de 2024 | Notícies científiques |