
En el marc del Projecte Aina, els investigadors de la Unitat de Tecnologies del Llenguatge del BSC, Javier Aula-Blasco i Julia Falcao ofereixen una xerrada en la ACM Europe Summer School on HPC Computer Architectures for AI and Dedicated Applications.
La xerrada, que porta per nom “Understanding LLMs & Life after Instruction Tuning: RLHF, LFPF, DPO, PPO” estarà dividida en dues parts. La primera part d’aquesta conferència oferirà una exploració 101 de l’arquitectura, el “cicle de vida” i les capacitats reals dels grans models de llenguatge (LLM). El focus se centrarà en com aquests models processen i generen text semblant a l’ésser humà, tots els mètodes disponibles per avaluar el seu rendiment i les limitacions inherents al desplegament i ús d’aquests models.
En la segona part d’aquesta conferència s’aprofundirà en tècniques avançades per perfeccionar els models de llenguatge post-instrucció. La discussió inclourà l’aprenentatge de reforç de la retroalimentació humana (RLHF), l’aprenentatge de la retroalimentació de preferències (LFPF), l’optimització de preferències directes (DPO) i l’optimització de polítiques proximals (PPO). Es posarà èmfasi en com aquests mètodes milloren el rendiment del model, l’adaptabilitat i l’alineació amb les preferències humanes, impulsant aplicacions d’IA més efectives i matisades.
Podeu consultar tota la informació en aquest enllaç.