Ciència

Marta Villegas, mestra de català de la IA

Lidera la Unitat de Tecnologies del Llenguatge al BSC, impulsant models de llenguatge en català i castellà

Marta Villegas, nascuda a Barcelona, és una de les figures més influents en el camp de les tecnologies del llenguatge. Amb més de 30 anys d’experiència, dirigeix la Unitat de Tecnologies del Llenguatge al Barcelona Supercomputing Center (BSC), una posició que l’ha situat com a referent en la recerca i desenvolupament del processament del llenguatge natural (NLP). Sota el seu lideratge, la unitat ha fet grans avenços en la creació de models de llenguatge massius i l’aprenentatge automàtic no supervisat, especialment per a llengües menys representades com el català, el gallec, l’euskera i el castellà.

Des de la seva incorporació al BSC, el 2017, ha treballat en projectes finançats per la Unió Europea, com OpenMinTeD i METANET4U, amb l’objectiu de millorar les infraestructures lingüístiques europees. Un dels projectes més destacats sota la seva direcció és el model de llenguatge anunciat pel govern espanyol al Mobile World Congress. Aquest model, concebut com un ChatGPT multilingüe, serà un recurs obert per facilitar la interacció amb màquines i aplicacions en llengües maternes. “El nostre objectiu és que totes les nostres llengües estiguin ben representades i, sobretot, que es respecti l’entorn cultural”, afirma Villegas, referint-se al paper essencial del català en el món digital.

La seva trajectòria acadèmica inclou posicions destacades a la Universitat Autònoma de Barcelona i la Universitat Pompeu Fabra, on va participar en la creació d’infraestructures lingüístiques pioneres a Europa. La seva experiència en la modelització de dades i la gestió d’infraestructures tecnològiques ha estat fonamental per als èxits dels projectes. El seu lideratge ha estat clau en el Projecte MarIA, guardonat amb el premi Archiletras 2022 a la innovació, i el Projecte AINA, que té com a objectiu avançar en el processament del llenguatge natural en català, generant recursos lingüístics i models preformats per desenvolupar aplicacions en català.

“És determinant que les nostres eines entenguin i reflecteixin les nostres pròpies cultures i llengües”, assegura Villegas, que ha impulsat models de llenguatge capaços de reconèixer i processar termes culturals específics. Aquest treball és clau per garantir que el català no es quedi enrere en l’evolució tecnològica global.

De l’acadèmia a la pràctica efectiva
El 2022 Marta Villegas va ser guardonada amb el premi Ciutat de Barcelona de ciències i tecnologia experimentals per la seva tasca pionera en la integració del català en el món digital. Amb un equip multidisciplinari format per lingüistes computacionals, científics de dades i enginyers de programari, la seva unitat al BSC es manté a l’avantguarda del processament del llenguatge natural, aprofitant la informàtica d’alt rendiment per crear tecnologies del llenguatge amb un impacte positiu tant per a la indústria com per a la societat.
El català i la IA
Amb la seva visió clara i determinació, continua contribuint de manera decisiva a la recerca en tecnologies lingüístiques, establint les bases per a un futur digital inclusiu, on totes les llengües tinguin un paper destacat en el món de la IA.
Sign in. Sign in if you are already a verified reader. I want to become verified reader. To leave comments on the website you must be a verified reader.
Note: To leave comments on the website you must be a verified reader and accept the conditions of use.