La RAE abrirá "próximamente" al público sus herramientas IA para buscar neologismos, verificar textos y aclarar dudas
La Real Academia Española (RAE) ultima sus herramientas elaboradas en el marco del proyecto Lengua Española e Inteligencia Artificial (LEIA) -que la academia ya utiliza internamente- para poderlas hacer públicas y gratuitas para el resto de ciudadanos "próximamente".
Entre estas herramientas hay tres aplicaciones principales, como ha explicado la experta en la materia, Asunción Gómez-Pérez, este jueves 6 de noviembre. Se trata de un observatorio de neologismos, herramientas para la verificación lingüística automática de textos y un sistema de consultas gracias al entrenamiento de la inteligencia artificial (IA) a través de materiales y obras en los que la RAE ha trabajado.
También se ha creado un archivo con las llamadas "fichas de puntos rojos" digitalizadas, papeletas lexicográficas de "gran valor" que designan la primera documentación que se tiene de una palabra.
La plataforma LEIA, que por el momento se encuentra alojada en una nube privada, tiene la parte privada con la que trabaja la institución y una parte pública que es a la que se podrá acceder desde su página web de manera libre. Así, el proyecto ha contado con una financiación pública de 5 millones de euros y el apoyo del Ministerio para la Transformación Digital y de la Función Pública. Han colaborado empresas como Google, Microsoft, Telefónica y AWS.
"La Real Academia de Españolas entra con decisión en el territorio de la inteligencia artificial con la convicción de que esta tecnología ya no es una opción, sino una necesidad. Y sabemos que a partir de ahora no podemos concebir nuestro trabajo sin ella. La inteligencia artificial no es un capricho, no es una opción, es una alianza indispensable para preservar, estudiar y priorizar la lengua española hacia el futuro", ha apuntado el director de la RAE, Santiago Muñoz Machado, durante la presentación de las herramientas.
Entre las aplicaciones prioritarias para la RAE se encuentra el observatorio de neologismos, términos y variaciones del español, que consiste en una herramienta que detecte -a partir de fuentes como prensa, blogs, información en redes sociales y demás obras de la Academia- palabras y expresiones panhispánicas en uso que no se hayan registrado en el Diccionario de la lengua española (DLE).
El Observatorio es una herramienta "muy avanzada" capaz de rastrear de manera masiva palabras que no están registradas, analizando 1 millón de formas diarias. Después de analizar y rastrear palabras como por ejemplo "juernes", "pódcast" o "youtuber", los lingüistas de la RAE estudian la palabra y la publicarán en la web solo si la consideran de interés. Solo significa que es detectada y que está en observación, no que esté aceptada.
Otra de las herramientas prioritarias para la entidad es el verificador lingüístico, con el que los usuarios podrán comprobar, tras introducir su texto, si este es correcto desde un punto de vista ortográfico, gramatical y léxico, mientras que la aplicación ofrece sugerencias de cambio y explicaciones sobre el error realizado.
Por otra parte, la RAE también pone en funcionamiento una herramienta que de respuesta a las dudas lingüísticas de los hispanohablantes a través de un buscador y un el sistema que seleccionará la respuesta de entre las almacenadas en la plataforma. Como ha explicado Gómez-Pérez, en caso de que el sistema no pueda dar respuesta concluyente, el usuario recibirá la explicación de manera "personalizada" de los lingüistas de la RAE, por lo que no se trata de un "chatbot".
Solo tiene intención de facilitar el trabajo entre miembros del equipo de la RAE y usar la IA para recuperar las respuestas que se hayan dado anteriormente a consultas realizadas en redes sociales como Twitter (actual X) o a través del mail institucional. Así, minimiza tiempos de respuestas pero en todo momento estará supervisada.
Junto con todas estas herramientas, que contarán con la implementación de medidas para la accesibilidad, existirá una línea de recopilación de material las distintas variedades geográficas del español (especialmente léxico y oral), que se completa con las aportaciones de los hispanohablantes, quienes podrán ver una imagen y describirla con su propia voz, u observar un objeto e indicar cómo lo llaman en su lugar de procedencia y así crear un "corpus oral" que entrene a la IA.
Para la ejecución de los paquetes de trabajo, la RAE ha puesto a "todo" su personal interno a disposición de esta segunda fase, mientras que contará con la participación de las empresas externas subcontratadas Fujitsu, con tecnología de Amazon Web Services (AWS), para los paquetes correspondientes al observatorio, verificador, diversidad y accesibilidad, y VASS, para la elaboración de la herramienta de consultas y respuestas.
Sé el primero en comentar