Nuestros objetivos para 2024

Conseguir que la IA comprenda a 600M de personas hispanohablantes

María Grandury· 30 dic 2023· 2min

Hoy en Discord un miembro muy activo de la comunidad me ha preguntado cuáles eran los objetivos de la comunidad para 2024, así que aquí van un par de ideas. ¡Se aceptan sugerencias!

  1. Crear un corpus de instrucciones de calidad que represente las variedades del español habladas por 600M de personas, así como las lenguas cooficiales 💛

  2. Estandarizar la evaluación de LLMs en estas ricas lenguas, permitiendo analizar el progreso y comparar los modelos disponibles ✅

  3. Ofreceros mayor soporte y visibilidad (¡porque estáis creando proyectos increíbles!) 🚀

¿Quién se apunta?somosnlp.org/hackathon

Continuamos con nuestra misión

SomosNLP es una comunidad abierta y apasionada de hispanohablantes comprometida con una misión crucial: democratizar el Procesamiento del Lenguaje Natural en nuestros idiomas. A través de la creación y promoción de recursos decódigo abierto, queremos impulsar el avance del PLN en español y las lenguas cooficiales.

En los últimos años hemos visto un crecimiento en los recursos disponibles en español, pero aún hay un largo camino por recorrer. Las contribuciones open-source están revolucionando la IA, y tenemos que seguir de cerca los desarrollos en inglés. En el mundo somos más de 599 millones de hispanohablantes (dominio nativo + competencia limitada + estudiantes de español) según el Anuario del Instituto Cervantes de 2023,¡somos el 7.5% de la población mundial!

Además, el hecho de ser lengua oficial en21 paísesnos da una riqueza inigualable. ¿Cómo dices que algo te encanta? Qué guay, copado, chévere, bacán, chido, padre, bárbaro, … Los sistemas de IA tienen que entender y utilizar todas las expresiones que componen nuestro colorido idioma y sus variedades.

Llega la tercera edición de nuestro hackathon

Volviendo a los objetivos para el 2024, presentamos nuestro gran evento anual, el #HackathonSomosNLP.

Tras dos ediciones en las que desarrollamos proyectos enfocados a los Objetivos de Desarrollo Sostenible con Transformers “clásicos” (2022) y con LLMs (2023), el enfoque de este año es en los datasets para entrenar modelos de instrucciones inclusivos, y en las técnicas para evaluarlos correctamente.Necesitamos modelos que comprendan y hablen las variedades del español de los 600M de hispanohablantes, y necesitamos una manera estandarizada de evaluar y comparar dichos modelos.

Hay muchas formas de contribuir: participando en el hackathon, compartiendo conocimiento como ponente, ofreciendo mentoría, patrocinando el evento, o ayudando en la logística técnica. ¡Toda el apoyo es bienvenido!

¡Feliz 2024, nos vemos en Marzo!

SomosNLP es tu comunidad. Queremos escuchar tus ideas y sugerencias para apoyarte en tus proyectos. ¡Estamos en Discord!

Te esperamos en nuestro próximo encuentro. ¡Feliz año, vamos a hacer de 2024 un año memorable para el NLP en español!