Recursos
Explora los datos y recursos usados en LatamGPT
Modelo LatamGPT 1.0
LatamGPT-SFT-1.0 es la primera versión del modelo de lenguaje latinoamericano, basado en Llama 3.1 de 70 mil millones de parámetros y entrenado con Continued Pretraining (CPT) y Supervised Fine-Tuning (SFT) utilizando datos regionales.
Descarga el modelo directamente con Hugging Face.
Modelo disponible en Hugging Face
Trueque Benchmark
Trueque es un benchmark de evaluación colaborativo y revisado por humanos para medir el desempeño de LLMs en preguntas sobre conocimiento y cultura latinoamericana.
Explora las 500 preguntas curadas sobre historia, cultura, geografía y gastronomía de 20 países de América Latina.
Dataset disponible en Hugging Face
CHOCLO
CHOCLO es un benchmark especializado en conocimiento cultural latinoamericano para evaluar qué tan bien los modelos de lenguaje comprenden y representan la cultura de la región.
Más de 100.000 filas con preguntas sobre geografía, fauna, flora, tradiciones, gastronomía y figuras públicas de 18 países, con tres niveles de dificultad.
Dataset disponible en Hugging Face
Copuchat - Contribuye con Datos
Copuchat es un aplicativo experimental montado sobre GPT 4.1, de OpenAI, que simula conversaciones reales con usuarios de América Latina y el Caribe para mejorar el alineamiento de futuras versiones de LatamGPT.
Ayuda a mejorar LatamGPT y participa en conversaciones anónimas que serán útiles para entrenar el modelo.
Participa en conversaciones para contribuir al entrenamiento de LatamGPT