Recursos
Explore os dados e recursos utilizados no LatamGPT
Modelo LatamGPT 1.0
LatamGPT-SFT-1.0 é a primeira versão do modelo de linguagem latino-americano, baseado no Llama 3.1 com 70 bilhões de parâmetros e treinado com Continued Pretraining (CPT) e Supervised Fine-Tuning (SFT) utilizando dados regionais.
Baixe o modelo diretamente no Hugging Face.
Modelo disponível no Hugging Face
Trueque Benchmark
Trueque é um benchmark de avaliação colaborativo e revisado por humanos para medir o desempenho de LLMs em perguntas sobre conhecimento e cultura latino-americana.
Explore 500 perguntas curadas sobre história, cultura, geografia e gastronomia de 20 países da América Latina.
Dataset disponível no Hugging Face
CHOCLO
CHOCLO é um benchmark especializado em conhecimento cultural latino-americano para avaliar o quanto os modelos de linguagem compreendem e representam a cultura da região.
Mais de 100.000 linhas com perguntas sobre geografia, fauna, flora, tradições, gastronomia e figuras públicas de 18 países, com três níveis de dificuldade.
Dataset disponível no Hugging Face
Copuchat - Contribua com Dados
O Copuchat é um aplicativo experimental baseado no GPT 4.1, da OpenAI, que simula conversas reais com usuários da América Latina e do Caribe para melhorar o alinhamento de versões futuras do LatamGPT.
Ajude a melhorar o LatamGPT e participe de conversas anônimas que serão úteis para treinar o modelo.
Participe de conversas para contribuir com o treinamento do LatamGPT