Modelo | Janela de Contexto | Pontuação geral | Conhecimentos gerais | Conhecimento científico e acadêmico | Matemática | Programação | Velocidade | Data de Corte |
---|---|---|---|---|---|---|---|---|
GPT-4o | 128k | 78 | 89% | 51% | 80% | 93% | 166.4 | Outubro/2023 |
o3-mini | 200k | 89 | 86% | 75% | Em testes | 97% | 61.2 | Outubro/2023 |
Claude 3.5 Sonnet | 200k | 80 | 89% | 59% | 77% | 94% | 96.1 | Junho/2022 |
DeepSeek V3 | 128k | 79 | 87% | 53% | 86% | 91% | 70.4 | Outubro/2023 |
DeepSeek R1 | 128k | 89 | 91% | 70% | 97% | 98% | 194.5 | Outubro/2023 |
Gemini 1.5 Pro | 2m | 80 | 86% | 59% | 87% | 88% | 71.3 | Janeiro/2024* |
Llama 3.1 | 128k | 74 | 87% | 51% | 70% | 87% | 88.3 | Atualizado* |
Mistral Large 2 | 128k | 74 | 85% | 48% | 73% | 90% | 44.1 | Atualizado* |
Grok Beta | 128k | 72 | 85% | 43% | 73% | 87% | 31.8 | Atualizado* |
Perplexity | 100k | 75* | 85%* | 50%* | 75%* | 85%* | 50.0* | Outubro/2023* |
Sabiá-3 | 128k | 70* | 80%* | 45%* | 70%* | 80%* | 40.0* | Outubro/2023* |
Educação & Concursos
Jurídico & Compliance
Saúde Pública
Setor Público
Recursos Humanos