As maiores Inteligências Artificiais avaliadas
27/05/2026
Ranking dos #10+ maiores modelos de IA
Os modelos de IA com os maiores índices de inteligência Artificial, segundo os critérios periodicamente avaliados pelo teste MMLU-Pro (veja mais abaixo o que significa isso).
A classificação, realizada pela plataforma Artificial Analysis, estabelece critérios e resultados envolvendo as principais inteligências artificiais a nível mundial. As avaliações são calculadas de forma independente.
Ranking
Análise de Inteligência, Desempenho, Preço e Verbosidade (o uso de mais palavras do que o necessário para transmitir uma ideia ou informação). [MAI2026]
1º GPT-5.5 (xhigh)
#01 • GPT-5.5 (xhigh) da OpenAI (EUA)
- #1/148 Inteligência 60,2%
- #61/148 Velocidade 70 tokens/seg de saída
- #124/148 Preço de entrada US$ 5.00 por 1 milhão de tokens
- #132/148 Preço de saída US$ 30.00 por 1 milhão de tokens
- #88/148 Verbosidade 75 milhões de tokens de saída do índice de inteligência
2º Claude Opus 4.7 (max)
#02 • Claude Opus 4.7 (Adaptative Reasoning, Max Effort) da Anthropic (EUA)
- #3/148 Inteligência 57,3%
- #80/148 Velocidade 55 tokens/seg de saída
- #131/148 Preço de entrada US$ 6.25 por 1 milhão de tokens
- #125/148 Preço de saída US$ 25.00 por 1 milhão de tokens
- #108/148 Verbosidade 110 milhões de tokens de saída do índice de inteligência
3º Gemini 3.1 Pro Preview
#03 • Gemini 3.1 Pro Preview do Google (EUA)
- #4/148 Inteligência 57,2%
- #31/148 Velocidade 136 tokens/seg de saída
- #84/148 Preço de entrada US$ 2.00 por 1 milhão de tokens
- #98/148 Preço de saída US$ 12.00 por 1 milhão de tokens
- #77/148 Verbosidade 57 milhões de tokens de saída do índice de inteligência
4º GPT-5.4 (xhigh)
#04 • GPT 5.4 (xhigh) da OpenAI (EUA)
- #5/148 Inteligência 56,8%
- #50/148 Velocidade 86 tokens/seg de saída
- #100/148 Preço de entrada US$ 2.50 por 1 milhão de tokens
- #108/148 Preço de saída US$ 15.00 por 1 milhão de tokens
- #109/148 Verbosidade 120 milhões de tokens de saída do índice de inteligência
5º Qwen3.7 Max
#05 • Qwen3.7 Max da Alibaba (China)
- #7/148 Inteligência 56,6%
- #3/148 Velocidade 210 tokens/seg de saída
- #100/148 Preço de entrada US$ 2.50 por 1 milhão de tokens
- #68/148 Preço de saída US$ 7.50 por 1 milhão de tokens
- #103/148 Verbosidade 97 milhões de tokens de saída do índice de inteligência
6º Gemini 3.5 Flash
#06 • Gemini 3.5 Flash do Google (EUA)
- #8/148 Inteligência 55,3%
- #2/148 Velocidade 212 tokens/seg de saída
- #72/148 Preço de entrada US$ 1.50 por 1 milhão de tokens
- #79/148 Preço de saída US$ 9.00 por 1 milhão de tokens
- #86/148 Verbosidade 73 milhões de tokens de saída do índice de inteligência
7º Kimi K2.6
#07 • Kimi K2.6 da MoonshotAI (China)
- #1/87 Inteligência 53,9%
- #52/87 Velocidade 30 tokens/seg de saída
- #71/87 Preço de entrada US$ 0.95 por 1 milhão de tokens
- #76/87 Preço de saída US$ 4.00 por 1 milhão de tokens
- #67/87 Verbosidade 170 milhões de tokens de saída do índice de inteligência
8º MiMo-V2.5-Pro
#08 • MiMo-V2.5 Pro da Xiaomi (China)
- #2/87 Inteligência 53,8%
- #41/87 Velocidade 49 tokens/seg de saída
- #45/87 Preço de entrada US$ 0.43 por 1 milhão de tokens
- #32/87 Preço de saída US$ 0.87 por 1 milhão de tokens
- #57/87 Verbosidade 92 milhões de tokens de saída do índice de inteligência
9º Grok 4.3 (high)
#09 • Grok 4.3 (high) da xAI (EUA)
- #11/147 Inteligência 53,2%
- #6/147 Velocidade 190 tokens/seg de saída
- #45/147 Preço de entrada US$ 1.25 por 1 milhão de tokens
- #6/147 Preço de saída US$ 2.50 por 1 milhão de tokens
- #97/147 Verbosidade 88 milhões de tokens de saída do índice de inteligência
10º Muse Spark
#10 • Muse Spark da Meta (EUA)
- #1/217 Inteligência 52%
- # Velocidade
- #1/217 Preço de entrada US$ 0.00 por 1 milhão de tokens
- #1/217 Preço de saída US$ 0.00 por 1 milhão de tokens
- #79/217 Verbosidade 58 milhões de tokens de saída do índice de inteligência
11º em diante
#11 • Claude Sonnet 4.6 da Anthropic (EUA) • #15/147 Inteligência 52%
#12 • DeepSeek V4 Pro (Reasoning, Max Effort) da DeepSeek (China) • #3/87 Inteligência 52%
#13 • GLM-5.1 da Zhipu AI (China) • #4/87 Inteligência 51%
#14 • MiniMax-M2.7 da MiniMax (China) • #7/87 Inteligência 50%
#15 • GPT-5.4 mini (xhigh) da OpenAI (EUA) • #25/147 Inteligência 49%
#16 • DeepSeek V4 Flash (Reasoning, Max Effort) da DeepSeek (China) • #10/87 Inteligência 47%
#17 • Qwen3.5 (Reasonig) da Alibaba (China) • #12/87 Inteligência 45%
#18 • DeepSeek V3.2 (Reasoning) da DeepSeek (China) • #18/87 Inteligência 42%
#19 • Mistral Medium 3.5 da Mistral (França) • #2/61 Inteligência 39%
#20 • Gemma 4 31B (Reasoning) do Google (EUA) • #4/125 Inteligência 39%
#21 • Claude Haiku 4.5 (Reasoning) da Anthropic (EUA) • #69/147 Inteligência 37%
#22 • NVIDIA Nemotron 3 Super (Reasoning) da NVIDIA (China) • #3/61 Inteligência 36%
#23 • Nova 2.0 Pro Preview da Amazon (EUA) • #72/147 Inteligência 36%
#24 • GPT-oss-120b (high) da OpenAI (EUA) • #5/61 Inteligência 33%
#25 • Solar Pro 3 da Upstage (Coreia) • #27/217 Inteligência 26%
#26 • GPT-oss-20b (high) da OpenAI (EUA) • #23/125 Inteligência 24%
#27 • K2 Think V2 da MBZUAI (China) • #11/61 Inteligência 24%
Entendendo o jogo dos grandes
O Índice de Inteligência que incorpora as 7 avaliações – MMLU-Pro, GPQA Diamond, Humanity’s Last Exam, LiveCodeBench, SciCode, AIME, MATH-500 – está lá no site da Artificial Analysis onde há todos detalhes, segundo cada critério.
Sete critérios explicados
• AIME – Artificial Intelligence in Medical Engineering – é a aplicação de Inteligência Artificial em Engenharia Médica para melhorar diagnósticos, tratamentos e dispositivos médicos. A IA é usada para analisar dados médicos, criar tratamentos personalizados, desenvolver dispositivos inteligentes, como próteses e robôs cirúrgicos, e prever tendências em saúde, otimizando os cuidados médicos.
• GPQA (Graduate-Level Google-Proof Q&A Benchmark) – Traduzindo: Benchmark de Perguntas e Respostas à Prova do Google em Nível de Pós-Graduação. É um modelo de inteligência artificial focado em sistemas de perguntas e respostas (Q&A – Questions and Answers), que utiliza redes neurais para entender perguntas em linguagem natural e fornecer respostas precisas. Ele é amplamente usado em assistentes virtuais, chatbots e suporte ao cliente.
• Humanity’s Last Exam – O Último Exame da Humanidade – Um conceito que se refere a um grande desafio ou teste final para a humanidade, que pode envolver questões existenciais, éticas ou tecnológicas. Ele representa o momento em que a humanidade deve tomar decisões cruciais que determinarão seu futuro, como lidar com ameaças globais, tomar decisões éticas importantes ou usar a tecnologia de forma responsável. A relação entre Humanity’s Last Exam e a avaliação de IAs está no fato de que, à medida que as IAs se tornam mais avançadas e integradas em diversas áreas da sociedade, elas podem representar um grande desafio para a humanidade. O “último exame” da humanidade poderia ser, por exemplo, a maneira como nos comportamos diante dos riscos e responsabilidades associados ao uso de IAs avançadas, garantindo que não haja impactos negativos irreversíveis para o futuro.
• LiveCodeBench – É uma plataforma para monitoramento e análise de código em tempo real, útil no desenvolvimento de software. Sua relação com IAs se dá no contexto de testar e otimizar algoritmos de IA, proporcionando feedback contínuo durante o desenvolvimento. Além disso, pode ser usado para analisar dados em tempo real e melhorar o processo de codificação, acelerando o desenvolvimento e a implementação de IAs.
• MATH-500 – É um curso de matemática avançada, que geralmente cobre álgebra linear, cálculo, probabilidade e estatística — áreas fundamentais para o desenvolvimento de algoritmos de inteligência artificial (IA). Esses conceitos são essenciais para entender e aplicar algoritmos de IA, como redes neurais e aprendizado de máquina, ajudando na otimização de modelos e análise de dados.
• MMLU-Pro (Massive Multitask Language Understanding – Professional) – Compreensão Massiva de Linguagem Multitarefa – Profissional – Recurso usado para avaliar como os modelos de inteligência artificial lidam com várias tarefas ao mesmo tempo, especialmente em áreas profissionais. Ele mede o quanto a IA consegue entender e resolver problemas mais complexos e específicos, como os encontrados em negócios, saúde, direito e outras profissões. O foco é ver se a IA pode aplicar seus conhecimentos de forma prática e útil no mundo real.
• SciCode – Uma plataforma voltada para o desenvolvimento e análise de código científico, usada em áreas como matemática, física e biologia. Sua relação com IAs está no uso dessas tecnologias para desenvolver algoritmos de aprendizado de máquina, processar grandes volumes de dados e realizar simulações científicas, otimizando resultados e melhorando previsões em diversos campos.
Fonte: Fevereiro 2026: Independent analysis of AI – Understand the AI landscape to choose the best model and provider for your use case – Disponível no site artificialanalysis
Veja agora o nosso Guia com a indicações de 200 IAs:

Guia das #200+ Inteligências Artificiais mais utilizadas, em índice A-Z, com a indicação da posição de preferência de uso, segundo voto popular. Esse conteúdo é voltado para quem quiser começar a entender o assunto e aperfeiçoar seu repertório. Um material de consulta, orientação e pesquisa rápida.
Veja também as #20 IAs eleitas pelos usuários:

Eleitas pelos usuários, reunimos as #20 IAs que ganharam destaque pela inovação, simplicidade e viabilidade. Quais reuniram condições e avanços, e que hoje ditam as tendências na prática. Atualização semanal.