As maiores Inteligências Artificiais avaliadas

27/05/2026 Por Arts Full 360

Ranking dos #10+ maiores modelos de IA

Os modelos de IA com os maiores índices de inteligência Artificial, segundo os critérios periodicamente avaliados pelo teste MMLU-Pro (veja mais abaixo o que significa isso).

A classificação, realizada pela plataforma Artificial Analysis, estabelece critérios e resultados envolvendo as principais inteligências artificiais a nível mundial. As avaliações são calculadas de forma independente.

Ranking

Análise de Inteligência, Desempenho, Preço e Verbosidade (o uso de mais palavras do que o necessário para transmitir uma ideia ou informação). [MAI2026]

1º GPT-5.5 (xhigh)

#01 • GPT-5.5 (xhigh) da OpenAI (EUA)

#1/148 Inteligência 60,2%
#61/148 Velocidade 70 tokens/seg de saída
#124/148 Preço de entrada US$ 5.00 por 1 milhão de tokens
#132/148 Preço de saída US$ 30.00 por 1 milhão de tokens
#88/148 Verbosidade 75 milhões de tokens de saída do índice de inteligência

2º Claude Opus 4.7 (max)

#02 • Claude Opus 4.7 (Adaptative Reasoning, Max Effort) da Anthropic (EUA)

#3/148 Inteligência 57,3%
#80/148 Velocidade 55 tokens/seg de saída
#131/148 Preço de entrada US$ 6.25 por 1 milhão de tokens
#125/148 Preço de saída US$ 25.00 por 1 milhão de tokens
#108/148 Verbosidade 110 milhões de tokens de saída do índice de inteligência

3º Gemini 3.1 Pro Preview

#03 • Gemini 3.1 Pro Preview do Google (EUA)

#4/148 Inteligência 57,2%
#31/148 Velocidade 136 tokens/seg de saída
#84/148 Preço de entrada US$ 2.00 por 1 milhão de tokens
#98/148 Preço de saída US$ 12.00 por 1 milhão de tokens
#77/148 Verbosidade 57 milhões de tokens de saída do índice de inteligência

4º GPT-5.4 (xhigh)

#04 • GPT 5.4 (xhigh) da OpenAI (EUA)

#5/148 Inteligência 56,8%
#50/148 Velocidade 86 tokens/seg de saída
#100/148 Preço de entrada US$ 2.50 por 1 milhão de tokens
#108/148 Preço de saída US$ 15.00 por 1 milhão de tokens
#109/148 Verbosidade 120 milhões de tokens de saída do índice de inteligência

5º Qwen3.7 Max

#05 • Qwen3.7 Max da Alibaba (China)

#7/148 Inteligência 56,6%
#3/148 Velocidade 210 tokens/seg de saída
#100/148 Preço de entrada US$ 2.50 por 1 milhão de tokens
#68/148 Preço de saída US$ 7.50 por 1 milhão de tokens
#103/148 Verbosidade 97 milhões de tokens de saída do índice de inteligência

6º Gemini 3.5 Flash

#06 • Gemini 3.5 Flash do Google (EUA)

#8/148 Inteligência 55,3%
#2/148 Velocidade 212 tokens/seg de saída
#72/148 Preço de entrada US$ 1.50 por 1 milhão de tokens
#79/148 Preço de saída US$ 9.00 por 1 milhão de tokens
#86/148 Verbosidade 73 milhões de tokens de saída do índice de inteligência

7º Kimi K2.6

#07 • Kimi K2.6 da MoonshotAI (China)

#1/87 Inteligência 53,9%
#52/87 Velocidade 30 tokens/seg de saída
#71/87 Preço de entrada US$ 0.95 por 1 milhão de tokens
#76/87 Preço de saída US$ 4.00 por 1 milhão de tokens
#67/87 Verbosidade 170 milhões de tokens de saída do índice de inteligência

8º MiMo-V2.5-Pro

#08 • MiMo-V2.5 Pro da Xiaomi (China)

#2/87 Inteligência 53,8%
#41/87 Velocidade 49 tokens/seg de saída
#45/87 Preço de entrada US$ 0.43 por 1 milhão de tokens
#32/87 Preço de saída US$ 0.87 por 1 milhão de tokens
#57/87 Verbosidade 92 milhões de tokens de saída do índice de inteligência

9º Grok 4.3 (high)

#09 • Grok 4.3 (high) da xAI (EUA)

#11/147 Inteligência 53,2%
#6/147 Velocidade 190 tokens/seg de saída
#45/147 Preço de entrada US$ 1.25 por 1 milhão de tokens
#6/147 Preço de saída US$ 2.50 por 1 milhão de tokens
#97/147 Verbosidade 88 milhões de tokens de saída do índice de inteligência

10º Muse Spark

#10 • Muse Spark da Meta (EUA)

#1/217 Inteligência 52%
# Velocidade
#1/217 Preço de entrada US$ 0.00 por 1 milhão de tokens
#1/217 Preço de saída US$ 0.00 por 1 milhão de tokens
#79/217 Verbosidade 58 milhões de tokens de saída do índice de inteligência

11º em diante

#11 • Claude Sonnet 4.6 da Anthropic (EUA) • #15/147 Inteligência 52%

#12 • DeepSeek V4 Pro (Reasoning, Max Effort) da DeepSeek (China) • #3/87 Inteligência 52%

#13 • GLM-5.1 da Zhipu AI (China) • #4/87 Inteligência 51%

#14 • MiniMax-M2.7 da MiniMax (China) • #7/87 Inteligência 50%

#15 • GPT-5.4 mini (xhigh) da OpenAI (EUA) • #25/147 Inteligência 49%

#16 • DeepSeek V4 Flash (Reasoning, Max Effort) da DeepSeek (China) • #10/87 Inteligência 47%

#17 • Qwen3.5 (Reasonig) da Alibaba (China) • #12/87 Inteligência 45%

#18 • DeepSeek V3.2 (Reasoning) da DeepSeek (China) • #18/87 Inteligência 42%

#19 • Mistral Medium 3.5 da Mistral (França) • #2/61 Inteligência 39%

#20 • Gemma 4 31B (Reasoning) do Google (EUA) • #4/125 Inteligência 39%

#21 • Claude Haiku 4.5 (Reasoning) da Anthropic (EUA) • #69/147 Inteligência 37%

#22 • NVIDIA Nemotron 3 Super (Reasoning) da NVIDIA (China) • #3/61 Inteligência 36%

#23 • Nova 2.0 Pro Preview da Amazon (EUA) • #72/147 Inteligência 36%

#24 • GPT-oss-120b (high) da OpenAI (EUA) • #5/61 Inteligência 33%

#25 • Solar Pro 3 da Upstage (Coreia) • #27/217 Inteligência 26%

#26 • GPT-oss-20b (high) da OpenAI (EUA) • #23/125 Inteligência 24%

#27 • K2 Think V2 da MBZUAI (China) • #11/61 Inteligência 24%

Entendendo o jogo dos grandes

O Índice de Inteligência que incorpora as 7 avaliações – MMLU-Pro, GPQA Diamond, Humanity’s Last Exam, LiveCodeBench, SciCode, AIME, MATH-500 – está lá no site da Artificial Analysis onde há todos detalhes, segundo cada critério.

Sete critérios explicados

• AIME – Artificial Intelligence in Medical Engineering – é a aplicação de Inteligência Artificial em Engenharia Médica para melhorar diagnósticos, tratamentos e dispositivos médicos. A IA é usada para analisar dados médicos, criar tratamentos personalizados, desenvolver dispositivos inteligentes, como próteses e robôs cirúrgicos, e prever tendências em saúde, otimizando os cuidados médicos.

• GPQA (Graduate-Level Google-Proof Q&A Benchmark) – Traduzindo: Benchmark de Perguntas e Respostas à Prova do Google em Nível de Pós-Graduação. É um modelo de inteligência artificial focado em sistemas de perguntas e respostas (Q&A – Questions and Answers), que utiliza redes neurais para entender perguntas em linguagem natural e fornecer respostas precisas. Ele é amplamente usado em assistentes virtuais, chatbots e suporte ao cliente.

• Humanity’s Last Exam – O Último Exame da Humanidade – Um conceito que se refere a um grande desafio ou teste final para a humanidade, que pode envolver questões existenciais, éticas ou tecnológicas. Ele representa o momento em que a humanidade deve tomar decisões cruciais que determinarão seu futuro, como lidar com ameaças globais, tomar decisões éticas importantes ou usar a tecnologia de forma responsável. A relação entre Humanity’s Last Exam e a avaliação de IAs está no fato de que, à medida que as IAs se tornam mais avançadas e integradas em diversas áreas da sociedade, elas podem representar um grande desafio para a humanidade. O “último exame” da humanidade poderia ser, por exemplo, a maneira como nos comportamos diante dos riscos e responsabilidades associados ao uso de IAs avançadas, garantindo que não haja impactos negativos irreversíveis para o futuro.

• LiveCodeBench – É uma plataforma para monitoramento e análise de código em tempo real, útil no desenvolvimento de software. Sua relação com IAs se dá no contexto de testar e otimizar algoritmos de IA, proporcionando feedback contínuo durante o desenvolvimento. Além disso, pode ser usado para analisar dados em tempo real e melhorar o processo de codificação, acelerando o desenvolvimento e a implementação de IAs.

• MATH-500 – É um curso de matemática avançada, que geralmente cobre álgebra linear, cálculo, probabilidade e estatística — áreas fundamentais para o desenvolvimento de algoritmos de inteligência artificial (IA). Esses conceitos são essenciais para entender e aplicar algoritmos de IA, como redes neurais e aprendizado de máquina, ajudando na otimização de modelos e análise de dados.

• MMLU-Pro (Massive Multitask Language Understanding – Professional) – Compreensão Massiva de Linguagem Multitarefa – Profissional – Recurso usado para avaliar como os modelos de inteligência artificial lidam com várias tarefas ao mesmo tempo, especialmente em áreas profissionais. Ele mede o quanto a IA consegue entender e resolver problemas mais complexos e específicos, como os encontrados em negócios, saúde, direito e outras profissões. O foco é ver se a IA pode aplicar seus conhecimentos de forma prática e útil no mundo real.

• SciCode – Uma plataforma voltada para o desenvolvimento e análise de código científico, usada em áreas como matemática, física e biologia. Sua relação com IAs está no uso dessas tecnologias para desenvolver algoritmos de aprendizado de máquina, processar grandes volumes de dados e realizar simulações científicas, otimizando resultados e melhorando previsões em diversos campos.

Fonte: Fevereiro 2026: Independent analysis of AI – Understand the AI landscape to choose the best model and provider for your use case – Disponível no site artificialanalysis

Veja agora o nosso Guia com a indicações de 200 IAs:

artsfull.com.br/inteligencia/banner/guia-das-200-inteligencias-artificiais

Guia das #200+ Inteligências Artificiais mais utilizadas, em índice A-Z, com a indicação da posição de preferência de uso, segundo voto popular. Esse conteúdo é voltado para quem quiser começar a entender o assunto e aperfeiçoar seu repertório. Um material de consulta, orientação e pesquisa rápida.

Veja também as #20 IAs eleitas pelos usuários:

Eleitas pelos usuários, reunimos as #20 IAs que ganharam destaque pela inovação, simplicidade e viabilidade. Quais reuniram condições e avanços, e que hoje ditam as tendências na prática. Atualização semanal.

Voltar ao Topo