As maiores Inteligências Artificiais avaliadas

27/05/2026 Por Arts Full 360
artsfull.com.br/inteligencia/

Os modelos de IA com os maiores índices de inteligência Artificial, segundo os critérios periodicamente avaliados pelo teste MMLU-Pro (veja mais abaixo o que significa isso).

A classificação, realizada pela plataforma Artificial Analysis, estabelece critérios e resultados envolvendo as principais inteligências artificiais a nível mundial. As avaliações são calculadas de forma independente.


Ranking

Análise de Inteligência, Desempenho, Preço e Verbosidade (o uso de mais palavras do que o necessário para transmitir uma ideia ou informação). [MAI2026]


1º GPT-5.5 (xhigh)

#01 • GPT-5.5 (xhigh) da OpenAI (EUA)

  • #1/148 Inteligência 60,2%
  • #61/148 Velocidade 70 tokens/seg de saída
  • #124/148 Preço de entrada US$ 5.00 por 1 milhão de tokens
  • #132/148 Preço de saída US$ 30.00 por 1 milhão de tokens
  • #88/148 Verbosidade 75 milhões de tokens de saída do índice de inteligência

2º Claude Opus 4.7 (max)

#02 • Claude Opus 4.7 (Adaptative Reasoning, Max Effort) da Anthropic (EUA)

  • #3/148 Inteligência 57,3%
  • #80/148 Velocidade 55 tokens/seg de saída
  • #131/148 Preço de entrada US$ 6.25 por 1 milhão de tokens
  • #125/148 Preço de saída US$ 25.00 por 1 milhão de tokens
  • #108/148 Verbosidade 110 milhões de tokens de saída do índice de inteligência

3º Gemini 3.1 Pro Preview

#03 • Gemini 3.1 Pro Preview do Google (EUA)

  • #4/148 Inteligência 57,2%
  • #31/148 Velocidade 136 tokens/seg de saída
  • #84/148 Preço de entrada US$ 2.00 por 1 milhão de tokens
  • #98/148 Preço de saída US$ 12.00 por 1 milhão de tokens
  • #77/148 Verbosidade 57 milhões de tokens de saída do índice de inteligência

4º GPT-5.4 (xhigh)

#04 • GPT 5.4 (xhigh) da OpenAI (EUA)

  • #5/148 Inteligência 56,8%
  • #50/148 Velocidade 86 tokens/seg de saída
  • #100/148 Preço de entrada US$ 2.50 por 1 milhão de tokens
  • #108/148 Preço de saída US$ 15.00 por 1 milhão de tokens
  • #109/148 Verbosidade 120 milhões de tokens de saída do índice de inteligência

5º Qwen3.7 Max

#05 • Qwen3.7 Max da Alibaba (China)

  • #7/148 Inteligência 56,6%
  • #3/148 Velocidade 210 tokens/seg de saída
  • #100/148 Preço de entrada US$ 2.50 por 1 milhão de tokens
  • #68/148 Preço de saída US$ 7.50 por 1 milhão de tokens
  • #103/148 Verbosidade 97 milhões de tokens de saída do índice de inteligência

6º Gemini 3.5 Flash

#06 • Gemini 3.5 Flash do Google (EUA)

  • #8/148 Inteligência 55,3%
  • #2/148 Velocidade 212 tokens/seg de saída
  • #72/148 Preço de entrada US$ 1.50 por 1 milhão de tokens
  • #79/148 Preço de saída US$ 9.00 por 1 milhão de tokens
  • #86/148 Verbosidade 73 milhões de tokens de saída do índice de inteligência

7º Kimi K2.6

#07 • Kimi K2.6 da MoonshotAI (China)

  • #1/87 Inteligência 53,9%
  • #52/87 Velocidade 30 tokens/seg de saída
  • #71/87 Preço de entrada US$ 0.95 por 1 milhão de tokens
  • #76/87 Preço de saída US$ 4.00 por 1 milhão de tokens
  • #67/87 Verbosidade 170 milhões de tokens de saída do índice de inteligência

8º MiMo-V2.5-Pro

#08 • MiMo-V2.5 Pro da Xiaomi (China)

  • #2/87 Inteligência 53,8%
  • #41/87 Velocidade 49 tokens/seg de saída
  • #45/87 Preço de entrada US$ 0.43 por 1 milhão de tokens
  • #32/87 Preço de saída US$ 0.87 por 1 milhão de tokens
  • #57/87 Verbosidade 92 milhões de tokens de saída do índice de inteligência

9º Grok 4.3 (high)

#09 • Grok 4.3 (high) da xAI (EUA)

  • #11/147 Inteligência 53,2%
  • #6/147 Velocidade 190 tokens/seg de saída
  • #45/147 Preço de entrada US$ 1.25 por 1 milhão de tokens
  • #6/147 Preço de saída US$ 2.50 por 1 milhão de tokens
  • #97/147 Verbosidade 88 milhões de tokens de saída do índice de inteligência

10º Muse Spark

#10 • Muse Spark da Meta (EUA)

  • #1/217 Inteligência 52%
  • # Velocidade
  • #1/217 Preço de entrada US$ 0.00 por 1 milhão de tokens
  • #1/217 Preço de saída US$ 0.00 por 1 milhão de tokens
  • #79/217 Verbosidade 58 milhões de tokens de saída do índice de inteligência

11º em diante

#11 • Claude Sonnet 4.6 da Anthropic (EUA) • #15/147 Inteligência 52%

#12 • DeepSeek V4 Pro (Reasoning, Max Effort) da DeepSeek (China) • #3/87 Inteligência 52%

#13 • GLM-5.1 da Zhipu AI (China) • #4/87 Inteligência 51%

#14 • MiniMax-M2.7 da MiniMax (China) • #7/87 Inteligência 50%

#15 • GPT-5.4 mini (xhigh) da OpenAI (EUA) • #25/147 Inteligência 49%

#16 • DeepSeek V4 Flash (Reasoning, Max Effort) da DeepSeek (China) • #10/87 Inteligência 47%

#17 • Qwen3.5 (Reasonig) da Alibaba (China) • #12/87 Inteligência 45%

#18 • DeepSeek V3.2 (Reasoning) da DeepSeek (China) • #18/87 Inteligência 42%

#19 • Mistral Medium 3.5 da Mistral (França) • #2/61 Inteligência 39%

#20 • Gemma 4 31B (Reasoning) do Google (EUA) • #4/125 Inteligência 39%

#21 • Claude Haiku 4.5 (Reasoning) da Anthropic (EUA) • #69/147 Inteligência 37%

#22 • NVIDIA Nemotron 3 Super (Reasoning) da NVIDIA (China) • #3/61 Inteligência 36%

#23 • Nova 2.0 Pro Preview da Amazon (EUA) • #72/147 Inteligência 36%

#24 • GPT-oss-120b (high) da OpenAI (EUA) • #5/61 Inteligência 33%

#25 • Solar Pro 3 da Upstage (Coreia) • #27/217 Inteligência 26%

#26 • GPT-oss-20b (high) da OpenAI (EUA) • #23/125 Inteligência 24%

#27 • K2 Think V2 da MBZUAI (China) • #11/61 Inteligência 24%


O Índice de Inteligência que incorpora as 7 avaliações – MMLU-Pro, GPQA Diamond, Humanity’s Last Exam, LiveCodeBench, SciCode, AIME, MATH-500 – está lá no site da Artificial Analysis onde há todos detalhes, segundo cada critério.


AIME Artificial Intelligence in Medical Engineering – é a aplicação de Inteligência Artificial em Engenharia Médica para melhorar diagnósticos, tratamentos e dispositivos médicos. A IA é usada para analisar dados médicos, criar tratamentos personalizados, desenvolver dispositivos inteligentes, como próteses e robôs cirúrgicos, e prever tendências em saúde, otimizando os cuidados médicos.

GPQA (Graduate-Level Google-Proof Q&A Benchmark) – Traduzindo: Benchmark de Perguntas e Respostas à Prova do Google em Nível de Pós-Graduação. É um modelo de inteligência artificial focado em sistemas de perguntas e respostas (Q&A – Questions and Answers), que utiliza redes neurais para entender perguntas em linguagem natural e fornecer respostas precisas. Ele é amplamente usado em assistentes virtuais, chatbots e suporte ao cliente.

Humanity’s Last Exam – O Último Exame da Humanidade – Um conceito que se refere a um grande desafio ou teste final para a humanidade, que pode envolver questões existenciais, éticas ou tecnológicas. Ele representa o momento em que a humanidade deve tomar decisões cruciais que determinarão seu futuro, como lidar com ameaças globais, tomar decisões éticas importantes ou usar a tecnologia de forma responsável. A relação entre Humanity’s Last Exam e a avaliação de IAs está no fato de que, à medida que as IAs se tornam mais avançadas e integradas em diversas áreas da sociedade, elas podem representar um grande desafio para a humanidade. O “último exame” da humanidade poderia ser, por exemplo, a maneira como nos comportamos diante dos riscos e responsabilidades associados ao uso de IAs avançadas, garantindo que não haja impactos negativos irreversíveis para o futuro.

LiveCodeBench – É uma plataforma para monitoramento e análise de código em tempo real, útil no desenvolvimento de software. Sua relação com IAs se dá no contexto de testar e otimizar algoritmos de IA, proporcionando feedback contínuo durante o desenvolvimento. Além disso, pode ser usado para analisar dados em tempo real e melhorar o processo de codificação, acelerando o desenvolvimento e a implementação de IAs.

MATH-500 – É um curso de matemática avançada, que geralmente cobre álgebra linear, cálculo, probabilidade e estatística — áreas fundamentais para o desenvolvimento de algoritmos de inteligência artificial (IA). Esses conceitos são essenciais para entender e aplicar algoritmos de IA, como redes neurais e aprendizado de máquina, ajudando na otimização de modelos e análise de dados.

MMLU-Pro (Massive Multitask Language Understanding – Professional) Compreensão Massiva de Linguagem Multitarefa – Profissional – Recurso usado para avaliar como os modelos de inteligência artificial lidam com várias tarefas ao mesmo tempo, especialmente em áreas profissionais. Ele mede o quanto a IA consegue entender e resolver problemas mais complexos e específicos, como os encontrados em negócios, saúde, direito e outras profissões. O foco é ver se a IA pode aplicar seus conhecimentos de forma prática e útil no mundo real.

SciCode – Uma plataforma voltada para o desenvolvimento e análise de código científico, usada em áreas como matemática, física e biologia. Sua relação com IAs está no uso dessas tecnologias para desenvolver algoritmos de aprendizado de máquina, processar grandes volumes de dados e realizar simulações científicas, otimizando resultados e melhorando previsões em diversos campos.


Fonte: Fevereiro 2026: Independent analysis of AI – Understand the AI landscape to choose the best model and provider for your use case – Disponível no site artificialanalysis


artsfull.com.br/inteligencia/banner/guia-das-200-inteligencias-artificiais

Guia das #200+ Inteligências Artificiais mais utilizadas, em índice A-Z, com a indicação da posição de preferência de uso, segundo voto popular. Esse conteúdo é voltado para quem quiser começar a entender o assunto e aperfeiçoar seu repertório. Um material de consulta, orientação e pesquisa rápida.

Eleitas pelos usuários, reunimos as #20 IAs que ganharam destaque pela inovação, simplicidade e viabilidade. Quais reuniram condições e avanços, e que hoje ditam as tendências na prática. Atualização semanal.

Voltar ao Topo