Startup de IA de Elon Musk, xAI, revelou o Grok 4 na manhã desta quinta-feira, apresentando-o como "o modelo de IA mais poderoso do mundo."
Durante uma transmissão ao vivo de uma hora realizada na plataforma X, também de propriedade de Musk, o CEO afirmou que a nova versão do modelo principal da sua empresa de IA superou chatbots concorrentes em vários critérios importantes. Este agente de IA multimodal possui capacidades de visão e voz, além de uma janela de contexto de 128k.
Ele destacou o Grok 4 como o modelo com melhor desempenho no Humanity’s Last Exam (HLE), um teste de IA que abrange uma série de problemas desafiadores em matemática, ciências e humanidades. O HLE é considerado um teste mais confiável das capacidades de um modelo desde seu lançamento em janeiro, devido ao problema da saturação de benchmarks, onde os testes se tornam muito fáceis em virtude da rápida evolução dos modelos.
De acordo com relatórios da xAI, o Grok 4 superou o o3 da OpenAI e o Gemini 2.5 Pro do Google no HLE. "O Grok 4 é melhor que o nível de doutorado em todas as disciplinas," afirmou Musk durante a transmissão. "Sem exceções."
A xAI ainda não publicou um artigo acadêmico detalhando o desempenho do Grok 4 em benchmarks importantes de IA, uma prática que se tornou comum entre os principais desenvolvedores de IA ao lançarem um novo modelo. A empresa não respondeu ao pedido de comentário no momento da redação deste texto.
No entanto, a análise independente feita pelo revisor de IA Artificial Analysis confirmou as alegações da xAI, afirmando que teve acesso antecipado ao Grok 4 e que agora é "o modelo de IA líder," comparando o progresso da empresa com o dos concorrentes em um gráfico. O Grok 4 já está disponível no aplicativo e site da xAI por $30 mensais. Desenvolvedores podem acessar a API do modelo por $3 a cada 1 milhão de tokens de entrada, ou $15 por 1 milhão de tokens de saída. Uma versão chamada Grok 4 Heavy, que utiliza múltiplos agentes de IA simultaneamente para resolver problemas particularmente difíceis, também está disponível com uma assinatura de $300 por mês. O modelo anterior, Grok 3, ainda pode ser utilizado gratuitamente online.
O lançamento ocorre logo após o Grok 3 ter feito uma série de postagens antissemitas na plataforma X, onde possui uma conta própria. Em uma das publicações, insinuou que pessoas com sobrenomes judaicos eram mais propensas a participar de "ativismo de extrema esquerda." Em outra, respondendo a um usuário que se referiu a campistas no Camp Mystic, um acampamento cristão no Texas onde mais de duas dúzias de campistas e funcionários foram recentemente mortos por enchentes letais, o Grok pareceu endossar genocídio à moda hitleriana para lidar com o que descreveu como "um ódio anti-branco tão vil."
Algumas postagens foram posteriormente removidas pela X. A CEO da empresa, Linda Yaccarino, anunciou na manhã de quarta-feira — sem muitas explicações — que iria deixar o cargo. Na mesma manhã, Musk respondeu brevemente ao fiasco do Grok na X, afirmando que o modelo "era muito complacente com os comandos dos usuários. Muito ansioso para agradar e ser manipulado, essencialmente." O problema, acrescentou, "está sendo tratado." Ele evitou mencionar a tirada de mídias sociais de seu chatbot durante a transmissão ao vivo de quinta-feira, mas disse acreditar que é fundamental que a IA busque "o máximo de verdade."
Musk fundou a xAI em 2023 "para compreender o universo," segundo a declaração de missão da empresa em seu site. Ele posicionou o Grok como uma alternativa aos chatbots de IA oferecidos por empresas como Google e OpenAI, que Musk criticou por serem muito "woke" e politicamente corretos. Em contraste, o Grok foi criado para ser direto e humorístico nas suas respostas às perguntas dos usuários.
[Referência: ZDNET]