Todos agora podem experimentar o Gemini 2.5 Pro gratuitamente.

Momentos após o lançamento do mais recente modelo da DeepSeek, outro gigante da inteligência artificial já conseguiu recuperar parte do destaque. Na terça-feira, o Google anunciou o Gemini 2.5, seu modelo "mais inteligente". A empresa afirmou que essa versão inicial é uma "versão experimental do 2.5 Pro, que é de última geração em uma ampla gama de benchmarks e estreia em 1º lugar no LMArena por uma margem significativa".

Fonte: ZDNet

Como uma família de modelos de raciocínio, que desenvolvem suas respostas de maneira lógica, o lançamento segue o Gemini 2.0 Flash Thinking, que foi apresentado em dezembro. O mais notável é que o Gemini 2.5 Pro Experimental superou o o3 mini da OpenAI e o Claude 3.7 Sonnet da Anthropic no Humanity’s Last Exam (HLE), um benchmark recentemente criado para combater a saturação, ou seja, o problema dos testes da indústria se tornarem muito fáceis para modelos que evoluem rapidamente. O HLE, portanto, é um teste relativamente mais desafiador; o Gemini 2.5 obteve 18,8%, em comparação com os 14% do o3 mini (avaliado apenas com problemas em texto, sem imagens) e 8,9% do Claude 3.7 Sonnet.

Fonte: ZDNet

Já liderando o ranking do Chatbot Arena, o novo modelo também superou os concorrentes em benchmarks comuns de ciências, matemática e programação, embora geralmente por uma margem menor, o que agora é esperado devido à velocidade com que novos modelos estão surgindo. O Google relatou que o Gemini 2.5 Pro Experimental demonstra melhorias nas capacidades de raciocínio, multimodal e agente, mesmo a partir de um "prompt de uma única linha".

Fonte: ZDNet

Além disso, o novo modelo obteve uma pontuação superior à de seus concorrentes em um teste de QI hospedado pelo site de testes Tracking AI, que utiliza perguntas exclusivas que não estão disponíveis publicamente e, portanto, não podem ser incluídas nos dados de treinamento. No entanto, especialistas alertam que os testes de QI humanos — além de serem questionáveis por suas raízes na eugenia — não são exatamente uma medida útil das capacidades de um modelo de IA, uma vez que os modos de inteligência humanos operam de maneiras significativamente diferentes.

Fonte: ZDNet

No sábado, o Google anunciou no X que o Gemini 2.5 Pro agora está disponível para todos os usuários do Gemini "com limites de taxa", após um lançamento inicialmente mais restrito, e será lançado em dispositivos móveis em breve. Os usuários podem experimentá-lo hoje em gemini.google.com. Embora a empresa não tenha atualizado os detalhes específicos, reiterou que usuários do Gemini Advanced ainda possuem "acesso ampliado" além de uma janela de contexto maior.

Fonte: ZDNet

Quer saber mais histórias sobre IA? Inscreva-se na nossa newsletter semanal sobre Inovação.

Fonte: ZDNet

Referência: source

Fonte: ZDNet