Novos modelos de IA Claude da Anthropic estão disponíveis – experimente um gratuitamente hoje!

Desde a sua fundação em 2021, a Anthropic rapidamente se destacou como uma das principais empresas de inteligência artificial, competindo à altura com gigantes como OpenAI, Google e Microsoft, especialmente com seus modelos Claude. Aproveitando esse impulso, a empresa realizou sua primeira conferência para desenvolvedores, o "Code with Claude", que apresentou as conquistas até agora e os próximos passos da companhia.

Durante o evento, a Anthropic revelou dois modelos muito aguardados, o Claude Opus 4 e o Claude Sonnet 4. Ambos trazem melhorias significativas em relação aos modelos anteriores, oferecendo desempenho superior em programação e raciocínio. Além disso, foram lançadas novas funcionalidades e ferramentas para os modelos, que visam aprimorar a experiência do usuário.

O Claude Opus 4 faz parte da linha mais avançada da empresa, voltada para tarefas complexas. Enquanto o Claude Opus 3 já era reconhecido por suas capacidades, a nova geração trouxe ainda mais aprimoramentos. A Anthropic o considera o modelo mais poderoso já criado e o melhor modelo de programação no mundo, com base nos resultados do benchmark SWE-bench.

A empresa destacou que o Opus 4 foi projetado para manter um alto desempenho em atividades complexas e de longa duração que exigem múltiplos passos, superando significativamente todos os modelos da linha Sonnet. Um dos principais destaques é que o modelo pode operar de forma autônoma por várias horas, tornando o Claude Opus 4 uma excelente opção para impulsionar agentes de IA — a próxima fronteira na assistência de inteligência artificial.

A atratividade dos agentes de IA reside em sua capacidade de realizar tarefas de forma independente. Para isso, é essencial que esses agentes consigam raciocinar sobre os passos necessários a serem dados, como qual ferramenta utilizar ou qual ação tomar. Assim, é necessário contar com um modelo que possua um raciocínio eficaz e que mantenha essa linha de pensamento ao longo do tempo, como o Claude Opus 4.

Por outro lado, o Claude Sonnet 4, como a nova geração da família Claude Sonnet, mantém os atrativos do seu antecessor, sendo um modelo altamente eficiente e prático, adequado para as necessidades da maioria das pessoas. Ele se baseia nas funcionalidades do Claude Sonnet 3.7, apresentando uma melhor capacidade de orientação, que se refere à forma como um modelo pode seguir direções humanas, raciocinar e programar. Agora, será uma substituição direta do Claude Sonnet 3.7 no chatbot.

Outra novidade em beta permite que o Opus 4 e o Sonnet 4 alternem entre pensamento expansivo e uso de ferramentas, oferecendo aos usuários uma performance que combina rapidez e precisão. A Anthropic também revelou que Claude pode utilizar ferramentas em paralelo, realizando tarefas de maneira adequada ao rodar várias ferramentas simultaneamente ou de forma sequencial.

Quando os desenvolvedores concedem acesso aos arquivos locais, o Claude agora consegue criar e manter "arquivos de memória" com os principais insights, promovendo uma melhor consciência a longo prazo das tarefas, coerência e desempenho nas atividades de agentes, de acordo com a Anthropic. Os desenvolvedores também conseguirão novas capacidades na API da empresa, criando agentes mais potentes, incluindo a ferramenta de execução de código, conector MCP, API de arquivos e armazenamento de prompts suportados por até uma hora.

Outra melhoria nos dois modelos é a redução de 65% em "reward hacking", um comportamento onde o modelo toma atalhos para completar uma tarefa, em comparação ao Claude Sonnet 3.7, especialmente em tarefas de programação onde esse problema é recorrente. Os usuários também terão um entendimento aprimorado do processo de raciocínio do modelo com um novo recurso de resumos de pensamento, que apresenta o raciocínio do modelo de forma digerível, em vez de uma sequência bruta de pensamentos quando o processo é longo demais.

A Anthropic anunciou também planos futuros, incluindo a preparação dos modelos para níveis mais altos de segurança em IA, como o ASL-3, e a oferta de atualizações mais frequentes nos modelos para que os clientes possam acessar novos recursos rapidamente.

Com o lançamento do Opus 4 e Sonnet 4, foram apresentados resultados de benchmark mostrando um desempenho excepcional em tarefas de programação. Nos testes do SWE-bench, focado na avaliação de grandes modelos de linguagem em desafios de software do mundo real, os novos modelos superaram diversos modelos líderes na área de programação, incluindo OpenAI Codex-1, OpenAI o3, GPT-4.1 e Gemini 2.5 Pro.

Além da programação, o Opus 4 e Sonnet 4 também se mostraram competitivos em outros benchmarks tradicionais, liderando categorias ou se aproximando disso, como no GPQA Diamond, que avalia raciocínio em nível de pós-graduação; AIME 2025, que testa o nível de competição em matemática do ensino médio; e o MMMLU, que avalia tarefas multilíngues.

Os modelos Claude Opus 4 e Sonnet 4 são híbridos, apresentando um modo de resposta quase instantâneo e um modo de raciocínio prolongado para solicitações que exigem uma análise mais profunda. Os planos pagos da Claude, incluindo Pro, Max, Team e Enterprise, têm acesso a ambos os modelos e ao pensamento expandido. O Claude Sonnet 4 também está disponível para usuários gratuitos.

Desenvolvedores podem acessar os modelos pela API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud. A Anthropic informou que os preços permanecem consistentes com os modelos anteriores.

Por fim, o Claude Code permite que os desenvolvedores utilizem o assistente de programação do Claude diretamente onde escrevem e gerenciam seu código, seja no terminal, dentro de seus IDEs ou funcionando em segundo plano com o SDK do Claude Code. Novas extensões em beta para o VS Code e JetBrains permitem que os usuários integrem o Claude Code dentro desses IDEs, onde as sugestões de edição do Claude aparecerão inline. A Anthropic também lançou o SDK do Claude Code, permitindo que os usuários construam suas próprias ferramentas e agentes impulsionados por IA, aproveitando o mesmo "agente central" do Claude Code para garantir um nível de assistência similar.

Referência: Ziff Davis