Novos modelos de IA Claude da Anthropic estão disponíveis – experimente um gratuitamente hoje!

Desde a sua fundação em 2021, a Anthropic rapidamente se destacou como uma das principais empresas de inteligência artificial, competindo à altura com gigantes como OpenAI, Google e Microsoft, especialmente com seus modelos Claude. Aproveitando esse impulso, a empresa realizou sua primeira conferência para desenvolvedores, o "Code with Claude", que apresentou as conquistas até agora e os próximos passos da companhia.

Fonte: ZDNet

Durante o evento, a Anthropic revelou dois modelos muito aguardados, o Claude Opus 4 e o Claude Sonnet 4. Ambos trazem melhorias significativas em relação aos modelos anteriores, oferecendo desempenho superior em programação e raciocínio. Além disso, foram lançadas novas funcionalidades e ferramentas para os modelos, que visam aprimorar a experiência do usuário.

Fonte: ZDNet

O Claude Opus 4 faz parte da linha mais avançada da empresa, voltada para tarefas complexas. Enquanto o Claude Opus 3 já era reconhecido por suas capacidades, a nova geração trouxe ainda mais aprimoramentos. A Anthropic o considera o modelo mais poderoso já criado e o melhor modelo de programação no mundo, com base nos resultados do benchmark SWE-bench.

Fonte: ZDNet

A empresa destacou que o Opus 4 foi projetado para manter um alto desempenho em atividades complexas e de longa duração que exigem múltiplos passos, superando significativamente todos os modelos da linha Sonnet. Um dos principais destaques é que o modelo pode operar de forma autônoma por várias horas, tornando o Claude Opus 4 uma excelente opção para impulsionar agentes de IA — a próxima fronteira na assistência de inteligência artificial.

Fonte: ZDNet

A atratividade dos agentes de IA reside em sua capacidade de realizar tarefas de forma independente. Para isso, é essencial que esses agentes consigam raciocinar sobre os passos necessários a serem dados, como qual ferramenta utilizar ou qual ação tomar. Assim, é necessário contar com um modelo que possua um raciocínio eficaz e que mantenha essa linha de pensamento ao longo do tempo, como o Claude Opus 4.

Fonte: ZDNet

Por outro lado, o Claude Sonnet 4, como a nova geração da família Claude Sonnet, mantém os atrativos do seu antecessor, sendo um modelo altamente eficiente e prático, adequado para as necessidades da maioria das pessoas. Ele se baseia nas funcionalidades do Claude Sonnet 3.7, apresentando uma melhor capacidade de orientação, que se refere à forma como um modelo pode seguir direções humanas, raciocinar e programar. Agora, será uma substituição direta do Claude Sonnet 3.7 no chatbot.

Fonte: ZDNet

Outra novidade em beta permite que o Opus 4 e o Sonnet 4 alternem entre pensamento expansivo e uso de ferramentas, oferecendo aos usuários uma performance que combina rapidez e precisão. A Anthropic também revelou que Claude pode utilizar ferramentas em paralelo, realizando tarefas de maneira adequada ao rodar várias ferramentas simultaneamente ou de forma sequencial.

Fonte: ZDNet

Quando os desenvolvedores concedem acesso aos arquivos locais, o Claude agora consegue criar e manter "arquivos de memória" com os principais insights, promovendo uma melhor consciência a longo prazo das tarefas, coerência e desempenho nas atividades de agentes, de acordo com a Anthropic. Os desenvolvedores também conseguirão novas capacidades na API da empresa, criando agentes mais potentes, incluindo a ferramenta de execução de código, conector MCP, API de arquivos e armazenamento de prompts suportados por até uma hora.

Fonte: ZDNet

Outra melhoria nos dois modelos é a redução de 65% em "reward hacking", um comportamento onde o modelo toma atalhos para completar uma tarefa, em comparação ao Claude Sonnet 3.7, especialmente em tarefas de programação onde esse problema é recorrente. Os usuários também terão um entendimento aprimorado do processo de raciocínio do modelo com um novo recurso de resumos de pensamento, que apresenta o raciocínio do modelo de forma digerível, em vez de uma sequência bruta de pensamentos quando o processo é longo demais.

Fonte: ZDNet

A Anthropic anunciou também planos futuros, incluindo a preparação dos modelos para níveis mais altos de segurança em IA, como o ASL-3, e a oferta de atualizações mais frequentes nos modelos para que os clientes possam acessar novos recursos rapidamente.

Fonte: ZDNet

Com o lançamento do Opus 4 e Sonnet 4, foram apresentados resultados de benchmark mostrando um desempenho excepcional em tarefas de programação. Nos testes do SWE-bench, focado na avaliação de grandes modelos de linguagem em desafios de software do mundo real, os novos modelos superaram diversos modelos líderes na área de programação, incluindo OpenAI Codex-1, OpenAI o3, GPT-4.1 e Gemini 2.5 Pro.

Fonte: ZDNet

Além da programação, o Opus 4 e Sonnet 4 também se mostraram competitivos em outros benchmarks tradicionais, liderando categorias ou se aproximando disso, como no GPQA Diamond, que avalia raciocínio em nível de pós-graduação; AIME 2025, que testa o nível de competição em matemática do ensino médio; e o MMMLU, que avalia tarefas multilíngues.

Fonte: ZDNet

Os modelos Claude Opus 4 e Sonnet 4 são híbridos, apresentando um modo de resposta quase instantâneo e um modo de raciocínio prolongado para solicitações que exigem uma análise mais profunda. Os planos pagos da Claude, incluindo Pro, Max, Team e Enterprise, têm acesso a ambos os modelos e ao pensamento expandido. O Claude Sonnet 4 também está disponível para usuários gratuitos.

Fonte: ZDNet

Desenvolvedores podem acessar os modelos pela API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud. A Anthropic informou que os preços permanecem consistentes com os modelos anteriores.

Fonte: ZDNet

Por fim, o Claude Code permite que os desenvolvedores utilizem o assistente de programação do Claude diretamente onde escrevem e gerenciam seu código, seja no terminal, dentro de seus IDEs ou funcionando em segundo plano com o SDK do Claude Code. Novas extensões em beta para o VS Code e JetBrains permitem que os usuários integrem o Claude Code dentro desses IDEs, onde as sugestões de edição do Claude aparecerão inline. A Anthropic também lançou o SDK do Claude Code, permitindo que os usuários construam suas próprias ferramentas e agentes impulsionados por IA, aproveitando o mesmo "agente central" do Claude Code para garantir um nível de assistência similar.

Fonte: ZDNet

Referência: Ziff Davis

Fonte: ZDNet

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima
Tutorial Elevenlabs