Como as novas ferramentas de agentes de IA podem transformar sua forma de programar

Se você atua como desenvolvedor de produção há algum tempo, já deve saber que as interfaces de programação de aplicativos (APIs) estão sujeitas a mudanças a qualquer momento, conforme a vontade do provedor. Você pode ir dormir à noite consciente de que seu aplicativo está sólido e tem um futuro promissor. Mas ao acordar, descobre que um dos fornecedores de API anunciou uma mudança que exigirá que você passe os próximos seis meses recompilando seu aplicativo para trabalhar com a API revisada. Pergunte-me como sei disso.

Além disso, aplicativos baseados em inteligência artificial não estão imunes a esta lei imutável da vida das APIs. A OpenAI anunciou a introdução da API Responses, que resultará na desativação da sua API Assistants em algum momento de 2026. Como na maioria das mudanças de API, a nova API oferece mais funcionalidades, melhor desempenho e é mais eficiente. No entanto, apesar dessas capacidades, a nova API impõe grandes tarefas a quem utilizou APIs anteriores. A OpenAI também lançou uma série de novos recursos voltados para programadores para a construção de agentes de IA.

Antes de detalharmos as novidades, vamos colocar essa mudança em contexto. Você provavelmente percebeu que, desde que a inteligência artificial generativa (Gen AI) surgiu há alguns anos, quase todo produto e serviço parece ter adicionado repentinamente uma função de venda adicional de IA. Essa é uma boa estratégia para muitos produtos e serviços, mas não é como se cada fornecedor tivesse equipes de pesquisa em IA desenvolvendo grandes modelos de linguagem. Em vez disso, essas empresas licenciam APIs que fornecem serviços de IA a uma taxa bastante previsível por transação.

Os diferentes modelos têm custos variados, mas, em uma estimativa aproximada, um desenvolvedor poderia fazer 67 consultas típicas de chat GPT-4.5, 1.176 consultas GPT-4o, ou 20.000 consultas mini GPT-4o por um único dólar. Com as APIs da OpenAI (e de outras empresas de IA), a funcionalidade de IA pode ser adicionada ao código com chamadas de funções simples e um cartão de crédito, reduzindo anos de desenvolvimento e milhões de dólares em custos de infraestrutura e pesquisa.

Até agora, a OpenAI ofereceu uma API, a API Chat Completions, para enviar solicitações de chat ao ChatGPT e receber respostas. A OpenAI também disponibilizou uma API, a API Assistants, que permite que os agentes realizem raciocínio em várias etapas e acessem arquivos. A nova API Responses combina os recursos das duas APIs anteriores. Embora se espere que a API Chat Completions permaneça, a empresa anunciou planos para descontinuar a API Assistants já no próximo ano em favor da mais capaz API Responses.

As tarifas para usar a API Responses podem ser consultadas na página de preços da OpenAI e variam de acordo com o modelo e o uso. A API Responses conta com três ferramentas integradas que os programadores podem utilizar: pesquisa na web, pesquisa de arquivos e uso do computador.

Se você já usou o ChatGPT para pesquisar na web e compilar uma resposta, sabe qual é a função da ferramenta de pesquisa na web. No caso da API Responses, ela permite que programadores iniciem essas consultas a partir de seus programas. Quando utilizada, a API fornece texto como resposta, além de links para fontes e citações inline. Muitas dessas respostas devem estar corretas. A empresa cita um gráfico mostrando que os testes de pesquisas na web com o GPT-4o eram apenas 38% precisos (lembre-se disso na próxima vez que usar o ChatGPT para pesquisar), mas as buscas usando a pré-visualização de pesquisa do GPT-4o e a pré-visualização mini do GPT-4o acertaram nove em cada dez vezes. Aceitável, certo?

A próxima ferramenta é a pesquisa de arquivos, que pesquisa uma biblioteca de documentos corporativos. E sim, sei o que você está pensando. A OpenAI afirma que não treina suas IAs com dados empresariais. Portanto, você deve estar relativamente confiante de que o upload de todos os seus dados será seguro e não aparecerá na resposta de outro usuário.

Porém, existem questões. Em primeiro lugar, a $0,10 por gigabyte, por mês, o armazenamento de arquivos não é barato. O pequeno banco de dados de documentos corporativos da minha empresa possui 57TB. Se esse banco de dados fosse enviado para a OpenAI para pesquisa de IA específica, o armazenamento custaria quase $6.000 por mês – e minha empresa tem apenas dois empregados. Os benefícios de ter uma ferramenta de pesquisa de IA são a capacidade de quebrar silos. Mas se os silos são o que torna o armazenamento de dados mais acessível ao enviar apenas dados selecionados, essa precificação pode limitar a utilidade desse recurso.

Por último, a OpenAI inclui sua ferramenta de uso do computador, a ferramenta de visualização de tela e cliques no coração de sua oferta de agente Operator. Essa ferramenta supostamente consegue ler telas e, com base no conteúdo visualizado, realizar processamentos ou clicar para acionar ações. Pelas demonstrações, especialmente na prévia do anúncio atual, parece que essa ferramenta ainda precisa desenvolver muito antes de se tornar universalmente útil. Fique atento a essa funcionalidade.

Uma API é um conjunto de pontos finais ou chamadas de função para interagir com um sistema externo. Um SDK (kit de desenvolvimento de software) é uma coleção mais abrangente, que muitas vezes inclui ferramentas de software, algumas APIs, bibliotecas e utilitários, todos trabalhando juntos. A OpenAI anunciou o Agents SDK, um conjunto de ferramentas para criação, depuração e monitoramento de agentes em ação. O kit inclui a API Responses e adiciona orquestração de fluxo de trabalho, permitindo que programadores realizem raciocínio em várias etapas e execução de tarefas.

O kit também possibilita aos codificadores formar equipes de agentes, cada um com responsabilidades específicas. Uma funcionalidade de “passagem” permite que um agente execute uma parte do trabalho e, em seguida, transfira o processamento para outro agente, e assim por diante. Além disso, e considero isso uma das características mais importantes, um painel de monitoramento permite que os desenvolvedores vejam cada interação com a IA, identifiquem quais agentes foram utilizados e como foram designados. Com a prevalência de alucinações em IA, é fundamental acompanhar o que todas aquelas tarefas independentes estão realizando.

O que você pensa sobre as últimas atualizações da OpenAI? Está planejando integrar a API Responses em seus projetos, ou está preocupado com o fim da API Assistants? Como você vê as ferramentas integradas, como pesquisa na web, pesquisa de arquivos e uso do computador? Elas solucionam problemas reais ou introduzem novos desafios? E quanto ao Agents SDK? Você considera isso um divisor de águas para o desenvolvimento de agentes de IA, ou ainda faltam recursos?

Referência: monsitj/Getty Images.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima