OpenAI lançou recentemente seu novo navegador de IA, o Atlas, disponível apenas para usuários de Mac neste momento. Após assistir à demonstração da empresa, fiquei curioso para testá-lo, uma vez que sou usuário de Mac. O novo navegador combina o que parece ser o melhor do ChatGPT com uma interface web completa. Para os usuários Plus e Pro, a novidade inclui um modo Agent, que permite ao ChatGPT assumir o controle do seu navegador, clicar em links e realizar tarefas em seu nome.
Durante a demonstração da OpenAI, o CEO Sam Altman e outros executivos mostram o modo Agent em ação ao pedir ao ChatGPT que lesse uma receita e, em seguida, pedisse os ingredientes para oito pessoas da Safeway via Instacart — tudo isso sem que ninguém precisasse clicar em nada. Foi uma impressão marcante. No entanto, como moro em uma área rural onde o Instacart não está disponível, e o Walmart é uma das poucas lojas locais que fazem entregas, decidi que isso seria um ótimo teste para o Atlas e o modo Agent. Para simplificar, optei por comprar apenas alguns itens, em vez dos mais de 50 produtos que normalmente peço durante minhas entregas semanais.
Depois de baixar o Atlas, o processo de configuração me pediu para importar dados do Chrome, usar o Apple Keychain para senhas e defini-lo como meu navegador padrão. Assim que fiz essas aprovações e outras permissões, o navegador foi iniciado. A interface é semelhante a uma nova aba do Google Chrome — uma página branca simples com uma caixa de pesquisa no centro e algumas sugestões abaixo. A OpenAI afirma que essas sugestões irão melhorar ao longo do tempo, com base nos hábitos de navegação e dados de uso.
Ativei o modo Agent, selecionei a opção de permanecer conectado para que o ChatGPT pudesse operar dentro das minhas contas, e digitei meu primeiro comando: “Compre massa para madeira, selante para pintura e parafusos de 2 polegadas no Walmart.” Imediatamente, o Agent assumiu o controle da minha aba do Atlas — com o cursor e tudo — enquanto eu apenas assistia. Nesse momento, poderia ter feito outras coisas e voltado depois, mas eu queria ver exatamente o que o Agent faria.
No entanto, o Agent enfrentou alguns obstáculos logo de início. O site do Walmart exibiu um pop-up de seleção de idioma que parecia impedir a navegação do Agent. Apesar de ter concedido acesso ao Atlas para meus dados do Chrome e Keychain, eu não estava logado no Walmart no navegador, então o Agent não sabia minha localização ou loja padrão. Sem essa informação, não consegui verificar quais produtos estavam disponíveis para entrega.
Parei a sessão, fiz login manualmente no Walmart, reativei o modo Agent e refinei meu comando: “Compre 5 massas para madeira, 5 selantes para pintura e um pacote de parafusos de 2 polegadas. Quero que sejam entregues na minha casa a partir da loja de Malone, NY, em uma hora.” O Agent reiniciou a busca e, desta vez, conseguiu pesquisar e adicionar itens ao carrinho. No entanto, percebi que não estava selecionando as marcas que eu costumava comprar, mesmo tendo feito essas compras anteriormente. Portanto, refinei ainda mais meu comando: “Compre 5 massas para madeira, 5 selantes para pintura e um pacote de parafusos de 2 polegadas. Quero que sejam entregues na minha casa a partir da loja de Malone, NY, em uma hora. Eu já pedi esses itens antes, então use meu histórico de compras para encontrar os produtos e marcas que costumo usar.”
Dessa vez, a busca foi bem-sucedida. O Agent acessou meu histórico de compras no Walmart, procurou os produtos, encontrou-os em meus pedidos anteriores e carregou corretamente meu carrinho. Quando a tela de checkout apareceu, tudo o que precisei fazer foi selecionar uma janela de entrega, ajustar a gorjeta e confirmar o pagamento. Minha compra já está a caminho.
No geral, minha experiência foi uma mistura de mágica e ajustes. Após algumas modificações no meu comando e um login manual no Walmart, o modo Agent compreendeu perfeitamente a tarefa, interagiu com a loja online do Walmart e quase concluiu a compra. Ele teve dificuldades com pop-ups e com minhas preferências de compras quando não estava logado no Walmart e não se referiu ao meu histórico de compras sem que eu lhe dissesse diretamente para fazer isso. Apesar disso, para um teste no primeiro dia e sendo a versão 1.0, é surpreendentemente eficaz. O pedido poderia ter sido feito mais rapidamente por mim, mas assistir ao Agent do ChatGPT navegar em um site ao vivo, clicar em menus e montar um carrinho de compras foi, sem dúvida, legal. A experiência levou cerca de 10 minutos. Não foi nada mal, certo?
Estou ansioso para descobrir mais do que posso fazer com isso. Acredito que pode ser incrível usá-lo durante as festas de fim de ano. Por exemplo, já estou planejando pedir ao Agent para encontrar os brinquedos mais procurados para crianças de 4 anos na Amazon, filtrando por mais vendidos e análises, respeitando um orçamento e preenchendo meu carrinho automaticamente. Se funcionar, pode me economizar horas na busca de presentes — ou, no mínimo, inspirar algumas boas ideias.
Ainda é o começo, mas se a OpenAI continuar atualizando o Atlas e o modo Agent, como planeja fazer, eles podem se tornar uma das ferramentas de IA mais úteis disponíveis para usuários do dia a dia.
Referência da matéria: https://www.zdnet.com/article/openais-new-ai-browser-atlas-impresses-during-a-shopping-test/
Posts relacionados:
O navegador da OpenAI pode ser um concorrente do Chrome? Minhas expectativas.
Testei a busca por IA do Google Fotos e a experiência foi decepcionante – 3 soluções para melhorar
Eu deixei o agente de IA Jules do Google acessar meu repositório de código e ele fez quatro horas de trabalho em um instante.
O Atlas da Boston Dynamics agora pode correr e dar cambalhotas como um humano – e é impressionante