OpenAI apresenta oficialmente o GPT-4.5: Descubra suas funcionalidades.

No início deste mês, o CEO da OpenAI, Sam Altman, apresentou um planejamento para os próximos modelos, GPT-4.5 e GPT-5. Em uma postagem na plataforma X, Altman revelou que o GPT-4.5, codificado internamente como Orion, seria o último modelo sem raciocínio em cadeia. Além disso, os detalhes sobre o modelo permaneceram um mistério até hoje.

O lançamento do GPT-4.5 ocorreu nesta quinta-feira de manhã, quando a OpenAI anunciou de forma enigmática que realizaria uma transmissão ao vivo em 4,5 horas, sugerindo que algo significativo estava por vir. Durante a apresentação ao vivo, a OpenAI revelou o GPT-4.5 em uma prévia de pesquisa, a qual a empresa afirma ser o “maior e mais inteligente modelo até o momento”. A OpenAI afirmou que os usuários devem notar uma melhoria geral ao usar o GPT-4.5, o que significa menos alucinações, um alinhamento mais forte com a intenção do prompt e uma inteligência emocional aprimorada. As interações com o modelo devem ser mais intuitivas e naturais em comparação com modelos anteriores, principalmente devido ao seu conhecimento mais profundo e melhor entendimento contextual.

Os métodos que impulsionaram as melhorias do modelo foram o aprendizado não supervisionado — que aumenta o conhecimento e a intuição sobre palavras — e o raciocínio. Embora este modelo não ofereça raciocínio em cadeia, como o modelo o1 da OpenAI, ele ainda proporcionará um nível superior de raciocínio com menos latência e outras melhorias, como consciência de pistas sociais. Por exemplo, em uma demonstração, o ChatGPT foi solicitado a produzir um texto que transmitisse uma mensagem de ódio enquanto executava o GPT-4.5 e o o1. A versão o1 levou um pouco mais de tempo e retornou apenas uma resposta, que tratou o memorando de ódio muito a sério, soando um pouco dura. O modelo GPT-4.5, por outro lado, ofereceu duas respostas diferentes, uma mais leve e outra mais séria. Nenhuma mencionou explicitamente o ódio; em vez disso, expressaram desapontamento com o comportamento do “usuário”.

De maneira semelhante, quando ambos os modelos foram questionados sobre um tema técnico, o GPT-4.5 forneceu uma resposta que fluiu de maneira mais natural, em comparação com a saída mais estruturada do o1. No geral, o GPT-4.5 se destina a realizar tarefas cotidianas em uma variedade de temas, incluindo redação e resolução de problemas práticos.

Para alcançar essas melhorias, o modelo foi treinado usando novas técnicas de supervisão, assim como métodos tradicionais, como ajuste fino supervisionado (SFT) e aprendizado por reforço com feedback humano (RLHF). Durante a transmissão ao vivo, a OpenAI fez uma viagem pela memória, pedindo a todos os seus modelos anteriores, começando pelo GPT-1, que respondessem à pergunta: “Por que a água é salgada?” Como era de se esperar, cada modelo subsequente forneceu uma resposta melhor do que o anterior. O que distinguiu o GPT-4.5 foi o que a OpenAI chamou de “grande personalidade”, que tornou a resposta mais leve, conversacional e envolvente, utilizando técnicas como aliteração.

O modelo integra alguns dos recursos mais avançados do ChatGPT, incluindo Busca, Canvas e upload de arquivos e imagens. No entanto, não estará disponível para recursos multimodais como Modo de Voz, vídeo e compartilhamento de tela. No futuro, a OpenAI disse que planeja tornar a transição entre modelos uma experiência mais fluida, que não dependa da seleção de modelo.

É claro que um lançamento de modelo não estaria completo sem uma análise de benchmarks. Em alguns dos principais benchmarks usados para avaliar esses modelos, incluindo Competição Matemática (AIME 2024), Questões Científicas de nível de doutorado (GPQA Diamond) e SWE-Bench verificado (programação), o GPT-4.5 superou o GPT-4o, seu modelo geral anterior. Ao ser comparado ao OpenAI o3-mini — o modelo de raciocínio recentemente lançado pela OpenAI, ensinado a pensar antes de se pronunciar — o GPT-4.5 chegou bem perto, superando o o3-mini nos benchmarks SWE-Lancer Diamond (programação) e MMMLU (multilíngue).

Uma grande preocupação ao usar modelos de IA generativa é sua tendência a alucinar ou incluir informações incorretas nas respostas. Duas avaliações diferentes de alucinação, SimpleQA Accuracy e SimpleQA Hallucination, mostraram que o GPT-4.5 foi mais preciso e com menos alucinações do que o GPT-4o, o1 e o3-mini. Os resultados de avaliações comparativas com testadores humanos mostraram que o GPT-4.5 é o modelo preferido em relação ao GPT-4o. Em particular, os testadores humanos o preferiram em consultas cotidianas, profissionais e criativas.

Como sempre, a OpenAI garantiu ao público que os modelos são considerados seguros o suficiente para serem lançados, testando rigorosamente o modelo e detalhando esses resultados no cartão de sistema a acompanhar. A empresa também acrescentou que a cada novo lançamento e aumento nas capacidades do modelo, há oportunidades de torná-los mais seguros. Por essa razão, com o lançamento do GPT-4.5, a empresa combinou novas técnicas de supervisão com RLHF.

Atualmente, o GPT-4.5 está em prévia de pesquisa para usuários Pro, acessível através do seletor de modelo na web, móvel e desktop. Se você não deseja pagar os $200 pela assinatura Pro, a OpenAI informou que começará a liberar o GPT-4.5 para usuários Plus e Team na próxima semana, e, em seguida, para usuários de Enterprise e Edu na semana seguinte. Altman mencionou na plataforma X que o objetivo era lançar o modelo para usuários Pro e Plus ao mesmo tempo, mas que é um “modelo gigante e caro”. Ele acrescentou que, como a empresa ficou sem GPUs, irá adicionar dezenas de milhares de GPUs na próxima semana e disponibilizá-lo aos usuários Plus em seguida.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima