OpenAI amplia a disponibilidade do GPT-4.5: Como acessar e quais são suas vantagens

Na semana passada, a OpenAI lançou o GPT-4.5, que a empresa afirma ser o "maior e mais informado modelo até agora". Inicialmente, foi disponibilizado como uma prévia de pesquisa apenas para usuários inscritos no ChatGPT Pro, um plano de $200 por mês. No entanto, hoje, mais usuários da OpenAI podem acessá-lo por um custo significativamente menor.

Acesso expandido ao GPT-4.5
Na manhã de quarta-feira, a OpenAI anunciou, em uma postagem no X, que começou a disponibilizar o GPT-4.5 para usuários do ChatGPT Plus. Quando foi anunciado, a OpenAI informou que o lançamento completo poderia levar de uma a três horas. No entanto, apenas uma hora depois, o lançamento integral do GPT-4.5 foi concluído, o que foi mais rápido do que o esperado, conforme a postagem no X.
As limitações do modelo para usuários do ChatGPT Plus não estão claras. A OpenAI mencionou que pretende oferecer a todos um "limite de taxa considerável", mas que esses limites podem mudar à medida que a empresa entender melhor a demanda pelo modelo. Os assinantes do ChatGPT Pro continuam a ter acesso ao GPT-4.5, mas se você deseja experimentá-lo por um preço mais em conta, pode fazê-lo com o plano ChatGPT Plus, que custa $20 por mês.

O que é o GPT-4.5?
No lançamento, a OpenAI afirmou que os usuários deveriam perceber uma melhoria geral ao usar o GPT-4.5, o que significa que haveria menos alucinações, um alinhamento mais forte à intenção das solicitações e uma inteligência emocional aprimorada. De maneira geral, as interações com o modelo devem parecer mais intuitivas e naturais do que nos modelos anteriores, principalmente devido ao seu conhecimento mais profundo e à melhor compreensão contextual.

Além disso, a OpenAI atualizou seus modelos de raciocínio, que ganharam duas melhorias úteis. As duas metodologias que impulsionam as melhorias do modelo foram o aprendizado não supervisionado — que aumenta o conhecimento de palavras e intuição — e o raciocínio. Embora este modelo não ofereça raciocínio em cadeia, como o modelo de raciocínio o1 da OpenAI, ele ainda proporcionará um nível mais elevado de raciocínio com menos latência e outras melhorias, como a consciência de pistas sociais.

Por exemplo, na demonstração, pediu-se ao ChatGPT que produzisse um texto transmitindo uma mensagem de ódio enquanto rodava o GPT-4.5 e o o1. A versão o1 demorou um pouco mais e produziu apenas uma resposta, que levou a mensagem de ódio muito a sério, soando um tanto severa. O modelo GPT-4.5 ofereceu duas respostas diferentes, uma mais leve e outra mais séria. Nenhuma mencionou explicitamente ódio; em vez disso, expressaram desapontamento sobre como o "usuário" estava se comportando.

De forma semelhante, quando ambos os modelos foram solicitados a fornecer informações sobre um tópico técnico, a resposta do GPT-4.5 fluiu de maneira mais natural em comparação com a saída mais estruturada do o1. No fim das contas, o GPT-4.5 é projetado para tarefas cotidianas em diversos tópicos, incluindo escrita e resolução de problemas práticos.

Para alcançar essas melhorias, o modelo foi treinado utilizando novas técnicas de supervisão junto com metodologias tradicionais, como ajuste fino supervisionado (SFT) e aprendizado por reforço a partir de feedback humano (RLHF). Durante a transmissão ao vivo, a OpenAI revisitou seus modelos anteriores, começando com o GPT-1, para responder à pergunta: "Por que a água é salgada?" Como esperado, cada modelo subsequente forneceu uma resposta melhor do que o anterior. O fator que distingue o GPT-4.5 foi o que a OpenAI chamou de "grande personalidade", que tornou a resposta mais leve, conversacional e envolvente, utilizando técnicas de aliteração.

O modelo integra alguns dos recursos mais avançados do ChatGPT, incluindo Pesquisa, Canvas e upload de arquivos e imagens. No entanto, ele não estará disponível em recursos multimodais, como Modo de Voz, vídeo e compartilhamento de tela. No futuro, a OpenAI afirmou que planeja tornar a transição entre modelos uma experiência mais fluida, que não dependa do seletor de modelos.

Benchmarks
É claro que não poderia haver um lançamento de modelo sem a análise de benchmarks. Em alguns dos principais benchmarks utilizados para avaliar esses modelos, incluindo Competição Matemática (AIME 2024), Perguntas de Ciência de nível de PhD (GPQA Diamond) e SWEBench verificado (codificação), o GPT-4.5 superou o GPT-4o, seu modelo de uso geral anterior.

Notavelmente, quando comparado ao OpenAI o3-mini — um modelo de raciocínio recentemente lançado pela OpenAI, que foi ensinado a pensar antes de se expressar — o GPT-4.5 chegou bastante perto, superando o 4o em benchmarks de SWE-Lancer Diamond (codificação) e MMMLU (multilíngue). Uma grande preocupação ao usar modelos de IA generativa é a sua tendência a alucinar ou incluir informações imprecisas nas respostas. Duas avaliações diferentes de alucinação, SimpleQA Accuracy e SimpleQA Hallucination, mostraram que o GPT-4.5 foi mais preciso e apresentou menos alucinações do que o GPT-4o, o1 e o3-mini.

Os resultados das avaliações comparativas com testadores humanos mostraram que o GPT-4.5 é o modelo preferido em relação ao GPT-4o. Testadores humanos o preferiram para consultas cotidianas, profissionais e criativas.

Segurança
Como sempre, a OpenAI assegurou ao público que os modelos foram considerados seguros o suficiente para ser lançados, realizando testes de estresse no modelo e detalhando esses resultados no cartão de sistema que o acompanhava. A empresa também acrescentou que, a cada novo lançamento e aumento nas capacidades do modelo, surgem oportunidades para tornar os modelos mais seguros. Por essa razão, com o lançamento do GPT-4.5, a empresa combinou novas técnicas de supervisão com RLHF.

Referência: OpenAI

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima