OpenAI pode ter iniciado a tendência de geração de imagens a partir de texto com seu modelo DALL-E, mas, desde então, a oferta da empresa de IA foi superada por modelos de imagem muito mais avançados. Por isso, quando OpenAI lançou seu mais novo modelo de geração de imagens, o GPT-4o, fiquei cética. Contudo, após testá-lo, minha opinião mudou completamente.
Para começar, quando DALL-E foi lançado pela primeira vez, tinha um site dedicado; desde então, ele foi integrado ao ChatGPT. Essa transição trouxe várias vantagens, incluindo a possibilidade de solicitar uma imagem ao chatbot de IA na mesma interface em que você está conversando sobre outros assuntos, eliminando a necessidade de mudar de contexto constantemente. Com o lançamento do modelo de geração de imagens GPT-4o, a OpenAI manteve esse formato prático, trocando o gerador de imagens padrão de DALL-E para GPT-4o para assinantes pagos. Isso facilitou muito o início da criação de novas imagens a partir da minha conta do ChatGPT Plus. Bastou inserir o comando do que eu queria visualizar, e ele a gerou.
Usuários também podem gerar imagens se estiverem na versão gratuita. Na inauguração, informou-se que o modelo estaria disponível para todos os usuários, incluindo os gratuitos, mas no dia seguinte, o CEO da OpenAI, Sam Altman, anunciou que a liberação para a versão gratuita seria “adiada por um tempo”, para torná-la disponível a usuários gratuitos novamente uma semana depois. Entretanto, se o que você experimenta na versão gratuita não impressionar, é porque o único método que ativa o uso do GPT-4o é digitando o atalho “/create image.” Se você apenas digitar um pedido como “Crie uma imagem de XYZ,” ele usará o modelo DALL-E, que produz fotos de qualidade significativamente inferior. A OpenAI não estabelece limites explicitamente, mas, após gerar três imagens em minha conta gratuita, atingi meu limite diário. Portanto, o ChatGPT Plus ainda é uma boa opção para acesso ampliado à geração de imagens.
Agora, sobre as imagens. O momento que você esperava — as imagens. Após inserir um prompt, a IA retorna a geração em menos de um minuto. O processo leva um pouco mais de tempo do que antes, mas as imagens valem a espera, apresentando muitos detalhes, texturas, realismo e até mesmo precisão textual. Ao invés de descrever, incluirei exemplos abaixo para que você possa conferir por si mesmo.
O gerador de imagens se sai muito bem ao seguir o prompt e entregar imagens realistas e de alta qualidade. Contudo, ao testar um modelo de IA, um dos verdadeiros parâmetros de desempenho é como ele se compara aos concorrentes do mercado. Para dar uma boa indicação disso, pedi que gerasse o mesmo prompt que testei em todos os principais geradores de imagens de IA, incluindo Midjourney, Google’s Imagen 3, Adobe Firefly e outros. Estou anexando a versão do GPT-4o abaixo. Você pode ver como ele se compara a todos os outros geradores de imagens de IA neste artigo, incluindo a versão do DALL-E, que claramente fica muito atrás do que o novo modelo pode realizar.
Apesar da qualidade das imagens ser uma das maiores conquistas do modelo, há outros benefícios também. Um dos principais é que ele está integrado na interface do chatbot, o que torna fácil ajustar as gerações com prompts simples em linguagem natural. Além disso, como o chatbot tem o contexto do que você acabou de perguntar, ele pode considerar isso na hora de construir a imagem. Por exemplo, se você estiver conversando sobre organizar uma festa de aniversário, poderá pedir: “Pode agora criar um convite que tenha as informações acima?”, ao invés de precisar reescrever tudo. Comecei a conversar com o ChatGPT sobre uma festa de inauguração, e ao solicitar que criasse um convite, não precisei repetir as informações que já havia fornecido.
Você também pode enviar imagens de referência e, em seguida, pedir ao ChatGPT para criar uma versão diferente ou utilizá-las como elementos de uma nova imagem. Por exemplo, você pode enviar uma selfie e tê-la gerada em estilo anime. Todas essas funcionalidades de customização tornam a ferramenta uma proposta muito forte para criativos, que também podem solicitar que a imagem seja renderizada com fundo transparente ou que incorpore guias de estilo de marca, como códigos hexadecimais ou logotipos.
Com relação a Altman, consegui gerar uma imagem dele usando um chapéu de festa. Isso foi possível porque o novo modelo possui salvaguardas muito mais flexíveis, permitindo que os usuários explorem sua liberdade criativa. O post no blog que anunciou o modelo mencionou que limita o que pode ser criado quando pessoas reais estão no contexto, incluindo “salvaguardas particularmente robustas em torno de nudez e violência gráfica.”
Embora eu não consiga determinar se há casos práticos de uso para este recurso, é uma mudança notável que senti a necessidade de testar. Quando tentei criar uma imagem do Mickey Mouse, disseram que não era possível devido a implicações de direitos autorais, então parece que nem todas as figuras públicas são justas para exploração.
No geral, o gerador de imagens GPT-4o é uma grande vitória em relação aos modelos DALL-E e, talvez, esteja entre os melhores dos muitos que testei. Vale a pena o investimento de R$ 20 por mês? Se você está apenas interessado em geração de imagens de alta qualidade, ainda há versões gratuitas para explorar, como Adobe Firefly ou Google’s Imagen 3.
Dito isso, os recursos de geração de imagens atualizados estão sendo lançados agora, e todos os usuários, incluindo os gratuitos, podem acessá-los. No entanto, usuários gratuitos devem digitar o atalho “/create image”, ou o sistema volta a usar o modelo DALL-E de menor qualidade. Se você é um usuário frequente do ChatGPT, a atualização para o ChatGPT Plus se torna bastante atraente. Você terá acesso a todos os recursos mais recentes e avançados do chatbot da OpenAI, assim como geração de imagens e vídeos de alta qualidade, tudo por R$ 20 por mês, o que não é um mau negócio, especialmente em comparação com outras ofertas no mercado. Por exemplo, a assinatura do Midjourney começa em R$ 10 por mês e oferece apenas geração de imagens.
Referência: https://example.com
Posts relacionados:



