Luma AI desenvolveu um modelo de vídeo com IA que “raciocina” – suas inovações.

A Evolução da Inteligência Artificial no Mercado de Vídeo

Nos últimos anos, a geração de vídeos por inteligência artificial passou de uma piada na internet a um campo em rápida evolução. Apesar de alguns clipes gerados por IA, como o infame vídeo de Will Smith "devorando" espaguete, terem gerado risadas, a tecnologia evoluiu consideravelmente. Hoje, startups do setor tecnológico estão competindo para oferecer ferramentas de IA generativa que, em sua visão futurista, pretendem igualar a qualidade das produções de Hollywood, mas a um custo muito menor.

Na última quinta-feira, a Luma AI apresentou seu novo modelo gerador de vídeo, chamado Ray3. Outro produto da empresa, o Luma Dream Machine, permite que usuários criem vídeos a partir de suas fotografias. O modelo já está disponível através do Dream Machine e para os assinantes do Adobe Firefly e Creative Cloud Pro, que podem gerar vídeos ilimitados por meio dele até 1º de outubro.

Um Modelo de Vídeo com "Raciocínio"

Modelos de IA "racionais", como o o3 da OpenAI, são projetados para analisar consultas, especialmente as mais complexas, por um tempo maior que modelos de IA generativa padrão. Até agora, porém, esses modelos não contavam com a capacidade de gerar vídeos. Segundo a Luma AI, o Ray3 se destaca em relação a concorrentes como Google, Runway, Meta e OpenAI, justamente por sua habilidade de "raciocinar" enquanto cria clipes de vídeo.

Esse termo, "raciocínio", é um conceito vago e debatido quanto à sua definição. Em termos simples, ele remete à capacidade de um modelo de decompor problemas em várias etapas, avaliar a qualidade de seus resultados e aprimorá-los de forma iterativa. Ao invés de simplesmente criar vídeos a partir de um prompt textual, o Ray3 segmenta o processo de produção em várias fases, semelhante ao que uma equipe criativa faria. Ele possui capacidades de raciocínio multimodal, ou seja, pode gerar texto juntamente com ativos visuais para auxiliar os usuários a desenvolver conceitos para o vídeo final.

Os cineastas podem, por exemplo, solicitar que o sistema anote imagens ou sugira ângulos de câmera para diferentes sequências. Segundo a Luma AI, este é o primeiro modelo de video que entrega saídas em 4K e em alta faixa dinâmica, oferecendo um espectro visual muito mais amplo de luz e sombra.

O Futuro da Produção Criativa Automatizada

A Luma AI posiciona o Ray3 como um parceiro criativo automatizado para cineastas, designers de jogos e anunciantes. Uma nova "modo rascunho" permite que o Ray3 gere rapidamente uma variedade de clipes de teste, cada um com variações sutis, proporcionando às equipes criativas diversas opções e economizando tempo no processo de ideação. "Isso permite que os criadores entrem em um estado de fluxo, experimentando livremente sem se preocupar com tempo ou custos computacionais", afirmou a Luma AI.

Outros desenvolvedores de IA também têm comercializado suas ferramentas com a proposta de atuar como parceiros criativos automatizados, onde os humanos podem delegar tarefas rotineiras e trabalhosas, economizando dinheiro nesse processo. Recentemente, a Amazon apresentou um agente de IA que pode auxiliar as marcas em praticamente todas as etapas necessárias para a criação de um anúncio em vídeo curto.

Referência: zdnet.com

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima