Uma startup chinesa de inteligência artificial, chamada DeepSeek, divulgou no sábado (1º) alguns dados sobre os custos e receitas de seus modelos de sucesso V3 e R1. A empresa afirmou que a relação teórica entre custo e lucro pode chegar a 545% — mais de cinco vezes — em um único dia, embora tenha alertado que a receita real seria consideravelmente menor. Esta é a primeira vez que a empresa, com sede em Hangzhou, apresenta informações sobre suas margens de lucro em tarefas de “inferência”, o estágio pós-treinamento que envolve modelos de IA realizando previsões ou executando funções, como em chatbots.
A gigante chinesa Tencent anunciou que sua nova IA é mais veloz que o modelo R1 da DeepSeek. Após algumas críticas, Jack Ma, do Alibaba, voltou a aparecer em um encontro com Xi Jinping. Enquanto isso, informações sobre a Grok 3, a nova versão da IA de Elon Musk, começam a surgir. A divulgação dos resultados pode impactar ainda mais as ações de empresas de IA fora da China, que sofreram quedas em janeiro, após os chatbots baseados nos modelos de R1 e V3 ganharem destaque globalmente. Essa desvalorização foi exacerbada pelas alegações da DeepSeek de que investiu menos de US$ 6 milhões em chips para treinar seu modelo, uma quantia inferior à investida por concorrentes americanos, como a OpenAI.
Os chips mencionados pela DeepSeek, que são o H800 da Nvidia, possuem menos potência em comparação aos disponíveis para a OpenAI e outras empresas de IA nos EUA, o que gerou ceticismo entre os investidores a respeito das promessas das empresas americanas de investir bilhões em tecnologia avançada. A DeepSeek informou em uma postagem no GitHub que, considerando um custo de aluguel de chip H800 a US$ 2 por hora, o custo total diário de inferência para os modelos V3 e R1 chega a US$ 87.072. Em contrapartida, a receita teórica diária obtida por esses modelos seria de US$ 562.027, o que resulta em uma relação de custo-lucro de 545%. Ao longo de um ano, isso representaria um total de pouco mais de US$ 200 milhões em receitas. Entretanto, a empresa reconheceu que sua “receita real é significativamente menor”, pois o custo de uso do modelo V3 é inferior ao do modelo R1, além de que apenas alguns serviços são monetizados, uma vez que o acesso à web e ao aplicativo continua gratuito, e os desenvolvedores pagam menos em horários de menor demanda.
Posts relacionados:



