A startup chinesa de inteligência artificial DeepSeek, que nunca saiu de cena, está novamente em evidência com o lançamento de uma versão atualizada do seu modelo V3, apresentada em dezembro.
Na terça-feira, a empresa fez um anúncio oficial sobre o V3-0324, nomeado de acordo com o mês e o dia de lançamento. Um dia antes, foi notado que a DeepSeek havia disponibilizado o novo modelo na plataforma HuggingFace, embora sem muitas informações adicionais.
O que há de novo no modelo V3-0324 da DeepSeek? Semelhante ao R1 — o modelo mais avançado da DeepSeek lançado em janeiro e que compete com a OpenAI — a nova versão é de código aberto (com os pesos públicos, mas não o código-fonte) sob uma licença MIT. A DeepSeek anunciou que o V3-0324 já está disponível, ressaltando várias melhorias: um aumento significativo no desempenho de raciocínio, habilidades mais desenvolvidas em front-end e capacidades mais inteligentes de uso de ferramentas. Para tarefas de raciocínio menos complexas, a empresa sugere usar o V3, desativando o recurso “DeepThink”. A utilização da API permanece inalterada.
Em uma publicação na plataforma X, a DeepSeek destacou que a atualização trouxe melhoras nas habilidades de codificação para desenvolvimento web e um “grande impulso no desempenho de raciocínio”, embora ainda recomende seu uso para tarefas de raciocínio simples. O R1 continua sendo o modelo de raciocínio mais destacado do laboratório, ocupando a quarta posição no Chatbot Arena.
A DeepSeek também mencionou que a atualização demonstrou um desempenho superior ao V3 em vários benchmarks padrão da indústria, destacando-se no AIME (American Invitational Mathematics Examination), onde obteve quase 20 pontos a mais. Embora os benchmarks estejam se tornando muito fáceis para a maioria dos modelos, um problema conhecido como saturação de benchmark, o AIME continua sendo considerado mais desafiador. Em janeiro, a Scale AI e o Centro de Segurança em IA (CAIS) lançaram o Humanity’s Last Exam para combater essa saturação.
Dito isso, como as respostas do AIME são baseadas em conteúdo matemático de nível médio, elas estão disponíveis publicamente na internet, o que possibilita sua inclusão nos dados de treinamento. De acordo com a DeepSeek, outras melhorias incluem um estilo de escrita "aprimorado" e uma qualidade superior, especialmente para conteúdos mais longos. Alguns comentários no Reddit sugerem que o lançamento dessa atualização poderia sinalizar a chegada do R2, que é esperado para ser tão disruptivo quanto o R1.
Para experimentar o modelo V3-0324 da DeepSeek, você pode acessá-lo agora através do HuggingFace ou diretamente pelo site e aplicativo da DeepSeek. Contudo, é importante considerar as principais vulnerabilidades de segurança e as preocupações com a privacidade do usuário antes disso. Enquanto as versões V3 e R1 demonstraram ser facilmente manipuláveis e perigosas, ainda não está claro se a DeepSeek implementou alguma camada adicional de segurança no V3-0324.
Referência: ZDNET
Posts relacionados:



