Liquid AI: IA gigante que roda leve no seu celular!

LFM2.5: A IA Que Desafia Seu Hardware Comum e Cabe no Seu Bolso! 🚀

Olá, pessoal! Aqui é o Lucas Tech, e hoje o papo é sobre algo que promete revolucionar como a gente interage com a inteligência artificial no dia a dia. Preparem-se porque a Liquid AI acabou de lançar um modelo que vai fazer seu celular e seu computador parecerem máquinas do futuro! É o LFM2.5-8B-A1B, e ele é uma verdadeira joia da engenharia de IA, projetado para ser superpoderoso e, ao mesmo tempo, incrivelmente eficiente. Vamos mergulhar nessa!

O LFM2.5-8B-A1B: O Que É Essa Magia?

Pensa num modelo de IA que tem 8.3 bilhões de parâmetros (basicamente, o "cérebro" da IA), mas que, para cada pedacinho de informação que ele processa, só ativa 1.5 bilhão. Essa sacada, conhecida como "Mixture-of-Experts" (MoE) e arquitetura esparsa, é o segredo para ele ser um peso-pena em termos de computação, rodando até mesmo no seu hardware do dia a dia.

O modelo tem 24 camadas, sendo 18 blocos de convolução LIV de porta dupla e seis camadas GQA. Essa combinação o torna um verdadeiro "canivete suíço" para chamar ferramentas e seguir instruções complexas.

Outra novidade é que ele é um modelo "reasoning-only". Isso significa que ele não te dá a resposta de cara. Ele primeiro "pensa" em voz alta, mostrando o passo a passo do raciocínio. Isso é super útil para entendermos como a IA chegou àquela conclusão!

Ele também tem uma janela de contexto GIGANTE: 131.072 tokens! É como se ele pudesse "ler" um livro inteiro e ainda se lembrar de tudo para te ajudar. E não é só isso: ele entende e gera conteúdo em nove idiomas, incluindo árabe, chinês e japonês.

A equipe da Liquid AI sugere algumas configurações para extrair o melhor dele: temperatura de 0.2, top_k de 80 e repetition_penalty de 1.05.

As Novidades Desde a Versão Anterior

Lembra do LFM2-8B-A1B? Pois é, o LFM2.5 trouxe melhorias que são um verdadeiro salto!

A janela de contexto, que antes era de 32.768 tokens, agora é de impressionantes 128.000 tokens. Isso permite que ele trabalhe com documentos muito mais longos e faça raciocínios mais profundos.

O pré-treinamento quadruplicou, passando de 12 trilhões para 38 trilhões de tokens. Mais dados, mais inteligência! O vocabulário também dobrou, de 65.536 para 128.000 tokens. Isso é crucial para idiomas não latinos, como hindi, tailandês, vietnamita, indonésio e árabe, onde a compressão de texto ficou muito mais eficiente, deixando a IA ainda mais fluida.

Como a Liquid AI O Treinou? A Magia Por Trás

Não foi um recomeço do zero, o que é bem inteligente! A Liquid AI expandiu o "vocabulário" do modelo, treinando-o com mais dados em vários idiomas.

A extensão do contexto foi feita em duas fases, com foco em raciocínio, matemática e uso de ferramentas.

Eles também usaram uma técnica de "reforço de aprendizado" (RL) para resolver dois problemas chatos: os "doom loops" (quando a IA fica repetindo a mesma coisa, tipo um disco arranhado) e as famigeradas alucinações (quando a IA inventa coisas). Basicamente, a IA aprende a ser mais precisa e a dizer "não sei" quando não tem certeza, em vez de inventar uma resposta.

Resultados de Tirar o Chapéu: Os Benchmarks

Os números não mentem: o LFM2.5-8B-A1B superou o antecessor em TUDO!

A taxa de não-alucinação (AA-Omniscience Non-Hallucination Rate) saltou de 7.46 para 63.47! Isso é GIGANTE!
No IFEval, que mede a capacidade de seguir instruções, foi de 79.44 para 91.84. E o mais legal: ele consegue isso com uma fração dos parâmetros ativos de modelos muito maiores, como o Gemma-4-26B-A4B-IT!
Em raciocínio matemático (MATH500) e uso de ferramentas (Tau² Telecom), os ganhos também foram enormes. Isso significa uma IA mais confiável e eficiente, pronta para te ajudar.

Benchmark	LFM2-8B-A1B	LFM2.5-8B-A1B	Δ
AA-Omniscience Non-Hallucination Rate	7.46	63.47	+56.01
IFEval	79.44	91.84	+12.40
MATH500	74.80	88.76	+13.96
Tau² Telecom	13.60	88.07	+74.47

Performance Incrível: Rodando em Qualquer Lugar

Essa é a parte que me deixa mais animado: a performance!

No seu notebook com um M5 Max, ele decodifica 253 tokens por segundo, usando menos de 6GB de RAM. No Ryzen AI Max+ 395, são 146 tokens/s. É super rápido!
E no celular? Cerca de 30 tokens por segundo! Imagina uma IA super inteligente rodando direto no seu bolso, sem precisar de internet!
Para quem tem hardware mais parrudo, como uma NVIDIA H100 SXM5, ele chega a incríveis 18.5K tokens por segundo! É mais de 1.6 bilhão de tokens por dia!

Ah, e ele já vem com suporte para os principais frameworks de inferência, tipo llama.cpp, MLX, vLLM e SGLang, além de ONNX e a plataforma LEAP da Liquid AI. Para usar ferramentas, ele gera chamadas de função em Python por padrão (entre os tokens especiais <|tool_call_start|> e <|tool_call_end|>), mas você pode configurar para JSON.

Pontos Fortes e O Que Ficar De Olho

Como toda tecnologia, o LFM2.5-8B-A1B tem seus superpoderes e alguns pontos que merecem atenção.

Pontos Fortes:

Eficiência Máxima: Ativa apenas 1.5 bilhão de parâmetros, tornando a inferência super barata em hardware de borda (celulares, notebooks).
Inteligência Competitiva: Ótima capacidade de seguir instruções e atuar como agente para seu tamanho.
Contexto Gigante: Janela de contexto de 128K e suporte a nove idiomas.
Aberto para Todos: É open-weight (licença LFM1.0), com checkpoints base e pós-treinados. Você pode baixar e usar!

O Que Ficar De Olho:

Conhecimento Direto Limitado: Por ter menos parâmetros ativos, sua "memória" de conhecimento sem buscar informações externas é menor.
Não É Para Tudo: Não é ideal para programação pesada ou perguntas muito complexas que exigem um conhecimento profundo sem um sistema de busca acoplado.
Saída Mais Longa: O modo "reasoning-only" adiciona tokens ao processo, ou seja, o output pode ser um pouco mais longo por incluir o raciocínio.
Somente Texto: Por enquanto, esta variante não tem entrada de visão ou áudio.

Minha Visão

Gente, essa liberação da Liquid AI é um divisor de águas! Ver uma IA tão potente, com capacidade de raciocínio aprimorada e uma janela de contexto gigantesca, rodando de forma tão eficiente em hardware de consumo, abre um leque de possibilidades que antes pareciam distantes. Pensem na privacidade aprimorada, na autonomia, na velocidade de resposta sem depender da nuvem. Isso significa assistentes pessoais mais inteligentes, aplicativos que entendem o contexto como nunca e ferramentas que podem operar localmente no seu dispositivo, transformando a forma como interagimos com a tecnologia. É um passo enorme para a democratização da IA de ponta!

E você, o que acha dessa novidade? Qual a primeira coisa que você faria com uma IA tão poderosa e eficiente no seu dispositivo? Compartilha nos comentários!

Referência: Matéria Original