LFM2.5: A IA Que Desafia Seu Hardware Comum e Cabe no Seu Bolso! 🚀
Olá, pessoal! Aqui é o Lucas Tech, e hoje o papo é sobre algo que promete revolucionar como a gente interage com a inteligência artificial no dia a dia. Preparem-se porque a Liquid AI acabou de lançar um modelo que vai fazer seu celular e seu computador parecerem máquinas do futuro! É o LFM2.5-8B-A1B, e ele é uma verdadeira joia da engenharia de IA, projetado para ser superpoderoso e, ao mesmo tempo, incrivelmente eficiente. Vamos mergulhar nessa!
O LFM2.5-8B-A1B: O Que É Essa Magia?
Pensa num modelo de IA que tem 8.3 bilhões de parâmetros (basicamente, o "cérebro" da IA), mas que, para cada pedacinho de informação que ele processa, só ativa 1.5 bilhão. Essa sacada, conhecida como "Mixture-of-Experts" (MoE) e arquitetura esparsa, é o segredo para ele ser um peso-pena em termos de computação, rodando até mesmo no seu hardware do dia a dia.
O modelo tem 24 camadas, sendo 18 blocos de convolução LIV de porta dupla e seis camadas GQA. Essa combinação o torna um verdadeiro "canivete suíço" para chamar ferramentas e seguir instruções complexas.
Outra novidade é que ele é um modelo "reasoning-only". Isso significa que ele não te dá a resposta de cara. Ele primeiro "pensa" em voz alta, mostrando o passo a passo do raciocínio. Isso é super útil para entendermos como a IA chegou àquela conclusão!
Ele também tem uma janela de contexto GIGANTE: 131.072 tokens! É como se ele pudesse "ler" um livro inteiro e ainda se lembrar de tudo para te ajudar. E não é só isso: ele entende e gera conteúdo em nove idiomas, incluindo árabe, chinês e japonês.
A equipe da Liquid AI sugere algumas configurações para extrair o melhor dele: temperatura de 0.2, top_k de 80 e repetition_penalty de 1.05.
As Novidades Desde a Versão Anterior
Lembra do LFM2-8B-A1B? Pois é, o LFM2.5 trouxe melhorias que são um verdadeiro salto!
A janela de contexto, que antes era de 32.768 tokens, agora é de impressionantes 128.000 tokens. Isso permite que ele trabalhe com documentos muito mais longos e faça raciocínios mais profundos.
O pré-treinamento quadruplicou, passando de 12 trilhões para 38 trilhões de tokens. Mais dados, mais inteligência! O vocabulário também dobrou, de 65.536 para 128.000 tokens. Isso é crucial para idiomas não latinos, como hindi, tailandês, vietnamita, indonésio e árabe, onde a compressão de texto ficou muito mais eficiente, deixando a IA ainda mais fluida.
Como a Liquid AI O Treinou? A Magia Por Trás
Não foi um recomeço do zero, o que é bem inteligente! A Liquid AI expandiu o "vocabulário" do modelo, treinando-o com mais dados em vários idiomas.
A extensão do contexto foi feita em duas fases, com foco em raciocínio, matemática e uso de ferramentas.
Eles também usaram uma técnica de "reforço de aprendizado" (RL) para resolver dois problemas chatos: os "doom loops" (quando a IA fica repetindo a mesma coisa, tipo um disco arranhado) e as famigeradas alucinações (quando a IA inventa coisas). Basicamente, a IA aprende a ser mais precisa e a dizer "não sei" quando não tem certeza, em vez de inventar uma resposta.
Resultados de Tirar o Chapéu: Os Benchmarks
Os números não mentem: o LFM2.5-8B-A1B superou o antecessor em TUDO!
- A taxa de não-alucinação (AA-Omniscience Non-Hallucination Rate) saltou de 7.46 para 63.47! Isso é GIGANTE!
- No IFEval, que mede a capacidade de seguir instruções, foi de 79.44 para 91.84. E o mais legal: ele consegue isso com uma fração dos parâmetros ativos de modelos muito maiores, como o Gemma-4-26B-A4B-IT!
- Em raciocínio matemático (MATH500) e uso de ferramentas (Tau² Telecom), os ganhos também foram enormes. Isso significa uma IA mais confiável e eficiente, pronta para te ajudar.
| Benchmark | LFM2-8B-A1B | LFM2.5-8B-A1B | Δ |
|---|---|---|---|
| AA-Omniscience Non-Hallucination Rate | 7.46 | 63.47 | +56.01 |
| IFEval | 79.44 | 91.84 | +12.40 |
| MATH500 | 74.80 | 88.76 | +13.96 |
| Tau² Telecom | 13.60 | 88.07 | +74.47 |
Performance Incrível: Rodando em Qualquer Lugar
Essa é a parte que me deixa mais animado: a performance!
- No seu notebook com um M5 Max, ele decodifica 253 tokens por segundo, usando menos de 6GB de RAM. No Ryzen AI Max+ 395, são 146 tokens/s. É super rápido!
- E no celular? Cerca de 30 tokens por segundo! Imagina uma IA super inteligente rodando direto no seu bolso, sem precisar de internet!
- Para quem tem hardware mais parrudo, como uma NVIDIA H100 SXM5, ele chega a incríveis 18.5K tokens por segundo! É mais de 1.6 bilhão de tokens por dia!
Ah, e ele já vem com suporte para os principais frameworks de inferência, tipo llama.cpp, MLX, vLLM e SGLang, além de ONNX e a plataforma LEAP da Liquid AI. Para usar ferramentas, ele gera chamadas de função em Python por padrão (entre os tokens especiais <|tool_call_start|> e <|tool_call_end|>), mas você pode configurar para JSON.
Pontos Fortes e O Que Ficar De Olho
Como toda tecnologia, o LFM2.5-8B-A1B tem seus superpoderes e alguns pontos que merecem atenção.
Pontos Fortes:
- Eficiência Máxima: Ativa apenas 1.5 bilhão de parâmetros, tornando a inferência super barata em hardware de borda (celulares, notebooks).
- Inteligência Competitiva: Ótima capacidade de seguir instruções e atuar como agente para seu tamanho.
- Contexto Gigante: Janela de contexto de 128K e suporte a nove idiomas.
- Aberto para Todos: É open-weight (licença LFM1.0), com checkpoints base e pós-treinados. Você pode baixar e usar!
O Que Ficar De Olho:
- Conhecimento Direto Limitado: Por ter menos parâmetros ativos, sua "memória" de conhecimento sem buscar informações externas é menor.
- Não É Para Tudo: Não é ideal para programação pesada ou perguntas muito complexas que exigem um conhecimento profundo sem um sistema de busca acoplado.
- Saída Mais Longa: O modo "reasoning-only" adiciona tokens ao processo, ou seja, o output pode ser um pouco mais longo por incluir o raciocínio.
- Somente Texto: Por enquanto, esta variante não tem entrada de visão ou áudio.
Minha Visão
Gente, essa liberação da Liquid AI é um divisor de águas! Ver uma IA tão potente, com capacidade de raciocínio aprimorada e uma janela de contexto gigantesca, rodando de forma tão eficiente em hardware de consumo, abre um leque de possibilidades que antes pareciam distantes. Pensem na privacidade aprimorada, na autonomia, na velocidade de resposta sem depender da nuvem. Isso significa assistentes pessoais mais inteligentes, aplicativos que entendem o contexto como nunca e ferramentas que podem operar localmente no seu dispositivo, transformando a forma como interagimos com a tecnologia. É um passo enorme para a democratização da IA de ponta!
E você, o que acha dessa novidade? Qual a primeira coisa que você faria com uma IA tão poderosa e eficiente no seu dispositivo? Compartilha nos comentários!
Referência: Matéria Original
Posts relacionados:

THINKING PROCESS:
Analyze the original title: "I just played Crimson Desert on PS5 Pro — here’s how this massive RPG looks and runs on console"
- Core subject: Crimson Desert
- Platform: PS5 Pro (and "console" in general)
- Main aspects discussed: Looks (graphics), runs (performance)
- Implied tone: Personal experience, informative review/first impression.
- Keywords: Crimson Desert, PS5 Pro, RPG, looks, runs, console.
Understand the target platform: Google Discover.
- Characteristics: Visual-driven, snackable content, engaging, curiosity-inducing, often uses questions, bold claims, or intriguing statements. Personalization is key.
- Goal: Make people click now.
Understand the requirements:
- Language: Portuguese (BR, implied).
- Length: Short.
- Tone: Curious.
- Output: ONLY the final title text.
Brainstorm Portuguese equivalents for key concepts:
- "I just played" -> Joguei, Acabei de jogar, Minha experiência com
- "Crimson Desert" -> Crimson Desert (keep original)
- "PS5 Pro" -> PS5 Pro (keep original)
- "massive RPG" -> RPG massivo, RPG gigante, mundo aberto gigante
- "looks and runs" -> Gráficos e desempenho, Como roda, Como está, O que esperar
- "on console" -> No console, No PS5 Pro
Focus on "short and curious" for Google Discover:
Curiosity triggers:
- Questions (e.g., "Impressionado?", "Como será?", "Vale a pena?")
- Intriguing statements (e.g., "Você não vai acreditar!", "Chocante!", "Surpreendente!")
- Direct address ("Você precisa ver")
- Highlighting the impressiveness or challenge of the game/platform.
- Using strong adjectives (massivo, gigante, surpreendente, incrível).
- Shortness: Avoid long clauses, get straight to the point.
Drafting – Iteration 1 (Mental or scratchpad):
- "Joguei Crimson Desert no PS5 Pro: veja como roda!" (Too plain)
- "Crimson Desert no PS5 Pro: gráficos e desempenho surpreendem?" (Better, but maybe more active)
- "Como Crimson Desert roda no PS5 Pro? É gigante!" (A bit clunky)
- "O RPG massivo Crimson Desert no PS5 Pro: veja como ele se saiu!" (A bit long)
Focus on the "massive RPG" aspect combined with "PS5 Pro":
- The challenge for an "RPG massivo" to run well on a console is the implicit hook. The PS5 Pro is the specific new tech.
Drafting – Iteration 2 (Closer to final):
- "Crimson Desert no PS5 Pro: o RPG massivo surpreende no console?" (Good, but "surpreende" might be too weak, or implies it might not surprise).
- "Crimson Desert no PS5 Pro: É assim que o RPG massivo roda!" (A bit bland).
- "Joguei Crimson Desert no PS5 Pro: o RPG massivo impressiona!" (Good, but "joguei" might make it sound too personal, not for a broader audience seeking a quick info bite). Discover often uses more declarative or question-based styles.
Refine for "curious" and "short":
What makes people curious about a huge game on a powerful console?
- Does it push the limits?
- Is it smooth?
- Are the graphics mind-blowing?
Combine game, platform, and key performance aspects.
- Option 1 (Question-based): "Crimson Desert no PS5 Pro: O RPG massivo impressiona?" (Good, short, curious. "Impressiona" covers both looks and runs implicitly).
- Option 2 (Statement-based with intrigue): "Crimson Desert no PS5 Pro: O RPG gigante em ação!" (A bit less specific on performance).
- Option 3 (Focus on the how): "Crimson Desert no PS5 Pro: Veja como o RPG massivo se saiu!" (A bit long, "se saiu" is okay but not super punchy).
Final selection strategy:
- Choose the one that best combines "Crimson Desert," "PS5 Pro," "massive RPG," and the core idea of "looks and runs" in a curious and short way.
- The question format is excellent for Discover.
"Impressiona" in Portuguese is a strong verb that covers both visual appeal and performance satisfaction.
- Consider: "Crimson Desert no PS5 Pro: como o RPG massivo roda?" (Good, direct, but maybe a bit too much "como roda" which is expected.)
- Consider: "Crimson Desert no PS5 Pro: gráficos e desempenho no RPG gigante!" (A bit descriptive, less curious).
Consider: "Crimson Desert no PS5 Pro: O RPG massivo te surpreende?" (Very good, direct to the reader).
- Let’s try one more: "Crimson Desert no PS5 Pro: O RPG massivo te convence?" (A bit strong on "convence" – implies skepticism).
"Crimson Desert no PS5 Pro: Vale a pena?" (Too generic).
Let’s go back to focusing on the impact of the game running on the Pro. "Impressiona" is good because it covers both visual fidelity and smooth performance, and it directly asks if the combination delivers.
- "Crimson Desert no PS5 Pro: o RPG massivo impressiona?"
- Short: Yes.
- Curious: Yes, it asks a direct question that makes the reader wonder about the answer.
- Covers key elements: Game title, platform, genre, and the core "how it performs" implied by "impressiona."
- Final check: Is it only the title text? Yes.
The chosen title is concise, uses the game and console names, highlights its genre ("RPG massivo") as a key challenge/feature, and asks a direct question ("impressiona?") to pique curiosity about its performance and visuals.
"Crimson Desert no PS5 Pro: O RPG massivo impressiona?"Crimson Desert no PS5 Pro: O RPG massivo impressiona?
Minhas capinhas de celular favoritas e acessíveis estão com promoção de leve duas e pague uma (incluindo para a nova série Google Pixel 10)
Vizinhos em pânico: Um Alien animatrônico gigante pode ser seu!
Não gosta de Liquid Glass? A atualização para iOS 26.1 fez toda a diferença para mim – veja como.