A startup de inteligência artificial Mistral, localizada em Paris, está concentrando esforços na criação de modelos de linguagem de grande porte que compreendam idiomas específicos de determinadas regiões e que sejam adaptados para captar as sutilezas culturais frequentemente negligenciadas por modelos mais gerais, que são treinados para lidar com várias línguas. A Mistral lançou recentemente seu primeiro modelo “especializado” focado em idiomas regionais, chamado Saba. De acordo com a Mistral, esse modelo possui 24 bilhões de parâmetros e foi treinado com “conjuntos de dados meticulosamente selecionados” provenientes do Oriente Médio e da Ásia do Sul, em resposta à demanda crescente de um público falante de árabe.
Além disso, a startup, cofundada por ex-funcionários da Meta, busca competir com gigantes como ChatGPT e Microsoft Copilot, introduzindo seu próprio chatbot de IA, o Le Chat. A Mistral desenvolveu e lançou uma variedade de modelos de linguagem, tanto comerciais quanto de código aberto, que estão disponíveis por meio de sites, aplicativos móveis e APIs para aplicações de terceiros. O Saba é semelhante em tamanho ao Mistral Small 3, um modelo de propósito geral de código aberto que pode ser comparado a modelos maiores, como Llama 3.3 70B, Qwen 32B e até mesmo GPT4o-mini. No entanto, segundo as métricas da Mistral, o Saba se destaca no tratamento de conteúdos em árabe, superando o Mistral Small 3 e outros LLMs.
O modelo também possui um desempenho notável com idiomas do sul da Índia, como o tâmil e o malaiala, conforme menciona a Mistral, devido à “interculturalidade” entre o Oriente Médio e a Ásia do Sul. Outras empresas de IA estão perseguindo objetivos semelhantes com modelos de linguagem regional específicos: a OpenAI desenvolveu um modelo GPT-4 específico para o japonês; o projeto EuroLingua GPT se concentra em idiomas europeus; a BAAI Beijing lançou um modelo de linguagem árabe de código aberto (ALM) em 2022; e a Awarri, com sede na Nigéria, está criando seu próprio modelo de linguagem para idiomas nigerianos de baixo recurso.
De acordo com os testes de benchmark da Mistral, o Saba supera modelos focados em árabe, como o JAIS 70B, além de LLMs multilíngues como o Mistral Small 3, Llama 3.1 70B e GPT 4o-mini. A Mistral também ressalta que “Saba oferece respostas mais precisas e relevantes do que modelos com mais de cinco vezes seu tamanho, sendo significativamente mais rápido e de menor custo. O modelo também pode servir como uma base robusta para treinar adaptações regionais altamente específicas.” Como o modelo se destaca na compreensão de sutilezas culturais locais e nuances do Oriente Médio, a Mistral afirma que ele é mais eficiente na geração de conteúdo específico para a região, tornando-o ideal para casos de uso especializados.
Atualmente, o Saba está disponível para suporte conversacional ou geração de conteúdo em árabe e, segundo a empresa, pode ser “ajustado” para alimentar assistentes virtuais em árabe para empresas ou “ferramentas especializadas nos setores de energia, mercados financeiros e saúde.” O modelo Mistral Saba também pode ser acessado por meio da API da Mistral e pode ser “implantado nas instalações de segurança dos clientes.”
Referência: chrispecoraro/Getty Images
Posts relacionados:



