5 dicas para criar modelos de base para IA

Muitas empresas estão apenas começando a entender o impacto da inteligência artificial, enquanto algumas já utilizam aprendizado de máquina (ML) e outras tecnologias emergentes há mais de uma década. Para Manish Jethwa, CTO do Ordnance Survey (OS), o serviço de mapeamento nacional do Reino Unido, a prioridade é unir as experiências em IA e ML da organização com os avanços recentes em IA generativa para refinar, distribuir e aplicar seus valiosos dados.

Jethwa explicou como os modelos de linguagem (LLMs) estão ajudando os usuários do OS a encontrar e consultar dados geoespaciais. Um dos elementos-chave nessa abordagem são os modelos de base da organização para IA, que atuam como fundação para a construção de aplicativos mais especializados. Embora analistas de tecnologia, como os do Gartner, indiquem que há muita especulação sobre se os líderes empresariais devem comprar ou desenvolver modelos de IA, Jethwa e sua equipe no OS combinam modelos de base com ferramentas comercialmente disponíveis para explorar e disseminar dados geoespaciais. Aqui estão cinco lições importantes que os líderes empresariais podem aprender com a implementação de modelos de base para IA por Jethwa.

  1. Desenvolva um caso de uso sólido
    Para Jethwa, o OS está criando modelos de base para extrair características ambientais para análise de forma sensível a direitos autorais. "Muitos dos modelos existentes treinados por grandes organizações de tecnologia são baseados em dados disponíveis comercialmente", comentou. O OS se beneficia de uma longa história de coleta de dados de alta precisão que alimenta seu desenvolvimento em IA. "Onde estamos tentando extrair características, construímos modelos de base desde o início", acrescentou. "Esse será um modelo onde definimos todo o conjunto de treinamento com os dados rotulados que temos internamente."

Os modelos de base também servem como base para a análise de dados em outras áreas. Jethwa enfatizou a mensagem simples: você pode reutilizar o que já foi construído inúmeras vezes. "Os modelos de base estão lá para nos ajudar a construir saídas subsequentes. Assim, se quisermos aprender sobre materiais de telhados ou áreas verdes, poderíamos fazer tudo isso a partir do mesmo modelo de base", explicou. "Em vez de ter que treinar vários modelos de base, você apenas faz o ajuste fino no final. Esse processo nos permite conectar ao problema que estamos tentando resolver com os dados de origem."

  1. Estabeleça métodos com propósito
    Jethwa afirmou que um treinamento focado ajuda a restringir custos ao construir modelos de base. "Devemos estar atentos de que, ao treinar esses modelos, fazemos isso de maneira intencional, pois é fácil desperdiçar muitos ciclos nesse exercício", disse. "A execução desses modelos consome muito menos energia e recursos do que o próprio treinamento." O OS costuma alimentar seus modelos de treinamento em partes. "Construir os dados rotulados leva bastante tempo", observou. "É necessário cuidar dos dados em todo o país, com uma ampla variedade de classes das quais estamos tentando aprender, como um mix diferente entre áreas urbanas e rurais."

A organização inicialmente cria um pequeno modelo usando várias centenas de exemplos. Essa abordagem ajuda a conter custos e garante que o OS esteja no caminho certo. "Então, lentamente, aumentamos aquele conjunto rotulado", disse Jethwa. "Acho que agora estamos na faixa das centenas de milhares de exemplos rotulados. Tipicamente, esses modelos são treinados com milhões de conjuntos de dados rotulados." Embora os modelos da organização sejam menores, os resultados são impressionantes. "Já estamos superando os modelos existentes oferecidos por grandes provedores, porque esses modelos são treinados em uma variedade mais ampla de imagens", afirmou. "Os modelos podem resolver uma variedade maior de problemas, mas, para nosso domínio específico, superamos esses modelos mesmo em menor escala."

  1. Utilize outros LLMs para ajustes finos
    O uso de seus próprios modelos de base não significa que o OS ignore os reconhecidos modelos de linguagem de grande porte, afirmou Jethwa: "Estamos construindo sobre os modelos existentes e fazendo o ajuste fino baseado na nossa documentação." O OS utiliza toda a extensão de LLMs disponíveis comercialmente. Como a organização faz parte do ecossistema Microsoft, ela utiliza os modelos de aprendizado de máquina Azure, ferramentas baseadas em Python e outras capacidades especializadas.

Jethwa destacou que o OS também busca parcerias com organizações externas, como a IBM e outros fornecedores de tecnologia, para gerar soluções colaborativas para desafios baseados em dados. Novamente, assim como com os modelos de base, o objetivo é manter os custos restritos. "É um esforço de racionalização", disse Jethwa. “Internamente, o jeito principal de adotar essa abordagem é construindo aos poucos, sendo que a meta que você está tentando alcançar é realizável, evitando desperdício de recursos em atividades infrutíferas."

  1. Pense na comercialização
    Com o OS já começando a construir e refinar seus modelos de base, será que essas tecnologias podem ser utilizadas ou vendidas para outras organizações? Segundo Jethwa, a resposta é talvez. Um dos principais desafios é o copyright da Coroa, que se aplica a ativos criados por funcionários do setor público do Reino Unido. "Acredito que haverá oportunidades para compartilharmos esses modelos de base em algum momento, mas o fato de serem construídos sob copyright da Coroa significa que ainda estamos tentando entender o impacto potencial de fazer esse trabalho externamente", explicou. "Existem desafios em dar away os ‘jewels da coroa’ — estes ativos são, literalmente, joias do copyright da Coroa, então precisamos ser cuidadosos."

Quando o OS oferece acesso aberto, Jethwa menciona que os ativos da organização não devem ser coletados e monetizados sem que traga benefícios para os contribuintes do Reino Unido. "Estamos tentando proteger nossos dados tanto quanto possível, mas ao mesmo tempo, oferecer o máximo de valor para o Reino Unido. Assim, estamos tentando encontrar esse equilíbrio, o que é um desafio."

  1. Mantenha um olho no futuro
    Jethwa comentou que o trabalho da sua organização em modelos de base demonstrou os benefícios da IA generativa para abrir acesso a insights profundos. "Tem proporcionado aquela chave que antes parecia sempre fora de alcance em termos de como você poderia realizar a interação, acessar os dados e refinar o pedido." Ele imagina como a abordagem do OS em IA pode se desenvolver ao longo da próxima década.

"Consigo imaginar uma interface onde há um mapa e você pode dizer: ‘Estou interessado nesta área,’ e você pode dar zoom, e a IA vai perguntar: ‘Quais coisas específicas você está procurando?’ Quando você responde ‘escolas’, a IA vai perguntar que tipos de escolas, e você terá esse diálogo de volta e para frente através da interface." Jethwa destacou que a chave para o sucesso a longo prazo é usar APIs e dados para criar respostas definitivas para os comandos utilizando fontes confiáveis, incluindo informações do OS combinadas com fontes externas. "Modelos de IA são ótimos em agregação e uma visão probabilística, mas, no nosso exemplo, você não quer saber probabilisticamente onde estão as escolas", disse. "Você quer saber onde estão as escolas reais. A IA precisa traduzir um pedido verdadeiro, retornando a uma fonte autoritária, que é o OS, e conseguimos extrair os dados e fornecer a saída."

Fonte: ZDNET

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima