Seus dados podem não estar prontos para a IA – veja como torná-los confiáveis

A confiança é um conceito delicado, e esse é um dos desafios enfrentados pela inteligência artificial, que depende da qualidade dos dados que a sustentam. As preocupações com a integridade dos dados — que há muito tempo incomodam até mesmo as organizações mais experientes — estão se manifestando novamente. Especialistas do setor estão emitindo sinais de alerta. Usuários de IA generativa podem se deparar com informações incompletas, duplicadas ou errôneas, que podem ter consequências negativas devido à fragilidade ou ao isolamento dos dados que sustentam esses sistemas.

De acordo com uma análise recente, publicada por Ashish Verma, responsável por dados e análises na Deloitte EUA, e sua equipe de co-autores, "IA e IA generativa estão elevando os padrões para a qualidade dos dados". O grupo afirmou que "estratégias de GenAI podem enfrentar dificuldades sem uma arquitetura de dados clara que abranja tipos e modalidades, levando em conta a diversidade e o viés dos dados e reestruturando a informação para sistemas probabilísticos".

Uma arquitetura de dados adequada para IA apresenta características distintas em comparação aos métodos tradicionais de entrega de dados. Assim, a IA é fundamentada em modelos probabilísticos, o que implica que a saída pode variar com base nas probabilidades e nos dados subjacentes no momento da consulta. Isso limita o design dos sistemas de dados, segundo os autores. Eles ressaltaram que "os sistemas de dados podem não estar projetados para modelos probabilísticos, o que pode aumentar os custos de treinamento e reeducação, sem que haja transformação de dados que inclua ontologias de dados, governança e ações para construção de confiança, além da criação de consultas de dados que reflitam cenários do mundo real".

Entre os desafios, eles também destacaram a ocorrência de alucinações e desvios nos modelos. Todos esses fatores reforçam a importância da participação humana no processo e a intensificação dos esforços para alinhar e assegurar a consistência dos dados. Isso pode, potencialmente, corroer a confiança, que talvez seja a mercadoria mais valiosa no universo da IA, conforme Ian Clayton, diretor de produtos da Redpoint Global, mencionou.

Clayton destacou que "a criação de um ambiente de dados com governança robusta, rastreamento de dados e regulamentos de privacidade transparentes ajuda a garantir o uso ético da IA dentro dos parâmetros de promessas de marca". Estabelecer uma base de confiança é crucial para evitar que a IA atue de maneira errática, o que pode causar experiências de clientes inconsistentes.

Recentemente, as preocupações sobre a prontidão dos dados para a IA vêm crescendo. Gordon Robinson, diretor sênior de gerenciamento de dados na SAS, observou que "a qualidade dos dados é uma questão perene que as empresas enfrentam há décadas". Ele ressaltou duas perguntas essenciais que as empresas devem considerar antes de iniciar um programa de IA: primeiro, "Você entende quais dados possui, a qualidade dele e se é confiável ou não?" E segundo, "Você tem as habilidades e ferramentas certas à sua disposição para preparar seus dados para a IA?"

Clayton comentou sobre a necessidade crescente de "consolidação de dados e qualidade das informações" para enfrentar os desafios da IA. Ele explicou que isso envolve reunir todos os dados e removê-los de silos, além de implementar etapas intensivas de qualidade que garantam a integridade e a consistência dos dados.

A segurança dos dados também assume uma nova dimensão com a introdução da IA. Omar Khawaja, diretor de segurança da informação na Databricks, alertou que "encurtar os controles de segurança na tentativa de entregar rapidamente soluções de IA leva à falta de supervisão".

Especialistas do setor apontam para vários elementos essenciais necessários para garantir a confiança nos dados por trás da IA:

  • Pipelines de dados ágeis: A rápida evolução da IA exige "pipelines de dados ágeis e escaláveis, que são vitais para permitir que a empresa possa se adaptar facilmente a novos casos de uso da IA", afirmou Clayton. Essa agilidade é especialmente importante para fins de treinamento.

  • Visualização: Clayton também destacou que "se os cientistas de dados têm dificuldade em acessar e visualizar os dados que possuem, isso limita severamente a eficiência do desenvolvimento da IA".

  • Programas de governança robustos: Robinson apontou que "sem uma governança de dados forte, as empresas podem enfrentar problemas de qualidade, levando a insights imprecisos e tomadas de decisões inadequadas". Além disso, uma abordagem de governança robusta ajuda a identificar "quais dados a organização possui, preparando-os adequadamente para aplicações de IA e garantindo conformidade com exigências regulatórias".

  • Medições completas e contínuas: Khawaja enfatizou que "a precisão e a eficácia dos modelos de IA dependem diretamente da qualidade dos dados utilizados durante o treinamento". Ele sugeriu implementar medições, como taxas de adoção mensais, que "acompanham a rapidez com que equipes e sistemas adotam capacidades de dados impulsionadas por IA. Altas taxas de adoção indicam que as ferramentas e processos de IA estão atendendo às necessidades dos usuários".

Uma arquitetura de dados preparada para IA deve permitir que as equipes de TI e dados "meçam uma variedade de resultados, abrangendo qualidade dos dados, precisão, completude, consistência e desempenho do modelo de IA", conforme destacou Clayton. "As organizações devem tomar medidas para continuar verificando se a IA está trazendo benefícios reais, em vez de simplesmente implementar IA por implementar."

(Referência: peepo/Getty Images)

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima