Essa coisa de IA decolou rapidamente, não é mesmo? É quase como se tivéssemos extraído tecnologia avançada de uma nave espacial alienígena acidentada, e isso é o que obtivemos. Eu sei, estou assistindo demais Stargate. Mas os efeitos do salto hiper-rápido proporcionado pela IA generativa são reais. Com ferramentas como o ChatGPT, a IA generativa impactou o mundo de forma intensa no início de 2023. De repente, muitos fornecedores começaram a incorporar recursos de IA em seus produtos, e nossos padrões de trabalho mudaram consideravelmente.
Como isso aconteceu tão rapidamente, transformando essencialmente toda a indústria de tecnologia da informação da noite para o dia? O que possibilitou isso e por que foi tão veloz? Neste artigo, analiso dez fatores-chave que contribuíram para o avanço extremamente rápido da IA generativa e sua adoção nos nossos sistemas tecnológicos e práticas diárias de trabalho.
Na minha perspectiva, o rápido crescimento de ferramentas de IA como o ChatGPT e sua ampla integração ocorreu em duas fases principais. Vamos começar com a Fase I.
Fase I: Inovações fundamentais
Pesquisadores vêm trabalhando com IA há décadas. Eu fiz um projeto de tese sobre IA há mais de 20 anos, lancei produtos de IA nos anos 1990 e tenho utilizado linguagens de IA desde que comecei a programar. No entanto, embora tudo isso envolvesse IA, era incrivelmente limitado comparado ao que o ChatGPT pode fazer. Mesmo tendo trabalhado com IA ao longo da minha carreira acadêmica e profissional, fui completamente surpreso pelo ChatGPT e suas versões.
Os anos 2020 marcaram uma era de inovações fundamentais em IA, que permitiram que a IA passasse de resolver problemas específicos em domínios muito restritos para a capacidade de trabalhar em praticamente qualquer área. Três fatores principais estão nessa fase.
- Avanços em modelos transformer
Embora a IA tenha sido pesquisada e utilizada por décadas, durante a maior parte desse tempo, ela possuía limitações profundas. Muitos sistemas de IA precisavam ser pré-treinados com materiais específicos para criar expertise. Nos anos 1990, por exemplo, eu lancei um produto chamado House Plant Clinic, que foi especificamente treinado em doenças e remédios de plantas de interior. Ele era muito útil, desde que a planta e sua doença estivessem nos dados de treinamento. Qualquer situação que fugisse desses dados significava uma lacuna para o sistema.
Além disso, as IAs utilizavam redes neurais que processavam palavras uma a uma, dificultando a compreensão da diferença entre "um banco do rio" e "um banco no centro da cidade". Mas em 2017, o Google publicou um artigo intitulado "Attention Is All You Need", onde propôs um modelo chamado "autoatenção", permitindo que as IAs se concentrem nas palavras que identificam como importantes, possibilitando que processem frases e pensamentos inteiros de uma vez. Essa "transformação dos mecanismos de atenção" possibilitou que as IAs entendessem o contexto (como se o "banco" em uma frase se referisse à margem de um rio ou a um edifício que guarda dinheiro).
- Modelos base amplamente treinados
A abordagem transformer deu aos pesquisadores uma maneira de treinar IAs em grandes coleções de informações e determinar o contexto a partir dessas informações. Isso significou que as IAs podiam escalar para treinar sobre quase qualquer coisa, permitindo que modelos como o GPT-3.5 e GPT-4 da OpenAI operassem com bases de conhecimento que abrangiam virtualmente toda a Internet e vastas coleções de livros e materiais impressos.
Isso os torna quase infinitamente adaptáveis e capazes de acessar grandes quantidades de informações do mundo real, permitindo que as IAs sejam utilizadas para quase qualquer aplicativo, não apenas aqueles especificamente desenvolvidos para resolver problemas individuais. Enquanto passamos meses treinando o House Plant Clinic com dados de plantas, o ChatGPT, o Google Gemini e o Microsoft Copilot podem diagnosticar problemas de plantas de interior (e muito mais) sem treinamento especializado.
Uma questão a ser observada é quem possui todos esses dados de treinamento? Vários processos judiciais estão em andamento contra os fornecedores de IA por treinar (e usar) dados de fontes com direitos autorais. Isso pode restringir os dados disponíveis para grandes modelos de linguagem e reduzir sua utilidade. Outra preocupação com o tipo de dados de treinamento infinitamente escaláveis é que muitas dessas informações não são verificadas. Isso pode surpreender muitos, mas as informações publicadas na Internet nem sempre são precisas, apropriadas ou mesmo sensatas. Embora os fornecedores estejam trabalhando para fortalecer as regras de controle, nós humanos ainda não temos certeza do que é considerado apropriado. Pergunte a duas pessoas com perspectivas divergentes qual é a verdade, e você verá o que quero dizer.
- Avanços em hardware (GPUs e TPUs)
No início dos anos 2020, várias empresas e equipes de pesquisa desenvolveram sistemas de software baseados no modelo transformer e conjuntos de dados de treinamento em grande escala. No entanto, todos esses cálculos de transformação em frases exigiam uma enorme capacidade de computação.
Não era apenas a necessidade de realizar operações de matriz massivamente paralelas e em alta velocidade, mas também a necessidade de fazer isso enquanto se mantinha os custos de energia e resfriamento em um nível minimamente prático. No início, ficou claro que as GPUs para jogos da NVIDIA eram capazes de realizar as operações de matriz necessárias para a IA (o renderizado em jogos também é bastante baseado em matrizes). Mas depois, a NVIDIA desenvolveu suas chips das séries Ampere e Hopper, que melhoraram substancialmente tanto o desempenho quanto a utilização de energia.
Da mesma forma, o Google desenvolveu suas TPUs (Unidades de Processamento Tensorial), projetadas especificamente para lidar com fluxos de trabalho de IA. A Microsoft e a Amazon também desenvolveram chips personalizados (Maia e Graviton) para ajudar na construção de seus centros de dados de IA.
Daí surgiram três impactos principais desses enormes centros de dados alimentados por chips de IA: 1) o treinamento em escala mundial tornou-se acessível, pelo menos para os maiores players; 2) as capacidades de IA podiam ser medidas e vendidas por meio de um modelo SaaS, tornando a IA acessível para a maioria das empresas; e 3) a velocidade de processamento da IA aumentou rapidamente, permitindo o início da análise em tempo real e quase em tempo real de dados (o que se mostrou crítico para carros autônomos).
Fase II: Forças de mercado impulsionam a adoção
Então, temos tecnologia funcional. E daí? Quer dizer, quantas vezes uma equipe de engenharia produziu um produto ou uma capacidade que considerava revolucionária, apenas para ver o resultado morrer pela falta de praticidade ou aceitação do mercado?
Mas aqui, com a IA generativa, as forças do mercado são o que estão impulsionando a verdadeira mudança. Vamos explorar mais sete fatores-chave.
- ChatGPT para todos e acesso via API
E então surgiu o ChatGPT. É um nome engraçado e demorou um tempo para a maioria de nós aprender. ChatGPT é literalmente um programa de chat que é generativo, pré-treinado e usa tecnologia transformer. Mas, apesar de um nome que só um geek poderia amar, no início de 2023, o ChatGPT se tornou o aplicativo que mais cresceu na história.
A OpenAI disponibilizou o ChatGPT gratuitamente para todos. Claro, havia limitações de uso na versão gratuita. A interface era fácil (ou até mais fácil) de usar do que uma pesquisa no Google. Bastava abrir o site e digitar seu prompt. E devido às três inovações discutidas anteriormente, a qualidade da resposta do ChatGPT era impressionante. Todos que testaram perceberam que estavam tocando o futuro.
Em seguida, a OpenAI disponibilizou os modelos do ChatGPT para outros programadores por meio de uma API. Qualquer programador precisava apenas de um fim de semana de aprendizado e de um cartão de crédito para adicionar IA revolucionária a qualquer aplicação. O custo por chamada de API não era muito mais caro do que o de outras APIs comerciais, o que de repente significava que a IA era uma adição fácil e muito notável que poderia expandir a linha de produtos de uma empresa com um serviço novo e rentável.
Barreras de entrada? Que barreiras de entrada?
- Aceleração de código aberto
Enquanto APIs suportadas por fornecedores, como as da OpenAI, podem reduzir significativamente o tempo de mercado, também podem levar ao bloqueio do fornecedor. Para evitar uma dependência total de tecnologias proprietárias, a comunidade de código aberto adotou a IA de maneira robusta.
Modelos de código aberto (LLaMa, Stable Diffusion, Falcon, Bloom, T5, etc.) fornecem capacidades de IA que são não proprietárias e auto-hospedadas, sem depender de grandes monopólios tecnológicos. O código aberto também democratiza a IA, permitindo que desenvolvedores criem soluções de IA para áreas fora das normas que os grandes provedores de modelos precisam manter em operação.
Plataformas como as da Hugging Face oferecem ferramentas fáceis de usar e testar que permitem que desenvolvedores de diferentes níveis de habilidade integrem IA em seus projetos rapidamente. Então, claro, existem os benefícios clássicos do código aberto: colaboração em grande escala, melhorias contínuas, otimizações geradas e validadas pela comunidade e a introdução de novos recursos, incluindo alguns muito obscuros que não seriam lucrativos para um grande fornecedor, mas são necessários para determinados projetos.
Tudo isso oferece a empresas de todos os tamanhos, pesquisadores e até desenvolvedores que trabalham nas horas vagas, a oportunidade de adicionar IA em seus projetos, o que, por sua vez, acelera a adoção da IA em uma ampla gama de aplicações.
- Demanda do consumidor e das empresas
O fato é que a IA generativa não era apenas uma moda passageira. Ela funcionava e agregava valor. Separadamente da ajuda com redações (que a política do site proíbe para seus autores), listei 15 maneiras diferentes pelas quais a IA me ajudou de forma concreta apenas em 2024.
Essas utilizações variavam de ajuda em programação e depuração a correção de fotos, passando pela análise de sentimentos que mencionei, criação de capas de álbuns, geração de imagens mensais para a loja de e-commerce da minha esposa, criação de máscaras de movimento em clipes de vídeo, melhoramento de áudio ruim, monitoramento durante filmagens, pesquisa de projetos e muito mais. E eu não sou o único. Empresas pequenas e grandes, assim como estudantes e colaboradores individuais, notaram que a IA generativa podia realmente ajudar. As avaliações das empresas de IA dispararam e os consumidores realmente compraram — e usaram de fato — as ferramentas de IA que se tornaram disponíveis de repente.
- Viralidade e efeitos de rede
Por décadas, a IA esteve longe de ser algo comum. Certamente existiram IAs limitadas em videogames. Sistemas especialistas foram criados para ajudar a resolver problemas específicos para algumas empresas. Havia muito potencial e pesquisa, mas quando se tratava de "mostrar o dinheiro", nunca teve o retorno esmagador que os investidores de risco exigiam de investimentos em tecnologia.
Então, de repente, tia Marge começou a falar sobre o ChatGPT durante encontros familiares. A IA era um assunto, era surpreendente, e oh, as coisas que ela poderia fazer. Você sabia que poderia fazê-la falar como um pirata? Você sabia que poderia solicitar que ela escrevesse uma história de Star Trek? Você sabia que poderia analisar os dados isolados de seus negócios e fornecer uma análise de sentimentos em minutos sem nenhum pouco de programação? E você sabia que ela poderia escrever um código que funcionasse?
Dentro de poucos meses, o ChatGPT se tornou o aplicativo que mais cresceu na história, alcançando 100 milhões de usuários ativos. Um ano depois, esse número dobrou para 200 milhões.
- Pressão competitiva do mercado
De repente, a IA era um destaque, em vez de ser apenas a marca pessoal do vizinho geek que você chama para consertar seu PC, mas que você realmente preferiria que fosse embora depois de resolver o problema e por um pagamento em biscoitos frescos.
Analogias estranhas sobre meu passado geek à parte, a IA era claramente uma oportunidade. A OpenAI valia bilhões de dólares, e parecia que Google, Microsoft, Meta, Amazon, Apple e todos os outros haviam ficado para trás.
Investimentos e acordos de licenciamento estavam em toda parte, e a IA estava sendo incorporada a produtos de consumo, seja como um recurso adicional ou (mais frequentemente) como uma excelente opção de venda adicional para uma receita mensal. A Microsoft tinha o Copilot, o Google tinha o Gemini, a Meta tinha a Meta AI, a Amazon tinha o Q e a Apple… eventualmente teve a Apple Intelligence (para o que isso vale).
- Atraso legislativo e regulatório
Esse novo boom da IA tomou características de um "velho oeste". Os governos estavam apenas tentando entender o que tudo isso significava, se isso era uma enorme oportunidade econômica ou uma ameaça existencial. Dica: é ambas as coisas.
O governo dos EUA elaborou alguns planos para regulamentação da IA, mas foram mornos, no melhor dos casos. Os fornecedores de IA alertaram sobre catástrofes se a IA não fosse regulamentada. Processos judiciais sobre questões de direitos autorais complicaram a situação. Então, a nova administração mudou o jogo, focando na redução substancial da regulamentação.
Tudo isso abre portas para empresas de IA e negócios que utilizam IA para inovar e introduzir novas capacidades. Isso é ótimo para o crescimento e inovação rápidos, mas também significa que a tecnologia está funcionando sem regras de controle. Isso definitivamente alimenta a popularização da tecnologia de IA, mas pode também ser muito, muito perigoso.
- Inovação contínua e investimento
Portanto, chegamos à fase de "lavagem e repetição" da nossa discussão. A IA não vai a lugar algum. Todas as profecias autorrealizáveis estão alimentando novas inovações porque, de fato, elas funcionam. Grandiosas empresas continuam a apostar bilhões na tecnologia e também a oferecer produtos e serviços atraentes que podem fornecer verdadeiro valor a seus clientes.
Cada vez mais empresas e indivíduos estão investindo em startups de IA e serviços contínuos. Estamos vendo avanços como a IA multimodal com texto/imagens/vídeo/áudio, agentes autônomos e até IAs usadas para programar outras IAs.
O exemplo mais próximo que consigo pensar para esse ciclo virtuoso foi a economia de aplicativos do meio dos anos 2000. A velocidade dos dados se tornou rápida e acessível o suficiente para que os telefones estivessem sempre conectados à Internet, startups ofereciam serviços de aplicativos que se mostraram valiosos, essas empresas cresceram enormemente e continuaram a oferecer serviços, e mais investimentos em computação mobile-first se reverteram em benefícios tanto para consumidores quanto para produtores.
É muito provável que um ciclo virtuoso também esteja impulsionando a inovação e a produção de IA, levando a IA generativa e outros serviços baseados em IA a um ponto em que se tornem extremamente comuns.
Fase III: O futuro
Quando fui para a faculdade nos anos 1980 e me formei em ciência da computação, minha mãe disse que tudo o que ela queria de mim era um computador que pudesse aspirar o chão. Agora, temos uma ampla gama de pequenos robôs que fazem exatamente isso. Esta manhã, enquanto tomava meu café, eu comandei "Limpar e esfregar o quarto", e o Wally, meu robô aspirador, fez isso sem problemas.
Meu sonho é poder dizer: "Alexa, me traga um café", e ter um dispositivo realmente fazendo uma xícara e trazendo-a para mim enquanto estou aqui escrevendo. Não ri. Seja a Tesla, a Apple ou a Meta, um trabalho real está sendo feito neste momento em robôs humanoides.
Dadas as inúmeras vezes que minha Alexa comete erros e a frequência com que o ChatGPT inventa informações para manter a aparência, não tenho certeza se ter um robô pulando e fazendo barulho em minha sala de estar ou escritório seja uma boa ideia. Mas eu quero meu café.
Fique ligado. Os últimos dois anos foram uma montanha-russa e suspeito que apenas começamos a ver o início de tudo.
Quais você acha que foram os fatores mais significativos na rápida adoção da IA? Você incorporou ferramentas de IA como o ChatGPT em seu fluxo de trabalho diário? Se sim, como elas mudaram sua forma de trabalhar ou criar?
Você vê a IA como algo que pode mudar o jogo a longo prazo ou acredita que estamos no meio de um ciclo de modismo que eventualmente se estabilizará? E quanto às preocupações éticas e regulatórias? Você acha que o desenvolvimento da IA está avançando rápido demais para um controle adequado? Deixe-nos saber nos comentários abaixo.
Você pode acompanhar minhas atualizações de projetos diários nas redes sociais. Não se esqueça de se inscrever na minha newsletter de atualizações semanais e me seguir no Twitter/X.
Referência: ZDNET
Posts relacionados:



