A pesquisa sobre inteligência artificial (IA) na medicina está se mostrando cada vez mais promissora – a tecnologia já acelera o desenvolvimento de medicamentos, o Google utiliza IA para aprimorar suas orientações médicas e empresas de dispositivos vestíveis estão incorporando a tecnologia em recursos de saúde preditiva. Agora, a Microsoft é a mais recente a alterar o cenário.
Na segunda-feira, a Microsoft anunciou em um post em seu blog que o Microsoft AI Diagnostic Orchestrator (MAI-DxO), seu sistema de IA médica, conseguiu diagnosticar 85% dos casos publicados no New England Journal of Medicine (NEJM). Essa taxa de acerto é mais de quatro vezes superior à dos médicos humanos. Os casos da NEJM são particularmente complexos e frequentemente exigem a participação de vários especialistas.
Dada a inaccessibilidade, complexidade e confusão que caracterizam os sistemas de saúde, não é surpreendente que as pessoas busquem auxílio na tecnologia sempre que possível. A Microsoft mencionou: “Nos produtos de consumo de IA da Microsoft, como o Bing e o Copilot, vemos mais de 50 milhões de sessões relacionadas à saúde diariamente. Desde uma busca inicial sobre dor no joelho até uma consulta noturna por uma clínica de urgência, motores de busca e assistentes de IA estão se tornando rapidamente a nova linha de frente na saúde.”
Os médicos humanos precisam ser aprovados no Exame de Licenciamento Médico dos EUA (USMLE) para exercer a medicina, teste que também é utilizado para avaliar o desempenho de sistemas de IA em contextos médicos, tanto entre modelos quanto em comparação com humanos. Atualmente, a IA apresenta um bom desempenho no USMLE – um efeito colateral, segundo a Microsoft, da memorização (em vez da compreensão) das respostas às perguntas de múltipla escolha, o que não resulta na análise médica mais sólida. A maioria dos benchmarks padrão da indústria está saturada há algum tempo, o que significa que os modelos de IA estão evoluindo tão rapidamente que os testes não apresentam mais desafios substantivos.
Para lidar com esse problema, a Microsoft criou o Sequential Diagnosis Benchmark (SD Bench). O diagnóstico sequencial é um processo utilizado por clínicos reais para diagnosticar pacientes, começando com a apresentação dos sintomas e prosseguindo com perguntas e exames. O teste apresenta desafios diagnósticos a partir de 304 casos do NEJM, que humanos e modelos de IA podem utilizar para formular perguntas.
A Microsoft então combinou o agente diagnóstico, MAI-DxO, com vários modelos avançados, incluindo GPT, Llama, Claude, Gemini, Grok e DeepSeek, e submeteu o agente ao teste do SD Bench. O MAI-DxO transforma qualquer modelo de linguagem que está utilizando em um “painel virtual de médicos com abordagens diagnósticas diversificadas colaborando para resolver casos diagnósticos,” explicaram os representantes da Microsoft.
Em uma demonstração em vídeo, o MAI-DxO também exibe seu raciocínio enquanto consulta o benchmark, desenvolve diagnósticos possíveis e acompanha o custo de cada teste solicitado. Assim que o agente obtém as informações necessárias do benchmark sobre o caso, ele altera seus diagnósticos, solicitando diferentes exames e exibindo um processo diagnóstico que é muito mais familiar aos médicos humanos.
“MAI-DxO elevou o desempenho diagnósticos de todos os modelos que testamos,” afirmou a Microsoft em seu post, notando que o sistema teve o melhor desempenho quando combinado com o modelo o3 da OpenAI. A empresa comparou os resultados com os de 21 médicos do Reino Unido e dos EUA, cuja experiência variava de cinco a 20 anos, alcançando uma precisão média de apenas 20%.
A Microsoft observou que o MAI-DxO também pode ser configurado, permitindo que opere dentro de limitações de custo definidas por um usuário ou organização – um recurso que permite ao agente realizar uma análise de custo-benefício de determinados testes, algo bastante relevante para os preços exorbitantes da medicina nos EUA, um aspecto que médicos e pacientes também devem considerar. Este recurso também serve como um controle – sem ele, a IA pode “optar por solicitar todos os testes possíveis, independentemente do custo, do desconforto do paciente ou das atrasos no atendimento,” explicou o post.
Provavelmente, a IA não substituirá o seu médico tão cedo – embora o post da Microsoft tenha notado que, devido ao seu amplo conhecimento, a IA pode ultrapassar “as capacidades de raciocínio clínico que, em muitos aspectos do raciocínio clínico, superam as de qualquer médico individual.” A empresa acredita que sistemas como este podem “transformar a saúde” ao oferecer aos pacientes a opção de se autoavaliarem de forma confiável e ajudar os médicos com casos complexos. As economias de custo seriam outro benefício para uma indústria que enfrenta constantemente tarifas inexplicáveis e estruturas de preços opacas.
A Microsoft reconheceu que o MAI-DxO foi testado apenas em casos especiais, portanto, não está claro como funcionaria em tarefas cotidianas. No entanto, essa questão pode não ser relevante se o agente não tiver a intenção de substituir médicos humanos, o que a Microsoft também reafirmou no post. O MAI-DxO faz parte de um “esforço dedicado à saúde do consumidor” que a Microsoft AI iniciou no ano passado. Outros produtos de IA dentro dessa iniciativa incluem o RAD-DINO, uma ferramenta de fluxo de trabalho em radiologia, e o Microsoft Dragon Copilot, um assistente de voz projetado para profissionais da saúde.
Referência: krisanapong detraphiphat/Getty
Posts relacionados:



