Qualquer pessoa que não trabalhe na área da saúde e que tenha entrado em uma sala de emergência pode ficar confusa com as longas horas de espera e com o enigmático processo pelo qual enfermeiros e médicos movimentam pacientes nas etapas do atendimento. Pesquisadores da Escola de Medicina de Yale e da Universidade Johns Hopkins publicaram recentemente que um programa de inteligência artificial que desenvolveram pode aprimorar o processo nas salas de emergência, tornando a triagem mais eficiente e precisa. A triagem é quando os enfermeiros avaliam a gravidade das condições no momento da admissão dos pacientes.
Este estudo é o primeiro de seu tipo a mostrar efeitos reais do uso de IA na triagem, afirmam os autores. O autor principal e sua equipe descrevem um experimento de três anos, abrangendo o período de 2020 a 2023, onde enfermeiros de emergência em três unidades na região nordeste dos EUA usaram o programa de IA para ajudar na classificação da gravidade dos casos na entrada. Os autores descobriram que os enfermeiros que utilizaram a ferramenta conseguiram movimentar os pacientes mais rapidamente pelo processo de atendimento emergencial—desde o tempo necessário para fornecer os primeiros cuidados até a atribuição de leitos e a alta dos pacientes. Isso resultou numa diminuição do tempo total no pronto-socorro. O programa de triagem "informado por IA", uma ferramenta de suporte à decisão clínica (CDS), resultou em "desempenho melhorado na triagem e no fluxo de pacientes no departamento de emergência", afirmaram, indicando que "a IA poderia levar a tempos de espera menores e à redução da permanência no ED".
Além disso, também foi observado que os enfermeiros com a ferramenta estavam mais atentos às necessidades críticas dos pacientes, como hospitalização, cirurgia ou internação na unidade de terapia intensiva. No estudo intitulado "Impacto do Suporte à Decisão de Triagem Baseado em Inteligência Artificial no Atendimento de Emergência", Taylor e sua equipe descreveram uma interface de usuário que exibia as recomendações da CDS para o enfermeiro. O programa de IA não é um modelo de linguagem grande como o GPT da OpenAI. Trata-se de uma técnica de IA mais antiga e tradicional conhecida como "floresta aleatória", que se baseia em redes neurais, assim como o GPT, mas não gera saídas de texto. Em vez disso, ele navega por uma "árvore" de escolhas possíveis e seleciona a melhor.
A CDS foi alimentada com dados como idade, sexo, modo de chegada, sinais vitais, "queixa principal", comorbidades (histórico de condições médicas que podem indicar áreas de risco, como hipertensão) e "problemas médicos ativos" de cada paciente no momento da admissão. (Curiosamente, entre todos os casos, as três queixas principais mais comuns foram dor abdominal, dor no peito e falta de ar.) Assim que os dados foram inseridos, a interface mostrava ao enfermeiro uma classificação da gravidade do paciente gerada pela CDS de acordo com uma escala padrão chamada ESI, ou Índice de Severidade Emergencial. O ESI classifica os pacientes de 1 a 5 em relação à seriedade, ou "agudeza", da condição, sendo 1 a classificação mais grave. Um resumo em linguagem natural da justificativa para a pontuação da máquina também era exibido.
Os enfermeiros foram questionados se concordavam ou não com a pontuação ESI gerada pelo computador e também foram convidados a atribuir sua própria pontuação, como normalmente fazem no pronto-socorro. A concordância ou discordância deles com o computador era um variável importante no experimento, pois o estudo mediu o que aconteceu quando os enfermeiros estavam em acordo ou não com a recomendação da IA. Os resultados do fluxo de pacientes foram comparados entre os pacientes seis meses antes e seis meses após a implementação da CDS. O principal resultado foi que o número de pessoas agrupadas por alta ou baixa gravidade mudou, assim como o perfil dos classificados como altos ou baixos. O número de pacientes categorizados como "baixa" gravidade (ESI 4 ou 5) aumentou em quase 50%, enquanto o total na categoria "alta" diminuiu em quase 9%, e o total na classificação média, nível 3, também caiu em quase 20%. Ou seja, mais pessoas foram reclassificadas para menor risco com a CDS.
Além disso, mais pacientes idosos foram alocados no grupo de alta gravidade, enquanto mais jovens foram reclassificados para o grupo de baixa gravidade. Também houve mudanças nas formas como os sinais vitais, queixas e comorbidades foramindicados, com, por exemplo, dor no peito tornando-se mais prevalente entre aqueles classificados como baixa gravidade e falta de ar aparecendo mais entre os de alta gravidade. Em resumo, a IA levou a uma utilização diferente das queixas para "estratificar" os pacientes.
O pagamento imediato, como descreveram Taylor e sua equipe, foi que os pacientes "transitaram" mais rapidamente pelo atendimento. "Observou-se uma diminuição no tempo desde a chegada até o espaço inicial de atendimento," afirmaram. Também houve uma mudança na rapidez com que as pessoas foram liberadas do pronto-socorro, com uma média de até 82 minutos. A mudança mais significativa foi que aqueles na categoria de alta gravidade passaram a esperar menos tempo antes de serem encaminhados para o atendimento crítico, uma redução que ultrapassou duas horas. "As mudanças mais notáveis foram observadas entre os gravemente enfermos ou aqueles que atendiam aos critérios para cuidados críticos ou cirurgia de emergência," relataram.
Não se tratou apenas de eficiência, no entanto. O número de pacientes corretamente alocados para "cuidados críticos" aumentou com a utilização da CDS, indicando que os pacientes que acabaram falecendo no hospital ou sendo internados na unidade de terapia intensiva foram mais precisamente identificados durante a triagem. Com a IA, os enfermeiros mostraram-se mais "sensíveis" aos casos que exigiam atendimento crítico, conforme destacado por Taylor e sua equipe. "Os resultados demonstram uma mudança significativa no processo de triagem," escreveram, "com uma melhor distribuição, maior precisão na identificação de pacientes de alto e baixo risco por enfermeiros assistidos por IA, e um fluxo de pacientes aprimorado." Além disso, os enfermeiros que concordaram mais frequentemente com a CDS apresentaram ainda melhor sensibilidade a urgências, cirurgias, cuidados intensivos, entre outros. Contudo, Taylor e sua equipe não podem afirmar que foi a máquina que guiou os enfermeiros a melhores decisões; pode ter sido simplesmente que eles eram enfermeiros mais competentes.
A subcategoria de enfermeiros que mostraram altas taxas de concordância geralmente superaram a IA sozinha; ao contrário, a subcategoria de enfermeiros com baixas taxas de concordância teve um desempenho inferior à IA sozinha. Embora os achados sugiram que uma maior concordância possa estar ligada a um melhor desempenho na triagem, é possível que o grupo de alta concordância possuísse uma capacidade clínica maior independentemente da CDS, permitindo-lhes discernir melhor quando alinhar-se às recomendações baseadas em IA. A conclusão é que "a retenção da tomada de decisão humana é fundamental e está alinhada com estudos anteriores que destacam um potencial sinérgico para integrar a IA com o julgamento humano."
As incertezas sobre o papel da expertise individual dos enfermeiros não são a única limitação do estudo. Além disso, diferentes salas de emergência podem ter tendências sazonais que atuam como "confundidores", fatores que dificultam a interpretação dos achados do estudo. Outra limitação é que a CDS utilizou registros eletrônicos de saúde, que têm suas próprias limitações, como a falta de especificidade sobre os pacientes. A limitação mais profunda, no entanto, está no fato de que o estudo não acompanhou o que aconteceu com os pacientes após a saída do pronto-socorro. A triagem melhorada levou a melhores resultados para os pacientes? Não está claro, conforme pontuaram Taylor e sua equipe. "Pesquisas futuras devem considerar esses fatores a longo prazo para entender completamente as implicações do suporte da IA na tomada de decisão clínica em ambientes de emergência," escreveram. Uma conclusão muito intrigante—e que provavelmente é relevante para todas as implementações de IA—é que a IA precisa ser ajustada para os particularidades do cenário em que é aplicada. O experimento foi realizado em três salas de emergência em uma região específica dos EUA, e isso claramente desempenhou um papel nos resultados observados. Como afirmaram Taylor e sua equipe: "Nossos dados sugerem que as ferramentas de IA na saúde podem atingir seu pleno potencial por meio de estratégias de implantação específicas para cada local. Essa abordagem marca uma mudança na ênfase pela generalização ampla e sinaliza uma transição para uma aplicação mais cuidadosa e sensível ao contexto da IA na saúde."
Referência: The New England Journal of Medicine
Posts relacionados:



