Saúde aumentada: o potencial dos dados na saúde

há 1 dia
6 min de leitura

Atualizado: há 20 horas

Auto-diagnóstico com IA

Uma das transformações mais visíveis na relação entre cidadãos e saúde é o recurso crescente a modelos de linguagem de grande escala (LLMs), como o ChatGPT, Gemini ou Claude, para obter informação clínica e, muitas vezes, tentar um auto-diagnóstico. A saúde é hoje uma das formas mais comuns de as pessoas usarem o ChatGPT.

Mais de 230 milhões de pessoas, em todo o mundo, colocam todas as semanas perguntas relacionadas com saúde e bem-estar no ChatGPT.

Uma percentagem crescente de utilizadores recorre a ferramentas de IA para obter informação médica antes de contactar profissionais de saúde. Embora os números variem por país, o padrão é consistente: a IA tornou-se um “primeiro ponto de consulta”.

Este fenómeno não é novo: já antes da era dos LLMs, muitos recorriam ao “Dr. Google”. O que mudou foi a natureza da interação: de uma pesquisa passiva no Google a um diálogo ativo com um modelo que responde em linguagem natural, interpreta sintomas e sugere diagnósticos diferenciais. Os dados sobre precisão são reveladores e preocupantes em simultâneo.

O estudo “Can Public LLMs be used for Self-Diagnosis of Medical Conditions?” (2024) comparou o desempenho do GPT-4 e do Gemini em 10 000 amostras de auto-diagnóstico, obtendo precisões de 63% e apenas 6%, respetivamente. Esta é uma diferença abismal que demonstra a inconsistência das ferramentas disponíveis ao público.

Paralelamente, o estudo “Human-AI collectives most accurately diagnose clinical vignettes” (2025) demonstrou que os melhores resultados em diagnóstico clínico são alcançados não por modelos de IA isolados nem por médicos a trabalhar sozinhos, mas por coletivos híbridos, ou seja, grupos que combinam a capacidade analítica dos LLMs com o raciocínio clínico dos médicos, superando qualquer uma das partes individualmente.

As vantagens do auto-diagnóstico assistido por IA são reais: democratização do acesso à informação médica, redução de consultas desnecessárias para queixas menores, diminuição de barreiras geográficas e económicas no acesso a orientação de saúde. Contudo, os riscos são igualmente sérios. A integração rápida de LLMs na saúde levanta preocupações globais sobre a qualidade, clareza e robustez das respostas geradas, em particular o risco de desinformação médica. O estudo Medical Misinformation in AI-Assisted Self-Diagnosis (EvalPrompt) de 2025 alerta que o impacto inevitável destes modelos como ferramentas de auto-diagnóstico e o seu papel na disseminação de desinformação clínica ainda não foram devidamente avaliados e regulamentados.

Ilustração isométrica em tons de roxo sobre telessaúde e monitorização médica. Do lado esquerdo, um médico com estetoscópio surge de um computador portátil rodeado por ícones flutuantes de saúde. Do lado direito, um smartwatch exibe dados biométricos interligados por linhas brilhantes à interface do médico.

Wearables: a explosão dos dados biométricos

A recolha contínua de dados de saúde começou a ganhar escala com dispositivos como Fitbit (2009) e, mais tarde, com o Apple Watch (2015), que popularizou sensores de ritmo cardíaco, ECG e monitorização de atividade física. O fenómeno dos “wearables” de monitorização de saúde teve o seu arranque efetivo com o lançamento em massa destes smartwatches e pulseiras de fitness acessíveis ao consumidor. Desde então, o crescimento foi exponencial. Em 2026, o mercado global de wearables está avaliado em 238 mil milhões de dólares, com projeções que apontam para mais de 900 mil milhões de dólares até 2035, a uma taxa de crescimento anual composta de 16,35%. De acordo com a IDC, o volume de dispositivos expedidos em 2025 superou os 600 milhões de unidades, incluindo smartwatches, pulseiras de fitness, dispositivos auditivos inteligentes e equipamentos de realidade aumentada. Em termos de adoção, um em cada três consumidores globais possui pelo menos um wearable. Em países como a Índia (57%), a China (53%) e o Reino Unido (52%), mais de metade tem um wearable. A maioria dos utilizadores recorrem a estes dispositivos para monitorização de saúde em tempo real. Até 2029, o número global de utilizadores de smartwatch poderá ultrapassar os 740 milhões.

O que estes dispositivos produzem é um manancial sem precedentes de dados biométricos contínuos: frequência cardíaca, padrões de sono, saturação de oxigénio, electrocardiograma, temperatura corporal, atividade física e, cada vez mais, marcadores de stress. A integração destes dados com sistemas hospitalares e com plataformas de inteligência artificial cria oportunidades únicas de deteção precoce de anomalias, personalização terapêutica e monitorização remota de doentes crónicos, uma área em que os wearables prometem economizar mais de 200 mil milhões de dólares ao sector da saúde ao longo das próximas décadas.

Vieses e dados incompletos

A qualidade dos dados de saúde utilizados para treinar modelos de inteligência artificial é um dos problemas mais sérios e menos visíveis do ecossistema de IA médica. Os dados clínicos históricos, incluindo os próprios EHRs, refletem décadas de desigualdades no acesso a cuidados de saúde, o que significa que os modelos treinados sobre esses dados herdam e amplificam as disparidades existentes.

O estudo “Accounting for bias in medical data” de 2024, com dados de duas instituições americanas de referência, revelou que a taxa de realização de testes clínicos em doentes caucasianos é 4,5% superior à de doentes negros com o mesmo perfil clínico, incluindo idade, sexo, queixas e triagem de urgência.

As consequências desta realidade para os modelos de IA são diretas e perigosas: quando doentes de determinados grupos étnicos são sistematicamente sub-testados, os dados de saúde disponíveis para treinar algoritmos subestimam a prevalência e a gravidade das doenças nesses grupos. Doentes negros são assumidos como saudáveis nos dados de treino, e os modelos resultantes tendem a subestimar a doença nessa população.

Um caso paradigmático identificado pela investigação: um algoritmo comercialmente utilizado por hospitais norte-americanos para prever a necessidade de cuidados especializados foi treinado usando custos de saúde como proxy de doença e, como doentes negros geram historicamente menores custos de saúde para o mesmo nível de doença, o resultado foi que doentes negros eram sistematicamente menos referenciados para programas de cuidados avançados.

A Yale School of Medicine publicou em 2024 uma análise aprofundada sobre as fontes de viés nos modelos de IA médica, “Bias in medical AI: Implications for clinical decision-making”, concluindo que o viés pode emergir em qualquer fase do ciclo de vida do modelo: na recolha de dados, na anotação e etiquetagem, no desenvolvimento e avaliação do modelo, na fase de implementação e até na publicação científica. A subrepresentação de mulheres em ensaios clínicos, de populações rurais em bases de dados hospitalares, e de minorias étnicas e linguísticas em praticamente todos os datasets de referência, cria um risco sistémico que não pode ser resolvido apenas com mais dados, requer uma mudança profunda na forma como os dados são recolhidos, processados e geridos.

Data Governance na Saúde

Face aos desafios de qualidade, interoperabilidade e viés, o data governance emerge como a condição necessária, mas frequentemente negligenciada, para que a IA em saúde cumpra o seu potencial. O data governance define quem pode aceder a que dados, com que finalidade, em que formato e com que salvaguardas. No contexto da saúde, onde os dados são simultaneamente extremamente sensíveis e de enorme valor clínico e científico, este equilíbrio é particularmente delicado.

O modelo do UK Biobank é frequentemente citado como referência internacional de boa data governance em saúde. Com mecanismos rigorosos de controlo de acesso para investigadores, períodos de aprovação encurtados que aceleram o ciclo de investigação, e um portfólio com milhares de publicações peer-reviewed, o UK Biobank demonstra que é possível partilhar dados de saúde em larga escala sem comprometer a ética ou a privacidade dos participantes.

O data governance não é apenas uma questão técnica ou legal, é uma questão de confiança. Sem confiança dos cidadãos na forma como os seus dados de saúde são utilizados, toda a edificação da medicina baseada em IA fica comprometida.

Da medicina das massas à medicina personalizada

A fronteira mais promissora da IA em saúde é a medicina personalizada ou de precisão, a capacidade de adaptar o diagnóstico, a prevenção e o tratamento ao perfil único de cada doente. Esta abordagem tornou-se possível graças à convergência de três fatores: a queda acentuada do custo da sequenciação genómica; a disponibilidade de grandes volumes de dados clínicos estruturados; e a capacidade dos algoritmos de aprendizagem automática em identificar padrões em dados multi-dimensionais de uma complexidade impossível para o cérebro humano.

Em 2024, foi criado um modelo de inteligência artificial chamado DeepDRA que consegue prever com elevada precisão se um medicamento vai funcionar ou não numa pessoa.

A integração de dados genómicos com dados clínicos provenientes de EHRs e de wearables representa o próximo patamar desta revolução. Investigação publicada em 2025 demonstra que a combinação de dados de multi-ómicas (genómica, transcriptómica, epigenómica, proteómica e metabolómica) com modelos de IA permite uma compreensão muito mais completa da resposta individual a fármacos.

Ilustração vetorial em tons de roxo e rosa mostrando um robô humanoide que segura uma prancheta e interage com um ecrã. À frente, encontram-se três tubos de ensaio de laboratório e, do lado direito, uma mulher analisa gráficos e dados de um perfil numa interface digital.

Um Ecossistema de Dados ao Serviço da Saúde

Os dados de saúde são, de facto, o novo combustível da inteligência artificial e, a qualidade, a abrangência e o governance desses dados determinarão se a IA na saúde será uma força de democratização e equidade ou uma amplificadora das desigualdades já existentes. As oportunidades são extraordinárias: do auto-diagnóstico informado à medicina personalizada, dos wearables à previsão de readmissões hospitalares. Mas os riscos são reais: vieses algorítmicos que perpetuam injustiças, dados incompletos que geram decisões erradas, e uma interoperabilidade ainda longe do desejável.

O caminho passa por investir na robustez do data governance, por diversificar os datasets de treino para incluir populações sub-representadas, por garantir que a IA clínica é sempre um apoio à decisão médica e nunca um substituto do julgamento humano, e por educar os cidadãos para um uso crítico e informado das ferramentas digitais de saúde. A inteligência artificial tem o potencial de ser a maior transformação da medicina desde a descoberta dos antibióticos, mas só se construída sobre alicerces de dados sólidos, éticos e verdadeiramente representativos.

Estamos perante uma mudança estrutural: os dados de saúde deixaram de ser apenas registos clínicos para se tornarem uma infraestrutura ativa de inteligência. O futuro da medicina dependerá menos da quantidade de dados e mais da capacidade de os integrar, interpretar e gerir de forma ética e eficiente.

Publicado in revista Marketeer