La inteligencia artificial (IA) está revolucionando el campo de la salud, con aplicaciones que van desde la optimización de trasplantes de órganos hasta la mejora en la precisión de cirugías. Sin embargo, a pesar de los avances prometedores, un estudio reciente ha revelado un hecho preocupante: casi la mitad de los dispositivos médicos de IA aprobados por la Administración de Alimentos y Medicamentos de los Estados Unidos (FDA) no están entrenados con datos reales de pacientes, lo que genera serias dudas sobre su efectividad clínica.
Desde 2016, la cantidad de autorizaciones de dispositivos médicos de IA por parte de la FDA ha aumentado drásticamente, pasando de dos a 69 por año. Este crecimiento ha llevado a una rápida comercialización de estas tecnologías, principalmente en el diagnóstico de anomalías en imágenes radiológicas, análisis patológicos y dosificación de medicamentos. Sin embargo, según un análisis exhaustivo realizado por un equipo multiinstitucional de investigadores, aproximadamente el 43% de estos dispositivos carecen de datos de validación clínica publicados.
Regulación en medio de la rápida expansión de dispositivos médicos con IA
Ante la rápida expansión de dispositivos médicos impulsados por IA y el creciente número de solicitudes presentadas ante la FDA, Chouffani El Fassi y Henderson, junto con su equipo, decidieron investigar la seguridad y la eficacia clínica de los dispositivos autorizados. Para ello, analizaron todas las solicitudes disponibles en la base de datos oficial de la FDA, titulada “Dispositivos médicos habilitados con inteligencia artificial y aprendizaje automático (IA/ML)”.
De las 521 autorizaciones de dispositivos, 144 fueron clasificadas como ‘validadas retrospectivamente’, 148 como ‘validadas prospectivamente’, y 22 mediante ensayos controlados aleatorios. Es importante destacar que 226 de los 521 dispositivos médicos aprobados por la FDA no contaban con datos de validación clínica publicados.
Algunos de estos dispositivos empleaban ‘imágenes fantasma’ o generadas por computadora, que no provenían de pacientes reales, lo que técnicamente no cumplía con los requisitos de validación clínica.
La importancia de la validación clínica
El proceso de validación clínica es crucial para asegurar que un dispositivo de IA pueda desempeñarse de manera efectiva en situaciones reales. Existen tres tipos principales de validación clínica mencionados anteriormente: retrospectiva, prospectiva y ensayos controlados aleatorizados, siendo estos últimos el estándar de oro en términos de calidad de evidencia. Sin embargo, muchos dispositivos médicos de IA utilizan imágenes generadas por computadora o datos de archivo, que no reflejan las condiciones clínicas actuales, lo que compromete su fiabilidad.
La validación retrospectiva alimenta a los modelos de IA con datos históricos, como radiografías tomadas antes de la pandemia de COVID-19. En contraste, la validación prospectiva utiliza datos en tiempo real, lo que permite al dispositivo adaptarse a nuevas variables, como las consecuencias del COVID-19 en las imágenes médicas. Los ensayos controlados aleatorizados, al asignar aleatoriamente a los pacientes para comparar el rendimiento de la IA con profesionales médicos, proporcionan la evidencia más robusta.
Potencial de los algoritmos para salvar vidas
Los algoritmos tienen el potencial de salvar vidas, y Chouffani El Fassi está trabajando en colaboración con los cirujanos cardiotorácicos de la UNC, Aurelie Merlo y Benjamin Haithcock, así como con el equipo de liderazgo ejecutivo de UNC Health, para implementar un algoritmo en su sistema de registro médico electrónico. Este automatiza el proceso de evaluación y derivación de donantes de órganos, lo que podría transformar significativamente la eficiencia en el campo de los trasplantes.
Sin embargo, a diferencia de la rápida producción de dispositivos de inteligencia artificial en la medicina, aún falta el desarrollo de algoritmos básicos, como software que diagnostique a los pacientes utilizando valores de laboratorio simples en registros médicos electrónicos.
El estudio fue publicado en Nature Medicine, allí Chouffani El Fassi, Henderson y otros investigadores establecieron definiciones de los métodos de validación clínica que pueden utilizarse como estándar en el campo de la IA médica.
Chouffani El Fassi explica que la implementación de estos algoritmos suele ser costosa y requiere equipos interdisciplinarios con experiencia tanto en medicina como en informática. A pesar de estos desafíos, UNC Health está comprometido en mejorar el proceso de trasplante de órganos. Como señala Chouffani El Fassi, “Si este algoritmo informático tan básico funciona, podríamos optimizar el proceso de donación de órganos, lo que significaría salvar varias vidas adicionales. Con un umbral de éxito tan bajo, esperamos poder ofrecer a más personas una segunda oportunidad de vida”.
Recomendaciones para asegurar la eficacia
A pesar de que la FDA aprobó más de 500 dispositivos de IA, muchos de estos no fueron sometidos a los rigurosos ensayos controlados aleatorizados necesarios para asegurar su eficacia y seguridad. Este vacío en el proceso de validación ha llevado a expertos a cuestionar la fiabilidad de estas tecnologías y a sugerir que la FDA y los fabricantes de dispositivos deberían diferenciar claramente entre los diferentes tipos de estudios de validación clínica en sus recomendaciones.
Los hallazgos de este estudio subrayan la necesidad urgente de establecer estándares más rigurosos para la validación clínica de dispositivos médicos de IA. Si bien la IA tiene el potencial de salvar vidas y optimizar procesos médicos complejos, como la donación de órganos, su efectividad depende en gran medida de la calidad de los datos utilizados para su entrenamiento.