Nueva herramienta con IA logra detectar cáncer de laringe a través de la voz con 93% de precisión

Un investigador del Instituto Oncológico Winship de la Universidad Emory desarrolla una herramienta basada en inteligencia artificial capaz de identificar cáncer de laringe mediante el análisis de la voz, con una precisión del 93 %.
Nueva herramienta con IA logra detectar cáncer de laringe a través de la voz con 93% de precisión

Escucha esta noticia

Cargando audio...

El investigador Anthony Law, otorrinolaringólogo y doctor en biofísica, ha desarrollado una herramienta que puede marcar un antes y un después en la detección temprana del cáncer de laringe. Basado en una red neuronal profunda, su modelo de inteligencia artificial (IA) permite identificar masas laríngeas con un 93 % de precisión, a partir de un análisis automatizado de la voz.

La iniciativa, que nació de una experiencia personal durante la pandemia, busca poner a disposición de los médicos de atención primaria la capacidad diagnóstica que hoy está reservada a especialistas. “Cuando me contagié de COVID en 2021”, relató Law, “en los primeros cinco segundos de nuestra conversación telefónica, mi madre supo que algo andaba mal. Lo notaba en mi voz”.

Detección temprana de cáncer de laringe y desafío clínico: disfonía como síntoma inespecífico

En su práctica clínica, Law afirma que la mayoría de pacientes con cáncer de laringe presentan alteraciones vocales notables, como voz áspera, grave o entrecortada. Estas disfonías surgen porque el tumor impide el cierre adecuado de la laringe, interfiriendo con la producción normal del sonido.

Sin embargo, este cambio en la voz también puede estar relacionado con múltiples causas benignas, lo que convierte su evaluación en un verdadero reto diagnóstico fuera del entorno especializado. Law señala que distinguir entre una disfonía por resfriado y una por cáncer es “como buscar una aguja en un pajar” para médicos sin formación específica en otorrinolaringología.

IA para democratizar la experiencia clínica especializada

Con el objetivo de cerrar esa brecha diagnóstica, Law construyó una base de datos con más de 15.000 grabaciones de voz y entrenó un modelo de red neuronal profunda para clasificar cambios de voz sugestivos de masas en la laringe. El algoritmo no solo detecta patrones acústicos, sino que integra variables demográficas y fonéticas.

Bw700-p5-pc-Dr. Jamel Alberto Henao_SPEAKERS-CNS-2025

Para hacerlo accesible en el entorno clínico real, el equipo desarrolló una aplicación móvil que permite completar el análisis en menos de cinco minutos. Incluye consentimiento informado, registro de datos del paciente y una serie de 10 indicaciones vocales. Esta herramienta ya se encuentra en fase de validación previa a un ensayo clínico aleatorizado.

Law advierte que uno de los desafíos técnicos más relevantes fue garantizar la equidad en el entrenamiento del modelo. El algoritmo debía funcionar con la misma precisión en hombres y mujeres, así como en hablantes de diferentes regiones y acentos. “Hemos sido muy cuidadosos para asegurarnos de ser justos y equitativos al construir nuestros modelos”, afirmó.

El equipo ajustó continuamente los conjuntos de datos para evitar sesgos demográficos y garantizar resultados reproducibles en ambientes clínicos diversos, más allá del entorno controlado de laboratorio.

Bw900-p5-pc-alianza-enero-2025

Próximo paso: ensayo clínico y validación en atención primaria

En los próximos meses, el grupo de investigación de Emory espera iniciar un ensayo clínico aleatorizado que compare clínicas que utilizan la herramienta con otras que no. Los indicadores principales serán el tamaño tumoral al momento del diagnóstico, la reducción en tiempos de derivación y, eventualmente, mejoras en la supervivencia.

La hipótesis es clara: si los médicos de primer nivel utilizan esta herramienta, podrían referir a pacientes con disfonía significativa de forma más oportuna, permitiendo el tratamiento en etapas más tempranas y con mejores pronósticos.

Para Law, esta iniciativa no es solo un avance tecnológico, sino una propuesta ética de democratización del acceso al diagnóstico especializado. “Podemos optar por dos caminos”, concluye. “O bien, podemos concentrar todo el poder de esta herramienta en manos de unos pocos. O podemos usarla para ampliar el acceso a los pacientes. Por eso seguimos entusiasmados”.

El caso de esta aplicación representa un ejemplo concreto del potencial de la inteligencia artificial en salud cuando se aplica con criterio clínico, validación científica y enfoque inclusivo. Su éxito podría sentar las bases para modelos similares en otras enfermedades que afectan el habla, e incluso extenderse a patologías neurológicas, respiratorias o infecciosas con impacto fonatorio.

Temas relacionados

suscríbete-consultorsalud-2023 (opt)

Recibe actualizaciones del sector salud directamente en tu correo electrónico.

RELACIONADAS

Otras noticias para ti

¡Gracias por suscribirte!

Desde ya haces parte de la familia de CONSULTORSALUD,  por favor revisa tu bandeja de correo electrónico, te hemos enviado un mensaje de bienvenida.