Sensibilidad superior al 99 %.

La inteligencia artificial identifica con precisión las radiografías de tórax normales y anormales

Una herramienta de inteligencia artificial puede identificar con precisión radiografías de tórax normales y anormales en un entorno clínico, según un estudio publicado en Radiology

Autor/a: Louis L. Plesner, Felix C. Müller, Janus D. Nybing, Lene C. Laustrup, Finn Rasmussen, et al.

Fuente: Autonomous Chest Radiograph Reporting Using AI: Estimation of Clinical Impact

Introducción

La radiografía de tórax es una prueba de diagnóstico por imágenes común y se usa de forma rutinaria para una variedad de hallazgos de enfermedades diferentes. En los últimos años, se ha prestado gran atención a la clasificación de imágenes con modelos de inteligencia artificial (IA) basados en aprendizaje profundo para radiología. Varios estudios se han centrado en desarrollar modelos para diferenciar entre una radiografía de tórax normal y una anormal. El foco de la investigación ha sido clasificar las radiografías y reducir el tiempo de respuesta en los estudios de simulación. Pero también se ha sugerido una descripción autónoma de radiografías de tórax normales sin interacción humana.

En estudios de viabilidad recientes, se ha sugerido que una herramienta de IA autónoma puede descartar correctamente anomalías con un alto nivel de confianza en aproximadamente el 15 % de la producción total de radiografías de tórax. Existe una creciente escasez mundial de radiólogos, y la automatización de la lectura de radiografías de tórax normales podría aliviar la carga de trabajo de los radiólogos. Sin embargo, esta área de investigación aún está en sus inicios y aún no hemos visto la adopción de los modelos disponibles en la clínica. El rendimiento de un modelo de IA de este tipo aún no se ha descrito en una muestra de pacientes clínicamente bien caracterizada y consecutiva con una comparación relevante con los estándares actuales de informes en radiología.

Nuestro objetivo fue realizar una evaluación en profundidad de una herramienta de IA comercialmente disponible para el informe autónomo de radiografías de tórax, frente a un estándar de referencia adjudicado en una muestra de pacientes consecutivos bien caracterizados para determinar (a) el número de informes de radiografías de tórax informados de forma autónoma, (b) la sensibilidad de la IA en la detección de radiografías de tórax anormales, y (c) el rendimiento de la IA en comparación con el informe de radiología clínica.

Informes autónomos de radiografías de tórax mediante IA: estimación del impacto clínico

Antecedentes

La interpretación automatizada de radiografías de tórax normales podría aliviar la carga de trabajo de los radiólogos. Sin embargo, no se ha establecido el rendimiento de una herramienta de inteligencia artificial (IA) de este tipo en comparación con los informes de radiología clínica.

Objetivo

Para realizar una evaluación externa de una herramienta de IA disponible comercialmente para (a) el número de radiografías de tórax informadas de forma autónoma, (b) la sensibilidad para la detección de IA de radiografías de tórax anormales, y (c) el rendimiento de IA en comparación con el de la clínica informes de radiología.

Materiales y métodos

En este estudio retrospectivo, se obtuvieron radiografías de tórax posteroanteriores consecutivas de pacientes adultos en cuatro hospitales de la región de la capital de Dinamarca en enero de 2020, incluidas imágenes de pacientes del departamento de emergencias, pacientes hospitalizados y pacientes ambulatorios.

Tres radiólogos torácicos etiquetaron las radiografías de tórax en un estándar de referencia basado en los hallazgos de la radiografía de tórax en las siguientes categorías: crítica, otras notables, sin complicaciones o normales (sin anomalías). AI clasificó las radiografías de tórax como normales de confianza alta (normales) o normales de confianza no alta (anormales).

Resultados

Se incluyeron para el análisis un total de 1529 pacientes (mediana de edad, 69 años [IQR, 55–69 años]; 776 mujeres), con 1100 (72 %) clasificados por el estándar de referencia con radiografías anormales, 617 (40 %) como con radiografías anormales críticas y 429 (28%) con radiografías normales.

Para la comparación, los informes de radiología clínica se clasificaron según el texto y se excluyeron los informes insuficientes (n = 22). La sensibilidad del AI fue del 99,1 % (IC del 95 %: 98,3, 99,6; 1090 de 1100 pacientes) para radiografías anormales y del 99,8 % (IC del 95 %: 99,1, 99,9; 616 de 617 pacientes) para radiografías críticas.

Las sensibilidades correspondientes para los informes del radiólogo fueron del 72,3 % (IC del 95 %: 69,5, 74,9; 779 de 1078 pacientes) y del 93,5 % (IC del 95 %: 91,2, 95,3; 558 de 597 pacientes), respectivamente. La especificidad de la IA y, por lo tanto, la posible tasa de notificación autónoma, fue del 28,0 % de todas las radiografías de tórax posteroanteriores normales (IC del 95 %: 23,8, 32,5; 120 de 429 pacientes) o del 7,8 % (120 de 1529 pacientes) de todas las radiografías de tórax posteroanteriores.


Imágenes en un hombre de 44 años que consultó por dolor torácico y disnea. (A) La radiografía de tórax muestra opacidades nodulares muy sutiles, principalmente en lóbulos inferiores, representativas de neumonía y un discreto signo de silueta del borde cardíaco derecho (flecha). El sistema de IA interpretó esta radiografía de tórax como normal. También se interpretó como normal en el informe clínico radiológico. (B) La tomografía computarizada muestra las opacidades del espacio aéreo del lóbulo inferior con una vaga morfología de árbol en brote (recuadro) y un área de consolidación (flecha). La angiografía pulmonar se realizó 5 horas después de la radiografía. Este fue el único hallazgo "crítico" falso negativo de la herramienta de IA.

Conclusión

De todas las radiografías de tórax posteroanteriores normales, el IA informó de forma autónoma el 28 % con una sensibilidad para cualquier anomalía superior al 99 %. Esto correspondió al 7,8% de toda la producción de radiografía de tórax posteroanterior.

Síntesis

En un estudio retrospectivo multicéntrico de 1529 pacientes consecutivos, el 28 % de las radiografías de tórax posteroanteriores normales, o el 7,8 % de todas las radiografías, podrían automatizarse de manera segura mediante una herramienta de inteligencia artificial.

Resultados clave

■ En este estudio retrospectivo multicéntrico de 1529 radiografías de tórax posteroanterior consecutivas de 1529 pacientes adultos, según el entorno de referencia, entre el 6,2 % y el 11,6 % de todas las radiografías de tórax posteroanterior podrían informarse de forma autónoma, con las tasas más altas en pacientes ambulatorios.

■ No hubo daño potencial para el paciente asociado con el informe autónomo de radiografías de tórax normales, donde la sensibilidad de la inteligencia artificial (IA) para cualquier anomalía fue superior al 99 %.

■ La herramienta AI tuvo una mayor sensibilidad para radiografías de tórax anormales que el informe de radiología clínica (99,1 % frente a 72,3 %, respectivamente; P < 0,001).


Discusión

La interpretación automatizada de radiografías de tórax normales podría aliviar la carga de trabajo de los radiólogos. Sin embargo, hasta donde sabemos, aún no se ha establecido el rendimiento de una herramienta de inteligencia artificial (IA) de este tipo en una muestra de pacientes consecutiva en comparación con el informe de radiología clínica. En este estudio multicéntrico consecutivo, una herramienta comercial de IA destinada a la notificación autónoma de radiografías de tórax normales demostró una sensibilidad del 99,1 % (1090 de 1100) para los hallazgos anormales, que fue significativamente mayor que la de los informes clínicos radiológicos, y con solo una prueba falsa. - Radiografía de tórax "crítica" negativa: una opacidad neumónica sutil. Esto está de acuerdo con los hallazgos de estudios de factibilidad anteriores que apuntan a la automatización potencial, que obtuvieron sensibilidades del 99,8 % (5119 de 5128) (8) y del 99,2 % (1581 de 1594) (10). De las radiografías de tórax normales, el 28,0 % se pudo informar de forma autónoma, lo que da como resultado una tasa general de informe autónomo del 7,8 % en toda la producción de radiografías de tórax posteroanteriores.

En conclusión, en este estudio retrospectivo multicéntrico de 1529 pacientes consecutivos, el informe del 28 % de todas las radiografías de tórax posteroanteriores normales, que corresponde al 7,8 % de toda la producción de radiografías de tórax posteroanterior, podría automatizarse potencialmente mediante una herramienta de IA disponible comercialmente, con un sensibilidad para cualquier anomalía superior al 99%. La investigación adicional podría dirigirse hacia estudios de implementación prospectivos más grandes en los que todas las radiografías de tórax informadas de forma autónoma todavía se controlen para garantizar la seguridad del paciente.


Comentarios

Las radiografías de tórax se utilizan para diagnosticar una amplia variedad de afecciones relacionadas con el corazón y los pulmones. Una radiografía de tórax anormal puede ser una indicación de una variedad de afecciones, que incluyen cáncer y enfermedades pulmonares crónicas.

Una herramienta de inteligencia artificial que pueda diferenciar con precisión entre radiografías de tórax normales y anormales aliviaría en gran medida la gran carga de trabajo que experimentan los radiólogos en todo el mundo.

“Existe una demanda exponencialmente creciente de imágenes médicas, especialmente transversales, como CT y MRI”, dijo el coautor del estudio, Louis Lind Plesner, M.D., del Departamento de Radiología del Hospital Herlev and Gentofte en Copenhague, Dinamarca. “Mientras tanto, hay una escasez mundial de radiólogos capacitados. La inteligencia artificial se ha mostrado muy prometedora, pero siempre debe probarse exhaustivamente antes de cualquier implementación”.

Para este estudio multicéntrico retrospectivo, el Dr. Plesner y sus colegas querían determinar la confiabilidad del uso de una herramienta de inteligencia artificial que puede identificar radiografías de tórax normales y anormales.

Los investigadores utilizaron una herramienta de inteligencia artificial disponible comercialmente para analizar las radiografías de tórax de 1529 pacientes de cuatro hospitales en la región capital de Dinamarca. Se incluyeron radiografías de tórax de pacientes de urgencias, hospitalizados y ambulatorios. La herramienta de IA clasificó los rayos X como "normales de alta confianza" o "normales sin alta confianza" como normales y anormales, respectivamente.

Dos radiólogos torácicos (tórax) certificados por la junta se utilizaron como estándar de referencia. Se utilizó un tercer radiólogo en casos de desacuerdo, y los tres médicos desconocían los resultados de la IA.

De las 429 radiografías de tórax que se clasificaron como normales, 120, o el 28 %, también fueron clasificadas por la herramienta de IA como normales. Estos rayos X, o el 7,8 % de todos los rayos X, podrían automatizarse de forma segura mediante una herramienta de IA. La herramienta de IA identificó radiografías de tórax anormales con un 99,1 % de sensibilidad.

“El hallazgo más sorprendente fue cuán sensible era esta herramienta de IA para todo tipo de enfermedades del pecho”, dijo el Dr. Plesner. “De hecho, no pudimos encontrar una sola radiografía de tórax en nuestra base de datos donde el algoritmo cometió un error importante. Además, la herramienta de IA tuvo una sensibilidad general mejor que la de los radiólogos certificados por la junta clínica”.

Según los investigadores, los estudios adicionales podrían dirigirse hacia una implementación prospectiva más amplia de la herramienta de IA donde los radiólogos aún revisan las radiografías de tórax informadas de forma autónoma.

La herramienta de IA se desempeñó especialmente bien en la identificación de radiografías normales del grupo de pacientes ambulatorios con una tasa del 11,6 %. Esto sugiere que el modelo de IA funcionaría especialmente bien en entornos ambulatorios con una alta prevalencia de radiografías de tórax normales.

“Las radiografías de tórax son uno de los exámenes por imágenes más comunes que se realizan en todo el mundo”, dijo el Dr. Plesner. “Incluso un pequeño porcentaje de automatización puede ahorrar tiempo a los radiólogos, que pueden priorizar en asuntos más complejos”.