Yoel Shoshan, et al. https://doi.org/10.1148/radiol.211105
Recopilado por Carlos Cabrera Lozada. Miembro Correspondiente Nacional, ANM puesto 16. ORCID: 0000-0002-3133-5183. 06/07/2023
Resumen
La tomosíntesis mamaria digital (DBT) tiene una mayor precisión diagnóstica que la mamografía digital, pero el tiempo de interpretación es sustancialmente más largo. La inteligencia artificial (IA) podría mejorar la eficiencia de lectura.
Objetivo
Evaluar el uso de IA para reducir la carga de trabajo al filtrar las pantallas DBT normales.
Materiales y métodos
El estudio retrospectivo incluyó 13 306 exámenes DBT de 9919 mujeres realizadas entre junio de 2013 y noviembre de 2018 de dos redes de atención médica. La cohorte se dividió en conjuntos de entrenamiento, validación y prueba (3948, 1661 y 4310 mujeres, respectivamente). Se simuló un flujo de trabajo en el que el modelo de IA clasificó los exámenes sin cáncer que podían descartarse de la lista de trabajo de detección y utilizó las interpretaciones originales de los radiólogos en el resto de los exámenes de la lista de trabajo. El sistema de IA también se evaluó con un estudio de lectores de cinco radiólogos de mama que leyeron las mamografías DBT de 205 mujeres. En ambos estudios se evaluaron el área bajo la curva característica operativa del receptor (AUC), la sensibilidad, la especificidad y la tasa de recuperación. Las estadísticas se calcularon a través de 10 000 muestras de arranque para evaluar los IC del 95 %, las pruebas de no inferioridad y superioridad.
Resultados
El modelo se probó en 4310 mujeres examinadas (edad media, 60 años ± 11 [desviación estándar]; 5182 exámenes DBT). En comparación con el desempeño de los radiólogos (417 de 459 cánceres detectados [90,8 %], 477 recordatorios en 5182 exámenes [9,2 %]), el uso de IA para filtrar automáticamente los casos resultaría en un 39,6 % menos de carga de trabajo, sensibilidad no inferior (413 de 459 cánceres detectados; 90,0 %; P = 0,002) y una tasa de recuperación un 25 % más baja (358 revisiones en 5182 exámenes; 6,9 %; P= .002). En el estudio del lector, el AUC fue mayor en el AI independiente en comparación con el lector medio (0,84 frente a 0,81; P = 0,002).
Conclusión
El modelo de inteligencia artificial pudo identificar exámenes de detección de tomosíntesis de mama digitales normales, lo que redujo la cantidad de exámenes que requerían la interpretación de un radiólogo en un flujo de trabajo clínico simulado.