Un problema actual en los Departamentos de Radiología es el aumento constante en el número de estudios realizados. Actualmente, el mayor volumen de estudios corresponde a las radiografías simples. Este problema se intensifica por la escasez de especialistas con dedicación y experiencia en su interpretación. En el campo de la informática ha surgido un área de estudio llamada Inteligencia Artificial (IA), que consiste en un sistema informático que aprende a realizar tareas rutinarias específicas y puede complementar o imitar el trabajo humano. Desde 2018, el Hospital Italiano de Buenos Aires lleva adelante el programa TRx, que consiste en el desarrollo de una herramienta basada en IA para detectar hallazgos patológicos en radiografías de tórax. El uso previsto de esta herramienta es asistir a médicos no radiólogos en el diagnóstico de radiografías de tórax mediante la detección automática de hallazgos radiológicos. El presente estudio multicéntrico busca validar externamente el desempeño de una herramienta de IA (TRx v1) como herramienta de asistencia diagnóstica para radiografías de tórax.
Un problema actual en los Departamentos de Radiología es el aumento constante en el número de estudios realizados. Este volumen de información en continuo crecimiento implica un incremento en el tiempo que los especialistas médicos deben dedicar a informar dichos estudios. La metodología utilizada para la elaboración de informes varía según la modalidad de imágenes, que en centros de alta complejidad incluye radiología, tomografía computada, resonancia magnética y ecografía, entre otras. Actualmente, el mayor volumen de estudios corresponde a las radiografías simples. En el Hospital Italiano de Buenos Aires (HIBA) se realizaron más de 220.000 radiografías durante 2019, y dentro de este grupo más del 50% de las prácticas son radiografías de tórax, que se realizan como método de detección inicial de patologías potencialmente graves (nódulo pulmonar, neumonía, neumotórax). Esta modalidad de imágenes no resulta atractiva y no es explorada por las nuevas generaciones de especialistas en imágenes, quienes prefieren orientarse hacia métodos más modernos y complejos como la tomografía computada o la resonancia magnética. Por lo tanto, el problema del creciente volumen de radiografías simples a analizar se intensifica por la escasez de especialistas con dedicación y experiencia en su interpretación. En el campo de la informática ha surgido un área de estudio llamada Inteligencia Artificial (IA), que consiste en un sistema informático que aprende a realizar tareas rutinarias específicas y puede complementar o imitar el trabajo humano. El desarrollador debe indicarle al sistema de IA qué respuesta se espera ante un determinado estímulo. Un ejemplo de esto es el corrector ortográfico en un procesador de texto. El campo de la IA abarca una amplia variedad de subcampos y técnicas específicas, como el Machine Learning (ML) o el Deep Learning (DL). El ML comprende cualquier herramienta en la que se utilizan datos informatizados para ajustar un modelo que extrae conclusiones a partir de los datos de entrada. Los algoritmos se entrenan para aprender tareas específicas a partir de un conjunto de información previamente clasificada. Esto también incluye técnicas tradicionales para la creación de modelos predictivos o de clasificación. El filtrado de spam en correo electrónico es un ejemplo de ML. Las redes neuronales son una de las herramientas incluidas en el ML. Por su parte, el DL es un tipo de ML que comenzó a aparecer en 2015, que consiste en agregar capas a una red neuronal tradicional y así crear un modelo no lineal con un mayor grado de complejidad, ya que incrementa el número de parámetros a ajustar. Esta red se expone a un conjunto de datos de entrenamiento, que consiste en información ya etiquetada, y "aprende" a etiquetar nueva información imitando los criterios de etiquetado del conjunto de datos. Este aprendizaje es en realidad un ajuste iterativo de los parámetros del modelo, que se modifican iterativamente según el error entre el etiquetado original y el etiquetado sugerido por la red. Una vez entrenado el modelo, sus parámetros se fijan y puede utilizarse para inferir etiquetas de nueva información cuyo etiquetado se desconoce. Se ha comprobado que los métodos de DL tienen un rendimiento mucho mejor en el análisis de datos que los métodos tradicionales. El DL ya tiene aplicaciones en la vida cotidiana, como los asistentes de voz en teléfonos inteligentes o el reconocimiento y etiquetado automático de rostros en redes sociales. El DL aplicado al procesamiento de imágenes se basa en un método denominado redes neuronales convolucionales. Su aplicación ha sido investigada en el campo de las imágenes médicas, encontrando mejoras en el rendimiento, desde la detección de objetos (estructuras anatómicas o patológicas en imágenes radiológicas) hasta tareas de segmentación. Desde 2018, el Hospital Italiano de Buenos Aires lleva adelante el programa TRx, que consiste en el desarrollo de una herramienta basada en IA para detectar hallazgos patológicos en radiografías de tórax. El proyecto forma parte del programa de Inteligencia Artificial en Salud del Hospital Italiano de Buenos Aires, y es llevado a cabo por un equipo multidisciplinario de profesionales que incluye ingenieros biomédicos, científicos de datos, radiólogos, informáticos clínicos, metodólogos e ingenieros de software. TRx es un modelo de DL, desarrollado y validado en el HIBA, que detecta cuatro tipos de hallazgos radiológicos en radiografías de tórax: opacidades pulmonares (nódulos, masas, neumonía, consolidaciones, vidrio esmerilado o atelectasia), neumotórax, derrames pleurales y fracturas costales. Esta detección se realiza a través de cuatro módulos independientes que se integran en un único sistema. Al procesar una radiografía, TRx reporta diferentes tipos de resultados. En primer lugar, el sistema TRx unificado indica de forma dicotómica si la imagen es sospechosa de hallazgo patológico, o si posiblemente se trata de una radiografía de tórax normal. En segundo lugar, cada uno de los cuatro módulos indica en particular si se detectó un hallazgo de opacidad pulmonar, neumotórax, derrame pleural o fractura costal, respectivamente. Por último, TRx permite la visualización de un mapa de calor sobre la imagen que indica en color la región del tórax donde se detectó un hallazgo sospechoso. El uso previsto de esta herramienta es asistir a médicos no radiólogos en el diagnóstico de radiografías de tórax mediante la detección automática de hallazgos radiológicos. TRx versión 1.0 (TRx v1) evalúa radiografías de tórax frontales de pacientes mayores de 14 años en busca de cuatro tipos de hallazgos: opacidades pulmonares, derrame pleural, fracturas y neumotórax. El objetivo de esta herramienta es mejorar el rendimiento diagnóstico de los médicos no radiólogos brindándoles asistencia o un "informe preliminar". Un aspecto que se enfatiza en la IA es que los modelos deben ser replicables; el modelo debe dar los mismos resultados o mejores si recibe la misma entrada. Aunque esto parece obvio, contrasta con los seres humanos, que habitualmente presentan variabilidad tanto inter como intraobservador. El estándar de un modelo de IA debe igualar al menos el desempeño humano al que asistirá. La replicabilidad depende del problema, y el grado de variabilidad depende de la tarea específica en cuestión. Algunos autores señalan que un modelo de IA puede presentar dificultades para proporcionar predicciones precisas cuando se aplica a nuevas situaciones o poblaciones (es decir, a las que no estuvo expuesto durante el entrenamiento). Mientras que los radiólogos son capaces de adaptarse exitosamente a las diferencias en las imágenes (ya sea por el grosor de corte, la marca del equipo, la intensidad del campo, la intensidad del gradiente o el tiempo de contraste) sin que esto afecte su interpretación de las imágenes, la IA generalmente carece de esa capacidad. Por ejemplo, si un agente de IA fue entrenado únicamente con imágenes de un resonador de 3 Tesla, no se puede garantizar a priori que tendrá los mismos resultados en estudios realizados en 1,5 Tesla. Una solución consiste en desarrollar procesos matemáticos para reconocer, normalizar y transformar los datos a fin de minimizar la desviación. Otro enfoque para mitigar este fenómeno consiste en realizar el entrenamiento y la validación con conjuntos de datos "completos", que representen cada tipo de adquisición y reconstrucción de datos de imagen. Para evaluar el rendimiento diagnóstico de una herramienta de IA de manera integral y así garantizar su uso previsto, se recomienda realizar estudios multicéntricos, que permiten medir dicho rendimiento en diferentes poblaciones de pacientes y con distintos protocolos de adquisición de imágenes. El presente estudio multicéntrico busca validar externamente el desempeño de una herramienta de IA (TRx v.1) como herramienta de asistencia diagnóstica para radiografías de tórax.
Buenos Aires, Argentina