El objetivo de este estudio es identificar factores predictivos de infecciones causadas por organismos multirresistentes en pacientes con cirrosis, y desarrollar y validar (interna y externamente) un modelo predictivo que pueda ser útil en entornos clínicos para estratificar el riesgo y orientar las estrategias de toma de decisiones clínicas.
Antecedentes Las infecciones bacterianas son actualmente reconocidas como un indicador del estadio final de la hepatopatía crónica. La relevancia de las infecciones bacterianas como factor pronóstico ha sido claramente establecida en un metaanálisis que encontró que las infecciones bacterianas cuadruplican la mortalidad en esta población, considerando que el 30% de los pacientes fallece dentro del primer mes y otro 30% fallece un año después de que se diagnostican estas infecciones. Los pacientes con cirrosis son particularmente propensos a colonizarse o infectarse por organismos multirresistentes porque son internados frecuentemente en hospitales, requieren ingresos a unidades de cuidados críticos y reciben soporte orgánico, están expuestos a procedimientos invasivos y reciben antibióticos terapéuticos y profilácticos con frecuencia. Estudios previos en pacientes con cirrosis describieron principalmente factores de riesgo de infecciones por organismos multirresistentes sin proporcionar una evaluación del riesgo. Por lo tanto, sería deseable contar con herramientas para identificar qué pacientes tienen mayor riesgo que otros de presentar una infección por organismos multirresistentes, como un modelo predictivo que pueda ayudar a los profesionales a seleccionar el tratamiento antibiótico empírico. Objetivos Identificar predictores fácilmente accesibles de multirresistencia en pacientes adultos con cirrosis al momento del diagnóstico o la sospecha de infección bacteriana. Desarrollar y validar (bondad de ajuste, discriminación, calibración y rendimiento diagnóstico) modelos predictivos de multirresistencia en pacientes adultos con cirrosis al momento de la infección bacteriana. Entorno y diseño del estudio Estudio transversal utilizando datos de dos estudios de cohortes prospectivos: * El estudio de cohorte prospectivo internacional (Piano et al, DOI: 10.1053/j.gastro.2018.12.00) que incluyó 1.302 pacientes de 46 centros en Europa, Asia y América, desde octubre de 2015 hasta septiembre de 2016. Este conjunto de datos se utilizará para el desarrollo del modelo y la validación interna, y se denominará conjunto de datos de desarrollo. * El estudio de cohorte prospectivo de Argentina y Uruguay (Marciano et al, NCT03919032), que incluyó 472 pacientes de 22 centros en Argentina y Uruguay, desde septiembre de 2018 hasta diciembre de 2020. Este conjunto de datos se utilizará para la validación externa y se denominará conjunto de datos de validación. Población Tal como se mencionó, el objetivo de esta investigación es desarrollar y validar un modelo predictivo de multirresistencia. Sin embargo, la multirresistencia solo es observable en episodios de infecciones bacterianas con cultivo positivo, y se sabe que aproximadamente el 50% de todas las infecciones bacterianas en conjunto son cultivo negativo. Dado que se espera que el puntaje predictivo se utilice a la cabecera del paciente al momento de la sospecha o confirmación de la infección bacteriana, pero antes de los resultados de los cultivos, todos los pacientes (cultivo positivo y cultivo negativo) de los estudios mencionados se utilizarán para desarrollar y validar interna y externamente el modelo. Variable de resultado El resultado será la infección por organismos multirresistentes definida en ambos estudios según la recomendación vigente: una infección causada por un organismo con resistencia adquirida a al menos un antibiótico de tres familias diferentes. Todos los episodios de infección con cultivo que arroje un organismo multirresistente se clasificarán como 1. Todos los episodios de infección con cultivo negativo junto con todas las infecciones con cultivo positivo sin organismos multirresistentes se clasificarán como 0 en el análisis principal. En el análisis secundario de validación, todos los episodios de infección con cultivo negativo serán excluidos. Muestreo y cálculo del tamaño muestral En ambos estudios, el muestreo fue consecutivo. En cuanto al cálculo del tamaño muestral para el desarrollo del modelo, se utilizará la regla empírica. Aunque existen propuestas más modernas para abordar el tamaño muestral para generar modelos predictivos, la falta de literatura previa en este campo impide al grupo de investigación contar con la información necesaria que este nuevo método requiere. Por lo tanto, dado que el conjunto de datos que se utilizará para desarrollar el modelo predictivo contiene un total de 253 eventos (infección por organismos multirresistentes), se podría explorar un modelo que comience con 13 a 25 parámetros, considerando que la regla empírica propone incluir de 10 a 20 eventos por parámetro (EPP). La prevalencia de organismos multirresistentes es de aproximadamente el 20% (253/1.302) en el conjunto de datos de desarrollo. Se utilizará un modelo predictivo parsimonioso con alrededor de 15 parámetros potenciales. El tamaño muestral se calculó para mantener un MAPE (error de predicción absoluto medio) de 0,05, un factor de contracción menor al 10% y un optimismo bajo de 0,05. Se utilizó el R2 de Cox-Snell esperado de 0,1. A continuación se presentan las estimaciones del tamaño muestral utilizando el enfoque de Riley en 4 pasos para estimar el tamaño muestral: 1. Tamaño muestral total de 246 (3,28 EPP) para estimar el parámetro independiente con precisión adecuada; 2. Tamaño muestral total de 860 (14,3 EPP) para mantener la precisión predictiva (12 porque es el mayor número de parámetros permitido, https://mvansmeden.shinyapps.io/BeyondEPV/); 3. Tamaño muestral total de 1.274 (16,99 EPP) para minimizar el sobreajuste; y 4. Tamaño muestral total de 443 (5,91 EPP) para minimizar el optimismo. Se eligió el mayor tamaño muestral total de 1.274 para cumplir los 4 criterios. El tamaño muestral se estimó utilizando pmsampsize de Ensor y Riley para STATA. En cuanto al tamaño muestral para la validación externa, la literatura es más contradictoria respecto a cuántos eventos y no eventos son necesarios. Dado que no es fácil contar con una base de datos para realizar la validación externa, y que algunos expertos sugieren que son necesarios al menos 100 eventos y no eventos para hacerlo, el conjunto de datos de validación se consideró adecuado ya que contiene 103 eventos y un número significativamente mayor de no eventos. Estadísticas descriptivas y exploratorias En ambos estudios, la prevalencia de infecciones por organismos multirresistentes se presentará con intervalos de confianza (IC) del 95% y se estimará sobre la población total (infecciones cultivo positivo más cultivo negativo) y también únicamente sobre el subgrupo de pacientes con infecciones cultivo positivo. La distribución de los predictores potenciales y el resultado se presentará para ambas cohortes utilizando media y desvíos estándar (DE) o mediana y percentiles 25-75 para las variables numéricas, y números absolutos y porcentajes para las variables categóricas. La prevalencia de infecciones por organismos multirresistentes varía en diferentes países, regiones e incluso dentro del mismo país y centros médicos. La frecuencia de organismos multirresistentes se presentará para cada país y se proporcionarán estadísticas descriptivas. Esto es un indicador de la frecuencia de organismos multirresistentes en diferentes entornos y, por lo tanto, potencialmente puede estar relacionado con la probabilidad de contraer una infección por organismos multirresistentes. Dado que el objetivo era desarrollar y validar un modelo predictivo que pueda usarse en cualquier entorno, los países no serán explorados como predictores. Esta posible limitación en el modelo predictivo potencia la posibilidad de desarrollar un modelo útil que no esté restringido a los países incluidos en este estudio. Desarrollo del modelo predictivo Todos los pacientes con información completa (análisis de casos completos) respecto al resultado del estudio y los predictores potenciales incluidos en el conjunto de datos de desarrollo se incluirán en el desarrollo y la validación interna del modelo predictivo (Piano et al, DOI: 10.1053/j.gastro.2018.12.00, N= 1.302). Los siguientes predictores candidatos de infecciones por organismos multirresistentes serán preseleccionados por el grupo de investigación según publicaciones previas, conocimiento en el campo y opinión de expertos: edad, sexo, profilaxis con norfloxacina, rifaximin_tratamiento, betabloqueantes, procedimientos_invasivos previos, MELD-Na, albúmina, ingreso a unidad de cuidados intensivos, insuficiencia hepática aguda sobre crónica, ACLF, ascitis, encefalopatía, síndrome de respuesta inflamatoria sistémica, vasopresores, neumonía, infección del tracto urinario, peritonitis bacteriana espontánea. La asociación entre cada predictor potencial y el resultado de interés se evaluará con modelos de regresión logística. Se presentarán odds ratios (OR) con IC del 95%. Se explorarán e incluirán en el modelo interacciones relevantes preespecificadas entre pares de predictores candidatos que se espera que ocurran según publicaciones previas o conocimiento en el campo. En caso de que no exista asociación lineal entre los predictores continuos y el log odds de infección por organismos multirresistentes, se utilizarán polinomios fraccionarios multivariables (MFP). Para este propósito, se utilizará el comando mfp de STATA, que realiza una regresión logística multivariable con selección escalonada hacia atrás para la selección final de predictores, aplicando el Criterio de Información de Akaike (AIC) para la eliminación de variables, junto con la generación de MFP. El AIC se abordará en STATA utilizando eliminación hacia atrás con un valor p de 0,157 como aproximación, ya que STATA no lo realizaría automáticamente. Los siguientes predictores, considerados de gran relevancia clínica, serán forzados a permanecer en el modelo final: uso terapéutico de antibióticos en los últimos tres meses y tipo de infección. La homocedasticidad se explorará gráficamente con un diagrama de dispersión de los residuos de Pearson estandarizados sobre la probabilidad predicha de infección por organismos multirresistentes. La colinealidad de los predictores se explorará con diagramas de puntos y coeficientes de correlación. Los valores extremos se explorarán utilizando la distancia de Cook. Se presentará el predictor lineal completo del modelo. Por predictor lineal completo se entiende lo que se destaca en la siguiente ecuación: Logit (pi) = A + B1X1 + B2X2 +......+ BnXn. Presentar el predictor lineal completo es un elemento clave para la validación externa del modelo desarrollado. Todos los coeficientes se presentarán con sus errores estándar, OR (IC 95%) y valores p. El predictor lineal individual se resumirá con media y DE o mediana y percentiles 25%-75% y rangos. Se aplicará contracción uniforme al predictor lineal completo para corregir el optimismo, y se presentará también de la siguiente manera: A1 + [S * (B1X1 + B2X2 +......+ BnXn)], donde A1 es el intercepto reestimado para garantizar la calibración en el conjunto completo, y S es el factor de contracción. El factor de contracción uniforme es la pendiente de calibración ajustada por optimismo calculada durante la validación interna por bootstrapping (explicada a continuación). La bondad de ajuste del modelo desarrollado se explorará con los siguientes estimadores: Puntaje de Brier, que varía de 0 a 0,25 (cuanto menor, mejor el ajuste del modelo). R2 de Nagelkerke (cuanto mayor, mejor el ajuste del modelo). Criterio de información de Akaike (cuanto menor, mejor). Validación aparente La validación aparente se explorará en el conjunto de datos original, sin remuestreo, y se evaluará con medidas de calibración y discriminación. La calibración se evaluará con el cociente observado/esperado, gráficos de calibración, calibración en el conjunto completo (CITL) y pendiente de calibración. La discriminación se evaluará estimando el área bajo la curva ROC (también denominada índice C o C-estadístico cuando se aplica regresión logística). Adicionalmente, se evaluará el rendimiento diagnóstico, informando la sensibilidad, especificidad, valores predictivos positivo y negativo de diferentes puntos de corte o riesgos de infección bacteriana multirresistente. Validación interna Para la validación interna, se aplicará bootstrapping utilizando 300 muestras del mismo tamaño extraídas con reemplazo del conjunto de datos de desarrollo. Esta estrategia imita el muestreo de la población objetivo tomando el conjunto de datos original y seleccionando aleatoriamente unidades de análisis (es decir, pacientes) con reemplazo hasta obtener un conjunto de datos del mismo tamaño. Con cada muestra de bootstrap, se genera un modelo utilizando los mismos métodos descritos anteriormente, y su rendimiento se evalúa utilizando el conjunto de datos original. Los siguientes pasos se aplican con fines de validación interna mediante bootstrap: Generar una muestra de bootstrap. Desarrollar un modelo en la muestra de bootstrap (utilizando los mismos métodos que originalmente). Calcular el rendimiento aparente (en la muestra de bootstrap) y el rendimiento de prueba (en los datos originales). Calcular el optimismo para cada estimador (aparente - prueba). Repetir los pasos anteriores 300 veces para obtener la distribución de las estimaciones de optimismo. Calcular el optimismo promedio y ajustar las estimaciones del modelo original: AUC, pendiente de calibración y CITL. Se presentará la fiabilidad de la selección de predictores utilizando el mismo procedimiento de bootstrapping. La fiabilidad de la selección de predictores es el porcentaje de muestras de bootstrapping en las que un predictor particular permanece en el modelo predictivo final según el mismo procedimiento automático utilizado para construir el modelo, dividido por el número total de muestras de bootstrapping. Se considera que los predictores con una fiabilidad superior al 50% son estables, y esto es evidencia sólida de que deben incluirse en el modelo final. Validación externa del modelo predictivo Todos los pacientes del conjunto de datos de validación externa (Marciano et al, NCT03919032, N=472) con datos completos sobre los predictores y el resultado se utilizarán para la validación externa, con la intención de explorar la transportabilidad del modelo predictivo. Se utilizará el predictor lineal completo contraído (es decir, los coeficientes beta y el intercepto) del modelo desarrollado. La calibración y la discriminación se estimarán en la validación externa del modelo predictivo. La calibración se evaluará con el cociente observado/esperado, gráficos de calibración, calibración en el conjunto completo (CITL) y pendiente de calibración. La discriminación se evaluará estimando el área bajo la curva ROC. Análisis de subgrupos La evaluación de la validación se repetirá como análisis secundario considerando únicamente los pacientes con infecciones cultivo positivo. Manejo de datos faltantes Se espera que la proporción de datos faltantes sea baja considerando la información disponible de las publicaciones de ambas cohortes o comunicaciones en reuniones científicas. Dado que el mecanismo predominante de datos faltantes puede ser Completamente al Azar, los casos completos se considerarán como una muestra aleatoria de todas las observaciones. Bajo este supuesto, todos los análisis de datos se realizarán como análisis de casos completos. Se informará el número de valores faltantes.
Buenos Aires, Buenos Aires, Argentina