Estimación del riesgo

Estimación del riesgo en el niño febril

Estudio transversal sobre la sobreestimación del riesgo en la evaluación del niño febril.

Autor/a: deVos-Kerkhof E1, Roland D2, de Bekker-Grob E3, Oostenbrink R1, Lakhanpaul M4, Moll HA5.

Fuente: Eur J Pediatr. 2016 Apr;175(4):563-72.


Abreviaturas
IC: Intervalo de confianza / PCR: Proteína C reactiva / SE: Servicios de Emergencia / IBG: Infecciones bacterianas graves / EAV: Escala Analógica Visual

Introducción

El niño febril es una presentación común en los servicios de emergencias (SE), con un 10 a 20% de todos los pacientes pediátricos consultando por enfermedad febril solamente. La mayoría de los niños sufren infecciones simples auto limitadas que no necesitan tratamiento. Sin embargo, una pequeña proporción tendrá infecciones bacterianas graves (IBG) que requieren estudios, ingreso hospitalario, antibióticos y en algunos casos la admisión a cuidados intensivos. 

La comprensión de la toma de decisiones de los profesionales de la salud, en particular en relación con el diagnóstico, el tratamiento y el seguimiento es de vital importancia, especialmente debido a que los SE tienen cada vez más demanda de pacientes. Por otra parte, los errores de diagnóstico, especialmente en las enfermedades infecciosas, se encuentran entre las causas más comunes de demandas médicas por negligencia en pediatría.

Para apoyar la toma de decisiones en los niños febriles, se desarrollaron diferentes modelos de predicción clínica en la década pasada. Aunque la mayoría de los estudios sobre modelos de predicción reportan una buena precisión y alto cumplimiento, la aplicación en la atención de emergencia pediátrica es limitada. Una de las razones podría ser que la estimación intuitiva de los médicos de las probabilidades puede ser tan buena como, o mejor que, los modelos de predicción. Por otra parte, la falta de evidencia sobre los umbrales de decisión basados en la clínica hace que el proceso de aplicación de modelos de predicción sea complejo en la práctica clínica. 

El objetivo de este estudio fue estimar los umbrales de riesgo en los cuales los niños serían manejados como IBG de acuerdo con el juicio médico, mediante la evaluación de viñetas de vídeo de niños febriles que consultan en el SE. Las medidas secundarias incluyeron la determinación del efecto de las investigaciones mediante el registro de las estimaciones de riesgo después de la información del valor de la proteína C-reactiva, determinando las características presentes que influyen en estos riesgos y la comparación de la percepción del riesgo clínico con las estimaciones de riesgo utilizando un modelo validado de predicción (herramienta del niño febril, Feverkidstool en inglés).


Métodos

Diseño del estudio y entorno

Los autores realizaron un estudio transversal con viñetas de vídeo reales de niños febriles que se presentaron al SE pediátrico del Leicester Royal Infirmary de Leicester, Reino Unido. Todos los padres dieron su consentimiento formal para que las imágenes de vídeo fueran vistas por los profesionales de la salud bajo las guías de política de confianza del proceso publicado previamente. El consentimiento para la recolección de las imágenes de video fue concedido por el Comité Nacional de Ética en Investigación de East Midlands.

Población de estudio
Se invitó a participar a pediatras y médicos de urgencias pediátricas de la población de la red REPEM (Investigación en Medicina de Emergencia Pediátrica, Europa; www.pemdatabase.org/REPEM.html), y a pediatras de hospitales escuela con interés en cuidados agudos y emergencias de los Países Bajos y Reino Unido (104 invitaciones). A los que no respondieron se les envió un recordatorio cada 4 semanas, con un máximo de cuatro envíos por persona.

Intervención del estudio: viñetas de video
A los participantes del estudio se les mostró vía web 21 viñetas de vídeo de niños febriles. Las viñetas eran una mezcla de niños de diferentes categorías de edad con IBG potencial y niños con problemas auto-limitados simples, reflejando los diferentes niveles de gravedad de los niños febriles en la práctica. Los videos, con una duración media de unos 30 segundos, fueron grabados originalmente con fines educativos para los pediatras en formación como parte del REMIT (Refining Evaluation Methodologies for Practice Changing Interventions) (ISRCTN94772165). Los antecedentes y los signos vitales podían interpretarse fácilmente de las viñetas de vídeo o ser reportados como texto añadido.

Inicialmente, se preguntó a los participantes si habrían manejado al niño febril como si tuviera una IBG en base a la viñeta y a los antecedentes (por ejemplo, duración de la fiebre) solamente. A continuación, se les pidió que evaluaran el riesgo real de que el niño tenga una IBG en una escala analógica visual (EAV1). Por último, los autores añadieron diferentes valores de proteína C reactiva (PCR) y se les preguntó si habrían cambiado su evaluación de riesgo (EAV2). Las viñetas en línea y las respuestas de los encuestados fueron almacenadas en un servidor seguro protegido por contraseña.

Recolección de datos
Todos los datos recolectados en línea se exportaron en un formato anónimo como un archivo de Excel. Los autores recolectaron las respuestas a las siguientes preguntas:

(1) ¿Hubiera manejado a este niño como si tuviera una infección bacteriana seria? (Respuestas: sí/no).

(2) ¿Qué diagnóstico o terapéutica hubiera realizado? (Opciones: ninguna acción y/o alta; antipiréticos; ingesta de líquido; análisis de sangre; radiografía de tórax; punción lumbar; orina con tira reactiva; antibióticos orales; antibióticos por vía intravenosa; internación). Los participantes del estudio podían marcar todos los elementos que juzgaran pertinentes.

(3) ¿Cuál es la posibilidad de IBG en este niño? (Respuesta: 0-100% en una EAV (EAV1)). Como la PCR es el predictor más fuerte de la Feverkidstool, los autores estudiaron el valor adicional de la PCR en las decisiones de manejo de los médicos, con la siguiente pregunta.

(4) Se toma una PCR y se informa (valor continuo) mg/l. ¿Cuál es la probabilidad de IBG en este niño? (Respuesta: 0-100% EAV (EAV2)).

La información del participante se recogió después de terminadas las viñetas de vídeo. Estas preguntas incluyeron

(1) ¿Es usted un: médico clínico/pediatra de emergencias?

(2) ¿Cuánto tiempo ha estado trabajando como médico clínico/pediatra de emergencia? (Opciones: <5 años; 5-10 años; 10-15 años; >15 años)

(3) ¿Alguna vez ha pasado por alto o ha reconocido una infección grave demasiado tarde? (Opciones: sí/no).


Definiciones y medidas de resultado
Todos los participantes fueron informados sobre el concepto de IBG predefinido en la carta de invitación para el estudio: infección bacteriana demostrada por cultivo o radiográficamente (por ejemplo, meningitis, sepsis, bacteriemia, neumonía, infección del tracto urinario, gastroenteritis bacteriana, osteomielitis o etmoiditis). El resultado de la IBG en las viñetas se definió como el manejo del niño con una IBG. 

Descripciones detalladas sobre el desarrollo y la validación del Feverkidstool han sido publicadas anteriormente. La capacidad de discriminación reportada originalmente de acuerdo con el área bajo la curva ROC (ABC) del modelo para predecir neumonía fue de 0,81 (error estándar 0,04) y para otras IBG de 0,86 (error estándar: 0,03). Debido a que el Feverkidstool se basó en un modelo de regresión logística politómica, se calcularon dos puntuaciones de riesgo, una para neumonía y una para otras IBG (por ejemplo, infección del tracto urinario).

Los autores utilizaron la puntuación de riesgo más alta en la comparación con los valores de riesgo de la EAV de las viñetas de video. Los autores dicotomizaron los resultados de los diagnósticos realizados y/o la terapéutica. Este resultado fue considerado como "presente" si los participantes marcaban fluidos, análisis de sangre, radiografía de tórax, punción lumbar, orina con tira reactiva, administración de antibióticos por vía oral/intravenosa y/o internación. Cuando se eligió 'no acción y/o alta y/o antipiréticos", el resultado se calificó como "no presente".

Todas las viñetas tenían una declaración de la edad, temperatura y duración de la fiebre. Los signos y síntomas clínicos anormales fueron distribuidos entre las diferentes viñetas, con diez viñetas que tenían un signo de alarma, cuatro viñetas con dos signos de alarma y siete viñetas que tenían tres o más signos de alarma.

Análisis estadístico
En primer lugar, los autores evaluaron el rango de la mediana de riesgos estimada por juicio clínico (EAV) y el riesgo con el valor añadido de la PCR. En segundo lugar, los autores midieron las características de los pacientes con el manejo de la IBG representada con el análisis del experimento de elección discreta (EED). Por último, los autores compararon las puntuaciones de riesgo EAV con el modelo de predicción basado en el juicio (Feverkidstool).

Los EEDs son un enfoque cuantitativo para evaluar las preferencias, por ejemplo, de intervenciones médicas y se utilizan cada vez más en el cuidado de la salud. En los EEDs, se asume que los elementos importantes que influyen en las intervenciones médicas, como los signos vitales, pueden ser descritos por sus características (es decir, los atributos). Las características se especifican con más detalle por las variantes de esas características (es decir, niveles de atributos). Un segundo supuesto es que los niveles de los atributos están determinados por las preferencias de los individuos por una intervención médica.

Los autores estudiaron las variables clínicas de la Feverkidstool (www.erasmusmc.nl/feverkidstool) como atributos a la decisión de tratar o no a los niños febriles de las viñetas como una IBG. Todos los datos del EED se analizaron tomando cada elección entre dos alternativas de manejo como una observación. Utilizando el software NLogit http://www.limdep.com/ para la siguiente sentencia, las observaciones se analizaron mediante un modelo logístico.

Ya que había una falta de diversidad entre las variables clínicas "saturación de oxígeno" y "taquipnea" entre las viñetas, no se pudieron analizar estas variables tan necesarias. Las variables taquicardia y relleno capilar prolongado fueron tomadas como una sola variable clínica ya que su correlación era demasiado alta. La influencia de los diferentes coeficientes de las variables se probó para la significación estadística (p≤0,05). Actualmente no hay métodos estadísticos formales para determinar tamaño de la muestra para el EED; el estudio de los autores se esforzó para llegar al menos a 40 encuestados de la misma manera que los estudios anteriores.


Resultados

De los 104 participantes invitados, el 50,4% estuvo de acuerdo en participar y 42 (40,4%) participantes terminaron las viñetas de vídeo en línea. Los 42 participantes finales incluyeron 83% de pediatras y 17% de médicos de urgencias pediátricas. El cincuenta por ciento de los participantes tenía una experiencia laboral de más de 10 años. Casi la mitad de los participantes no había reconocido o había retrasado el diagnóstico de infección grave al menos una vez.

Intervención del estudio - viñetas de video
La mediana de edad de los niños fue de 12 meses (Rango intercuartil (RIC) 2-72), el 57% eran varones y la mediana del nivel de proteína C reactiva (PCR) fue de 60 mg/l (RIC 10-110). El 41% de las viñetas de vídeo fueron manejadas como una IBG de acuerdo con los participantes. Se comenzó con el diagnóstico y/o la terapéutica en el 77% de las viñetas de video. La mediana de riesgo antes de saber la PCR (EAV1) fue del 20% (RIC 9-50) y con la información de la PCR (EAV2) aumentó al 30% (RIC 10-60). Como los valores de PCR ya estaban disponibles en el primer vídeo en las viñetas 3 y 21, no se pudo medir ningún cambio en el riesgo.

Se realizaron más diagnósticos y/o terapéuticas cuando el niño se manejó como una IBG. Se administraron antipiréticos en el 65% de las viñetas de vídeo sin diferencias al estratificar por el resultado (IBGM). En el 94% de las viñetas de vídeo que se manejaron como IBG, se realizaron análisis de sangre y el 71% fueron hospitalizados.

Juicio clínico vs. diferentes niveles de PCR
Se visualizaron diferencias en las puntuaciones de riesgo clínico frente a los diferentes niveles de PCR. La mediana de las diferencias de riesgo clínico (EAV2-EAV1) se correlacionaron positivamente con un mayor nivel de PCR (IBGM sí: correlación de Pearson 0,53 (p=0,000) e IBGM no: correlación de Pearson 0,68 (p=0,000)). Los puntajes de riesgo de los niños clasificados desde el principio como IBG fueron influenciados solamente por los altos niveles de PCR (>65 mg/l), mientras que los niños que no se manejaron inicialmente como IBG fueron influenciados por los bajos niveles de PCR (> 40 mg/l).

Experimento de elección discreta - viñetas de vídeo 
El experimento de elección discreta se basó en 20 viñetas de vídeo ya que las variables clínicas de un video estaban demasiado correlacionadas. Casi todas las variables clínicas de la Feverkidstool podían ser probadas con el análisis EED, excepto la PCR, la saturación de oxígeno y la taquipnea. Todas las variables clínicas probadas influyeron en la decisión sobre el manejo de los niños febriles de manera significativa. El aspecto enfermo y las variables combinadas de relleno capilar prolongado y taquicardia fueron los factores de mayor influencia, y la edad y la duración de la fiebre los factores que menos influyeron. 

Puntajes de riesgo de las viñetas de video - puntuación de riesgo Feverkidstool
Según los participantes, la mediana de puntuación de riesgo clínico (EAV2) entre esas viñetas de vídeo que fueron asignadas como manejadas como IBG fue del 60% (RIC 30 a 80,5), en comparación con la puntuación de riesgo de la Feverkidstool del 12,7% (RIC 7,7- 28,1). Cuando las viñetas de vídeo no se manejaron como IBG, la puntuación de riesgo clínico (EAV2) ascendió a 16% (5 a 32) en comparación con un riesgo de 7,3% (5,7 a 16,3) de acuerdo con la Feverkidstool.

Las mayores diferencias de puntuación de riesgo entre las viñetas y las puntuaciones de riesgo de acuerdo con la Feverkidstool se vieron en las viñetas de vídeo con (varios niveles de) disminución de la conciencia o agitación. Este ítem se observa claramente cuando se ven las viñetas de vídeo, pero esta variable clínica no está incluida en los predictores de la Feverkidstool. Por último, no se encontraron diferencias en la mediana de puntuación de riesgo clínico cuando se estratificó para diagnósticos previamente perdidos del participante (p=0,218).


Discusión

Principales hallazgos

Este es el primer estudio con viñetas de vídeo de la vida real para determinar las características del niño febril que llevan a los médicos a tomar decisiones de manejo. Las puntuaciones de riesgo clínico más elevadas para manejar a los niños febriles como IBG fueron creadas por clínicos. Todas las variables clínicas probadas de la Feverkidstool influenciaron las decisiones de manejo de los médicos en los niños febriles de manera significativa, siendo la apariencia grave y los signos circulatorios aberrantes los más importantes.

Los niveles de PCR moderados influyeron en las puntuaciones de riesgo de niños que en un principio no se manejarían como IBG mientras que fueron necesarios niveles altos de PCR para influir en las puntuaciones de riesgo en niños que inicialmente ya eran manejados como IBG. En niños manejados como de alto riesgo de IBG los umbrales juzgados por el clínico fueron más altos en comparación con los umbrales de riesgo predichos de acuerdo con la Feverkidstool. Los umbrales de riesgo clínico de los niños no manejados como IBG fueron más comparables con los umbrales de predicción de riesgo basados en modelos.

Comparación con la literatura

En este estudio, los autores focalizaron en las características del paciente y en los factores contextuales que influyen en las decisiones de manejo del niño febril en el SE. Una forma de abordar este proceso de razonamiento diagnóstico es la toma de decisiones. La toma de decisiones ha sido influenciada por los modelos estadísticos de razonamiento en condiciones de incertidumbre utilizando la probabilidad pre y post test de acuerdo al teorema de Bayes.

Este modelo se ocupa de dos clases principales de errores en el razonamiento clínico: en la evaluación de cualquier probabilidad previa o en la fuerza de la evidencia. Aunque la probabilidad pretest de tener una IBG (prevalencia de la enfermedad) depende de varios factores como, por ejemplo, la edad y los antecedentes médicos de relevancia, la probabilidad pre-test determinada por el centro de atención médica fue considerada estable en las viñetas.

Sin embargo, los autores se centraron en la interpretación de los puntos fuertes de la evidencia por parte de los clínicos sobre la probabilidad de una infección grave. Para este proceso de decisión, los autores realizaron un análisis de experimento de elección discreta (EED), que es un método cada vez más utilizado en estudios donde los clínicos sopesan información clínica en el trabajo de diagnóstico.

En la literatura sobre el razonamiento diagnóstico, la medicina basada en la evidencia es el método educativo de mayor éxito en la traducción de la teoría de decisión estadística en la práctica clínica. Dentro de esta traducción, los autores tuvieron como objetivo dar más detalles sobre la determinación de umbrales de decisión cuantitativos que probaron ser un tema complejo. La mayoría de los estudios utilizaron medidas de rendimiento optimizadas como el área bajo la curva ROC o la sensibilidad/especificidad para establecer estos umbrales.

Otros estudios describieron los procedimientos Delphi para determinar sus puntos de corte basados en la clínica. En este estudio, los autores describieron la mediana de las estimaciones de riesgo asignadas a los médicos de acuerdo a qué pacientes hubieran sido manejados como IBG. Los autores observaron un acuerdo en los umbrales de riesgo sobre clínica y predicción basados en modelos cuando los médicos decidieron no manejar al niño febril como IBG.

Sin embargo, el umbral de riesgo clínico para manejar al niño como IBG fue mucho mayor en comparación con el modelo de predicción basado en el juicio. Este fenómeno está bien reconocido; debido a que los médicos no quieren perderse enfermedades graves (pero susceptibles de tratamiento) hay una tendencia a sobreestimar la probabilidad de estas enfermedades.


Implicaciones clínicas y de investigación

El hallazgo más importante de este estudio incluye los puntajes de alto riesgo que los clínicos asignaron a los niños que habrían manejado como IBG (mediana de riesgo 60% (RIC 30-80,5)). Esta observación contrasta con la hipótesis de que deberían elegirse umbrales de riesgo muy bajos para diagnósticos específicos con alta morbilidad/mortalidad (por ejemplo, meningitis).

Aparentemente, los médicos crearon estimaciones de riesgo más dicotómicas (alto riesgo o bajo riesgo) para el manejo de infecciones específicas graves con la reevaluación de las estimaciones de riesgo después de cada etapa de diagnóstico. Los médicos utilizaron un enfoque progresivo en el manejo de los niños febriles, en lugar de considerar un umbral de riesgo de IBG en general.

Los autores observaron acuerdo en el valor predictivo de todas las variables de predicción clínica probadas en la detección de niños con IBG, tanto en los modelos de predicción basados en la clínica como en el juicio. Los médicos se guiaron por la apariencia de enfermedad y por los signos circulatorios anormales en la evaluación del niño febril, que no eran los factores más influyentes según la Feverkidstool. Para la Feverkidstool los predictores respiratorios como las retracciones torácicas y la saturación de oxígeno eran los factores que influyen de forma más potente.

Además, los autores encontraron que los niveles de PCR influenciaron la puntuación clínica de riesgo de manera diferente en niños con o sin tratamiento inicial de IBG, con mayor influencia de factores clínicos que del valor de la PCR. En la población de estudio, este enfoque no ha mejorado por las experiencias de errores en el pasado. Estos puntos de vista en los factores que influyen en la predicción clínica de los niños febriles con riesgo de IBG ayudan a entender, revisar y evaluar las decisiones de manejo clínico.

En comparación con las puntuaciones de riesgo basadas en modelos de predicción, los umbrales de los niños que no fueron manejados como IBG fueron más comparables, yendo del 7 al 16%. Se podría llegar a la conclusión de que este umbral de riesgo se justifica como umbral de desestimación de la IBG, pero no hay acuerdo en los umbrales de aceptación de IBG ya que parece demasiada diferencia entre el modelo de predicción y la evaluación clínica del riesgo por etapas en los niños manejados como IBG.

Fortalezas y limitaciones

La principal fortaleza de este estudio es el uso de videos de la vida real en lugar de pacientes presentados por escrito. Este enfoque es una forma más representativa de retratar la vida real, y hay una evolución de evidencia sobre el uso de casos de pacientes en vídeo como intervención educativa.

Una segunda fortaleza del estudio es el uso de la Feverkidstool como un modelo aritmético para comparar la evaluación subjetiva global del médico en la evaluación del niño febril. En una revisión que describe los estudios de viñeta en la toma de decisiones médicas, se concluyó que la mayoría de los estudios sobre este tema no compara sus resultados con algún tipo de normativa de referencia.

Por otra parte, el papel de los modelos de predicción se hace mayor, ya que los médicos pueden depender cada vez más de los signos y síntomas de alarma que se describen en las guías clínicas (inter) nacionales y en los modelos de predicción debido a la disminución de la incidencia de IBG. Sin embargo, hubo una discrepancia en la evaluación del riesgo de algunas viñetas de vídeo (por ejemplo viñetas 7, 11 y 18), probablemente debido a la ausencia de variables como estado de conciencia disminuido o agitación en la Feverkidstool.

Hay algunas otras limitaciones en este estudio. Los vídeos aún carecen de algunos aspectos de la vida real, tales como el tiempo de observación o las descripciones concisas de la historia de los pacientes. Sin embargo, a partir de la literatura, los autores saben que las descripciones más detalladas de casos asignarán una mayor probabilidad subjetiva de enfermedad que un breve resumen del mismo caso, incluso si contienen la misma información de la enfermedad.

Otra de las limitaciones incluye la determinación de algunas variables clínicas por el juicio de los clínicos (apariencia de enfermedad, retracciones torácicas y el tiempo de relleno capilar). De esta manera, podría haberse producido una clasificación errónea de estos predictores clínicos. Sin embargo, este enfoque refleja la práctica clínica y por lo tanto puede simplemente reforzar la generalización de los resultados.

A continuación, el análisis EED tuvo que ser realizado dentro de la disponibilidad de un número limitado de viñetas de vídeo. Como consecuencia de ello, los autores se vieron obligados a excluir o a fusionar algunas variables de predicción (por ejemplo, saturación de oxígeno y taquipnea) para cumplir con el diseño teórico del EED. En segundo lugar, aunque una tasa de respuesta de los médicos del 50% fue similar a otros estudios EED, esta tasa de respuesta no es óptima. Sin embargo, debido a la experiencia que respalda a todos los participantes, los autores asumieron la variabilidad de respuesta limitada lo que lleva a resultados representativos del estudio.


Conclusión

En este estudio sobre viñetas de vídeo de la vida real, los autores observaron altas puntuaciones de riesgo en la estimación del riesgo de los clínicos sobre el manejo de la IBG en niños febriles, y estos riesgos estuvieron influenciados en su mayoría por las características clínicas de apariencia de enfermo y signos circulatorios anormales.

Los umbrales de riesgo uniformes en los que uno debe empezar el manejo de IBG en niños febriles siguen siendo poco claros, ya que el concepto de umbrales de riesgo dicotómicos de los clínicos fue apenas comparable a la evaluación general del riesgo de IBG del modelo de predicción. Sin embargo, se encontraron resultados más consistentes para los umbrales de riesgo basados en el modelo clínico y de predicción en los niños febriles que no se manejaran como IBG que consultaron en el servicio de emergencias.

Comentario

El presente estudio destaca que los médicos asignaron mayor probabilidad de estar ante un paciente con una infección bacteriana grave basándose principalmente en el aspecto tóxico del paciente y en los signos de mala perfusión. Aún no se cuenta con umbrales de riesgo uniformes para manejar a un niño febril como potencial IBG, pero este estudio sugiere que podrían utilizarse los modelos clínicos y de predicción en forma más consistente para determinar que niños febriles tendrían bajo riesgo de IBG. 

Resumen y comentario objetivo: Dra. Alejandra Coarasa