Comparación: semejanzas y diferencias

Variación en las guías de asma y bronquiolitis

Comparación entre recomendaciones de tratamiento del asma y la bronquiolitis en diferentes guías de práctica clínica

Autor/a: Leigh Anne Bakel, Jemila Hamid, Joycelyne Ewusie, Kai Liu, Joseph Mussa

Fuente: Pediatrics 2017;140

Indice
1. Página 1
2. Referencias bibliográficas

Introducción

Los creadores de las guías intentan re definir las preguntas clínicas y equilibrar los beneficios versus los riesgos de una intervención y sus alternativas para influir en la atención médica de un paciente.1 La implementación de las guías de práctica clínica puede promover la atención de alto valor mejorando los resultados y reduciendo costos.2,3 Por ejemplo, se observó una disminución apropiada en el uso innecesario de radiografías de tórax, esteroides y broncodilatadores después de la publicación de la guía de bronquiolitis de la Academia Americana de Pediatría (AAP) 2006.

Sin embargo, los autores de varios estudios demostraron que hay diferencias en las guías de práctica clínica desarrolladas para la misma condición.5 - 8 Estas son el resultado de las diferencias en el desarrollo, el informe, la calidad metodológica y el contenido de las guías.9 - 14 Estas discrepancias pueden causar confusión sobre el mejor tratamiento para el paciente, y las razones subyacentes de tales diferencias podrían llevar a los médicos a aplicar incorrectamente estas recomendaciones en la práctica.9

Una forma común de comparar las guías es mediante el uso de escalas de calidad como la Valorización de Guías de Investigación y Evaluación II (AGREE II, en inglés).15 Sin embargo, se sabe poco acerca del potencial acuerdo en las recomendaciones de tratamiento de las guías en las enfermedades pediátricas prevalentes comunes.

El asma y la bronquiolitis se encuentran entre las afecciones médicas pediátricas más frecuentes y costosas que requieren hospitalización; en consecuencia, estas condiciones se identificaron como de alta prioridad para la investigación debido a su prevalencia y costo.16 El objetivo de este estudio fue evaluar la concordancia de las recomendaciones para estas condiciones.

Específicamente, el objetivo de los autores fue evaluar el grado de acuerdo entre similares recomendaciones de tratamiento a través de diferentes guías nacionales e internacionales de asma y de bronquiolitis. Los autores plantearon la hipótesis de que habría un alto nivel de acuerdo entre las recomendaciones de tratamiento similares en estas guías.

MÉTODOS

Fuentes de información y estrategia de búsqueda

Los autores realizaron una búsqueda bibliográfica para encontrar guías de asma y bronquiolitis usando 4 grandes bases de datos de guías: la Red Internacional de Guías, el Centro Nacional de Información sobre Guías, la Agencia Canadiense de Medicamentos y Tecnologías en Salud, y la base de datos de Viajes.17 - 20 Esta búsqueda de literatura gris se realizó del 16 al 17 de diciembre de 2014 (asma) y el 9 de enero de 2015 (bronquiolitis). Los duplicados se eliminaron y el autor principal (L.A.B.) examinó los títulos para las guías pertinentes.

Criterios de elegibilidad

Se incluyeron guías para el tratamiento del asma y la bronquiolitis publicadas en los últimos 12 años (enero de 2003 a enero de 2015) de los 34 países que participan actualmente en la Organización para la Cooperación y el Desarrollo Económico.21

Recolección, extracción y organización de datos

Los datos extraídos incluyeron la recomendación, guía, enfermedad, el resultado primario de la recomendación de tratamiento y la evaluación del instrumento AGREE II para calificar la calidad y el reporte de la guía, el país de origen y el año de publicación de la guía.

Tres autores (L.A.B., J.E., K.L.) extrajeron los datos de forma independiente utilizando formularios de recopilación de datos estructurados. En primer lugar, los 3 autores revisaron y puntuaron una sola guía, y todas las discrepancias entre los 3 autores se resolvieron mediante discusión.

En segundo lugar, todas las guías posteriores fueron revisadas y los datos fueron extraídos de ellas por 2 autores de forma independiente. Se discutieron las diferencias en las extracciones de datos y, si era necesario, se utilizó un tercer autor para el arbitraje.

Todos los campos se discutieron para un acuerdo unánime, con la excepción de la puntuación de la guía utilizando el instrumento AGREE II para evaluar la calidad de la guía y la presentación de informes. Esta herramienta tiene 2 evaluaciones generales de guíasy 23 preguntas individuales quecaen dentro de 6 dominios diferentes:alcance y propósito, implicación de la parte interesada, rigor de desarrollo,claridad de presentación, aplicabilidad, e independencia editorial.15Las discrepancias de>2 puntos para artículos en AGREE II fueron re-revisados colectivamente por 2 autores.

En cada guía, se identificaron recomendaciones centradas en el tratamiento. Las recomendaciones excluidas fueron sobre evaluación, criterios de derivación a la emergencia, presentación, pruebas de diagnóstico, seguimiento, profilaxis, prevención y educación. Solamente se incluyeronlas recomendaciones clave, según lo descrito por el instrumento AGREE II.15

Resultado primario

El resultado primario fue recomendación de tratamiento. Para cada guía, las recomendaciones de tratamiento fueron categorizadas como:

(1) Recomendada para: recomendación a favor de una intervención.

(2) Opcional: la intervención era una opción.

(3) Abstención: ninguna recomendación a favor o en contra de una intervención.

(4) Recomendación en contra: un tratamiento particular no era recomendado.

(5) No abordado: la guía no aborda específicamente una intervención para recomendarla.

Los sistemas de designación de recomendación que informaron este trabajo fueron la declaración de política de la AAP en las recomendaciones de clasificación y el sistema de Clasificación de Valoración, Desarrollo y Evaluación de las Recomendaciones.22,23 Aunque el instrumento no fue validado, 2 de los miembros del equipo dieron la designación de la recomendación de tratamiento y fueron revisados por consistencia.

Análisis estadístico

Después de la recolección de los datos, las recomendaciones clave para cada guía fueron organizadas por tema para permitir la comparación de las recomendaciones entre guías.

Los autores resumieron el número total de las recomendaciones hechas para cada condición, la frecuencia de cada una de las categorías de resultado primario para asma y bronquiolitis, y el número de recomendaciones que no fueron dirigidas para asma y bronquiolitis. Los autores compararon la calidad de las guías utilizando la herramienta AGREE II. Por referencia, la fuerza de la evidencia se informó cuando estaba disponible para las recomendaciones clave en las guías de EE. UU. para asma24 y bronquiolitis.23

Los autores utilizaron la estadística k de Cohen para evaluar el acuerdo entre similares recomendaciones. 25 Utilizaron ambos k no ponderado y ponderado en casos en el que el resultado primario fue tratado como categórico y ordinal, respectivamente. Un puntaje k ponderado es diferente de un puntaje k estándar no ponderado en que permite ponderar diferentes categorías con variaciones de gravedad para considerar la magnitud del desacuerdo presente.

El análisis se realizó utilizando el software estadístico R (www.r-project.org) (R Development Core Team, R Foundation for Statistical Computing, Vienna, Austria).26Los autores calcularon un k por pares entre las guías así como un puntaje general de k para todas las recomendaciones entre todas las guías disponibles.

Los puntajes de k se categorizaron como indicativo de pobre acuerdo (<0), acuerdo leve (0-0,2), acuerdo justo (0,21-0,4), acuerdo moderado (0,41-0,6), acuerdo sustancial (0,61-0,8), o acuerdo casi perfecto (0,81-1,0). 27Los intervalos de confianza (ICs) se determinaron usando los recursos disponibles (n=1000).

Análisis de sensibilidad

Los análisis de sensibilidad se realizaron con una interpretación alternativa de la ausencia de una recomendación informada. Primero, las recomendaciones originalmente categorizadas como no abordadas fueron recodificadasy analizadas como datos "perdidos". En segundo lugar, las recomendaciones originalmente categorizadas como no abordadas fueron re categorizadas como abstención.

Ética

Este estudio se consideró exento por los comitésde ética de la investigación del Hospital para Niños Enfermos y la Universidad de Toronto, Toronto, Ontario, Canadá.

RESULTADOS

Asma

De 1381 citas, 473 estabanduplicadas. Después del examen inicial detítulos y resúmenes, se identificaron 125 documentos para una revisión de texto completo, y 118 fueron excluidos. Se identificaron 7 guías de asma.

Hubo 166 temas de recomendaciones, con 69 recomendaciones en =2 guías. La media (DE) de recomendaciones por guíafue 28 (16,3). La guía de asma delInstituto Nacional de Corazón, Pulmón y Sangre (NHLBI en inglés) contenía la mayoría de los temas de recomendación en común con otras guías, totalizando 44 temas de recomendaciones. La guía del Colegio Americano de Médicos del Tórax (ACCP en inglés) contenía la menor cantidad, con solo 5 temas de recomendación. Hubo una media (DE) de 40,6 (16,5) temas de recomendación no abordados por guía.

El puntaje general de calidad AGREE II (puntuación total de 7) varió de 3 a 6 puntos. Las guías de la Red de Guías Intercolegiales Escocesas (SIGN en inglés) y laSociedad Torácica Canadiense (CTS en inglés) tuvieron el mejor puntaje general AGREE II de 6, y la guía de laSociedad Canadiense de Pediatría (CPS en inglés) tuvo el puntaje más bajo de 3.

Los puntajes k totales no ponderados y ponderados fueron ambos de 0,03(ICs 95%: -0,01 a 0,07 y -0,01 a 0,10, respectivamente). Ambas puntuaciones significaron solo un acuerdo leve. El acuerdo entre pares de guías fue pobre (Manual Australiano del Asma (AAH en inglés) y CTS, el puntaje k no ponderado: -0,15 [IC 95%: -0,28 a -0,02]; puntuación k ponderada: -0,2 [IC 95%: -0,04 a -0,01]) a regular (AAH y CPS, puntaje k no ponderado: 0,18 [IC 95%: 0,07 a 0,29]; puntuación k ponderada: 0,24 [IC 95%: 0,1 a 0,39]).

~ Análisis de sensibilidad 1

Cuando las recomendaciones originalmente categorizadas como no abordadasfueron recodificadas y analizadas como datos faltantes, el análisis k (tanto general como pareado) no pudo completarse debido al gran número de valores faltantes. Los temas clave de las recomendaciones de las 7 guías sobre el asma fueron discrepantes. En 31 casos, solo 2 guías contenían recomendaciones que podrían ser comparadas.

Análisis de sensibilidad 2

Cuando las recomendaciones originalmente categorizados como no abordadas fueron re categorizadas como ausentes, en general, los puntajes k ponderados y no ponderados mostraron un ligero acuerdo ( k en general no ponderado: 0,04 [IC 95%: 0 a 0,08]; ponderación global de ?: 0,12 (IC 95%: 0,06 a 0,19]). El acuerdo por pares varió de pobre a regular, de manera similar al análisis primario, aunque se notaron algunas diferencias en los pares de guías.

• Bronquiolitis

De 322 citas, 65 fueron duplicadas. Después de la pesquisa inicial de títulos y resúmenes, se identificaron 13 documentos y se adquirieron los textos completos. Se excluyeron 9 guías después de obtener los textos completos.Se identificaron 4 guías de bronquiolitis.

Hubo 46 temas de recomendaciones, con 21 temas provistos en =2 guías. El número medio (DE) de recomendaciones por guíafue 15 (2,7). La guía SIGN de bronquiolitis contenía la menor cantidad temas de recomendación en común con otras guías, totalizando 13 temas de recomendación. Las recomendaciones incluidas en la guía del Sistema Nacional de Salud Español (SNHS en inglés) también se abordaron todas en otras guías. Hubo una media (DE) de 6 (2,7) temas de recomendación no abordados por guía.

El puntaje general de calidad AGREE II (puntuación total de 7) varió de 2 a 6. El mejor puntaje de AGREE II fue el de la guía SNHS de 6, y laguía de CPS recibió el puntaje más bajo de 2.

El puntaje total de no ponderado para las recomendaciones detratamiento de la bronquiolitis demostróacuerdo razonable (0,32 [IC 95%: 0,16 a 0,52]), y el puntaje general ponderado presentó un acuerdo leve(0,15 [IC 95%: -0,01 a 0,5]). Hubo un leve acuerdo (SIGN y el CPS, puntaje ? no ponderado: 0,1 [IC 95%: -0,17 a 0,36]; puntaje ? ponderado: -0,35 [IC 95%: -0,79 a 0,09]) a un acuerdo moderado (AAP y CPS, puntaje ? no ponderado: 0,61 [IC 95%: 0,35 a 0,87]; puntuación ? ponderada: 0,39 [IC 95%: -0,09 a 0,87]; SNHS y SIGN, puntaje ? ponderado:0,39 [IC 95%: 0,02 a 0,75]) entre pares de guías.

Análisis de sensibilidad 1

Cuando las recomendaciones categorizadas originalmente como no abordadas fueron recodificadas y analizadas como datos faltantes, esto cambió sustancialmente lospuntajes ?. El puntaje total de ? no ponderado indicó un acuerdo sustancial (0,75 [IC 95%: 0,53 a 0,94]) y el puntaje k ponderado fue casi perfecto (0,92 [IC 95%: 0,82 a 0,99]). Para lacomparación por pares, tanto los puntajes k ponderados como no ponderados estaban entremoderado y casi perfecto.

Análisis de sensibilidad 2

Cuando las recomendaciones originalmente categorizadas como no abordadas se re categorizaron como ausentes, los puntajes k ponderados y no ponderados indicaron un acuerdo justo (0,34 [IC 95%: 0,17 a 0,51]) a sustancial (0,61 [IC 95%: 0,44 a 0,78]) y el acuerdo de pares demostró acuerdo leve a sustancial para los puntajes k no ponderados y ponderados. Estos resultados reflejan los resultados obtenidos del análisis primario y pueden estimar mejor las verdaderaspuntuaciones k generales y elacuerdo por pares, específicamente para lospuntajes ponderados que son dependientes de la naturaleza ordinal de la escala.

DISCUSIÓN

Son preocupantes las discrepancias encontradas en cuanto al acuerdo en las recomendaciones entre las guías en enfermedades pediátricas comunes

Este es el primer informe en la literatura en el cual se utilizan métodos cuantitativos para comparar los tratamientos recomendados en las guías de práctica clínica entre diferentes guías nacionales e internacionales. Centrándose en las enfermedades pediátricas altamente prevalentes que son atendidas por pediatras, encontraron menos acuerdo de lo previsto entre los lineamientos nacionales e internacionales para el asma que para bronquiolitis.

Esto es probablemente debido a la gran cantidad de recomendaciones abordadas entre las guías para el asma. Además, hubo una diferencia sustancial en las puntuaciones k cuando las recomendaciones fueron categorizadas como no dirigidas y cuando se consideraron datos faltantes para asma y bronquiolitis.

Cuando se analiza de esta manera, esas recomendaciones que no fueron abordadas y luego se recodificaron como datos faltantes no fueron contabilizados en este análisis, lo que genera menos comparaciones globales. Cuando las comparaciones con la categoría no abordada fueron eliminadas del análisis de bronquiolitis, el acuerdo se convierte en casi perfecto; sin embargo, esto puede falsamente exagerar el acuerdo entre las guías.

Además, la diferencia también podría atribuirse al tipo de recomendaciones de tratamiento que se están poniendo adelante. Puede ser más fácil ponerse de acuerdo enrecomendaciones de no intervención que son comunes para la bronquiolitis que en recomendaciones para unaintervención apropiada, como a menudo ocurre para el asma.

Los autores de numerosos estudios compararon las pautas para la misma condición utilizando el análisis cualitativo y descriptivo. 7, 10, 11, 14,28-31

Cuando las guías se comparan cuantitativamente en la literatura, la principal comparación se centra en las pautas decalidad evaluadas mediante el uso del instrumento AGREE II. 6, 8, 32,33 

Los autores también encontraron una variación en la calidad de la guía utilizando el instrumento AGREE II. Los autores no encontraron ningún reporte anterior en el que se cuantificaran las diferencias en el acuerdo entre las guías para la misma condición.

Las diferencias informadas en este estudio son clínicamente importantes. Es evidente que hay ocasiones en que las guías de asma coinciden. Sin embargo, también hay muchas instancias en las cuales no coinciden. Hay 4 ejemplos en los que 1 guía recomienda un tratamiento y otra está en contra de ese mismo tratamiento para el asma. Uno de esos ejemplos es el uso de un antagonista del receptor de leucotrieno (montelukast) para niños mayores de 2 años como primera opción de tratamiento de control para el asma leve persistente.

La Iniciativa Global para el Asma (GINA en inglés) realiza una recomendación en contra de esapráctica, mientras que era opcional en las guías AAH y NHLBI y su uso era recomendado en la guía SIGN. Aunque hay menos variación en las guías de bronquiolitis, aún hay discrepancias, aunque ninguna fue tan cruda como una guía recomendando un tratamiento y otra recomendando en contra de ese mismo.

Por ejemplo, no hay recomendación sobre el uso de montelukast en la guía SIGN, pero el uso de montelukast no fue recomendado en la guía SNHS. En general, estas diferencias pueden hacer que el tratamiento de pacientes sea confuso cuando se está intentando seguirguías de práctica clínica basada en la evidencia.

La AAP desarrolla guías de práctica clínica de forma independiente así como a través de colaboraciones con otras sociedades. También respalda las guías de otras organizaciones.22 Aunque laAAP desarrolló su propio sistema para evaluar la evidencia y realizar recomendaciones, 22la evidencia a menudo es insuficiente, dejando al panel de guías de la AAP hacer recomendaciones basándose en poca evidencia.34

Sería importante para la AAP ser consciente de las diferencias entre sus guías y los de otras sociedades pediátricas nacionales e internacionales. Esto también revela la continua variabilidad en la calidad de las guías en los Estados Unidos y en otros países que tienen como objetivo llevar la mejor atención clínica a través de las guías de práctica clínica para pacientes pediátricos. 34

Hay limitaciones en este estudio. Primero, hubo una falta de comparaciones por pares, particularmente para el asma. Este problema ha sido llamado la "paradoja de Kappa" en la literatura estadística.35 Hubo una gran cantidad de recomendaciones que fueron categorizadas como no abordadas. Por ejemplo, la guía CPS tenía delineadas pocas recomendaciones clave, lo que lleva a que muchas recomendaciones sean categorizadas como no abordadas.

La guía ACCP tenía pocas recomendaciones en común con las otras guías; esta guía se centró en gran medida en los dispositivos de inhalación y administración, llevando a que muchas recomendaciones sean categorizadas como no abordadas. Esta falta de datos es la explicación más plausible para las diferencias que se identificaronen el análisis cuando la categoría no abordado fue recodificada a datos faltantes, lo que conduce a menos comparaciones disponibles.

Segundo, aunque este estudio intentó cuantificar las diferencias entre las guías en cuanto a recomendaciones de tratamiento  que previamente se habían comparado cualitativamente, este método puede no ser lo suficientemente sensible para la semántica sutil de recomendaciones tal como son escritas. Como equipo, los autores tuvieron muchas discusiones sobre las diferencias en el lenguaje para recomendado para, opcional, abstenerse y recomendar en contra.

Esta categorización puede no abordar las sutilezas de lenguaje que explica en forma explícita en detalle las diferencias entre guías. Por ejemplo, hay un capítulo de 22 páginas dedicado a explicar las diferencias en las guías de asma actuales de Estados Unidos y Europa.30 Tercero, hubo varias limitaciones en la búsqueda y recuperación de guías para este estudio. Primero, los autores limitaron subúsqueda a la literatura gris estructurada que no fue revisada por pares por un bibliotecario.

Sin embargo, en comparación con una búsqueda más limitada de la literatura gris revisada por pares por un bibliotecario en Medline, Embase y similares para otro estudio no publicado, hubo pocas diferencias en el número de guías recuperadas de bronquiolitis y asma. Para bronquiolitis, hubo 2 guías adicionales recuperadas por esta búsqueda estructurada de la literatura gris, una guía publicada más recientemente y una actualización desde que se completó la última búsqueda. Para asma, se encontraron las mismas guías.

En cuarto lugar, los autores eligieron limitar su búsqueda a aquellas en inglés. Estopuede haber reducido innecesariamente la búsqueda de los autores, y podrían haber tenido una lista más completa de las guías internacionales si hubieran traducido esas guías en otros idiomas. Sin embargo, se excluyeron solo 4 guías de asma debido a que no estaban en inglés.

Ninguna de las guías de bronquiolitis encontradas no eran en inglés. Esto puede limitarla generalización de este proceso de evaluación de las guías y la comparación con los países que no hablan inglés, aunque la estandarización del contenido y calidad de la guía ha sido parte de una discusión a través del mundo con la herramienta AGREE II, que está disponible y traducida en 32 idiomas.36

Finalmente, los autores limitaron su estudio a las recomendaciones de tratamiento. Los hallazgos podrían haber diferido si hubieran considerado otras recomendaciones enfocadas en la evaluación, criterios de derivación a la emergencia, presentación, pruebas de diagnóstico, seguimiento, profilaxis, prevención y/o educación.

Son preocupantes las discrepancias encontradas en cuanto al acuerdo en las recomendaciones entre las guías en enfermedades pediátricas comunes atendidas por un pediatra o un pediatra internista entre las guías nacionales e internacionales. Hay una variabilidad sustancial en las guías de recomendación de tratamiento entre las guías nacionales e internacionales para el asma y alguna variación para bronquiolitis.

Hay variación en los métodos de desarrollo de guías en el mundo. Había más de 60 diferentes pruebas de evaluación de evidencia y sistemas de clasificación de recomendaciones en uso cuando fue evaluado por última vez en 2012, haciendo más difícil la interpretación de las guías.23, 37Los paneles de guías de práctica clínica podrían beneficiarse adaptando la síntesis de la evidencia existente y las guías de práctica clínica a su contexto local en lugar de desarrollar de nuevo la síntesis de evidencia para crear una nueva guía.8

La claridad y transparencia en el trabajo de una guía de práctica clínica podría mejorar si hubiera más trabajo internacional colaborativo en el desarrollo de guías de práctica clínica, o, al menos, más fidelidad a una estructura de reporte estándar.

Conclusiones

En general, el análisis k reveló leve acuerdo para las guías de asma y bastante acuerdo para las guías de bronquiolitis. Esto sugiere que hay variabilidad en las recomendaciones de tratamiento de las guías entre las guías nacionales e internacionales sobre asma y bronquiolitis.

• Comentario
Las guías de práctica clínica son herramientas ampliamente utilizadas por el médico en el cuidado de sus pacientes, por lo que es imprescindible contar con guías de alta calidad. El presente estudio cuantificó las diferencias en las recomendaciones de tratamiento del asma y la bronquiolitis en diferentes guías. Los autores determinaron que hay menor acuerdo en las recomendaciones para el asma que para la bronquiolitis.

Resumen y comentario objetivo: Dra. Alejandra Coarasa