Por los Dres. Hernán Doval, Carlos Tajer y Juan Gagliardi (GEDIC)
La aproximación del médico práctico a la literatura científica no es sencilla. No hemos tenido una formación sistemática en tal sentido, y la disponibilidad que era muy dificultosa en una época ha mutado en una sobreabundancia de publicaciones imposible de abarcar y con un efecto de "inhibición por sobreestimulación". Este capítulo está orientado a compartir una forma de leer los trabajos científicos para extraer información que pueda ser útil en la práctica clínica.
Hay dos tipos de lectura médica: la que se hace por formación "cultural" (lectura abierta de temas aún de poca prevalencia en consultorio, para conocer las novedades; por ejemplo: efectos del lavado frecuente de la cara sobre la incidencia de tracoma en aldeas árabes), recreativa, muy recomendable pero para la que contamos cada vez con menos tiempo; y aquella dirigida a resolver temas concretos de pacientes, imprescindible pero compleja.
En el consultorio nos enfrentamos con problemas cotidianamente:
Un paciente de 50 años, dislipémico, nos comenta que su padre falleció a los 45 años a causa de un infarto o muerte súbita, y que le interesa hacer un chequeo preventivo. Tenemos en este caso que decidir cuál es la mejor evaluación funcional (¿tiene sentido hacer una ergometría, es preferible la cámara gama o no efectuar estudios?), si intentaremos corregir factores de riesgo y si agregaremos medicación preventiva con aspirina.
Surgen múltiples preguntas, en este caso de temas comunes. ¿Cómo podemos contestarlas?
Las preguntas de temas comunes están bien respondidas en libros de la especialidad y armadas en forma de sistemática. En el caso presentado, por ejemplo, las respuestas pueden hallarse en libros de evidencias en forma sencilla y en pocos minutos.
Resuelto el primer conflicto es conveniente aproximarse a la solidez de la evidencia en el tema. ¿Qué significa esto de la evidencia? Los españoles han propuesto traducir "Evidence Based Medicine" por Medicina Basada en Datos. Es más claro.
¿Cuáles son los datos publicados que fundamentan una decisión médica?
Una forma de efectuar un viaje introspectivo al tema de la evidencia y la necesidad de consulta es anotar a lo largo de una tarde las decisiones que tomamos en el consultorio y luego la fuente de la evidencia en la que nos fundamentamos.
Cuento un ejemplo: el Sr. J., coronario crónico, consulta por polaquiuria y disuria de aparición reciente. Sospechamos una infección urinaria, y a la par de solicitar un urocultivo, decidimos medicarlo con norfloxacina en una determinada dosis. ¿En qué evidencia fundamentamos la utilización de norfloxacina?
Debemos confesar como cardiólogos que en las consultas de pasillo con los amigos clínicos y charlas con el infectólogo. En el intento de mejorar la estructura de evidencia para la práctica consultamos el Epocrates QID (puede bajarse gratuitamente de www.epocrates.com), una base de datos para PC y dispositivos móviles, que tiene las recomendaciones en Estados Unidos y señala para tratamiento empírico la norfloxacina, ciprofloxacina, ofloxacina y la combinación trimetropima, sulfametoxazol en ese orden.
El paciente consulta además, dado que decidió hace un tiempo suspender la aspirina, si es importante continuarla. Allí recurrimos a Evidencias en Cardiología1, tenemos el metaanálisis y le recomendamos con total seguridad que le conviene continuar. Dice también Don José que leyó en el diario que hay una droga que ayuda a los que tienen el colesterol bueno bajo, lo cual ya le he explicado que él padece, aunque su colesterol total es normal. Y aquí tenemos un problema…
Decidimos buscar un trabajo para aclarar el tema.
Si nos disponemos a leer el tema en profundidad, podemos consultar a alguien que esté siguiendo el tema de cerca o buscar en Internet. Para acceder a Medline existen diversos medios gratuitos como Pubmed o Medscape, cuyas direcciones son: www.ncbi.nlm.nih.gov/PubMed y www.medscape.com.
Se coloca el tema en el campo de interés, y luego conviene establecer los llamados límites, es decir, no queremos toda la información sino sólo algo acotada a nuestra necesidad. Por ejemplo, queremos leer sólo ensayos clínicos (clinical trials) o revisiones (reviews, overviews, este segundo tomado como sinónimo de metaanálisis).
En algunos casos, para no leer el trabajo, podemos solicitar editoriales donde prestigiosos colegas revisan el tema y afirman la importancia del trabajo ahorrándonos el esfuerzo de la lectura pero también algunos de sus placeres como hacernos una idea propia del valor de la investigación. Es como leer las críticas de cine. Cuando encontramos un crítico que coincide con nuestro gusto es una gran ayuda, pero igual conviene ver la película aunque casi con la garantía que nos gustará o en el caso de los ensayos, que nos será útil.
Una vez que identificamos los ensayos clínicos que nos puedan interesar, clickeando sobre su nombre nos aparece el abstract.
Los invitaré a leer en conjunto cuatro abstracts elegidos al azar (no espero que me crean y hasta aconsejo lo contrario) para puntualizar en los aspectos prácticos del estudio, nomenclatura, temas estadísticos, y todo lo que pueda ser de utilidad para encuadrar la información del mismo.
N Engl J Med 2010 Sep 23;363:1597-1607. Transcatheter Aortic-Valve Implantation for Aortic Stenosis in Patients Who Cannot Undergo Surgery
Leon MB, Smith CR, Mack M, Craig Miller D, Moses JW, Svensson LG, Murat Tuzcu E, Webb JG, Fontana GP, Makkar RR, Brown DL, Block PC, Guyton RA, Pichard AD, M.D., Bavaria JE, Herrmann HC, Douglas PS, Petersen JL, Akin JJ, Anderson WN, Wang D, and Pocock S, for the PARTNER Trial Investigators*
Background
Many patients with severe aortic stenosis and coexisting conditions are not candidates for surgical replacement of the aortic valve. Recently, transcatheter aortic-valve implantation (TAVI) has been suggested as a less invasive treatment for high-risk patients with aortic stenosis.
Methods
We randomly assigned patients with severe aortic stenosis, whom surgeons considered not to be suitable candidates for surgery, to standard therapy (including balloon aortic valvuloplasty) or transfemoral transcatheter implantation of a balloon-expandable bovine pericardial valve. The primary end point was the rate of death from any cause.
Results
A total of 358 patients with aortic stenosis who were not considered to be suitable candidates for surgery underwent randomization at 21 centers (17 in the United States).
At 1 year, the rate of death from any cause (Kaplan–Meier analysis) was 30.7% with TAVI, as compared with 50.7% with standard therapy (hazard ratio with TAVI, 0.55; 95% confidence interval [CI], 0.40 to 0.74; P<0.001). The rate of the composite end point of death from any cause or repeat hospitalization was 42.5% with TAVI as compared with 71.6% with standard therapy (hazard ratio, 0.46; 95% CI, 0.35 to 0.59; P<0.001). Among survivors at 1 year, the rate of cardiac symptoms (New York Heart Association class III or IV) was lower among patients who had undergone TAVI than among those who had received standard therapy (25.2% vs. 58.0%, P<0.001). At 30 days,
TAVI, as compared with standard therapy, was associated with a higher incidence of major strokes (5.0% vs. 1.1%, P = 0.06) and major vascular complications (16.2% vs. 1.1%, P<0.001). In the year after TAVI, there was no deterioration in the functioning of the bioprosthetic valve, as assessed by evidence of stenosis or regurgitation on an echocardiogram.
Conclusions
In patients with severe aortic stenosis who were not suitable candidates for surgery, TAVI, as compared with standard therapy, significantly reduced the rates of death from any cause, the composite end point of death from any cause or repeat hospitalization, and cardiac symptoms, despite the higher incidence of major strokes and major vascular events. (Funded by Edwards Lifesciences; ClinicalTrials.gov number, NCT00530894.)
Comencemos a leer este trabajo juntos.
Existen múltiples artículos -e incluso libros- sobre el tema. Preferiré compartir con ustedes mi forma de lectura, para seguir un orden propio (o desorden creativo) que estimo funciona.
Tabla 1. Preguntas en un ensayo de intervención (orientado al lector apurado frente al abstract)
• Título: ¿es interesante?
• Conclusiones: ¿son relevantes? ¿Estudio positivo o negativo?
• Antecedentes (background): poniéndose a tono con el tema
• Material y métodos
• Estudio pequeño o grande
• Pragmático o fisiopatológico
• ¿Cómo se asignó el tratamiento?
• ¿Hay un grupo tratado y un grupo control?
Estudio Controlado o no controlado
• ¿Se distribuyó al azar (sorteo)?
Randomizado (aleatorizado)
• ¿Conocía los médicos y los pacientes lo que tomaban?
Abierto (ambos conocen), simple ciego, doble ciego
• Criterios de inclusión: ¿existen estos pacientes?
• Tratamiento: ¿es un tratamiento factible?
• Puntos finales: duros (indudables), blandos (opinables), combinados
• Resultados
Primero lo primero: el Titulo. El título expresa la pregunta que se ha planteado el trabajo o en otras instancias su principal hallazgo. Aquí han sido mesurados y simplemente enuncian: Implantación transcateter de válvula aórtica para estenosis aórtica en pacientes que no podían ser sometidos a cirugia. Lo primero, obviamente, es preguntarnos si el tema nos interesa.
En este caso, el título enuncia un problema muy importante en el manejo de aquellos pacientes sintomáticos por estenosis aórtica y que tienen contraindicaciones, debido a su alto riesgo, para realizar la cirugía de reemplazo valvular; ¿podría ser este método endovascular mejor que el tratamiento conservador?; único posible hasta ese momento.
Dada la importancia del tema podemos pasar a leer las conclusiones del abstract. Esto nos dirá si vale la pena leer todos los datos del mismo (si las conclusiones son interesantes) o simplemente saltearlo (si son imprecisas o muy negativas).
Estudio positivo o negativo
En este caso vemos que las conclusiones son claramente positivas, en el sentido que existió una reducción significativa del riesgo con este tratamiento endovascular (TAVI) en la muerte de cualquier causa y en el punto final combinado de muerte por cualquier causa u hospitalización repetida y también en los síntomas.
Nos disponemos entonces a leer el abstract con detenimiento y tratar de extraerle el mayor jugo posible. Ya sabemos que se trata de un estudio positivo (el resultado favoreció la hipótesis del estudio). Uno de los primeros problemas a considerar en los estudios positivos es si el estudio es grande o pequeño.
Estudio grande o pequeño
El número de pacientes es crucial para interpretar el resultado.
Si el estudio es pequeño y el resultado es positivo, esto debe ser considerado sólo como una nueva hipótesis para ser desarrollada en el futuro.
Existe la posibilidad de que sea un falso positivo. ¿Por qué?
Siempre debemos pensar que existen muchos grupos interrogando el mismo problema en sus respectivas instituciones, y que sólo continúan los estudios o los publican aquellos cuyo resultado es favorable. Si comenzamos a investigar un tema en nuestra institución y en los primeros 80 pacientes vemos que no nos va bien, lo habitual es que pasemos a otra línea y los datos queden en el cajón. Si nos va muy bien, continuaremos hasta digamos 200 pacientes y, si alcanzamos significación, intentaremos y lograremos publicarlo.
¿Por qué se publican estudios positivos pequeños si sus resultados no son totalmente confiables?
Porque las revistas prefieren buenas a malas noticias científicas, y porque un hallazgo siempre es válido aunque sea por azar, mientras que la falta de hallazgo puede sugerir que el método es inadecuado. Esto es lo que se denomina Sesgo de Publicación (siempre aparecerán publicados más estudios pequeños positivos que negativos).
Los años siguientes confirman la positividad o lamentablemente en la mayoría de los casos la descartarán cuando se intentan confirmar los resultados inicialmente positivos en estudios grandes. Un ejemplo son los numerosos trombolíticos que superan a la tPA en estudios chicos fisiopatológicos, mejoran la permeabilidad angiográfica, y cuando se ensayan en miles de pacientes son iguales o inferiores.
La primera recomendación en ensayos pragmáticos que enfoquen una enfermedad común (hipertensión, diabetes, gripe) es que sólo se considere importante para la práctica cuando el número de pacientes es numeroso, algunos miles.
Se denominan ensayos pragmáticos: Lo opuesto de pragmático sería un estudio exploratorio o fisiopatológico: |
Apliquemos estos conceptos al estudio que estamos leyendo.
Parecería un estudio pequeño porque solamente incluyó a 358 pacientes, pero antes de afirmar esto debemos conocer si la posibilidad de los eventos es muy numerosa, en ese caso la capacidad para encontrar una diferencia establecida prospectivamente puede resultar adecuada.
Nuestros pacientes eran de muy alto riesgo quirúrgico y, en el seguimiento a uno o dos años, habían asumido como mínimo una mortalidad de 37,5% en el grupo de tratamiento estándar (que incluía la realización de valvuloplastía aórtica con balón a discreción del médico tratante) y para demostrar la reducción de la mortalidad en un tercio (25% en el grupo TAVI), tenían un poder de al menos 85% reclutando 350 pacientes.
Así aprendimos que el número per se puede ser engañoso, ya que para este objetivo podemos decir que este era un estudio de “dimensiones adecuadas” (los que se consideran de “grandes dimensiones” para eventos mucho menos frecuentes) y de ninguna manera un estudio de “pequeñas dimensiones”.
Es, por supuesto, un estudio randomizado (asignación aleatoria al grupo de pertenencia) y controlado con un grupo paralelo de tratamiento estándar (controlado implica en ensayos clínicos que se compara el tratamiento con un grupo control, que puede recibir placebo, otro tratamiento o en ocasiones nada más que el tratamiento que se considera estándar en ese momento; lo contrario sería un estudio no controlado, por ejemplo una serie de casos consecutivos operados con TAVI en los que se relata resultados y complicaciones).
Se trata entonces de un estudio pragmático, cuyo resultado no es una variación fisiopatológica sino un efecto clínico de importancia pragmática como la mortalidad. Esto aumenta el interés porque puede significar un aporte inmediato para nuestros pacientes.
Por supuesto no puede ser un estudio doble ciego (donde ni el paciente ni el médico conocen el tratamiento que se administra), porque tanto el médico como el paciente conocen si se le realizó el procedimiento. Pero los eventos adversos serios, entre los que estaban los puntos finales, fueron adjudicados por un “Comité independiente de eventos clínicos”, que no tenían conexión con el paciente
Selección de los pacientes
Aquí llegamos a uno de los puntos críticos, la selección de pacientes. Es muy importante que consideremos si los pacientes elegidos se parecen a los que puedan estar bajo nuestra atención. En este caso, además de conocer si el grado de severidad de la estenosis aórtica de los pacientes incluidos se parece al paciente que tenemos ante nosotros, también es muy importante reconocer muy bien cuales eran las condiciones que los hacían decir que no eran pacientes aptos para el reemplazo quirúrgico valvular.
En el estudio definían a la estenosis aórtica severa como un área aórtica valvular de <0,8 cm2, un gradiente valvular medio de > 40 mm Hg, o una velocidad del pico aórtico > 4,0 m por segundo; con CF (NYHA) II, III o IV.
Definiendo a los que no se consideraban adecuados para cirugía como aquellos que presentaban condiciones coexistentes que estarían asociadas con una probabilidad predicha de 50% o mayor a 30 días ya sea de muerte o condición irreversible seria. En este ECR por lo menos 2 cirujanos investigadores tenían que estar de acuerdo en que el paciente no era adecuado para cirugía. (Figura 1)
Pero además de los pacientes que incluyeron; ¿a que pacientes excluyeron?
Para ellos vemos que los “criterios de exclusión” se referían a los pacientes con válvula aórtica no calcificada o bicúspide, infarto agudo de miocardio, enfermedad coronaria sustancial que requiera revascularización, una fracción de eyección <20%, un diámetro del anillo aórtico de <18 mm o >25 mm, insuficiencia severa (>3+) mitral o aórtica, un ataque isquémico transitorio (AIT) o accidente cerebro-vascular (ACV) dentro de los 6 meses previos e insuficiencia renal severa. (Figura 2)
Después de conocer los criterios de inclusión y exclusión nos sigue resultado difícil reconocer a quiénes llamaban "pacientes no adecuados para cirugía". Para ello podríamos mirar las tablas que nos indican como estaban constituidos en la realidad el grupo TAVI y Control para reconocer en los hechos que llamaban inoperables.
Figura 1
Figura 2
Nos damos cuenta que eran, como deberían serlos, ancianos de avanzada edad con una media mayor a 83 años (o sea que aproximadamente la mitad de ellos tenían más de 83 años), las mujeres eran ligeramente mayores que los hombres. El 93% tenían CF III o IV y más de dos tercios padecían enfermedad coronaria con 70% que ya habían realizado cirugía o angioplastía coronaria, y aquí comienzan a verse los datos cruciales, la mitad tenían enfermedad pulmonar obstructiva crónica (EPOC) y hasta el 25% estaban eran dependientes del suministro continuo de oxígeno. (Tabla 1)
Tabla 1
Y proseguimos... Más del 40% presentaban hipertensión pulmonar y fibrilación auricular, y 20% o más ya tenían un marcapasos cardíaco permanente. Otras comorbilidades severas fueron en un 15% deformidad o efecto deletéreo de la irradiación de la pared torácica, entre un 11% a 19% aorta en porcelana (aorta extensamente calcificada) y fragilidad (determinado por los cirujanos de acuerdo a criterios específicos) de un 18% a 28%. (Tabla 2)
¿Estas características de la población son los criterios de no operabilidad que utilizaron en acuerdo los 2 cirujanos?
Por suerte tenemos la posibilidad de reconocerlo si comparamos a los pacientes a los que se les realizó TAVI con aquellos otros a los que también se les realizo TAVI, pero en el estudio PARTNER A, en el que se los comparó con pacientes operados de reemplazo aórtico (y por lo tanto no se los consideraban no adecuados para cirugía).
Si bien aumenta algo -de dos tercios a tres cuartos- le enfermedad vascular y su revascularización en el grupo con TAVI operables, lo más importante es que al compararlos nos damos cuenta que más del 60% del criterio por el cual los pacientes no eran adecuados para cirugía de reemplazo valvular se debía a la presencia de comorbilidades serias, como la EPOC dependiente de oxígeno, la deformidad o efecto deletéreo de la irradiación de la pared torácica y la aorta en porcelana. (Tabla 3)
Tabla 2
Tabla 3
¿Cuáles fueron los puntos finales?
En inglés se expresa como "primary end-points" (a veces como "primary study outcome"), es el llamado resultado principal, con el cual se calcula el número de la muestra. El punto final fue la frecuencia de muerte por cualquier causa durante la duración del ensayo clínico, pero en este caso también se utilizó como punto final coprimario (“coprimary end point”) la combinación de muerte por cualquier causa u hospitalización repetida (después del procedimiento).
Los puntos finales secundarios pre-especificados incluyeron la muerte de causa cardiovascular, clase Funcional (NYHA), hospitalización repetida debido a deterioro clínico relacionado con la válvula o el procedimiento, la distancia cubierta en la caminata de 6 minutos, evaluación del rendimiento de la válvula (por ecocardiografía) y la frecuencia de IAM, ACV, IRA, complicaciones vasculares y sangrado.
Conviene una digresión sobre el tema de los puntos finales. El punto final más duro es mortalidad de cualquier causa como se utilizó aquí (todos los especialistas están de acuerdo con el criterio de diagnóstico); es en general fácil de averiguar en el seguimiento aunque sea telefónico o a través de información del registro civil, y es incuestionable. Sin embargo, el punto final secundario de muerte de causa cardiovascular es más subjetivo y depende de lo que cada cual considera que es muerte cardiovascular.
El tamaño de la muestra (número de pacientes a incluir en el estudio) está en relación con dos aspectos fundamentales: la prevalencia del evento que se quiere disminuir (a mayor prevalencia más posibilidad de demostrar una reducción como en este estudio) y a la reducción esperada. Se requiere mucho menos número cuando se espera bajar el evento un 30% (en este estudio 33%) que sólo un 20%.
Si esperamos una reducción del 20-30% en eventos, moderada pero la habitual con las intervenciones actuales, generalmente necesitamos miles de pacientes cuando la prevalencia del evento es relativamente baja.
En la tabla 4 se observa como con una prevalencia de eventos del 30% en el grupo control, el número de pacientes es muy grande (más de 7000 pacientes) cuando el efecto beneficioso esperado es de solo el 10%, y sería chico (150 pacientes) si tuviéramos la expectativa de que la medicación reduzca un 66% el riesgo (poco común en ensayos clínicos: sería revolucionario).
En este ensayo clínico randomizado en pacientes inoperables (TAVI versus Control) se planificó una reducción de 33% (37,5 versus 25%) y solo se necesitaban 350 pacientes. Si la prevalencia de eventos fuera menor, del 20%, para similares porcentajes de reducción requeriríamos muchos más pacientes, 12000 y 230 respectivamente.
Cuando se selecciona un punto final combinado se busca aumentar la tasa de eventos esperada con lo cual necesitaría incluir un número menor de pacientes que si hubieran elegido como punto final un punto final único.
Tabla 4. Número de pacientes a incluir en un estudio para que tenga valor estadístico. (Se asume que se considerará una p < 0,05 y en un diseño clásico).
¿Es válido el punto final de mortalidad por una causa específica y no mortalidad general (de cualquier causa)?
Este es un tema muy dificultoso, dado que si consideramos un paciente que fallece en el seguimiento y tenemos información telefónica: ¿cómo podríamos estar seguros si su muerte ha sido o no debido a la valvulopatía?
Por ejemplo, el paciente cursaba una neumopatía, acentuó su disnea y falleció. Su valvulopatía influyó en la muerte (la disnea puede haberse agravado debido a su valvulopatía que generó insuficiencia cardíaca, etc.) o no tiene nada que ver con su valvulopatía (producto puramente de la infección).Aún en terapia intensiva nos cuesta con frecuencia distinguir el mecanismo predominante.
El segundo problema es confirmar el diagnóstico de AIT en forma retrospectiva. Siempre que aparece un punto final de estas características tenemos que ir al trabajo (“full paper” = publicación completa) para ver qué efecto tuvo sobre la mortalidad global, lo que nos ayuda a resignificar el resultado.
Hay un editorial clásico titulado Death is Death3 , apoyando la idea de jerarquizar la mortalidad general sobre cualquier otra lectura de causa de muerte. Aceptamos el punto final combinado como válido si en los resultados están incluidos los efectos beneficiosos sobre la mortalidad global y otros datos que nos permitan jerarquizarlos.
¿Cuánto tiempo fueron observados los pacientes?
El período de seguimiento es muy importante, y aquí el período mínimo fue establecido en 1 año.
Con estos elementos que hemos presentado hasta aquí, tenemos un panorama inicial de cómo leer un ensayo clínico y comprender mejor la literatura médica que se nos presenta habitualmente.
Referencias
1.Doval H, Tajer C y col. Evidencias en Cardiología. Editorial GEDIC. 2010.
2.Greenhalgh T. How to read a papel. Editorial BMJ. 2000.
3.Gottlieb S. Dead is dead - artificial definitions are no sustitute. Lancet 1997;349:662-663
*IntraMed agradece este artículo al equipo docente del
Curso de formación de investigadores clínicos La Investigación en la Práctica Médica (GEDIC).
Dr. Hernán C. Doval / Dr. Carlos D. Tajer Cuerpo Docente: Dr. Juan Gagliardi / Dr. Javier Mariani / Dr. Maximiliano de Abreu.