Niveles de evidencia de los estudios sobre el tratamiento del cáncer en adultos y niños (PDQ®)–Versión para profesionales de salud

Introducción

En los estudios clínicos del ámbito de la oncología es posible medir y notificar una variedad de criterios de valoración o evaluación. Esos criterios abarcan, entre otros, la mortalidad total (o supervivencia desde el inicio del tratamiento), la mortalidad por causa específica y la calidad de vida. Además, se pueden usar criterios indirectos de valoración como la supervivencia sin complicaciones, la supervivencia sin enfermedad y la tasa de respuesta tumoral. En ocasiones, los criterios de valoración se definen según cada uno de los diseños de estudios de solidez variable, desde el diseño de referencia —el ensayo clínico controlado aleatorizado con enmascaramiento doble— hasta las experiencias publicadas como series de casos de pacientes no consecutivos.

Los consejos editoriales del PDQ emplean un sistema de clasificación oficial de niveles de evidencia científica o grados de comprobación científica para ayudar al lector a juzgar la solidez de la evidencia vinculada con los resultados notificados de una estrategia terapéutica. Los resultados de cada tipo de tratamiento se clasifican usando las dos escalas descritas a continuación: 1) solidez del diseño del estudio y 2) solidez de los criterios de valoración del estudio. En conjunto, estas dos escalas de clasificación proporcionan una medida general del nivel de evidencia científica. Según la perspectiva, diferentes grupos de expertos, organizaciones profesionales o profesionales de la medicina en su práctica individual pueden emplear diferentes valores límite para la solidez general de la evidencia en el momento de formular directrices terapéuticas o al decidir las intervenciones para pacientes. Sin embargo, una descripción oficial del nivel de evidencia científica proporciona un marco uniforme para el análisis de datos que conducen a recomendaciones específicas.

Cuando es pertinente, el Consejo editorial del PDQ sobre el tratamiento para adultos y el Consejo editorial del PDQ sobre el tratamiento pediátrico añaden la información sobre los niveles de evidencia, descritos en este documento, a los resúmenes del PDQ sobre el tratamiento del cáncer en adultos y tratamiento del cáncer en niños.

Solidez del diseño del estudio

A continuación, se describen diferentes tipos de diseños de estudio en orden descendente de solidez:

Ensayos clínicos controlados aleatorizados.
El ensayo clínico controlado aleatorizado (ECA) y con enmascaramiento doble es el diseño de referencia de todos los estudios. Para que un estudio cumpla con los criterios de un ECA con enmascaramiento doble, la asignación se debe mantener oculta ante el equipo de investigación, antes y después de la aleatorización y de la asignación del tratamiento. Este diseño previene sesgos de asignación por parte del equipo investigador y sesgos durante la evaluación de los resultados por parte de investigadores o pacientes. Desafortunadamente, en la mayoría de los ensayos clínicos en oncología no es posible mantener el diseño de enmascaramiento doble después de la asignación del tratamiento porque los procedimientos o los efectos tóxicos suelen diferir mucho entre los grupos del estudio, de manera que la asignación es obvia para el equipo de profesionales de atención de la salud y los participantes del estudio.
Metanálisis de ensayos clínicos controlados aleatorizados.
Los metanálisis de estudios aleatorizados ofrecen una síntesis cuantitativa de estudios realizados en el pasado. La solidez de la evidencia de un metanálisis se basa en la calidad de cada uno de los estudios individuales. Por otra parte, los metanálisis a veces amplifican errores sistemáticos pequeños de los estudios individuales. En un estudio en el que se compararon los resultados individuales de ensayos aleatorizados grandes y los resultados de un metanálisis de ensayos más pequeños publicados antes sobre el mismo tema, solo se observó un grado de acuerdo razonable (estadístico κ, 0,35). El metanálisis no logró predecir de manera exacta los resultados de los ECA individuales en el 35 % de los casos.[1,2] Además, es posible que se obtengan conclusiones contradictorias cuando diferentes equipos de investigación llevan a cabo metanálisis independientes sobre el mismo tema.[2] En consecuencia, los metanálisis de estudios aleatorizados se ubican en la misma categoría o en una categoría inferior a la de los estudios aleatorizados; nunca se consideran superiores a los ECA.
Ensayos clínicos controlados no aleatorizados.
Esta categoría abarca ensayos dónde la asignación del tratamiento fue prospectiva pero no aleatorizada. El equipo de investigación conoce la asignación antes de obtener el consentimiento informado de cada participante. En estas circunstancias, es posible que la asignación del tratamiento no sea equilibrada. Los análisis de subconjuntos o subgrupos de participantes de ensayos aleatorizados a menudo se clasifican en este mismo nivel de evidencia.

Los análisis de subconjuntos de estudios aleatorizados están sujetos a errores inherentes a la multiplicidad (es decir, se esperan resultados estadísticamente significativos debido a la variación aleatoria de los efectos medidos en varios subconjuntos). En consecuencia, el análisis de subconjuntos no tiene la misma solidez de la evidencia que el análisis general de un ensayo aleatorizado según el diseño original, a menos que las hipótesis prospectivas para el subconjunto analizado se hayan formulado de manera explícita desde el comienzo en el diseño original. De no ser así, el análisis de subconjuntos se debe ubicar en el siguiente nivel descendente de diseños de estudios, es decir, con los ensayos clínicos controlados no aleatorizados.
Series de casos y otros diseños de estudios observacionales.
Este tipo de experiencias clínicas corresponden al diseño de estudio más débil, pero en muchas ocasiones son el único tipo de información disponible o que se puede obtener para respaldar determinada estrategia terapéutica. Esto ocurre por ejemplo para enfermedades raras o cuando el tratamiento se desarrolló antes de que se generalizara el uso del diseño de estudios aleatorizados en la práctica médica. También es posible que las series de casos o los diseños observacionales sean los únicos diseños prácticos cuando las intervenciones de tratamiento de diferentes grupos de estudio son radicalmente diferentes (por ejemplo, amputación vs. cirugía con conservación de un miembro). Aun así, estos diseños siempre plantean problemas de selección de pacientes y comparabilidad con otras poblaciones. Según el grado de generalización a otras poblaciones, los diseños de estudios se clasifican en orden descendente de la siguiente manera: estudios poblacionales (o basados en población) con población definida, series de casos consecutivos no poblacionales y series de casos no consecutivos. Algunos diseños de estudios (por ejemplo, estudios de cohorte y de casos y controles) incluyen grupos de participantes de control interno, mientras que otros diseños no incluyen este tipo de controles (por ejemplo, series de solo casos sin grupo de comparación interna o series de solo casos que se comparan con controles históricos).

Incluso los grandes estudios observacionales poblacionales con controles internos en los que se comparan estrategias terapéuticas en oncología se deben interpretar con mucho cuidado. En un estudio donde se hizo una comparación directa de resultados observacionales y resultados de ECA, los investigadores realizaron una búsqueda sistemática en MEDLINE para identificar estudios observacionales publicados entre 2000 y 2016 usando datos del Surveillance, Epidemiology, and End Results (SEER) Program, el SEER-Medicare o la National Cancer Database en los que se compararon regímenes terapéuticos para cualquier diagnóstico de cáncer.[3] El equipo investigador emparejó 350 comparaciones de tratamientos con 121 ECA sobre la misma comparación de tratamientos. No se encontró una correlación significativa entre los cocientes de riesgos instantáneos (CRI) de los estudios observacionales y los ECA emparejados (coeficiente de correlación de concordancia, 0,08; intervalo de confianza [IC] 95 %, -0,07 a 0,23). Solo el 40 % de los estudios emparejados concordaron en cuanto a los efectos del tratamiento (κ, 0,037), y solo el 62 % de los CRI de los estudios observacionales se ubicaron dentro del IC 95 % del ensayo aleatorizado con el que estaban emparejados. Ninguna de las correlaciones superó el resultado esperado según el azar, y las correlaciones no mejoraron en los estudios que usaron los métodos más sofisticados para el análisis estadístico, como la ponderación del índice de propensión, el ajuste de variables instrumentales o el análisis de sensibilidad. Cabe destacar que, de 70 estudios observaciones cuyo método fue clasificado como riguroso y en los que se notificó la supervivencia general, 35 notificaron resultados positivos, mientras que en el ECA correspondiente no se notificó diferencia o se observó un efecto en la dirección opuesta.

Bibliografía

LeLorier J, Grégoire G, Benhaddad A, et al.: Discrepancies between meta-analyses and subsequent large randomized, controlled trials. N Engl J Med 337 (8): 536-42, 1997. [PUBMED Abstract]
Bailar JC: The promise and problems of meta-analysis. N Engl J Med 337 (8): 559-61, 1997. [PUBMED Abstract]
Soni PD, Hartman HE, Dess RT, et al.: Comparison of Population-Based Observational Studies With Randomized Trials in Oncology. J Clin Oncol 37 (14): 1209-1216, 2019. [PUBMED Abstract]

Solidez de los criterios de valoración

Los criterios de valoración que suelen usarse en los estudios de tratamiento del cáncer en adultos y niños se enumeran a continuación en orden descendente de solidez:

Supervivencia general, también llamada sobrevida global, durante un periodo definido (o mortalidad total).
Este resultado es probablemente el más importante para los pacientes, además es el que se define de manera más fácil y está menos sujeto al sesgo del investigador.
Mortalidad por causa específica (o mortalidad por causa específica durante un periodo definido).
Aunque este resultado es de suma importancia biológica para una intervención dirigida a una enfermedad específica, es un criterio de valoración más subjetivo que la mortalidad total y su determinación está más sujeta al sesgo del investigador. Este criterio de valoración también puede pasar por alto efectos importantes del tratamiento que quizá en realidad acorten la supervivencia general.
Evaluación minuciosa de la calidad de vida.
Este es un criterio de valoración muy importante para los pacientes. La documentación cuidadosa de este criterio de valoración en el marco de un diseño de estudio sólido es, en consecuencia, suficiente para que la mayoría de profesionales de la medicina incorporen un tratamiento nuevo en su práctica médica.
Criterios indirectos de valoración.
- Supervivencia sin complicaciones.
- Supervivencia sin recaída.
- Supervivencia sin enfermedad.
- Supervivencia sin progresión.
- Tasa de respuesta tumoral.
Es posible que estos criterios de valoración estén sujetos a la interpretación del equipo investigador. Pero además, no siempre se traducen de manera automática en un beneficio directo para un paciente en términos de supervivencia o calidad de vida. A pesar de ello, en muchas circunstancias tiene sentido usar un tratamiento que mejore estos criterios indirectos de valoración mientras se aguarda un criterio de valoración más definitivo que apoye el uso de dicho tratamiento.

Síntesis de los niveles de evidencia

Después de considerar la solidez del diseño del estudio y la solidez de los criterios de valoración del estudio, en los resúmenes del PDQ sobre tratamiento del cáncer en adultos y tratamiento del cáncer en niños, se usan los siguientes niveles de evidencia:

Evidencia A1. Ensayo clínico controlado aleatorizado (ECA), con enmascaramiento doble o sin enmascaramiento, en el que se usa como un criterio de valoración la supervivencia general (SG) durante un periodo definido, la mortalidad total o la mortalidad por causa específica.
Evidencia A2. Metanálisis de ECA en el que se usa como un criterio de valoración la SG durante un periodo definido, la mortalidad total o la mortalidad por causa específica.
Evidencia A3. ECA (con enmascaramiento doble o sin enmascaramiento) en el que se usa como un criterio de valoración la calidad de vida de importancia clínica que se recabó de manera adecuada y se evaluó minuciosamente.
Evidencia B1. ECA (con enmascaramiento doble o sin enmascaramiento) en el que se usa como un criterio de valoración las diferencias en la supervivencia sin complicaciones (SSC), la supervivencia sin recaída (SSR), la supervivencia sin enfermedad (SSE) o la supervivencia sin progresión (SSP).
Evidencia B2. Metanálisis de ECA en el que se usa como un criterio de valoración la SSC, la SSE, la SSP o la evaluación minuciosa de la calidad de vida.
Evidencia B3. ECA (con enmascaramiento doble o sin enmascaramiento) en el que se usa como un criterio de valoración la tasa de respuesta tumoral o la medición de la calidad de vida que no alcanza el nivel de evidencia descrito en A3.
Evidencia B4. Ensayo clínico controlado no aleatorizado prospectivo multicéntrico en el que se hace una comparación planificada de la eficacia e incluye un criterio de valoración de SG durante un periodo definido, mortalidad total, mortalidad por causa específica, evaluación minuciosa de la calidad de vida o diferencia en la SSC, la SSE, la SSP o la respuesta tumoral.
Evidencia C1. Serie de casos u otro diseño de estudio observacional, incluso ensayos de casos no consecutivos, en el que se usa como un criterio de valoración la SG durante un periodo definido, la mortalidad total, la mortalidad por causa específica o la evaluación minuciosa de la calidad de vida.
Evidencia C2. Serie de casos u otro diseño de estudio observacional, incluso ensayos de casos no consecutivos, en el que se usa como un criterio de valoración las diferencias en la SSC, la SSR, la SSE o la SSP.
Evidencia C3. Serie de casos u otro diseño de estudio observacional, incluso ensayos de casos no consecutivos, en el que se usa como un criterio de valoración la tasa de respuesta tumoral o la medición de la calidad de vida que no alcanza el nivel de evidencia descrito en A3.
Evidencia D. Casos esporádicos y opiniones de expertos.

Conclusión

Además del nivel de evidencia científica, todas las recomendaciones deben tomar en cuenta otros aspectos que no pueden ser cuantificados tan fácilmente, como la toxicidad, la amplitud del intervalo de confianza de las observaciones, el tamaño del ensayo, la garantía de la calidad del ensayo y el costo. Pese a todo ello, el sistema de clasificación del PDQ proporciona una categorización de la solidez de la evidencia que sirve como punto de partida para analizar los resultados de los estudios.

Actualizaciones más recientes a este resumen (10/04/2023)

Los resúmenes del PDQ con información sobre el cáncer se revisan con regularidad y se actualizan a medida que se obtiene nueva información. Esta sección describe los cambios más recientes introducidos en este resumen a partir de la fecha arriba indicada.

Solidez de los criterios de valoración

Se añadió texto para indicar que la supervivencia sin recaída es un criterio de valoración que se mide con frecuencia en los estudios de tratamiento del cáncer en adultos y niños.

Síntesis de los niveles de evidencia

Se revisó el texto para definir la evidencia B1 como un ensayo controlado aleatorizado en el que se usa como un criterio de valoración las diferencias en la supervivencia sin complicaciones (SSC), la supervivencia sin recaída (SSR), la supervivencia sin enfermedad (SSE) o la supervivencia sin progresión (SSP). También se revisó el texto para definir la evidencia C2 como una serie de casos u otro diseño de estudio observacional, incluso ensayos de casos no consecutivos, en el que se usa como un criterio de valoración las diferencias en la SSC, la SSR, la SSE o la SSP.

El Consejo editorial del PDQ sobre el tratamiento para adultos es responsable de la redacción y actualización de este resumen y mantiene independencia editorial respecto del NCI. El resumen refleja una revisión independiente de la bibliografía médica y no representa las políticas del NCI ni de los NIH. Para obtener más información sobre las políticas relativas a los resúmenes y la función de los consejos editoriales del PDQ responsables de su actualización, consultar Información sobre este resumen del PDQ e Información del PDQ® sobre el cáncer dirigida a profesionales de la salud.

Información sobre este resumen del PDQ

Propósito de este resumen

Este resumen de información del PDQ sobre el cáncer dirigido a profesionales de la salud proporciona información integral revisada por expertos y basada en la evidencia sobre el sistema de clasificación oficial que utilizan los Consejos editoriales del PDQ para evaluar la evidencia científica que respalda el uso de intervenciones o abordajes específicos. El objetivo es servir como fuente de información y ayuda para los profesionales clínicos durante la atención de pacientes. No ofrece pautas ni recomendaciones formales para tomar decisiones relacionadas con la atención sanitaria.

Revisores y actualizaciones

El consejo editorial del PDQ sobre el tratamiento para adultos, que mantiene independencia editorial respecto del Instituto Nacional del Cáncer (NCI), revisa este resumen de manera periódica y, en caso necesario, lo actualiza. Este resumen es el resultado de una revisión bibliográfica independiente y no constituye una declaración de política del NCI ni de los Institutos Nacionales de la Salud (NIH).

Cada mes, los integrantes de este consejo revisan los artículos publicados recientemente para determinar lo siguiente:

Si el artículo se debe analizar en una reunión del consejo.
Si conviene añadir texto acerca del artículo.
Si se debe reemplazar o actualizar un artículo que ya se citó.

Los cambios en los resúmenes se deciden mediante consenso de los integrantes del consejo después de evaluar la solidez de la evidencia de los artículos publicados y determinar la forma de incorporar el artículo en el resumen.

Cualquier comentario o pregunta sobre el contenido de este resumen se debe enviar al Servicio de Información de Cáncer del Instituto Nacional del Cáncer. Por favor, no enviar preguntas o comentarios directamente a los integrantes del consejo, ya que no responderán consultas de manera individual.

Niveles de evidencia

Algunas de las referencias bibliográficas de este resumen se acompañan del nivel de evidencia. El propósito de esto es ayudar al lector a evaluar la solidez de la evidencia que respalda el uso de ciertas intervenciones o abordajes. El consejo editorial del PDQ sobre el tratamiento para adultos emplea un sistema de jerarquización formal para asignar los niveles de evidencia científica.

Permisos para el uso de este resumen

PDQ (Physician Data Query) es una marca registrada. Se autoriza el uso del texto de los documentos del PDQ; sin embargo, no se podrá identificar como un resumen de información sobre cáncer del PDQ del NCI, salvo que el resumen se reproduzca en su totalidad y se actualice de manera periódica. Por otra parte, se permitirá que un autor escriba una oración como “En el resumen del PDQ del NCI de información sobre la prevención del cáncer de mama se describen, de manera concisa, los siguientes riesgos: [incluir fragmento del resumen]”.

Se sugiere citar la referencia bibliográfica de este resumen del PDQ de la siguiente forma:

PDQ® sobre el tratamiento para adultos. PDQ Niveles de evidencia de los estudios sobre el tratamiento del cáncer en adultos y niños. Bethesda, MD: National Cancer Institute. Actualización: <MM/DD/YYYY>. Disponible en: https://www.cancer.gov/espanol/publicaciones/pdq/niveles-de-evidencia/tratamiento. Fecha de acceso: <MM/DD/YYYY>.

Las imágenes en este resumen se reproducen con autorización del autor, el artista o la editorial para uso exclusivo en los resúmenes del PDQ. La utilización de las imágenes fuera del PDQ requiere la autorización del propietario, que el Instituto Nacional del Cáncer no puede otorgar. Para obtener más información sobre el uso de las ilustraciones de este resumen o de otras imágenes relacionadas con el cáncer, consultar Visuals Online, una colección de más de 2000 imágenes científicas.

Cláusula sobre el descargo de responsabilidad

Según la solidez de la evidencia, las opciones de tratamiento se clasifican como “estándar” o “en evaluación clínica”. Estas clasificaciones no se deben utilizar para justificar decisiones sobre reembolsos de seguros. Para obtener más información sobre la cobertura de seguros, consultar la página Manejo de la atención del cáncer en Cancer.gov/espanol.

Comuníquese con el Instituto Nacional del Cáncer

Para obtener más información sobre las opciones para comunicarse con el NCI, incluso la dirección de correo electrónico, el número telefónico o el chat, consultar la página del Servicio de Información de Cáncer del Instituto Nacional del Cáncer.