Pasar al contenido principal

Niveles de evidencia de los estudios sobre el tratamiento del cáncer en adultos y niños (PDQ®)–Versión para profesionales de salud

Introducción

En los estudios clínicos del ámbito de la oncología es posible medir y notificar una variedad de criterios de valoración o evaluación. Esos criterios abarcan, entre otros, la mortalidad total (o supervivencia desde el inicio del tratamiento), la mortalidad por causa específica y la calidad de vida. Además, se pueden usar criterios indirectos de valoración como la supervivencia sin complicaciones, la supervivencia sin enfermedad y la tasa de respuesta tumoral. En ocasiones, los criterios de valoración se definen según cada uno de los diseños de estudios de solidez variable, desde el diseño de referencia —el ensayo clínico controlado aleatorizado con enmascaramiento doble— hasta las experiencias publicadas como series de casos de pacientes no consecutivos.

Los consejos editoriales del PDQ emplean un sistema de clasificación oficial de niveles de evidencia científica o grados de comprobación científica para ayudar al lector a juzgar la solidez de la evidencia vinculada con los resultados notificados de una estrategia terapéutica. Los resultados de cada tipo de tratamiento se clasifican usando las dos escalas descritas a continuación: 1) solidez del diseño del estudio y 2) solidez de los criterios de valoración del estudio. En conjunto, estas dos escalas de clasificación proporcionan una medida general del nivel de evidencia científica. Según la perspectiva, diferentes grupos de expertos, organizaciones profesionales o profesionales de la medicina en su práctica individual pueden emplear diferentes valores límite para la solidez general de la evidencia en el momento de formular directrices terapéuticas o al decidir las intervenciones para pacientes. Sin embargo, una descripción oficial del nivel de evidencia científica proporciona un marco uniforme para el análisis de datos que conducen a recomendaciones específicas.

Cuando es pertinente, el Consejo editorial del PDQ sobre el tratamiento para adultos y el Consejo editorial del PDQ sobre el tratamiento pediátrico añaden la información sobre los niveles de evidencia, descritos en este documento, a los resúmenes del PDQ sobre el tratamiento del cáncer en adultos y tratamiento del cáncer en niños.

Solidez del diseño del estudio

A continuación, se describen diferentes tipos de diseños de estudio en orden descendente de solidez:

  1. Ensayos clínicos controlados aleatorizados.

    El ensayo clínico controlado aleatorizado (ECA) y con enmascaramiento doble es el diseño de referencia de todos los estudios. Para que un estudio cumpla con los criterios de un ECA con enmascaramiento doble, la asignación se debe mantener oculta ante el equipo de investigación, antes y después de la aleatorización y de la asignación del tratamiento. Este diseño previene sesgos de asignación por parte del equipo investigador y sesgos durante la evaluación de los resultados por parte de investigadores o pacientes. Desafortunadamente, en la mayoría de los ensayos clínicos en oncología no es posible mantener el diseño de enmascaramiento doble después de la asignación del tratamiento porque los procedimientos o los efectos tóxicos suelen diferir mucho entre los grupos del estudio, de manera que la asignación es obvia para el equipo de profesionales de atención de la salud y los participantes del estudio.

  2. Metanálisis de ensayos clínicos controlados aleatorizados.

    Los metanálisis de estudios aleatorizados ofrecen una síntesis cuantitativa de estudios realizados en el pasado. La solidez de la evidencia de un metanálisis se basa en la calidad de cada uno de los estudios individuales. Por otra parte, los metanálisis a veces amplifican errores sistemáticos pequeños de los estudios individuales. En un estudio en el que se compararon los resultados individuales de ensayos aleatorizados grandes y los resultados de un metanálisis de ensayos más pequeños publicados antes sobre el mismo tema, solo se observó un grado de acuerdo razonable (estadístico κ, 0,35). El metanálisis no logró predecir de manera exacta los resultados de los ECA individuales en el 35 % de los casos.[1,2] Además, es posible que se obtengan conclusiones contradictorias cuando diferentes equipos de investigación llevan a cabo metanálisis independientes sobre el mismo tema.[2] En consecuencia, los metanálisis de estudios aleatorizados se ubican en la misma categoría o en una categoría inferior a la de los estudios aleatorizados; nunca se consideran superiores a los ECA.

  3. Ensayos clínicos controlados no aleatorizados.

    Esta categoría abarca ensayos dónde la asignación del tratamiento fue prospectiva pero no aleatorizada. El equipo de investigación conoce la asignación antes de obtener el consentimiento informado de cada participante. En estas circunstancias, es posible que la asignación del tratamiento no sea equilibrada. Los análisis de subconjuntos o subgrupos de participantes de ensayos aleatorizados a menudo se clasifican en este mismo nivel de evidencia.

    Los análisis de subconjuntos de estudios aleatorizados están sujetos a errores inherentes a la multiplicidad (es decir, se esperan resultados estadísticamente significativos debido a la variación aleatoria de los efectos medidos en varios subconjuntos). En consecuencia, el análisis de subconjuntos no tiene la misma solidez de la evidencia que el análisis general de un ensayo aleatorizado según el diseño original, a menos que las hipótesis prospectivas para el subconjunto analizado se hayan formulado de manera explícita desde el comienzo en el diseño original. De no ser así, el análisis de subconjuntos se debe ubicar en el siguiente nivel descendente de diseños de estudios, es decir, con los ensayos clínicos controlados no aleatorizados.

  4. Series de casos y otros diseños de estudios observacionales.

    Este tipo de experiencias clínicas corresponden al diseño de estudio más débil, pero en muchas ocasiones son el único tipo de información disponible o que se puede obtener para respaldar determinada estrategia terapéutica. Esto ocurre por ejemplo para enfermedades raras o cuando el tratamiento se desarrolló antes de que se generalizara el uso del diseño de estudios aleatorizados en la práctica médica. También es posible que las series de casos o los diseños observacionales sean los únicos diseños prácticos cuando las intervenciones de tratamiento de diferentes grupos de estudio son radicalmente diferentes (por ejemplo, amputación vs. cirugía con conservación de un miembro). Aun así, estos diseños siempre plantean problemas de selección de pacientes y comparabilidad con otras poblaciones. Según el grado de generalización a otras poblaciones, los diseños de estudios se clasifican en orden descendente de la siguiente manera: estudios poblacionales (o basados en población) con población definida, series de casos consecutivos no poblacionales y series de casos no consecutivos. Algunos diseños de estudios (por ejemplo, estudios de cohorte y de casos y controles) incluyen grupos de participantes de control interno, mientras que otros diseños no incluyen este tipo de controles (por ejemplo, series de solo casos sin grupo de comparación interna o series de solo casos que se comparan con controles históricos).

    Incluso los grandes estudios observacionales poblacionales con controles internos en los que se comparan estrategias terapéuticas en oncología se deben interpretar con mucho cuidado. En un estudio donde se hizo una comparación directa de resultados observacionales y resultados de ECA, los investigadores realizaron una búsqueda sistemática en MEDLINE para identificar estudios observacionales publicados entre 2000 y 2016 usando datos del Surveillance, Epidemiology, and End Results (SEER) Program, el SEER-Medicare o la National Cancer Database en los que se compararon regímenes terapéuticos para cualquier diagnóstico de cáncer.[3] El equipo investigador emparejó 350 comparaciones de tratamientos con 121 ECA sobre la misma comparación de tratamientos. No se encontró una correlación significativa entre los cocientes de riesgos instantáneos (CRI) de los estudios observacionales y los ECA emparejados (coeficiente de correlación de concordancia, 0,08; intervalo de confianza [IC] 95 %, -0,07 a 0,23). Solo el 40 % de los estudios emparejados concordaron en cuanto a los efectos del tratamiento (κ, 0,037), y solo el 62 % de los CRI de los estudios observacionales se ubicaron dentro del IC 95 % del ensayo aleatorizado con el que estaban emparejados. Ninguna de las correlaciones superó el resultado esperado según el azar, y las correlaciones no mejoraron en los estudios que usaron los métodos más sofisticados para el análisis estadístico, como la ponderación del índice de propensión, el ajuste de variables instrumentales o el análisis de sensibilidad. Cabe destacar que, de 70 estudios observaciones cuyo método fue clasificado como riguroso y en los que se notificó la supervivencia general, 35 notificaron resultados positivos, mientras que en el ECA correspondiente no se notificó diferencia o se observó un efecto en la dirección opuesta.

Bibliografía
  1. LeLorier J, Grégoire G, Benhaddad A, et al.: Discrepancies between meta-analyses and subsequent large randomized, controlled trials. N Engl J Med 337 (8): 536-42, 1997. [PUBMED Abstract]
  2. Bailar JC: The promise and problems of meta-analysis. N Engl J Med 337 (8): 559-61, 1997. [PUBMED Abstract]
  3. Soni PD, Hartman HE, Dess RT, et al.: Comparison of Population-Based Observational Studies With Randomized Trials in Oncology. J Clin Oncol 37 (14): 1209-1216, 2019. [PUBMED Abstract]

Solidez de los criterios de valoración

Los criterios de valoración que suelen usarse en los estudios de tratamiento del cáncer en adultos y niños se enumeran a continuación en orden descendente de solidez:

  1. Supervivencia general, también llamada sobrevida global, durante un periodo definido (o mortalidad total).

    Este resultado es probablemente el más importante para los pacientes, además es el que se define de manera más fácil y está menos sujeto al sesgo del investigador.

  2. Mortalidad por causa específica (o mortalidad por causa específica durante un periodo definido).

    Aunque este resultado es de suma importancia biológica para una intervención dirigida a una enfermedad específica, es un criterio de valoración más subjetivo que la mortalidad total y su determinación está más sujeta al sesgo del investigador. Este criterio de valoración también puede pasar por alto efectos importantes del tratamiento que quizá en realidad acorten la supervivencia general.

  3. Evaluación minuciosa de la calidad de vida.

    Este es un criterio de valoración muy importante para los pacientes. La documentación cuidadosa de este criterio de valoración en el marco de un diseño de estudio sólido es, en consecuencia, suficiente para que la mayoría de profesionales de la medicina incorporen un tratamiento nuevo en su práctica médica.

  4. Criterios indirectos de valoración.
    • Supervivencia sin complicaciones.
    • Supervivencia sin enfermedad, también llamada supervivencia sin recaída.
    • Supervivencia sin progresión.
    • Tasa de respuesta tumoral.

    Es posible que estos criterios de valoración estén sujetos a la interpretación del equipo investigador. Pero además, no siempre se traducen de manera automática en un beneficio directo para un paciente en términos de supervivencia o calidad de vida. A pesar de ello, en muchas circunstancias tiene sentido usar un tratamiento que mejore estos criterios indirectos de valoración mientras se aguarda un criterio de valoración más definitivo que apoye el uso de dicho tratamiento.

Síntesis de los niveles de evidencia

Después de considerar la solidez del diseño del estudio y la solidez de los criterios de valoración del estudio, en los resúmenes del PDQ sobre tratamiento del cáncer en adultos y tratamiento del cáncer en niños, se usan los siguientes niveles de evidencia:

  • Evidencia A1. Ensayo clínico controlado aleatorizado (ECA), con enmascaramiento doble o sin enmascaramiento, en el que se usa como un criterio de valoración la supervivencia general (SG) durante un periodo definido, la mortalidad total o la mortalidad por causa específica.
  • Evidencia A2. Metanálisis de ECA en el que se usa como un criterio de valoración la SG durante un periodo definido, la mortalidad total o la mortalidad por causa específica.
  • Evidencia A3. ECA (con enmascaramiento doble o sin enmascaramiento) en el que se usa como un criterio de valoración la calidad de vida de importancia clínica que se recabó de manera adecuada y se evaluó minuciosamente.
  • Evidencia B1. ECA (con enmascaramiento doble o sin enmascaramiento) en el que se usa como un criterio de valoración las diferencias en la supervivencia sin complicaciones (SSC), la supervivencia sin enfermedad (SSE) o la supervivencia sin progresión (SSP).
  • Evidencia B2. Metanálisis de ECA en el que se usa como un criterio de valoración la SSC, la SSE, la SSP o la evaluación minuciosa de la calidad de vida.
  • Evidencia B3. ECA (con enmascaramiento doble o sin enmascaramiento) en el que se usa como un criterio de valoración la tasa de respuesta tumoral o la medición de la calidad de vida que no alcanza el nivel de evidencia descrito en A3.
  • Evidencia B4. Ensayo clínico controlado no aleatorizado prospectivo multicéntrico en el que se hace una comparación planificada de la eficacia e incluye un criterio de valoración de SG durante un periodo definido, mortalidad total, mortalidad por causa específica, evaluación minuciosa de la calidad de vida o diferencia en la SSC, la SSE, la SSP o la respuesta tumoral.
  • Evidencia C1. Serie de casos u otro diseño de estudio observacional, incluso ensayos de casos no consecutivos, en el que se usa como un criterio de valoración la SG durante un periodo definido, la mortalidad total, la mortalidad por causa específica o la evaluación minuciosa de la calidad de vida.
  • Evidencia C2. Serie de casos u otro diseño de estudio observacional, incluso ensayos de casos no consecutivos, en el que se usa como un criterio de valoración la diferencia en la SSC, la SSE o la SSP.
  • Evidencia C3. Serie de casos u otro diseño de estudio observacional, incluso ensayos de casos no consecutivos, en el que se usa como un criterio de valoración la tasa de respuesta tumoral o la medición de la calidad de vida que no alcanza el nivel de evidencia descrito en A3.
  • Evidencia D. Casos esporádicos y opiniones de expertos.

Conclusión

Además del nivel de evidencia científica, todas las recomendaciones deben tomar en cuenta otros aspectos que no pueden ser cuantificados tan fácilmente, como la toxicidad, la amplitud del intervalo de confianza de las observaciones, el tamaño del ensayo, la garantía de la calidad del ensayo y el costo. Pese a todo ello, el sistema de clasificación del PDQ proporciona una categorización de la solidez de la evidencia que sirve como punto de partida para analizar los resultados de los estudios.

Modificaciones a este sumario (10/21/2022)

Los sumarios del PDQ con información sobre el cáncer se revisan con regularidad y se actualizan a medida que se obtiene nueva información. Esta sección describe los cambios más recientes introducidos en este sumario a partir de la fecha arriba indicada.

Este sumario se sometió a revisión integral.

Este sumario está redactado y mantenido por el Consejo editorial del PDQ sobre el tratamiento para adultos, que es editorialmente independiente del NCI. El sumario refleja una revisión independiente de la bibliografía y no representa una declaración de políticas del NCI o de los NIH. Para mayor información sobre las políticas de los sumarios y la función de los consejos editoriales del PDQ que mantienen los sumarios del PDQ, consultar en Información sobre este sumario del PDQ y la página sobre Banco de datos de información de cáncer - PDQ®.

Información sobre este sumario del PDQ

Propósito de este sumario

Este sumario del PDQ con información sobre el cáncer para profesionales de la salud proporciona información integral revisada por expertos y fundamentada en evidencia científica sobre el sistema de clasificación oficial que utilizan los Consejos editoriales del PDQ para evaluar la evidencia científica que respalda el uso de intervenciones o abordajes específicos. El propósito es servir como fuente de información y ayuda para los médicos que atienden a pacientes de cáncer. No ofrece pautas ni recomendaciones formales para tomar decisiones relacionadas con la atención sanitaria.

Revisores y actualizaciones

El Consejo editorial del PDQ sobre el tratamiento para adultos, cuya función editorial es independiente del Instituto Nacional del Cáncer (NCI), revisa con regularidad este sumario y, en caso necesario, lo actualiza. Este sumario refleja una revisión bibliográfica independiente y no constituye una declaración de la política del Instituto Nacional del Cáncer ni de los Institutos Nacionales de la Salud (NIH).

Cada mes, los miembros de este Consejo examinan artículos publicados recientemente para determinar si se deben:

  • tratar en una reunión,
  • citar textualmente, o
  • sustituir o actualizar, si ya se citaron con anterioridad.

Los cambios en los sumarios se deciden mediante consenso, una vez que los integrantes del Consejo evalúan la solidez de la evidencia científica de los artículos publicados y determinan la forma en que se incorporarán al sumario.

Cualquier comentario o pregunta sobre el contenido de este sumario se debe enviar mediante el formulario de comunicación en Cancer.gov/espanol del NCI. No se comunique con los miembros del Consejo para enviar preguntas o comentarios sobre los sumarios. Los miembros del Consejo no responderán a preguntas del público.

Niveles de evidencia científica

En algunas referencias bibliográficas de este sumario se indica el nivel de evidencia científica. El propósito de estas designaciones es ayudar al lector a evaluar la solidez de la evidencia científica que respalda el uso de ciertas intervenciones o abordajes. El Consejo editorial del PDQ sobre el tratamiento para adultos emplea un sistema de jerarquización formal para establecer las designaciones del nivel de evidencia científica.

Permisos para el uso de este sumario

PDQ (Physician Data Query) es una marca registrada. Se autoriza el libre uso del texto de los documentos del PDQ. Sin embargo, no se podrá identificar como un sumario de información sobre cáncer del PDQ del NCI, salvo que se reproduzca en su totalidad y se actualice con regularidad. Por otra parte, se permitirá que un autor escriba una oración como “En el sumario del PDQ del NCI de información sobre la prevención del cáncer de mama se describen, de manera concisa, los siguientes riesgos: [incluir fragmento del sumario]”.

Se sugiere citar la referencia bibliográfica de este sumario del PDQ de la siguiente forma:

PDQ® sobre el tratamiento para adultos. PDQ Niveles de evidencia de los estudios sobre el tratamiento del cáncer en adultos y niños. Bethesda, MD: National Cancer Institute. Actualización: <MM/DD/YYYY>. Disponible en: https://www.cancer.gov/espanol/publicaciones/pdq/niveles-de-evidencia/tratamiento. Fecha de acceso: <MM/DD/YYYY>.

Las imágenes en este sumario se reproducen con el permiso del autor, el artista o la editorial para uso exclusivo en los sumarios del PDQ. La utilización de las imágenes fuera del PDQ requiere la autorización del propietario, que el Instituto Nacional del Cáncer no puede otorgar. Para obtener más información sobre el uso de las ilustraciones de este sumario o de otras imágenes relacionadas con el cáncer, consultar Visuals Online, una colección de más de 2000 imágenes científicas.

Cláusula sobre el descargo de responsabilidad

Según la solidez de la evidencia científica, las opciones de tratamiento se clasifican como “estándar” o “en evaluación clínica”. Estas clasificaciones no deben fundamentar ninguna decisión sobre reintegros de seguros. Para obtener más información sobre cobertura de seguros, consultar la página Manejo de la atención del cáncer disponible en Cancer.gov/espanol.

Para obtener más información

En Cancer.gov/espanol, se ofrece más información sobre cómo comunicarse o recibir ayuda en ¿En qué podemos ayudarle?. También se puede enviar un mensaje de correo electrónico mediante este formulario.

  • Actualización:

Si desea copiar algo de este texto, vea Derechos de autor y uso de imágenes y contenido sobre instrucciones de derechos de autor y permisos. En caso de reproducción digital permitida, por favor, dé crédito al Instituto Nacional del Cáncer como su creador, y enlace al producto original del NCI usando el título original del producto; por ejemplo, “Niveles de evidencia de los estudios sobre el tratamiento del cáncer en adultos y niños (PDQ®)–Versión para profesionales de salud publicada originalmente por el Instituto Nacional del Cáncer.”