Niveles de evidencia de los estudios sobre el tratamiento del cáncer en adultos y niños (PDQ®)–Versión para profesionales de salud

Introducción

En los estudios clínicos de oncología es posible medir y notificar una variedad de criterios de valoración. Esos criterios abarcan, entre otros, la mortalidad total (o supervivencia desde el inicio del tratamiento), la mortalidad por causa específica y la calidad de vida. Otras veces incluyen marcadores indirectos de valoración de estos 4 criterios mencionados, como la supervivencia sin complicaciones, la supervivencia sin enfermedad, la supervivencia sin progresión o la tasa de respuesta tumoral. En ocasiones, también se definen criterios de valoración según cada uno de los diseños de estudios de solidez variable, que incluyen desde el diseño de referencia —el ensayo clínico controlado aleatorizado con enmascaramiento doble— hasta las experiencias de series de casos de pacientes no consecutivos. Los Consejos editoriales del PDQ emplean un sistema de clasificación oficial de los niveles de evidencia científica (grados de comprobación científica) para ayudar al lector a juzgar la solidez de la evidencia vinculada con los resultados notificados de una estrategia terapéutica. Los resultados de cada tipo de tratamiento se clasifican con cada una de las dos escalas descritas a continuación: 1) solidez del diseño del estudio y 2) solidez de los criterios de valoración. Juntas, estas escalas de clasificación dan una idea del nivel de evidencia general. Según la perspectiva, los diferentes grupos de expertos, organizaciones profesionales o médicos pueden emplear diferentes valores límite de la solidez general de la evidencia científica para formular directrices terapéuticas o al decidir las intervenciones; sin embargo, una descripción oficial del nivel de evidencia científica proporciona un marco uniforme para los datos y conduce a recomendaciones específicas.

Cuando es pertinente, el Consejo editorial del PDQ sobre el tratamiento para adultos y el Consejo editorial del PDQ sobre el tratamiento pediátrico añaden información de los niveles de evidencia científica, descritos más adelante, a los sumarios del PDQ sobre el tratamiento del cáncer en adultos y los sumarios del PDQ sobre el tratamiento del cáncer en niños.

Solidez del diseño del estudio

Se describen a continuación los diversos tipos de diseño de estudios en orden descendente de solidez:

  1. Ensayos clínicos controlados aleatorizados.
    1. Ensayos con enmascaramiento doble.
    2. Ensayos sin enmascaramiento.

    El ensayo clínico aleatorizado (ECA), controlado y con enmascaramiento doble (1i) es el diseño de referencia de todos los estudios. Para que un estudio se clasifique de esta manera, se debe ocultar al médico la asignación del estudio, antes y después de la aleatorización y de la asignación del tratamiento . Este diseño previene sesgos de asignación por parte del investigador y sesgos durante la evaluación de resultados por parte del investigador y el paciente. Lamentablemente, en la mayoría de los ensayos clínicos en oncología no es posible mantener el enmascaramiento doble después de la asignación del tratamiento porque los procedimientos o los efectos tóxicos a menudo varían bastante entre las asignaciones del estudio en modos que son obvios para el profesional de atención de la salud y para el paciente. Sin embargo, en la mayoría de los casos es posible mantener oculta la asignación al investigador y el paciente hasta la aleatorización. Si no se logra enmascarar la asignación al tratamiento, se asigna la categoría 1ii.

    Los metanálisis de estudios aleatorizados ofrecen una síntesis cuantitativa de estudios realizados antes. La solidez de la evidencia de un metanálisis se basa en la calidad de la dirección de los estudios individuales. Por otra parte, los metanálisis a veces amplifican los errores sistemáticos pequeños de los estudios individuales. Un estudio que comparaba los resultados de un solo ensayo aleatorizado grande con los de un metanálisis de ensayos más pequeños publicados antes sobre el mismo tema, solo mostró un grado de acuerdo razonable (estadístico κ, 0,35). El metanálisis no predijo con exactitud los resultados de los ensayos controlados aleatorizados grandes en el 35 % de los casos.[1,2] A veces, se obtienen conclusiones contradictorias en los metanálisis realizados por diferentes investigadores para evaluar el mismo asunto clínico.[2] En consecuencia, los metanálisis de estudios aleatorizados se ubican en la misma categoría de solidez de la evidencia que los estudios aleatorizados, no en un nivel más alto.

    El análisis de subconjuntos de estudios aleatorizados está sujeto a errores inherentes a la multiplicidad (es decir, se esperan resultados estadísticamente significativos debido a la variación aleatoria de los efectos medidos en varios subconjuntos). En consecuencia, el análisis de subconjuntos no tiene la misma solidez de la evidencia que el análisis general de un ensayo aleatorizado diseñado como tal, a menos que las hipótesis prospectivas para el subconjunto analizado se hayan formulado con anticipación. De no ser así, el análisis de subconjuntos se debe ubicar en el siguiente nivel descendiente de diseño de estudio (ensayos clínicos controlados no aleatorizados).

  2. Ensayos clínicos controlados no aleatorizados.

    Esta categoría incluye ensayos en los que la asignación del tratamiento se realizó por fecha de nacimiento, número de historia clínica, día de la visita al consultorio, disponibilidad de cama u otra estrategia cualquiera que permita que el investigador conozca la asignación antes de obtener el consentimiento informado del paciente. En estas circunstancias, a veces ocurre un desequilibrio en la asignación de tratamientos. Por las razones antes expuestas, los análisis de subconjuntos en ensayos aleatorizados a menudo se clasifican en este nivel de evidencia.

  3. Series de casos y otros diseños de estudios observacionales.
    1. Series consecutivas poblacionales.
    2. Casos consecutivos (no poblacionales).
    3. Casos no consecutivos y otros diseños de estudios observacionales (por ejemplo, estudios de cohortes o de casos y controles).

    Estas experiencias clínicas son la forma más débil de diseño de estudio, pero es posible que sean la única información práctica o disponible que respalde una estrategia terapéutica, en especial en el caso de enfermedades raras o cuando el tratamiento avanzó antes del uso generalizado de los diseños de estudios aleatorizados en la práctica médica. También es posible que sean el único diseño práctico cuando los tratamientos en diferentes grupos de estudio son radicalmente diferentes (por ejemplo, amputación vs. cirugía con conservación de un miembro). Sin embargo, siempre plantean problemas de selección de pacientes y comparabilidad con otras poblaciones. Según el grado de generalización a otras poblaciones, estos se clasifican como estudios poblacionales con población definida, series consecutivas no poblacionales y series de casos no consecutivos. Algunos diseños de estudios (por ejemplo, estudios de cohorte y de casos y controles) incluyen participantes de control interno, mientras que otros diseños no incluyen controles (por ejemplo, series de solo casos sin grupo de comparación interna o series de solo casos que se comparan con controles históricos).

    Incluso los grandes estudios observacionales poblacionales con controles internos en los que se comparan estrategias terapéuticas en oncología se deben interpretar con mucho cuidado. En un estudio en el que se estableció una comparación directa de resultados observacionales y resultados de ECA, los investigadores realizaron una búsqueda sistemática en MEDLINE para identificar estudios observacionales publicados entre 2000 y 2016 que usaran datos del Surveillance, Epidemiology, and End Results (SEER) Program, el SEER-Medicare, o la National Cancer Database para comparar regímenes de tratamiento de cualquier diagnóstico de cáncer.[3] Los investigadores emparejaron 350 comparaciones de tratamientos con 121 ECA de la misma comparación. No se encontró una correlación significativa entre los cocientes de riesgos instantáneos (CRI) de los estudios observacionales y los ECA emparejados (coeficiente de correlación de concordancia, 0,08; intervalo de confianza [IC] 95 %, -0,07 a +0,23). Solo el 40 % de los estudios emparejados concordaron en cuanto a los efectos del tratamiento (κ, 0,037), y solo el 62 % de los CRI de los estudios observacionales estuvieron dentro del IC 95 % del ensayo aleatorizado con el que estaban emparejados. En ninguna de las correlaciones se superó el resultado esperado según el azar, y las correlaciones no mejoraron en los estudios que usaron los métodos más sofisticados para el análisis estadístico, incluso ponderación del índice de propensión, ajuste de variables instrumentales o análisis de sensibilidad. Cabe destacar que en 35 estudios se notificó un resultado positivo entre 70 estudios observaciones cuyo método fue clasificado como riguroso y en los que se notificó la supervivencia general, mientras que en el ECA no se informaron diferencias o se observó un efecto en la dirección opuesta.

Bibliografía
  1. LeLorier J, Grégoire G, Benhaddad A, et al.: Discrepancies between meta-analyses and subsequent large randomized, controlled trials. N Engl J Med 337 (8): 536-42, 1997. [PUBMED Abstract]
  2. Bailar JC: The promise and problems of meta-analysis. N Engl J Med 337 (8): 559-61, 1997. [PUBMED Abstract]
  3. Soni PD, Hartman HE, Dess RT, et al.: Comparison of Population-Based Observational Studies With Randomized Trials in Oncology. J Clin Oncol 37 (14): 1209-1216, 2019. [PUBMED Abstract]

Solidez de los criterios de valoración

Los criterios de valoración que por lo común se miden en los estudios de tratamiento de cáncer en adultos y niños se enumeran a continuación en orden descendente de solidez:

  1. Mortalidad total (o supervivencia general a partir de un punto definido en el tiempo).

    Este resultado es probablemente el más importante para los pacientes y es también el que se define con más facilidad y está menos sujeto al sesgo del investigador.

  2. Mortalidad por causa específica (o mortalidad por causa específica a partir de un punto definido en el tiempo).

    Aunque es de suma importancia biológica en intervenciones para enfermedades específicas, es un criterio de valoración más subjetivo que la mortalidad total y su determinación está más sujeta al sesgo del investigador. Este criterio de valoración también puede pasar por alto efectos importantes del tratamiento que quizá en realidad acorten la supervivencia general.

  3. Evaluación cuidadosa de la calidad de vida.

    Este es un criterio de valoración sumamente importante para los pacientes. La documentación cuidadosa de este criterio de valoración en el marco de un diseño de estudio sólido es, en consecuencia, suficiente para que la mayoría de los médicos incorporen un tratamiento a sus prácticas.

  4. Marcadores indirectos de valoración.
    1. Supervivencia sin complicaciones.
    2. Supervivencia sin enfermedad.
    3. Supervivencia sin progresión.
    4. Tasa de respuesta tumoral.

    Es posible que estos criterios de valoración estén sujetos a la interpretación del investigador. Lo que es más importante, si bien pueden traducirse en beneficio directo para el paciente en aspectos tales como la supervivencia o la calidad de vida, esto no ocurre de modo automático. Sin embargo, en muchas circunstancias, es racional usar un tratamiento que mejore estos criterios de valoración indirectos, mientras se aguarda un criterio de valoración más definitivo que apoye su uso.

Síntesis

Debido a que los estudios o experiencias clínicas se clasifican por la solidez del diseño y la importancia del criterio de valoración, cada estudio se clasifica en dos categorías (por ejemplo, 1iiA para un estudio aleatorizado sin enmascaramiento que muestra un resultado favorable de la supervivencia general y 3iiiDiv para un ensayo de fase II de pacientes seleccionados usando la tasa de respuesta como el resultado). Asimismo, todas las recomendaciones deben tomar en cuenta otros aspectos que no pueden ser cuantificados tan fácilmente, como la toxicidad, la amplitud del intervalo de confianza de las observaciones, el tamaño del ensayo, la garantía de la calidad del ensayo y el costo. Pese a todo ello, el sistema de clasificación del PDQ proporciona las categorías ordinales de la solidez de la evidencia que sirven como punto de partida para analizar los resultados de los estudios.

Modificaciones a este sumario (12/02/2021)

Los sumarios del PDQ con información sobre el cáncer se revisan con regularidad y se actualizan a medida que se obtiene nueva información. Esta sección describe los cambios más recientes introducidos en este sumario a partir de la fecha arriba indicada.

Este sumario se sometió a revisión integral.

Este sumario está redactado y mantenido por el Consejo editorial del PDQ sobre el tratamiento para adultos, que es editorialmente independiente del NCI. El sumario refleja una revisión independiente de la bibliografía y no representa una declaración de políticas del NCI o de los NIH. Para mayor información sobre las políticas de los sumarios y la función de los consejos editoriales del PDQ que mantienen los sumarios del PDQ, consultar en Información sobre este sumario del PDQ y la página sobre Banco de datos de información de cáncer - PDQ®.

Información sobre este sumario del PDQ

Propósito de este sumario

Este sumario del PDQ con información sobre el cáncer para profesionales de la salud proporciona información integral revisada por expertos y fundamentada en evidencia científica sobre el sistema de clasificación oficial que utilizan los Consejos editoriales del PDQ para evaluar la evidencia científica que respalda el uso de intervenciones o abordajes específicos. El propósito es servir como fuente de información y ayuda para los médicos que atienden a pacientes de cáncer. No ofrece pautas ni recomendaciones formales para tomar decisiones relacionadas con la atención sanitaria.

Revisores y actualizaciones

El Consejo editorial del PDQ sobre el tratamiento para adultos, cuya función editorial es independiente del Instituto Nacional del Cáncer (NCI), revisa con regularidad este sumario y, en caso necesario, lo actualiza. Este sumario refleja una revisión bibliográfica independiente y no constituye una declaración de la política del Instituto Nacional del Cáncer ni de los Institutos Nacionales de la Salud (NIH).

Cada mes, los miembros de este Consejo examinan artículos publicados recientemente para determinar si se deben:

  • tratar en una reunión,
  • citar textualmente, o
  • sustituir o actualizar, si ya se citaron con anterioridad.

Los cambios en los sumarios se deciden mediante consenso, una vez que los integrantes del Consejo evalúan la solidez de la evidencia científica de los artículos publicados y determinan la forma en que se incorporarán al sumario.

Cualquier comentario o pregunta sobre el contenido de este sumario se debe enviar mediante el formulario de comunicación en Cancer.gov/espanol del NCI. No se comunique con los miembros del Consejo para enviar preguntas o comentarios sobre los sumarios. Los miembros del Consejo no responderán a preguntas del público.

Niveles de evidencia científica

En algunas referencias bibliográficas de este sumario se indica el nivel de evidencia científica. El propósito de estas designaciones es ayudar al lector a evaluar la solidez de la evidencia científica que respalda el uso de ciertas intervenciones o abordajes. El Consejo editorial del PDQ sobre el tratamiento para adultos emplea un sistema de jerarquización formal para establecer las designaciones del nivel de evidencia científica.

Permisos para el uso de este sumario

PDQ (Physician Data Query) es una marca registrada. Se autoriza el libre uso del texto de los documentos del PDQ. Sin embargo, no se podrá identificar como un sumario de información sobre cáncer del PDQ del NCI, salvo que se reproduzca en su totalidad y se actualice con regularidad. Por otra parte, se permitirá que un autor escriba una oración como “En el sumario del PDQ del NCI de información sobre la prevención del cáncer de mama se describen, de manera concisa, los siguientes riesgos: [incluir fragmento del sumario]”.

Se sugiere citar la referencia bibliográfica de este sumario del PDQ de la siguiente forma:

PDQ® sobre el tratamiento para adultos. PDQ Niveles de evidencia de los estudios sobre el tratamiento del cáncer en adultos y niños. Bethesda, MD: National Cancer Institute. Actualización: <MM/DD/YYYY>. Disponible en: https://www.cancer.gov/espanol/publicaciones/pdq/niveles-de-evidencia/tratamiento. Fecha de acceso: <MM/DD/YYYY>.

Las imágenes en este sumario se reproducen con el permiso del autor, el artista o la editorial para uso exclusivo en los sumarios del PDQ. La utilización de las imágenes fuera del PDQ requiere la autorización del propietario, que el Instituto Nacional del Cáncer no puede otorgar. Para obtener más información sobre el uso de las ilustraciones de este sumario o de otras imágenes relacionadas con el cáncer, consultar Visuals Online, una colección de más de 2000 imágenes científicas.

Cláusula sobre el descargo de responsabilidad

Según la solidez de la evidencia científica, las opciones de tratamiento se clasifican como “estándar” o “en evaluación clínica”. Estas clasificaciones no deben fundamentar ninguna decisión sobre reintegros de seguros. Para obtener más información sobre cobertura de seguros, consultar la página Manejo de la atención del cáncer disponible en Cancer.gov/espanol.

Para obtener más información

En Cancer.gov/espanol, se ofrece más información sobre cómo comunicarse o recibir ayuda en ¿En qué podemos ayudarle?. También se puede enviar un mensaje de correo electrónico mediante este formulario.