Probabilidad antes y después de la prueba

En la práctica clínica, las probabilidades después de la prueba a menudo se estiman aproximadamente o incluso se adivinan. Esto es generalmente aceptable en el hallazgo de un signo o síntoma patognomónico, en cuyo caso es casi seguro que la condición objetivo está presente; o en ausencia de encontrar un signo o síntoma sine qua non, en cuyo caso es casi seguro que la condición objetivo está ausente.

En realidad, sin embargo, la probabilidad subjetiva de la presencia de una condición nunca es exactamente 0 o 100%. Sin embargo, hay varios métodos sistemáticos para estimar esa probabilidad. Estos métodos se basan generalmente en haber realizado previamente el ensayo en un grupo de referencia en el que se conoce la presencia o ausencia de la condición (o al menos se estima mediante otro ensayo que se considera altamente preciso, como por ejemplo mediante «patrón oro»), con el fin de establecer datos de rendimiento del ensayo. Estos datos se utilizan posteriormente para interpretar el resultado de la prueba de cualquier individuo sometido a prueba por el método. Una alternativa o complemento a los métodos basados en grupos de referencia es comparar el resultado de una prueba con una prueba anterior en el mismo individuo, lo que es más común en las pruebas de monitoreo.

Los métodos sistemáticos basados en grupos de referencia más importantes para estimar la probabilidad posterior a la prueba incluyen los que se resumen y comparan en la siguiente tabla, y se describen con más detalle en secciones individuales a continuación.

Método	Establecimiento de datos de rendimiento	Método de interpretación individual	Capacidad para interpretar con precisión pruebas posteriores	Ventajas adicionales
Por valores predictivos	Cocientes directos del grupo de referencia	Lo más sencillo: El valor predictivo es igual a probabilidad	Generalmente bajo: Se requiere un grupo de referencia separado para cada estado anterior a la prueba	Disponible tanto para valores binarios como continuos
Por razón de verosimilitud	Derivada de sensibilidad y especificidad	Probabilidades posteriores a la prueba dadas multiplicando las probabilidades previas a la prueba con la relación	Teóricamente ilimitada	El estado previo a la prueba (y, por lo tanto, la probabilidad previa a la prueba) no tiene que ser la misma que en el grupo de referencia
Por riesgo relativo	Cociente de riesgo entre expuestos y riesgo entre no expuestos	Probabilidad previa a la prueba multiplicado por el riesgo relativo	Bajo, a menos que los riesgos relativos posteriores se deriven del mismo análisis de regresión multivariante	De uso relativamente intuitivo
Por criterios diagnósticos y reglas de predicción clínica	Variable, pero generalmente más tediosa	Variable	Generalmente excelente para todas las pruebas incluidas en los criterios	Generalmente más preferible si está disponible

Mediante valores predictivoseditar
Por razón de verosimilitud
ejemploeditar
Fuentes de inexactitud específicaseditar
Interferencia con el testEdit
Solapamiento de los testeseditar
Métodos para superar la imprecisióneditar
Por riesgo relativoeditar
Un factor de riesgoeditar
Múltiples factores de riesgoeditar
Por criterios diagnósticos y reglas de predicción clínicaeditar

Mediante valores predictivoseditar

Los valores predictivos se pueden utilizar para estimar la probabilidad posterior a la prueba de un individuo si se puede suponer que la probabilidad previa a la prueba del individuo es aproximadamente igual a la prevalencia en un grupo de referencia en el que se dispone de resultados de la prueba y conocimientos sobre la presencia o ausencia de la afección (por ejemplo, una enfermedad, como puede determinarse por «patrón oro»).

Si el resultado de la prueba es de una clasificación binaria en pruebas positivas o negativas, se puede hacer la siguiente tabla:

		Condición (según lo determinado por el «estándar de Oro»)
		Positivo	Negativo
Prueba resultado	Positivo	Verdadero Positivo	Falsos Positivos (error de Tipo II)	→ valor predictivo Positivo
Prueba resultado	Negativo	Falso Negativo (error de Tipo I)	Verdadero Negativo	→ valor predictivo Negativo
		↓ Sensibilidad	↓ La Especificidad	Accuracy Precisión

La probabilidad previa a la prueba se puede calcular a partir del diagrama de la siguiente manera:

Probabilidad antes de la prueba = (Verdadero positivo + Falso negativo) / Muestra total

También, en este caso, la probabilidad positiva después de la prueba (la probabilidad de tener la condición objetivo si la prueba cae positiva), es numéricamente igual al valor predictivo positivo, y la probabilidad negativa después de la prueba (la probabilidad de tener la condición objetivo si la prueba cae negativa) es numéricamente complementaria al valor predictivo negativo ( = 1 -), suponiendo de nuevo que el individuo que se está probando no tiene otros factores de riesgo que hacen que la persona tenga una probabilidad previa a la prueba diferente de la del grupo de referencia utilizado para establecer los valores predictivos positivos y negativos de la prueba.

En el diagrama anterior, esta probabilidad post-prueba positiva, es decir, la probabilidad post-prueba de una condición objetivo dado un resultado positivo de la prueba, se calcula como:

Probabilidad post-prueba positiva = Verdaderos positivos / (Verdaderos positivos + Falsos positivos)

Similarmente:

La probabilidad post-prueba de enfermedad dado un resultado negativo se calcula como:

Probabilidad postprueba negativa = Falsos negativos / (Falsos negativos + Verdaderos negativos)

La validez de las ecuaciones anteriores también depende de que la muestra de la población no tenga un sesgo de muestreo sustancial que haga que los grupos de los que tienen la condición y los que no son sustancialmente desproporcionados de la prevalencia correspondiente y la «no prevalencia» en la población. En efecto, las ecuaciones anteriores no son válidas con un simple estudio de casos y controles que recolecta por separado un grupo con la condición y un grupo sin ella.

Por razón de verosimilitud

Los métodos anteriores no son apropiados si la probabilidad pretest difiere de la prevalencia en el grupo de referencia utilizado para establecer, entre otros, el valor predictivo positivo de la prueba. Esta diferencia puede ocurrir si precede a otra prueba, o si la persona involucrada en el diagnóstico considera que se debe utilizar otra probabilidad de prueba previa debido al conocimiento de, por ejemplo, quejas específicas, otros elementos de un historial médico, signos en un examen físico, ya sea calculando cada hallazgo como una prueba en sí misma con su propia sensibilidad y especificidad, o al menos haciendo una estimación aproximada de la probabilidad individual de prueba previa.

En estos casos, la prevalencia en el grupo de referencia no es completamente exacta en la representación de la probabilidad pre-prueba del individuo, y, en consecuencia, el valor predictivo (ya sea positivo o negativo) no es completamente exacto en la representación de la probabilidad post-prueba del individuo de tener la condición objetivo.

En estos casos, una probabilidad posterior a la prueba puede estimarse con mayor precisión utilizando una razón de verosimilitud para la prueba. La razón de verosimilitud se calcula a partir de la sensibilidad y especificidad de la prueba, y por lo tanto no depende de la prevalencia en el grupo de referencia, y, del mismo modo, no cambia con el cambio de probabilidad previa a la prueba, en contraste con los valores predictivos positivos o negativos (que cambiarían). Además, en efecto, la validez de la probabilidad posterior a la prueba determinada a partir de la razón de verosimilitud no es vulnerable al sesgo de muestreo con respecto a aquellos con y sin la condición en la muestra poblacional, y se puede hacer como un estudio de casos y controles que reúne por separado a aquellos con y sin la condición.

La estimación de la probabilidad posterior a la prueba a partir de la probabilidad previa a la prueba y la relación de verosimilitud es la siguiente:

Probabilidades antes de la prueba = (Probabilidad antes de la prueba / (probabilidad 1-Antes de la prueba)
Probabilidades después de la prueba = Probabilidades antes de la prueba * Relación de verosimilitud

En la ecuación anterior, la probabilidad positiva después de la prueba se calcula utilizando la relación de verosimilitud positiva, y la probabilidad negativa después de la prueba se calcula utilizando la relación de verosimilitud negativa.

Probabilidad Postprueba = Cuotas Postprueba / (Cuotas Postprueba+ 1)

Nomograma de Fagan

La relación también se puede estimar mediante un nomograma de Fagan (mostrado a la derecha) haciendo una línea recta desde el punto de la probabilidad previa a la prueba dada hasta la razón de verosimilitud dada en sus escalas, que, a su vez, estima la probabilidad posterior a la prueba en el punto donde esa línea recta cruza su escala.

La probabilidad posterior a la prueba puede, a su vez, utilizarse como probabilidad previa a la prueba para pruebas adicionales si se sigue calculando de la misma manera.

Diagrama que relaciona las probabilidades antes y después de la prueba, con la curva verde (mitad superior izquierda) que representa una prueba positiva, y la curva roja (mitad inferior derecha) que representa una prueba negativa, para el caso de sensibilidad del 90% y especificidad del 90%, correspondiente a una razón de verosimilitud positiva de 9 y una razón de verosimilitud negativa de 0,111. La longitud de las flechas verdes representa el cambio en la probabilidad absoluta (en lugar de relativa) dada una prueba positiva, y las flechas rojas representan el cambio en la probabilidad absoluta dada una prueba negativa.
Se puede ver por la longitud de las flechas que, a bajas probabilidades previas a la prueba, una prueba positiva da un cambio mayor en la probabilidad absoluta que una prueba negativa (una propiedad que generalmente es válida siempre que la especificidad no sea mucho mayor que la sensibilidad). De manera similar, con altas probabilidades previas a la prueba, una prueba negativa da un cambio mayor en la probabilidad absoluta que una prueba positiva (una propiedad que generalmente es válida siempre que la sensibilidad no sea mucho mayor que la especificidad).
Relación entre las probabilidades antes y después de la prueba para varios positivos de razón de verosimilitud (mitad superior izquierda) y varios negativos de razón de verosimilitud (mitad inferior derecha).

Es posible hacer un cálculo de razones de verosimilitud para pruebas con valores continuos o más de dos resultados que sea similar al cálculo para resultados dicotómicos. Con este fin, se calcula una razón de verosimilitud separada para cada nivel de resultado de la prueba y se denomina razón de verosimilitud específica de intervalo o estrato.

ejemploeditar

Un individuo fue examinado con la prueba de sangre oculta en heces (FOB) para estimar la probabilidad de que esa persona tuviera la condición objetivo de cáncer de intestino, y resultó positivo (se detectó sangre en las heces). Antes de la prueba, esa persona tenía una probabilidad previa a la prueba de tener cáncer de intestino de, por ejemplo, 3% (0,03), como podría haberse estimado mediante la evaluación de, por ejemplo, la historia clínica, el examen y las pruebas previas de esa persona.

La sensibilidad, la especificidad, etc. de la prueba FOB se establecieron con una muestra de población de 203 personas (sin dicha herencia), y cayeron de la siguiente manera:

		los Pacientes con cáncer de intestino (como se confirmó en la endoscopia)
		Positivo	Negativo
Fecal oculto sangre pantalla prueba resultado	Positivo	TP = 2	FP = 18	→ valor predictivo Positivo = TP / (TP + FP) = 2 / (2 + 18) = 2 / 20 = 10%
Fecal oculto sangre pantalla prueba resultado	Negativo	FN = 1	TN = 182	→ valor predictivo Negativo = TN / (FN + TN) = 182 / (1 + 182) = 182 / 183 ≈ 99.5%
		↓ Sensibilidad = TP / (TP + FN) = 2 / (2 + 1) = 2 / 3 ≈ 66.67%	↓ Especificidad = TN / (FP + TN) = 182 / (18 + 182) = 182 / 200 = 91%	↘ Precisión = (TP + TN) / Total = (2 + 182) / 203 = 184 / 203 = 90.64%

A partir de esto, se pueden establecer las razones de verosimilitud de la prueba:

Razón de verosimilitud positiva = sensibilidad / (1-especificidad) = 66.67% / (1 − 91%) = 7.4
Razón de verosimilitud negativa = (1-sensibilidad) / especificidad = (1 − 66.67%) / 91% = 0.37

Probabilidad de la prueba previa ( en este ejemplo) = 0,03
Probabilidades de la prueba previa = 0.03 / (1 – 0.03) = 0.0309
Probabilidades post-test positivas= 0.0309 * 7.4 = 0.229
Probabilidad post-prueba positiva= 0.229 / (0.229 + 1) = 0.186 o 18.6%

Por lo tanto, ese individuo tiene una probabilidad (o «riesgo después de la prueba») de 18,6% de tener cáncer de intestino.

La prevalencia en la muestra de población se calcula para ser:Prevalencia

= (2 + 1) / 203 = 0.0148 o 1.48%

La probabilidad previa a la prueba del individuo fue más del doble de la de la muestra de población, aunque la probabilidad posterior a la prueba del individuo fue menos del doble de la de la muestra de población (que se estima por el valor predictivo positivo de la prueba del 10%), opuesto a lo que resultaría por un método menos preciso de simplemente multiplicar los riesgos relativos.

Fuentes de inexactitud específicaseditar

Las fuentes de inexactitud específicas al usar la razón de verosimilitud para determinar una probabilidad posterior a la prueba incluyen interferencia con determinantes o pruebas anteriores o superposición de objetivos de prueba, como se explica a continuación:

Interferencia con el testEdit

La probabilidad postprueba, estimada a partir de la probabilidad preprueba con razón de verosimilitud, debe manejarse con precaución en individuos con otros determinantes (como factores de riesgo) que la población general, así como en individuos que se han sometido a pruebas previas, porque tales determinantes o pruebas también pueden influir en la prueba en sí de manera impredecible, aún causando resultados inexactos. Un ejemplo con el factor de riesgo de obesidad es que la grasa abdominal adicional puede dificultar la palpación de los órganos abdominales y disminuir la resolución de la ecografía abdominal, y de manera similar, el contraste de bario remanente de una radiografía anterior puede interferir con los exámenes abdominales posteriores, disminuyendo en efecto las sensibilidades y especificidades de tales pruebas posteriores. Por otro lado, el efecto de la interferencia puede mejorar potencialmente la eficacia de las pruebas posteriores en comparación con el uso en el grupo de referencia, como algunos exámenes abdominales que son más fáciles cuando se realizan en personas con bajo peso.

Solapamiento de los testeseditar

Además, la validez de los cálculos sobre cualquier probabilidad previa a la prueba que a su vez se derive de una prueba anterior depende de que las dos pruebas no se solapen significativamente con respecto al parámetro objetivo que se está ensayando, como los análisis de sangre de sustancias pertenecientes a una misma vía metabólica trastornada. Un ejemplo del extremo de tal superposición es cuando se ha establecido la sensibilidad y la especificidad para un análisis de sangre que detecta «sustancia X», y del mismo modo para uno que detecta «sustancia Y». Si, de hecho, «sustancia X» y «sustancia Y» son la misma sustancia, entonces, hacer dos pruebas consecutivas de una y la misma sustancia puede no tener ningún valor diagnóstico, aunque el cálculo parece mostrar una diferencia. En contraste con la interferencia descrita anteriormente, el solapamiento cada vez mayor de las pruebas solo disminuye su eficacia. En el entorno médico, la validez diagnóstica aumenta combinando pruebas de diferentes modalidades para evitar solapamientos sustanciales, por ejemplo, al hacer una combinación de un análisis de sangre, una biopsia y una radiografía.

Métodos para superar la imprecisióneditar

Para evitar tales fuentes de inexactitud mediante el uso de ratios de verosimilitud, el método óptimo sería reunir un gran grupo de referencia de individuos equivalentes, con el fin de establecer valores predictivos separados para el uso de la prueba en dichos individuos. Sin embargo, con más conocimiento de la historia clínica de un individuo, examen físico y prueba previa, etc. ese individuo se hace más diferenciado, con una dificultad creciente para encontrar un grupo de referencia para establecer valores predictivos a medida, lo que hace que una estimación de la probabilidad posterior a la prueba por valores predictivos no sea válida.

Otro método para superar tales inexactitudes es evaluar el resultado de la prueba en el contexto de los criterios diagnósticos, como se describe en la siguiente sección.

Por riesgo relativoeditar

La probabilidad posterior a la prueba puede estimarse a veces multiplicando la probabilidad anterior a la prueba por un riesgo relativo dado por la prueba. En la práctica clínica, esto se aplica generalmente en la evaluación de la historia clínica de un individuo, donde la» prueba » generalmente es una pregunta (o incluso una suposición) con respecto a varios factores de riesgo, por ejemplo, sexo, tabaquismo o peso, pero puede ser potencialmente una prueba sustancial, como colocar al individuo en una balanza. Cuando se utilizan riesgos relativos, la probabilidad resultante suele estar más bien relacionada con el individuo que desarrolla la condición durante un período de tiempo (de manera similar a la incidencia en una población), en lugar de ser la probabilidad de que un individuo tenga la condición en el presente, pero puede ser indirectamente una estimación de la última.

El uso de la razón de riesgos puede utilizarse de forma algo similar al riesgo relativo.

Un factor de riesgoeditar

Para establecer un riesgo relativo, el riesgo en un grupo expuesto se divide por el riesgo en un grupo no expuesto.

Si solo se tiene en cuenta un factor de riesgo de un individuo, la probabilidad posterior a la prueba puede estimarse multiplicando el riesgo relativo por el riesgo en el grupo de control. El grupo de control generalmente representa a la población no expuesta, pero si una fracción muy baja de la población está expuesta, a menudo se puede suponer que la prevalencia en la población general es igual a la prevalencia en el grupo de control. En tales casos, la probabilidad posterior a la prueba puede estimarse multiplicando el riesgo relativo por el riesgo en la población general.

Por ejemplo, la incidencia de cáncer de mama en una mujer en el Reino Unido de 55 a 59 años se estima en aproximadamente 280 casos por 100.000 al año, y el factor de riesgo de haber estado expuesto a altas dosis de radiación ionizante en el pecho (por ejemplo, como tratamientos para otros cánceres) confiere un riesgo relativo de cáncer de mama entre 2,1 y 4,0, en comparación con el no expuesto. Debido a que una fracción baja de la población está expuesta, la prevalencia en la población no expuesta puede suponerse igual a la prevalencia en la población general. Posteriormente, se puede estimar que una mujer en el Reino Unido de entre 55 y 59 años de edad que haya estado expuesta a altas dosis de radiación ionizante debería tener un riesgo de desarrollar cáncer de mama durante un período de un año de entre 588 y 1.120 de cada 100.000 (es decir, entre el 0,6% y el 1,1%).

Múltiples factores de riesgoeditar

Teóricamente, el riesgo total en presencia de múltiples factores de riesgo se puede estimar aproximadamente multiplicando por cada riesgo relativo, pero generalmente es mucho menos preciso que el uso de ratios de verosimilitud, y generalmente se hace solo porque es mucho más fácil de realizar cuando solo se dan riesgos relativos, en comparación con, por ejemplo, convertir los datos de origen en sensibilidades y especificidades y calcularlos por ratios de verosimilitud. Del mismo modo, los riesgos relativos a menudo se dan en lugar de razones de verosimilitud en la literatura porque el primero es más intuitivo. Las fuentes de inexactitud de los riesgos relativos multiplicadores incluyen:

Los riesgos relativos se ven afectados por la prevalencia de la afección en el grupo de referencia (a diferencia de los cocientes de verosimilitud, que no lo son), y este problema hace que la validez de las probabilidades posteriores a la prueba sea menos válida a medida que aumenta la diferencia entre la prevalencia en el grupo de referencia y la probabilidad previa a la prueba para cualquier individuo. Cualquier factor de riesgo conocido o prueba previa de un individuo casi siempre confiere tal diferencia, disminuyendo la validez del uso de riesgos relativos para estimar el efecto total de múltiples factores de riesgo o pruebas. La mayoría de los médicos no tienen en cuenta adecuadamente estas diferencias en la prevalencia al interpretar los resultados de las pruebas, lo que puede causar errores innecesarios en las pruebas y el diagnóstico.
Otra fuente de inexactitud de multiplicar varios riesgos relativos, considerando solo pruebas positivas, es que tiende a sobreestimar el riesgo total en comparación con el uso de razones de verosimilitud. Esta sobreestimación puede explicarse por la incapacidad del método para compensar el hecho de que el riesgo total no puede ser superior al 100%. Esta sobreestimación es bastante pequeña para riesgos pequeños, pero aumenta para valores más altos. Por ejemplo, el riesgo de desarrollar cáncer de mama a una edad menor de 40 años en mujeres en el Reino Unido se puede estimar en aproximadamente 2%. Además, estudios con judíos asquenazíes han indicado que una mutación en el BRCA1 confiere un riesgo relativo de 21,6 de desarrollar cáncer de mama en mujeres menores de 40 años, y una mutación en el BRCA2 confiere un riesgo relativo de 3.3 de cáncer de mama en desarrollo en mujeres menores de 40 años de edad. A partir de estos datos, se puede estimar que una mujer con una mutación del BRCA1 tendría un riesgo de aproximadamente 40% de desarrollar cáncer de mama a una edad menor de 40 años, y una mujer con una mutación del BRCA2 tendría un riesgo de aproximadamente 6%. Sin embargo, en la situación bastante improbable de tener una mutación de BRCA1 y una de BRCA2, simplemente multiplicarse con ambos riesgos relativos resultaría en un riesgo de más del 140% de desarrollar cáncer de mama antes de los 40 años de edad, lo que posiblemente no sea exacto en la realidad.

El efecto (mencionado en este último caso) de la sobreestimación puede compensarse convirtiendo los riesgos en probabilidades y los riesgos relativos en razones de probabilidades. Sin embargo, esto no compensa el efecto (mencionado anteriormente) de ninguna diferencia entre la probabilidad previa a la prueba de un individuo y la prevalencia en el grupo de referencia.

Un método para compensar ambas fuentes de inexactitud es establecer los riesgos relativos mediante análisis de regresión multivariante. Sin embargo, para mantener su validez, los riesgos relativos establecidos como tales deben multiplicarse con todos los demás factores de riesgo en el mismo análisis de regresión, y sin añadir otros factores más allá del análisis de regresión.

Además, multiplicar múltiples riesgos relativos tiene el mismo riesgo de omitir solapamientos importantes de los factores de riesgo incluidos, de manera similar a cuando se utilizan razones de verosimilitud. Además, diferentes factores de riesgo pueden actuar en sinergia, con el resultado de que, por ejemplo, dos factores que individualmente tienen un riesgo relativo de 2 tienen un riesgo relativo total de 6 cuando ambos están presentes, o pueden inhibirse entre sí, de manera algo similar a la interferencia descrita para el uso de razones de verosimilitud.

Por criterios diagnósticos y reglas de predicción clínicaeditar

La mayoría de las enfermedades principales han establecido criterios diagnósticos y/o reglas de predicción clínica. El establecimiento de criterios de diagnóstico o reglas de predicción clínica consiste en una evaluación exhaustiva de muchas pruebas que se consideran importantes para estimar la probabilidad de una afección de interés, a veces también incluye cómo dividirla en subgrupos, y cuándo y cómo tratar la afección. Dicho establecimiento puede incluir el uso de valores predictivos, ratios de probabilidad y riesgos relativos.

Por ejemplo, los criterios ACR para lupus eritematoso sistémico definen el diagnóstico como la presencia de al menos 4 de cada 11 hallazgos, cada uno de los cuales puede considerarse como un valor objetivo de una prueba con su propia sensibilidad y especificidad. En este caso, se han evaluado las pruebas para estos parámetros objetivo cuando se utilizan en combinación, por ejemplo, en relación con la interferencia entre ellos y el solapamiento de los parámetros objetivo, procurando así evitar inexactitudes que de otro modo podrían surgir si se tratara de calcular la probabilidad de la enfermedad utilizando las razones de probabilidad de las pruebas individuales. Por lo tanto, si se han establecido criterios de diagnóstico para una afección, generalmente es más apropiado interpretar cualquier probabilidad posterior a la prueba para esa afección en el contexto de estos criterios.

Además, hay herramientas de evaluación de riesgos para estimar el riesgo combinado de varios factores de riesgo, como la herramienta en línea del Estudio Framingham Heart para estimar el riesgo de resultados de enfermedad coronaria utilizando múltiples factores de riesgo, incluyendo edad, sexo, lípidos en sangre, presión arterial y tabaquismo, siendo mucho más precisa que multiplicar los riesgos relativos individuales de cada factor de riesgo.

Sin embargo, un médico experimentado puede estimar la probabilidad posterior a la prueba (y las acciones que motiva) mediante una consideración amplia que incluye criterios y reglas, además de otros métodos descritos anteriormente, incluidos los factores de riesgo individuales y el rendimiento de las pruebas que se han realizado.