Probabilità pre e post – test

Nella pratica clinica, le probabilità post-test sono spesso solo approssimativamente stimate o addirittura indovinate. Questo è generalmente accettabile nel trovare un segno o un sintomo patognomonico, nel qual caso è quasi certo che la condizione target sia presente; o in assenza di trovare un segno o un sintomo sine qua non, nel qual caso è quasi certo che la condizione target sia assente.

In realtà, tuttavia, la probabilità soggettiva della presenza di una condizione non è mai esattamente 0 o 100%. Tuttavia, ci sono diversi metodi sistematici per stimare tale probabilità. Tali metodi sono generalmente basati su aver precedentemente eseguito il test su un gruppo di riferimento in cui la presenza o l’assenza sulla condizione è nota (o almeno stimata da un altro test considerato altamente accurato, come ad esempio da “Gold standard”), al fine di stabilire i dati delle prestazioni del test. Questi dati vengono successivamente utilizzati per interpretare il risultato del test di qualsiasi individuo testato con il metodo. Un’alternativa o un complemento ai metodi basati sul gruppo di riferimento è il confronto di un risultato del test con un test precedente sullo stesso individuo, che è più comune nei test per il monitoraggio.

I più importanti metodi sistematici basati su gruppi di riferimento per stimare la probabilità post-test includono quelli riassunti e confrontati nella seguente tabella e ulteriormente descritti nelle singole sezioni di seguito.

Metodo Struttura dei dati delle prestazioni Metodo di interpretazione individuale Capacità di interpretare i test successivi Ulteriori vantaggi
Dai valori predittivi Diretta quozienti dal gruppo di riferimento Più semplice: Valore predittivo di uguale probabilità di Solito bassa: Separato gruppo di riferimento necessario per ogni successiva pre-test di stato Disponibile sia per binario e valori continui
Dal rapporto di verosimiglianza Deriva dalla sensibilità e specificità Post-test di probabilità determinata moltiplicando la probabilità pre-test con la ratio Teoricamente illimitate Pre-test dello stato (e quindi il pre-test di probabilità) non deve essere lo stesso nel gruppo di riferimento
Da rischio relativo Quoziente di rischio tra esposti e a rischio tra i non esposti Pre-test di probabilità moltiplicato per il rischio relativo Basso, salvo successivi i rischi relativi sono derivati dalla stessa analisi di regressione multivariata Relativamente intuitivo da usare
Dai criteri diagnostici e clinici previsione di regole Variabile, ma di solito più noioso Variabile di Solito eccellente per tutti i test inclusi nei criteri di di Solito più preferibile se disponibile

Da predictive valuesEdit

valori Predittivi possono essere utilizzati per stimare il post-test di probabilità di un individuo se la probabilità pre-test dell’individuo può essere assunta approssimativamente uguale alla prevalenza in un gruppo di riferimento su cui sono disponibili sia i risultati del test che le conoscenze sulla presenza o assenza della condizione (ad esempio una malattia, come may determinata dal “Gold standard”).

Se il risultato del test è di una classificazione binaria in test positivi o negativi, è possibile creare la seguente tabella:

Condizione
(come determinato dal “Gold standard”)
Positivo Negativo
Test
risultato
Positivo Vero Positivo di Falsi Positivi
(errore di Tipo II)
→ valore predittivo Positivo
Negativo Falso Negativo
(errore di Tipo I)
Vero Negativo → valore predittivo Negativo

Sensibilità

Specificità

Precisione

La probabilità pre-test può essere calcolata dal diagramma come segue:

probabilità Pre-test = (Veri positivi + Falsi negativi) / Totale campione

Anche in questo caso, il positivo post-test di probabilità (la probabilità di avere il target condizione se il test cade positivo), è numericamente uguale al valore predittivo positivo e negativo post-test di probabilità (la probabilità di avere il target condizione se il test cade negativo) è numericamente complementari per il valore predittivo negativo ( = 1 – ), sempre nell’ipotesi che il soggetto in esame non hanno altri fattori di rischio che provocano tale individuo, avendo una diversa probabilità pre-test rispetto al gruppo di riferimento utilizzato per stabilire i valori predittivi positivi e negativi del test.

Nel diagramma sopra, questo positivo post-test di probabilità, che è, la probabilità post-test di un target condizione dato un risultato positivo del test, è calcolato come:

Positivo probabilità post-test = Veri positivi / (Veri positivi + Falsi positivi)

allo stesso modo:

Il post-test di probabilità di malattia dato un risultato negativo è calcolato come:

Negativo probabilità post-test = Falsi negativi / (Falsi negativi + Veri negativi)

La validità delle equazioni di cui sopra dipendono anche che il campione dalla popolazione non dispone di sostanziale bias di campionamento che fanno i gruppi di coloro che hanno la condizione e chi non sostanzialmente sproporzionato corrispondente prevalenza e non “prevalenza” della popolazione. In effetti, le equazioni di cui sopra non sono valide con un semplice studio di controllo del caso che raccoglie separatamente un gruppo con la condizione e un gruppo senza di esso.

Per rapporto di verosimiglianzamodifica

I metodi di cui sopra sono inappropriati da utilizzare se la probabilità pre-test differisce dalla prevalenza nel gruppo di riferimento utilizzato per stabilire, tra gli altri, il valore predittivo positivo del test. Tale differenza può verificarsi se un altro test preceduto, o la persona coinvolta nella diagnostica ritiene che un’altra probabilità pre-test deve essere utilizzato a causa della conoscenza, per esempio, di specifiche censure, altri elementi di storia medica segni di un esame fisico, calcolando ogni ricerca di una prova, di per sé, con la propria sensibilità e specificità, o almeno fare una stima approssimativa dei singoli pre-test di probabilità.

In questi casi, la prevalenza nel gruppo di riferimento non è completamente accurata nel rappresentare la probabilità pre-test dell’individuo e, di conseguenza, il valore predittivo (positivo o negativo) non è completamente accurato nel rappresentare la probabilità post-test dell’individuo di avere la condizione target.

In questi casi, una probabilità post-test può essere stimata in modo più accurato utilizzando un rapporto di verosimiglianza per il test. Il rapporto di verosimiglianza è calcolato dalla sensibilità e dalla specificità del test, e quindi non dipende dalla prevalenza nel gruppo di riferimento e, allo stesso modo, non cambia con la probabilità pre-test modificata, in contrasto con i valori predittivi positivi o negativi (che cambierebbero). Inoltre, in effetti, la validità della probabilità post-test determinata dal rapporto di verosimiglianza non è vulnerabile al bias di campionamento nei confronti di quelli con e senza la condizione nel campione di popolazione e può essere eseguita come studio di controllo del caso che raccoglie separatamente quelli con e senza la condizione.

Stima di post-test di probabilità pre-test di probabilità e verosimiglianza va come segue:

  • probabilità Pre-test = (probabilità Pre-test / (1 – probabilità Pre-test)
  • probabilità post-test = probabilità Pre-test * rapporto di Verosimiglianza

Nell’equazione di cui sopra, positivo post-test di probabilità è calcolata utilizzando il rapporto di verosimiglianza positivo, negativo e il post-test di probabilità è calcolata utilizzando il rapporto di verosimiglianza negativo.

  • probabilità post-test = probabilità post-test / (odds post-test + 1)
nomogramma di Fagan

La relazione può anche essere stimato da un cosiddetto nomogramma di Fagan (mostrato a destra) facendo una linea retta dal punto di pre-test di probabilità di un determinato rapporto di verosimiglianza nella loro scale, che, a sua volta, le stime il post-test di probabilità al punto in cui quella linea retta che attraversa la sua scala.

La probabilità post-test può, a sua volta, essere utilizzata come probabilità pre-test per ulteriori test se continua a essere calcolata nello stesso modo.

  • Schema relativo pre – e post-test di probabilità, con la curva verde (in alto a sinistra) che rappresenta un test positivo, e la curva rossa (in basso a destra) che rappresenta un test negativo, per il caso di sensibilità del 90% e il 90% di specificità, corrispondente ad un rapporto di verosimiglianza positivo di 9, e un rapporto di verosimiglianza negativo di 0.111. La lunghezza delle frecce verdi rappresenta il cambiamento nella probabilità assoluta (piuttosto che relativa) dato un test positivo, e le frecce rosse rappresentano il cambiamento nella probabilità assoluta dato un test negativo.
    Si può vedere dalla lunghezza delle frecce che, a basse probabilità pre-test, un test positivo dà un cambiamento maggiore nella probabilità assoluta di un test negativo (una proprietà che è generalmente valida finché la specificità non è molto più alta della sensibilità). Allo stesso modo, ad alte probabilità pre-test, un test negativo dà un cambiamento maggiore nella probabilità assoluta di un test positivo (una proprietà che è generalmente valida finché la sensibilità non è molto più alta della specificità).

  • Relazione tra probabilità pre e post-test per vari positivi del rapporto di verosimiglianza (metà superiore sinistra) e vari negativi del rapporto di verosimiglianza (metà inferiore destra).

È possibile fare un calcolo dei rapporti di verosimiglianza per i test con valori continui o più di due risultati che è simile al calcolo per i risultati dicotomici. A tale scopo, viene calcolato un rapporto di verosimiglianza separato per ogni livello di risultato del test e viene chiamato intervallo o rapporto di verosimiglianza specifico dello strato.

ExampleEdit

Un individuo è stato sottoposto a screening con il test del sangue occulto fecale (FOB) per stimare la probabilità che quella persona avesse la condizione bersaglio del cancro intestinale, ed è risultato positivo (il sangue è stato rilevato nelle feci). Prima del test, quell’individuo aveva una probabilità pre-test di avere un cancro intestinale, ad esempio, del 3% (0,03), come avrebbe potuto essere stimato valutando, ad esempio, l’anamnesi, l’esame e i test precedenti di quell’individuo.

La sensibilità, specificità ecc. del test FOB sono stati stabiliti con un campione di popolazione di 203 persone (senza tale ereditarietà), ed è caduto come segue:

i Pazienti con il cancro intestinale
(come confermato in endoscopia)
Positivo Negativo
Fecali
occulto
sangue
schermo
test
risultato
Positivo TP = 2 FP = 18 → valore predittivo Positivo
= TP / (TP + FP)
= 2 / (2 + 18)
= 2 / 20
= 10%
Negativo FN = 1 TN = 182 → valore predittivo Negativo
= TN / (FN + TN)
= 182 / (1 + 182)
= 182 / 183
≈ 99.5%

Sensibilità
= TP / (TP + FN)
= 2 / (2 + 1)
= 2 / 3
≈ 66.67%

Specificità
= TN / (FP + TN)
= 182 / (18 + 182)
= 182 / 200
= 91%

Accuratezza
= (TP + TN) / Totale
= (2 + 182) / 203
= 184 / 203
= 90.64%

Da questo, la probabilità che i rapporti di prova possono essere stabilite:

  1. rapporto di Verosimiglianza positivo = sensibilità / (1 − specificità) = 66.67% / (1 − 91%) = 7.4
  2. rapporto di Verosimiglianza negativo = (1 − sensibilità) / specificità = (1 − 66.67%) / 91% = 0.37
  • probabilità Pre-test (in questo esempio) = 0.03
  • probabilità Pre-test = 0.03 / (1 – 0.03) = 0.0309
  • Positivo probabilità post-test = 0.0309 * 7.4 = 0.229
  • Positivo probabilità post-test = 0.229 / (0.229 + 1) = 0.186 o 18.6%

Così, l’individuo ha un post-test di probabilità (o “post-test di rischio”) del 18,6% di avere un tumore all’intestino.

La prevalenza nel campione di popolazione è calcolata come:

  • Prevalenza = (2 + 1) / 203 = 0.0148 o 1.48%

L’individuo pre-test di probabilità in più di due volte quello della popolazione campione, anche se l’individuo post-test di probabilità è inferiore a due volte quello della popolazione campione, che viene stimato il valore predittivo positivo del test del 10%), di fronte a quello che sarebbe risultato meno preciso metodo di semplicemente moltiplicando i rischi relativi.

Fonti specifiche di inesattezzamodifica

Fonti specifiche di inesattezza quando si utilizza il rapporto di verosimiglianza per determinare una probabilità post-test includono interferenze con determinanti o test precedenti o sovrapposizione di obiettivi di test, come spiegato di seguito:

Interferenze con testEdit

Post-test di probabilità, così come stimato dal pre-test di probabilità con rapporto di verosimiglianza, deve essere maneggiato con cautela in soggetti con altri fattori determinanti (quali fattori di rischio) rispetto alla popolazione generale, così come gli individui che sono stati sottoposti a test precedenti, a causa di tali fattori determinanti o test possono anche influenzare il test in unpredictive modi, continuano a causare risultati non accurati. Un esempio con il fattore di rischio di obesità è che il grasso addominale aggiuntivo può rendere difficile la palpazione degli organi addominali e diminuire la risoluzione dell’ecografia addominale, e allo stesso modo, il contrasto di bario residuo da una precedente radiografia può interferire con i successivi esami addominali, in effetti diminuendo le sensibilità e le specificità di tali test successivi. D’altra parte, l’effetto dell’interferenza può potenzialmente migliorare l’efficacia dei test successivi rispetto all’uso nel gruppo di riferimento, come ad esempio alcuni esami addominali che sono più facili quando eseguiti su persone sottopeso.

Sovrapposizione dei testmodifica

Inoltre, la validità dei calcoli su qualsiasi probabilità pre-test che a sua volta deriva da un test precedente dipende dal fatto che i due test non si sovrappongono in modo significativo per quanto riguarda il parametro target testato, come gli esami del sangue di sostanze appartenenti a una stessa via metabolica squilibrata. Un esempio dell’estremo di tale sovrapposizione è dove è stata stabilita la sensibilità e la specificità per un esame del sangue che rileva “sostanza X”, e allo stesso modo per uno che rileva “sostanza Y”. Se, infatti, “sostanza X” e “sostanza Y” sono una stessa sostanza, quindi, facendo un due test consecutivi di una stessa sostanza non può avere alcun valore diagnostico a tutti, anche se il calcolo sembra mostrare una differenza. In contrasto con le interferenze come descritto sopra, l’aumento della sovrapposizione dei test diminuisce solo la loro efficacia. In ambito medico, la validità diagnostica è aumentata combinando test di diverse modalità per evitare sovrapposizioni sostanziali, ad esempio nel fare una combinazione di un esame del sangue, una biopsia e una radiografia.

Metodi per superare l’inesattezzamodifica

Per evitare tali fonti di inesattezza utilizzando i rapporti di verosimiglianza, il metodo ottimale sarebbe quello di raccogliere un ampio gruppo di riferimento di individui equivalenti, al fine di stabilire valori predittivi separati per l’uso del test in tali individui. Tuttavia, con più conoscenza della storia medica di un individuo, esame fisico e test precedente ecc. quell’individuo diventa più differenziato, con crescente difficoltà a trovare un gruppo di riferimento per stabilire valori predittivi personalizzati, rendendo non valida una stima della probabilità post-test per valori predittivi.

Un altro metodo per superare tali imprecisioni è valutare il risultato del test nel contesto dei criteri diagnostici, come descritto nella sezione successiva.

Per rischio relativomodifica

La probabilità post-test può talvolta essere stimata moltiplicando la probabilità pre-test con un rischio relativo dato dal test. Nella pratica clinica, questo è di solito applicato nella valutazione di una storia medica di un individuo, dove il “test” di solito è una domanda (o anche ipotesi) per quanto riguarda vari fattori di rischio, ad esempio, sesso, fumo di tabacco o peso, ma può potenzialmente essere un test sostanziale come mettere l’individuo su una bilancia. Quando si utilizzano i rischi relativi, la probabilità risultante è di solito piuttosto correlata all’individuo che sviluppa la condizione per un periodo di tempo (in modo simile all’incidenza in una popolazione), invece di essere la probabilità di un individuo di avere la condizione nel presente, ma può indirettamente essere una stima di quest’ultimo.

L’uso dell’hazard ratio può essere utilizzato in modo simile al rischio relativo.

Un fattore di rischiomodifica

Per stabilire un rischio relativo, il rischio in un gruppo esposto viene diviso per il rischio in un gruppo non esposto.

Se viene preso in considerazione solo un fattore di rischio di un individuo, la probabilità post-test può essere stimata moltiplicando il rischio relativo con il rischio nel gruppo di controllo. Il gruppo di controllo di solito rappresenta la popolazione non esposta, ma se una frazione molto bassa della popolazione è esposta, allora la prevalenza nella popolazione generale può spesso essere assunta uguale alla prevalenza nel gruppo di controllo. In questi casi, la probabilità post-test può essere stimata moltiplicando il rischio relativo con il rischio nella popolazione generale.

Per esempio, l’incidenza di cancro al seno in una donna nel Regno Unito all’età di 55 a 59 è stimato in circa 280 casi per 100.000 per anno, e il fattore di rischio di essere stati esposti ad alte dosi di radiazioni ionizzanti per il petto (per esempio, nel trattamento di altri tumori) conferisce un rischio relativo di cancro al seno tra 2.1 e 4.0, rispetto ai non esposti. Poiché una frazione bassa della popolazione è esposta, la prevalenza nella popolazione non esposta può essere assunta uguale alla prevalenza nella popolazione generale. Successivamente, si può stimare che una donna nel Regno Unito di età compresa tra 55 e 59 anni e che è stata esposta a radiazioni ionizzanti ad alte dosi dovrebbe avere un rischio di sviluppare il cancro al seno per un periodo di un anno compreso tra 588 e 1.120 su 100.000 (cioè tra 0,6% e 1,1%).

di rischio Multipli factorsEdit

in Teoria, il rischio totale in presenza di più fattori di rischio può essere approssimativamente stimato moltiplicando con ogni relativo rischio, ma è generalmente molto meno precisi utilizzando i rapporti di probabilità, e di solito è fatto solo perché è molto più facile da eseguire solo quando i rischi relativi sono dato, rispetto, ad esempio, convertendo l’origine dati di sensibilità e specificità e calcolare da rapporti di probabilità. Allo stesso modo, i rischi relativi sono spesso dati invece dei rapporti di verosimiglianza in letteratura perché il primo è più intuitivo. Fonti di imprecisione, di moltiplicare i rischi relativi di includere:

  • i rischi Relativi sono colpiti dalla prevalenza della condizione nel gruppo di riferimento (in contrasto con i rapporti di probabilità, che non sono), e questo problema determina la validità di post-test di probabilità di diventare meno valido con l’aumento della differenza tra la prevalenza nel gruppo di riferimento e i pre-test di probabilità per ogni individuo. Qualsiasi fattore di rischio noto o precedente test di un individuo conferisce quasi sempre tale differenza, diminuendo la validità dell’utilizzo dei rischi relativi nella stima dell’effetto totale di più fattori di rischio o test. La maggior parte dei medici non tiene adeguatamente conto di tali differenze di prevalenza nell’interpretazione dei risultati dei test, che possono causare errori diagnostici e test non necessari.
  • Una fonte separata di inesattezza nel moltiplicare diversi rischi relativi, considerando solo test positivi, è che tende a sovrastimare il rischio totale rispetto all’utilizzo dei rapporti di verosimiglianza. Questa sovrastima può essere spiegata dall’incapacità del metodo di compensare il fatto che il rischio totale non può essere superiore al 100%. Questa sopravvalutazione è piuttosto piccola per piccoli rischi, ma diventa più alta per valori più alti. Ad esempio, il rischio di sviluppare il cancro al seno a un’età inferiore ai 40 anni nelle donne nel Regno Unito può essere stimato a circa il 2%. Inoltre, studi sugli ebrei ashkenaziti hanno indicato che una mutazione in BRCA1 conferisce un rischio relativo di 21.6 di sviluppare il cancro al seno nelle donne sotto i 40 anni di età, e una mutazione in BRCA2 conferisce un rischio relativo di 3.3 di sviluppare il cancro al seno nelle donne sotto i 40 anni di età. Da questi dati, si può stimare che una donna con una mutazione BRCA1 avrebbe un rischio di circa il 40% di sviluppare il cancro al seno ad un’età inferiore ai 40 anni e una donna con una mutazione BRCA2 avrebbe un rischio di circa il 6%. Tuttavia, nella situazione piuttosto improbabile di avere sia una mutazione BRCA1 che una BRCA2, la semplice moltiplicazione con entrambi i rischi relativi comporterebbe un rischio di oltre il 140% di sviluppare il cancro al seno prima dei 40 anni di età, che non può essere accurato nella realtà.

L’effetto (quest’ultimo menzionato) della sovrastima può essere compensato convertendo i rischi in odds e i rischi relativi in odds ratio. Tuttavia, ciò non compensa l’effetto (precedentemente menzionato) di alcuna differenza tra la probabilità pre-test di un individuo e la prevalenza nel gruppo di riferimento.

Un metodo per compensare entrambe le fonti di inesattezza di cui sopra è quello di stabilire i rischi relativi mediante analisi di regressione multivariata. Tuttavia, per mantenere la sua validità, i rischi relativi stabiliti come tali devono essere moltiplicati con tutti gli altri fattori di rischio nella stessa analisi di regressione e senza alcuna aggiunta di altri fattori oltre all’analisi di regressione.

Inoltre, moltiplicando più rischi relativi si ha lo stesso rischio di perdere importanti sovrapposizioni dei fattori di rischio inclusi, analogamente a quando si utilizzano i rapporti di verosimiglianza. Inoltre, diversi fattori di rischio possono agire in sinergia, con il risultato che, ad esempio, due fattori che entrambi individualmente hanno un rischio relativo di 2 hanno un rischio relativo totale di 6 quando entrambi sono presenti, o possono inibirsi a vicenda, in qualche modo simile all’interferenza descritta per l’utilizzo di rapporti di verosimiglianza.

In base a criteri diagnostici e regole di previsione clinicamodifica

La maggior parte delle principali malattie ha stabilito criteri diagnostici e/o regole di previsione clinica. L’istituzione di criteri diagnostici o regole di previsione clinica consiste in una valutazione completa di molti test che sono considerati importanti nella stima della probabilità di una condizione di interesse, a volte anche incluso come dividerlo in sottogruppi, e quando e come trattare la condizione. Tale definizione può includere l’utilizzo di valori predittivi, rapporti di verosimiglianza e rischi relativi.

Ad esempio, i criteri ACR per il lupus eritematoso sistemico definiscono la diagnosi come presenza di almeno 4 risultati su 11, ognuno dei quali può essere considerato come un valore target di un test con la propria sensibilità e specificità. In questo caso, i test per questi parametri bersaglio sono stati valutati in combinazione, ad esempio per quanto riguarda l’interferenza tra di essi e la sovrapposizione dei parametri bersaglio, cercando in tal modo di evitare imprecisioni che potrebbero altrimenti sorgere se si tenta di calcolare la probabilità della malattia utilizzando i rapporti di verosimiglianza dei singoli test. Pertanto, se sono stati stabiliti criteri diagnostici per una condizione, è generalmente più appropriato interpretare qualsiasi probabilità post-test per tale condizione nel contesto di questi criteri.

Inoltre, esistono strumenti di valutazione del rischio per stimare il rischio combinato di diversi fattori di rischio, come lo strumento online del Framingham Heart Study per stimare il rischio di esiti di malattia coronarica utilizzando più fattori di rischio, tra cui età, sesso, lipidi nel sangue, pressione sanguigna e fumo, essendo molto più accurato della moltiplicazione dei singoli rischi relativi di ciascun fattore di rischio.

Tuttavia, un medico esperto può stimare la probabilità post-test (e le azioni che motiva) con un’ampia considerazione che include criteri e regole oltre ad altri metodi descritti in precedenza, inclusi sia i singoli fattori di rischio che le prestazioni dei test che sono stati effettuati.



+