Pre – og post-test sannsynlighet

i klinisk praksis er post-test sannsynligheter ofte bare grovt estimert eller til og med gjettet. Dette er vanligvis akseptabelt ved funn av et patognomonisk tegn eller symptom, i så fall er det nesten sikkert at måltilstanden er tilstede; eller i fravær av å finne et sinus qua non-tegn eller symptom, i så fall er det nesten sikkert at måltilstanden er fraværende.

i virkeligheten er imidlertid den subjektive sannsynligheten for tilstedeværelse av en tilstand aldri nøyaktig 0 eller 100%. Likevel er det flere systematiske metoder for å estimere denne sannsynligheten. Slike metoder er vanligvis basert på tidligere å ha utført testen på en referansegruppe der tilstedeværelsen eller fraværet på tilstanden er kjent (eller i det minste estimert av en annen test som anses å være svært nøyaktig, for eksempel ved «Gullstandard»), for å etablere data om testytelse. Disse dataene blir deretter brukt til å tolke testresultatet av ethvert individ som testes ved metoden. Et alternativ eller supplement til referansegruppebaserte metoder er å sammenligne et testresultat med en tidligere test på samme person, noe som er mer vanlig i tester for overvåking.

de viktigste systematiske referansegruppebaserte metodene for å estimere sannsynlighet etter test inkluderer de som er oppsummert og sammenlignet i tabellen nedenfor, og nærmere beskrevet i de enkelte avsnittene nedenfor.

Metode Etablering av ytelsesdata Metode for individuell tolkning Mulighet for nøyaktig tolkning av påfølgende tester Ytterligere fordeler
ved prediktive verdier Direkte kvotienter fra referansegruppen Enkelest: Prediktiv verdi er lik sannsynlighet vanligvis lav: Separat referansegruppe kreves for hver påfølgende pre-test tilstand Tilgjengelig Både for binære og kontinuerlige verdier
etter sannsynlighetsforhold Avledet fra sensitivitet og spesifisitet Post-test odds gitt ved å multiplisere pretest odds med forholdet Teoretisk ubegrenset pre-test tilstand (og dermed pre-test sannsynlighet) trenger ikke å være den samme som i referansegruppen
ved relativ risiko Kvotient av risiko blant eksponert og risiko blant ueksponert Sannsynlighet for førtest multiplisert med relativ risiko Lav, med mindre påfølgende relative risikoer er avledet fra samme multivariate regresjonsanalyse Relativt intuitiv å bruke
Av diagnostiske kriterier og kliniske prediksjonsregler Variabel, Men vanligvis mest kjedelige Variabel vanligvis utmerket for alle test inkludert i kriterier Vanligvis mest foretrukket hvis tilgjengelig

Prediktive verdier [rediger / rediger kilde]

Prediktive verdier kan brukes til å estimere sannsynligheten for et individ etter testen dersom den enkeltes pre-testsannsynlighet kan antas tilnærmet lik prevalensen i en referansegruppe hvor både testresultater og kunnskap om tilstandens tilstedeværelse eller fravær (for eksempel en sykdom, som kan bestemmes av «Gullstandard») er tilgjengelig.

hvis testresultatet er av en binær klassifisering i enten positive eller negative tester, kan følgende tabell gjøres:

Tilstand
(som bestemt av «Gullstandard»)
Positiv Negativ
Test
resultat
Positiv Sann Positiv Falsk Positiv
(TYPE II-feil)
→ Positiv prediktiv verdi
Negativ Falsk Negativ
(Type I-feil)
Sann Negativ → Negativ prediktiv verdi

Følsomhet

Spesifisitet

Nøyaktighet

Pre-test sannsynlighet kan beregnes ut fra diagrammet som følger:

Pretest sannsynlighet = (Sann positiv + Falsk negativ) / Total prøve

også i dette tilfellet er den positive sannsynligheten etter testen (sannsynligheten for å ha måltilstanden hvis testen faller ut positiv), numerisk lik den positive prediktive verdien, og den negative sannsynligheten etter testen (sannsynligheten for å ha måltilstanden hvis testen faller ut negativ) er numerisk komplementær til den negative prediktive verdien ( = 1 -), igjen forutsatt at den enkelte som testes ikke har andre risikofaktorer som fører til at den enkelte har en annen pre-test sannsynlighet enn referansegruppen som brukes til å etablere positive og negative prediktive verdier av testen.

i diagrammet ovenfor beregnes denne positive posttestsannsynligheten, det vil si posttestsannsynligheten for en måltilstand gitt et positivt testresultat, som:

Positiv posttestsannsynlighet = Sanne positiver / (Sanne positiver + Falske positiver)

På Samme Måte:

sannsynligheten for sykdom gitt et negativt resultat etter testen beregnes som:

Negativ posttestsannsynlighet = Falske negativer / (Falske negativer + Sanne negativer)

gyldigheten av ligningene ovenfor er også avhengig av at utvalget fra populasjonen ikke har vesentlig utvalgsskjevhet som gjør gruppene av de som har tilstanden og de som ikke vesentlig uforholdsmessig fra tilsvarende prevalens og» ikke-prevalens » i populasjonen. I virkeligheten er ligningene ovenfor ikke gyldige med bare en case-control-studie som separat samler en gruppe med tilstanden og en gruppe uten den.

etter sannsynlighetsgradrediger

metodene ovenfor er upassende å bruke hvis pretest-sannsynligheten avviker fra prevalensen i referansegruppen som brukes til å fastslå blant annet den positive prediktive verdien av testen. En slik forskjell kan oppstå hvis en annen test går forut, eller personen som er involvert i diagnostikken anser at en annen pretest sannsynlighet må brukes på grunn av kunnskap om for eksempel spesifikke klager, andre elementer i en medisinsk historie, tegn i en fysisk undersøkelse, enten ved å beregne på hvert funn som en test i seg selv med sin egen følsomhet og spesifisitet, eller i det minste gjøre en grov estimering av den enkelte pre-test sannsynlighet.

i disse tilfellene er prevalensen i referansegruppen ikke helt nøyaktig i å representere individets pre-testsannsynlighet, og følgelig er den prediktive verdien (enten positiv eller negativ) ikke helt nøyaktig i å representere individets post-testsannsynlighet for å ha måltilstanden.

i disse tilfellene kan en posttestsannsynlighet estimeres mer nøyaktig ved å bruke et sannsynlighetsforhold for testen. Sannsynlighetsgrad beregnes ut fra testens sensitivitet og spesifisitet, og er dermed ikke avhengig av prevalens i referansegruppen, og på samme måte endres den ikke med endret pre-testsannsynlighet, i motsetning til positive eller negative prediktive verdier (som ville endre seg). I virkeligheten er gyldigheten av sannsynlighet etter test bestemt ut fra sannsynlighetsforhold ikke sårbar for utvalgsskjevhet i forhold til de med og uten tilstanden i populasjonsprøven, og kan gjøres som en case-control-studie som separat samler de med og uten tilstanden.

Estimering av post-test sannsynlighet fra pre-test sannsynlighet og sannsynlighet ratio går som følger:

  • Pretest odds = (Pretest sannsynlighet / (1 – Pretest sannsynlighet)
  • Posttest odds = Pretest odds * Sannsynlighetsgrad

i ligningen ovenfor beregnes positiv sannsynlighet etter testen ved hjelp av sannsynlighetsgrad positiv, og den negative sannsynligheten etter testen beregnes ved hjelp av sannsynlighetsgrad negativ.

  • posttest sannsynlighet = posttest odds / (Posttest odds + 1)
Fagan nomogram

relasjonen kan også estimeres med Et Såkalt Fagan-nomogram (vist til høyre) ved å lage en rett linje fra punktet for den gitte pre-testsannsynligheten til det gitte sannsynlighetsforholdet i deres skalaer, som i sin tur estimerer post-testsannsynligheten på det punktet der den rette linjen krysser skalaen.

posttestsannsynligheten kan i sin tur brukes som pre-testsannsynlighet for ytterligere tester hvis den fortsatt beregnes på samme måte.

  • Diagram som relaterer pre-og post-test sannsynligheter, med den grønne kurven (øvre venstre halvdel) som representerer en positiv test, og den røde kurven (nedre høyre halvdel) som representerer en negativ test, for tilfellet 90% følsomhet og 90% spesifisitet, tilsvarende et sannsynlighetsforhold positivt på 9, og et sannsynlighetsforhold negativt på 0,111. Lengden på de grønne pilene representerer endringen i absolutt (snarere enn relativ) sannsynlighet gitt en positiv test, og de røde pilene representerer endringen i absolutt sannsynlighet gitt en negativ test.
    det kan ses fra lengden på pilene at ved lave pre-test sannsynligheter gir en positiv test en større endring i absolutt sannsynlighet enn en negativ test(en egenskap som generelt er gyldig så lenge spesifisiteten ikke er mye høyere enn følsomheten). På samme måte, ved høye pre-test sannsynligheter, gir en negativ test en større endring i absolutt sannsynlighet enn en positiv test (en egenskap som generelt er gyldig så lenge følsomheten ikke er mye høyere enn spesifisiteten).

  • Forholdet mellom pre-og post-test sannsynligheter for ulike sannsynlighetsforhold positive (øvre venstre halvdel) og ulike sannsynlighetsforhold negative (nedre høyre halvdel).

det er mulig å gjøre en beregning av sannsynlighetsforhold for tester med kontinuerlige verdier eller mer enn to utfall som ligner beregningen for dikotomiske utfall. For dette formålet beregnes et separat sannsynlighetsforhold for hvert nivå av testresultat og kalles intervall-eller stratumspesifikke sannsynlighetsforhold.

Eksempelrediger

en person ble screenet med testen av fekal okkult blod (FOB) for å estimere sannsynligheten for at personen hadde måltilstanden for tarmkreft, og det falt ut positivt (blod ble påvist i avføring). Før testen hadde personen en pre-test sannsynlighet for å ha tarmkreft på for eksempel 3% (0,03), som kunne ha blitt estimert ved evaluering av for eksempel medisinsk historie, undersøkelse og tidligere tester av den enkelte.

sensitivitet, spesifisitet etc. av FOB-testen ble etablert med en populasjonsprøve på 203 personer (uten slik arvelighet), og falt ut som følger:

Pasienter med tarmkreft
(som bekreftet ved endoskopi)
Positiv Negativ
Fekal
okkult
blod
skjerm
test
utfall
Positiv TP = 2 FP = 18 → Positiv prediktiv verdi
= TP / (TP + FP)
= 2 / (2 + 18)
= 2 / 20
= 10%
Negativ FN = 1 TN = 182 → Negativ prediktiv verdi
= TN / (FN + TN)
= 182 / (1 + 182)
= 182 / 183
≈ 99.5%

Følsomhet
= TP / (TP + FN)
= 2 / (2 + 1)
= 2 / 3
≈ 66.67%

Spesifisitet
= TN / (FP + TN)
= 182 / (18 + 182)
= 182 / 200
= 91%

Nøyaktighet
= (TP + TN) / Total
= (2 + 182) / 203
= 184 / 203
= 90.64%

fra dette kan sannsynlighetsforholdene til testen etableres:

  1. Sannsynlighetsgrad positiv = sensitivitet / (1-spesifisitet) = 66.67% / (1 − 91%) = 7.4
  2. Sannsynlighetsforhold negativ = (1-sensitivitet) / spesifisitet = (1 − 66.67%) / 91% = 0.37
  • Pretest sannsynlighet (i dette eksemplet) = 0,03
  • Pretest odds = 0.03 / (1 – 0.03) = 0.0309
  • Positive posttest odds = 0.0309 * 7.4 = 0.229
  • Positiv posttest sannsynlighet = 0.229 / (0.229 + 1) = 0.186 eller 18.6%

dermed har den personen en post-test sannsynlighet (eller «post-test risiko») på 18,6% av å ha tarmkreft.

prevalensen i populasjonsprøven er beregnet til å være:

  • Prevalens = (2 + 1) / 203 = 0.0148 eller 1.48%

individets pre-test sannsynlighet var mer enn det dobbelte av populasjonsprøven, selv om individets post-test sannsynlighet var mindre enn det dobbelte av populasjonsprøven (som estimeres av den positive prediktive verdien av testen på 10%), motsatt av hva som ville resultere ved en mindre nøyaktig metode for ganske enkelt å multiplisere relative risikoer.

Spesifikke kilder til unøyaktigheter [rediger / rediger kilde]

Spesifikke kilder til unøyaktighet ved bruk av sannsynlighetsforhold for å bestemme en post-test sannsynlighet inkluderer interferens med determinanter eller tidligere tester eller overlapping av testmål, som forklart nedenfor:

Interferens med testEdit

sannsynlighet etter testen, som estimert ut fra sannsynlighetsforholdet før testen, bør håndteres med forsiktighet hos personer med andre determinanter (som risikofaktorer) enn den generelle befolkningen, så vel som hos personer som har gjennomgått tidligere tester, fordi slike determinanter eller tester også kan påvirke selve testen på uforutsigbare måter, og fortsatt forårsake unøyaktige resultater. Et eksempel med risikofaktoren for fedme er at ytterligere abdominal fett kan gjøre det vanskelig å palpere abdominale organer og redusere oppløsningen av abdominal ultralyd, og på samme måte kan restbariumkontrast fra en tidligere radiografi forstyrre etterfølgende abdominale undersøkelser, noe som reduserer følsomheten og spesifisiteten til slike etterfølgende tester. På den annen side kan effekten av interferens potensielt forbedre effekten av etterfølgende tester i forhold til bruk i referansegruppen, for eksempel at noen abdominale undersøkelser blir lettere når de utføres på undervektige personer.

Overlapping av testrediger

videre er gyldigheten av beregninger på en pre-test sannsynlighet som i seg selv er avledet fra en tidligere test, avhengig av at de to testene ikke signifikant overlapper med hensyn til målparameteren som testes, for eksempel blodprøver av stoffer som tilhører en og samme forstyrret metabolismevei. Et eksempel på ekstremen av en slik overlapping er hvor følsomheten og spesifisiteten er etablert for en blodprøve som detekterer «substans X», og likeledes for en detekterer «substans Y». Hvis faktisk «substans X» Og «substans Y» er ett og Samme stoff, kan det hende at to påfølgende tester av ett og samme stoff ikke har noen diagnostisk verdi i det hele tatt, selv om beregningen ser ut til å vise en forskjell. I motsetning til interferens som beskrevet ovenfor, reduserer økende overlapping av tester bare deres effekt. I medisinsk sammenheng økes diagnostisk validitet ved å kombinere tester av forskjellige modaliteter for å unngå betydelig overlapping, for eksempel ved å lage en kombinasjon av blodprøve, biopsi og radiografi.

Metoder for å overvinne unøyaktighetrediger

for å unngå slike unøyaktighetskilder ved å bruke sannsynlighetsforhold, ville den optimale metoden være å samle en stor referansegruppe av ekvivalente individer, for å etablere separate prediktive verdier for bruk av testen hos slike individer. Men med mer kunnskap om en persons medisinske historie, fysisk undersøkelse og tidligere test etc. den enkelte blir mer differensiert, med økende vanskeligheter med å finne en referansegruppe for å etablere skreddersydde prediktive verdier, noe som gjør en estimering av sannsynlighet etter test ved prediktive verdier ugyldig.

En annen metode for å overvinne slike unøyaktigheter er ved å evaluere testresultatet i sammenheng med diagnostiske kriterier, som beskrevet i neste avsnitt.

ved relativ risikorediger

Sannsynligheten Etter testen kan noen ganger estimeres ved å multiplisere sannsynligheten før testen med en relativ risiko gitt av testen. I klinisk praksis brukes dette vanligvis i evaluering av en persons medisinske historie, hvor «testen» vanligvis er et spørsmål (eller til og med antagelse) angående ulike risikofaktorer, for eksempel kjønn, tobakksrøyking eller vekt, men det kan potensielt være en betydelig test som å sette individet på vei. Ved bruk av relative risikoer er den resulterende sannsynligheten vanligvis ganske relatert til den enkelte som utvikler tilstanden over en tidsperiode (på samme måte som forekomsten i en populasjon), i stedet for å være sannsynligheten for at en person har tilstanden i nåtiden, men kan indirekte være en estimering av sistnevnte.

bruk av hazard ratio kan brukes noe på samme måte som relativ risiko.

en risikofaktorrediger

for å etablere en relativ risiko, er risikoen i en eksponert gruppe delt på risikoen i en ueksponert gruppe.

hvis bare en risikofaktor for et individ er tatt i betraktning, kan sannsynligheten etter testen estimeres ved å multiplisere den relative risikoen med risikoen i kontrollgruppen. Kontrollgruppen representerer vanligvis den ueksponerte populasjonen, men dersom en svært lav andel av populasjonen eksponeres, kan prevalensen i den generelle populasjonen ofte antas å være lik prevalensen i kontrollgruppen. I slike tilfeller kan sannsynligheten etter testen estimeres ved å multiplisere den relative risikoen med risikoen i den generelle befolkningen.

for eksempel er forekomsten av brystkreft hos en kvinne i Storbritannia i alderen 55 til 59 anslått til ca 280 tilfeller per 100.000 per år, og risikofaktoren for å ha blitt utsatt for høydose ioniserende stråling til brystet (for eksempel som behandlinger for andre kreftformer) gir en relativ risiko for brystkreft mellom 2,1 og 4,0, sammenlignet med ueksponert. Fordi en lav andel av befolkningen er eksponert, kan prevalensen i den ueksponerte populasjonen antas å være lik prevalensen i den generelle befolkningen. Deretter kan det anslås at en Kvinne i Storbritannia som er mellom 55 og 59 år og som har vært utsatt for høydose ioniserende stråling, bør ha risiko for å utvikle brystkreft over en periode på ett år mellom 588 og 1.120 i 100.000(det vil si mellom 0,6% og 1.1%).

Flere risikofaktorerrediger

Teoretisk sett kan den totale risikoen i nærvær av flere risikofaktorer grovt estimeres ved å multiplisere med hver relativ risiko, men er generelt mye mindre nøyaktig enn å bruke sannsynlighetsforhold, og gjøres vanligvis bare fordi det er mye lettere å utføre når bare relative risikoer er gitt, sammenlignet med for eksempel å konvertere kildedataene til følsomhet og spesifisitet og beregne med sannsynlighetsforhold. På samme måte er relative risikoer ofte gitt i stedet for sannsynlighetsforhold i litteraturen fordi den tidligere er mer intuitiv. Kilder til unøyaktighet ved å multiplisere relative risikoer inkluderer:

  • Relativ risiko påvirkes av forekomsten av tilstanden i referansegruppen (i motsetning til sannsynlighetsforhold, som ikke er), og dette problemet resulterer i at gyldigheten av post-test sannsynligheter blir mindre gyldig med økende forskjell mellom forekomsten i referansegruppen og pre-test sannsynlighet for noen person. Enhver kjent risikofaktor eller tidligere test av en person gir nesten alltid en slik forskjell, noe som reduserer gyldigheten av å bruke relative risikoer ved å estimere den totale effekten av flere risikofaktorer eller tester. De fleste leger tar ikke hensyn til slike forskjeller i prevalens ved tolkning av testresultater, noe som kan føre til unødvendige test-og diagnostiske feil.
  • en separat kilde til unøyaktighet ved å multiplisere flere relative risikoer, med tanke på bare positive tester, er at den har en tendens til å overvurdere den totale risikoen sammenlignet med å bruke sannsynlighetsforhold. Denne overvurderingen kan forklares av metodens manglende evne til å kompensere for at den totale risikoen ikke kan være mer enn 100%. Denne overvurderingen er ganske liten for små risikoer, men blir høyere for høyere verdier. For eksempel kan risikoen for å utvikle brystkreft i en alder yngre enn 40 år hos kvinner I Storbritannia estimeres til ca 2%. Også studier På Ashkenazi-Jøder har indikert at en mutasjon I BRCA1 gir en relativ risiko for 21,6 for å utvikle brystkreft hos kvinner under 40 år, og en mutasjon I BRCA2 gir en relativ risiko for 3.3 av å utvikle brystkreft hos kvinner under 40 år. Fra disse dataene kan det anslås at en kvinne med EN BRCA1-mutasjon vil ha en risiko på ca. 40% av å utvikle brystkreft i en alder yngre enn 40 år, og en kvinne med EN BRCA2-mutasjon vil ha en risiko på ca.6%. Men i den ganske usannsynlige situasjonen med Å ha BÅDE EN BRCA1 og EN BRCA2-mutasjon, vil det bare å multiplisere med begge relative risikoer føre til en risiko for over 140% av å utvikle brystkreft før 40 år, noe som ikke kan være nøyaktig i virkeligheten.

den (sistnevnte nevnte) effekten av overestimering kan kompenseres ved å konvertere risiko til odds, og relativ risiko til oddsforhold. Dette kompenserer imidlertid ikke for (tidligere nevnt) effekt av noen forskjell mellom pre-test sannsynlighet for en person og prevalensen i referansegruppen.

en metode for å kompensere for begge kilder til unøyaktighet ovenfor er å etablere de relative risikoene ved multivariat regresjonsanalyse. For å beholde sin gyldighet må imidlertid relative risikoer etablert som sådan multipliseres med alle de andre risikofaktorene i samme regresjonsanalyse, og uten tillegg av andre faktorer utover regresjonsanalysen.

i tillegg har multiplikasjon av flere relative risikoer samme risiko for manglende viktige overlapper av de inkluderte risikofaktorene, på samme måte som ved bruk av sannsynlighetsforhold. Også ulike risikofaktorer kan virke i synergi, med det resultat at for eksempel to faktorer som begge individuelt har en relativ risiko på 2, har en total relativ risiko på 6 når begge er tilstede, eller kan hemme hverandre, noe på samme måte som interferensen beskrevet for bruk av sannsynlighetsforhold.

ved diagnostiske kriterier og kliniske prediksjonsreglerrediger

De fleste alvorlige sykdommer har etablert diagnostiske kriterier og / eller kliniske prediksjonsregler. Etablering av diagnostiske kriterier eller kliniske prediksjonsregler består av en omfattende evaluering av mange tester som anses som viktige for å estimere sannsynligheten for en tilstand av interesse, noen ganger også inkludert hvordan man deler den i undergrupper, og når og hvordan man skal behandle tilstanden. Slik etablering kan omfatte bruk av prediktive verdier, sannsynlighetsforhold samt relative risikoer.

FOR EKSEMPEL DEFINERER acr-kriteriene for systemisk lupus erythematosus diagnosen som tilstedeværelse av minst 4 av 11 funn, som hver kan betraktes som en målverdi av en test med egen følsomhet og spesifisitet. I dette tilfellet har det vært evaluering av testene for disse målparametrene når de brukes i kombinasjon med hensyn til for eksempel interferens mellom dem og overlapping av målparametere, og derved streve for å unngå unøyaktigheter som ellers kunne oppstå hvis man forsøker å beregne sannsynligheten for sykdommen ved hjelp av sannsynlighetsforhold for de enkelte testene. Derfor, hvis diagnostiske kriterier er etablert for en tilstand, er det generelt mest hensiktsmessig å tolke noen post-test sannsynlighet for at tilstanden i sammenheng med disse kriteriene.

det Er også risikovurderingsverktøy for å estimere den kombinerte risikoen for flere risikofaktorer, for eksempel Det elektroniske verktøyet Fra Framingham Heart Study for å estimere risikoen for koronar hjertesykdomsutfall ved hjelp av flere risikofaktorer, inkludert alder, kjønn, blodlipider, blodtrykk og røyking, som er mye mer nøyaktig enn å multiplisere de individuelle relative risikoene for hver risikofaktor.

likevel kan en erfaren lege estimere sannsynligheten etter testen (og handlingene den motiverer) ved en bred vurdering, inkludert kriterier og regler i tillegg til andre metoder som er beskrevet tidligere, inkludert både individuelle risikofaktorer og utførelsen av tester som er utført.



+