Sandsynlighed før og efter test

i klinisk praksis estimeres sandsynligheder efter test ofte bare groft eller endda gættet. Dette er normalt acceptabelt ved konstateringen af et patognomonisk tegn eller symptom, i hvilket tilfælde Det er næsten sikkert, at målbetingelsen er til stede; eller i mangel af at finde et absolut tegn eller symptom, i hvilket tilfælde Det er næsten sikkert, at målbetingelsen er fraværende.

i virkeligheden er den subjektive Sandsynlighed for tilstedeværelsen af en tilstand aldrig nøjagtigt 0 eller 100%. Alligevel er der flere systematiske metoder til at estimere denne sandsynlighed. Sådanne metoder er normalt baseret på tidligere at have udført testen på en referencegruppe, hvor tilstedeværelsen eller fraværet på betingelsen er kendt (eller i det mindste estimeret ved en anden test, der betragtes som meget nøjagtig, såsom ved “guldstandard”) for at etablere data om testydelse. Disse data bruges efterfølgende til at fortolke testresultatet for enhver person, der testes efter metoden. Et alternativ eller supplement til referencegruppebaserede metoder sammenligner et testresultat med en tidligere test på det samme individ, hvilket er mere almindeligt i test til overvågning.

de vigtigste systematiske referencegruppebaserede metoder til estimering af sandsynlighed efter test inkluderer dem, der er opsummeret og sammenlignet i den følgende tabel, og yderligere beskrevet i individuelle afsnit nedenfor.

metode etablering af præstationsdata metode til individuel fortolkning evne til nøjagtigt at fortolke efterfølgende tests yderligere fordele
ved forudsigelige værdier direkte kvotienter fra referencegruppe mest ligetil: forudsigelig værdi er lig med Sandsynlighed normalt lav: Separat referencegruppe påkrævet for hver efterfølgende præ-testtilstand tilgængelig både for binære og kontinuerlige værdier
ved sandsynlighedsforhold afledt af følsomhed og specificitet post-test odds givet ved at multiplicere pretest odds med forholdet teoretisk ubegrænset Pre-test tilstand (og dermed pre-test Sandsynlighed) behøver ikke at være samme som i referencegruppe
ved relativ risiko Risikokvotient blandt eksponeret og risiko blandt ikke eksponeret præ-test Sandsynlighed multipliceret med den relative risiko lav, medmindre efterfølgende relative risici er afledt af samme multivariate regressionsanalyse relativt intuitiv at bruge
ved diagnostiske kriterier og kliniske forudsigelsesregler variabel, men normalt mest kedelige variabel normalt fremragende til alle test inkluderet i kriterier normalt mest foretrukne, hvis de er tilgængelige

ved forudsigelige værdierredit

forudsigelige værdier kan bruges til at estimere sandsynligheden for et individ efter test hvis individets præ-test sandsynlighed kan antages omtrent lig med forekomsten i en referencegruppe, hvor både testresultater og viden om tilstedeværelsen eller fraværet af tilstanden (for eksempel en sygdom, såsom maj bestemt af “guldstandard”) er tilgængelige.

hvis testresultatet er af en binær klassificering i enten positive eller negative tests, kan følgende tabel laves:

tilstand
(som bestemt af “guldstandard”)
positiv negativ
Test
resultat
positiv sand positiv falsk positiv
(type II fejl)
negativ falsk negativ
(type i-fejl)
ægte negativ

følsomhed

specificitet
liter
nøjagtighed

pre-test sandsynlighed kan beregnes ud fra diagrammet som følger:

Pretest Sandsynlighed = (sand positiv + falsk negativ) / samlet prøve

også i dette tilfælde er den positive Sandsynlighed efter test (sandsynligheden for at have målbetingelsen, hvis testen falder ud positiv) numerisk lig med den positive forudsigelsesværdi, og den negative Sandsynlighed efter test (sandsynligheden for at have målbetingelsen, hvis testen falder negativ) er numerisk komplementær til den negative forudsigelsesværdi ( = 1 -), idet man igen antager, at den person, der testes, ikke har nogen anden risiko for at faktorer, der resulterer i, at den enkelte har en anden præ-test sandsynlighed end referencegruppen anvendes til at fastslå de positive og negative prædiktive værdier af testen.

i diagrammet ovenfor beregnes denne positive post-test Sandsynlighed, det vil sige posttest sandsynligheden for en måltilstand givet et positivt testresultat, som:

positiv posttest Sandsynlighed = sande positive / (sande positive + falske positive)

tilsvarende:

post-test sandsynligheden for sygdom givet et negativt resultat beregnes som:

negativ posttest Sandsynlighed = falske negativer / (falske negativer + sande negativer)

gyldigheden af ligningerne ovenfor afhænger også af, at prøven fra befolkningen ikke har væsentlig prøveudtagningsforstyrrelse, der gør grupperne af dem, der har tilstanden, og dem, der ikke væsentligt uforholdsmæssigt fra tilsvarende prævalens og “ikke-prævalens” i befolkningen. I virkeligheden er ligningerne ovenfor ikke gyldige med blot en case-control-undersøgelse, der separat samler en gruppe med tilstanden og en gruppe uden den.

efter sandsynlighedsforhold

ovennævnte metoder er uhensigtsmæssige at anvende, hvis prætest-sandsynligheden afviger fra prævalensen i referencegruppen, der anvendes til bl.a. at fastslå testens positive prædiktive værdi. En sådan forskel kan forekomme, hvis en anden test gik forud, eller den person, der er involveret i diagnosen, mener, at der skal anvendes en anden prætest sandsynlighed på grund af kendskab til for eksempel specifikke klager, andre elementer i en medicinsk historie, tegn i en fysisk undersøgelse, enten ved at beregne på hvert fund som en test i sig selv med sin egen følsomhed og specificitet eller i det mindste foretage et groft skøn over den enkelte præ-test Sandsynlighed.

i disse tilfælde er prævalensen i referencegruppen ikke fuldstændig nøjagtig til at repræsentere individets præ-test sandsynlighed, og følgelig er den forudsigelige værdi (hvad enten den er positiv eller negativ) ikke fuldstændig nøjagtig til at repræsentere individets post-test Sandsynlighed for at have målbetingelsen.

i disse tilfælde kan en posttest Sandsynlighed estimeres mere præcist ved hjælp af et sandsynlighedsforhold for testen. Sandsynlighedsforholdet beregnes ud fra testens følsomhed og specificitet, og derved afhænger det ikke af prævalens i referencegruppen, og det ændrer sig heller ikke med ændret Sandsynlighed før test i modsætning til positive eller negative forudsigelige værdier (som ville ændre sig). Også, træde i kræft, gyldigheden af sandsynlighed efter test bestemt ud fra sandsynlighedsforholdet er ikke sårbar over for prøveudtagningsforstyrrelse med hensyn til dem med og uden betingelsen i populationsprøven, og kan udføres som en case-control-undersøgelse, der separat samler dem med og uden betingelsen.

estimering af sandsynlighed efter test fra sandsynlighed og sandsynlighedsforhold før test går som følger:

  • Pretest odds = (Pretest Sandsynlighed / (1 – Pretest Sandsynlighed)
  • posttest odds = Pretest odds * Sandsynlighedsforhold

i ligning ovenfor beregnes positiv Sandsynlighed efter test ved hjælp af sandsynlighedsforholdet positivt, og den negative Sandsynlighed efter test beregnes ved hjælp af sandsynlighedsforholdet negativt.

  • posttest Sandsynlighed = posttest odds / (posttest odds + 1)
Fagan nomogram

forholdet kan også estimeres ved hjælp af et såkaldt Fagan nomogram (vist til højre) ved at lave en lige linje fra punktet for den givne Sandsynlighed før testen til det givne sandsynlighedsforhold i deres skalaer, som igen estimerer sandsynligheden efter testen på det punkt, hvor den lige linje krydser dens skala.

post-test sandsynlighed kan igen bruges som præ-test Sandsynlighed for yderligere tests, hvis det fortsætter med at blive beregnet på samme måde.

  • Diagram vedrørende sandsynligheder før og efter test, hvor den grønne kurve (øverste venstre halvdel) repræsenterer en positiv test, og den røde kurve (nederste højre halvdel) repræsenterer en negativ test for 90% følsomhed og 90% specificitet svarende til et sandsynlighedsforhold positivt på 9 og et sandsynlighedsforhold negativt på 0,111. Længden af de grønne pile repræsenterer ændringen i absolut (snarere end relativ) Sandsynlighed givet en positiv test, og de røde pile repræsenterer ændringen i absolut sandsynlighed givet en negativ test.
    det kan ses fra længden af pilene, at en positiv test ved lave sandsynligheder før test giver en større ændring i absolut sandsynlighed end en negativ test (en egenskab, der generelt er gyldig, så længe specificiteten ikke er meget højere end følsomheden). På samme måde giver en negativ test ved høj sandsynlighed for test en større ændring i absolut sandsynlighed end en positiv test (en egenskab, der generelt er gyldig, så længe følsomheden ikke er meget højere end specificiteten).

  • forholdet mellem sandsynligheder før og efter test for forskellige sandsynlighedsforhold positiver (øverste venstre halvdel) og forskellige sandsynlighedsforhold negativer (nederste højre halvdel).

det er muligt at foretage en beregning af sandsynlighedsforhold for test med kontinuerlige værdier eller mere end to resultater, der svarer til beregningen for dikotome resultater. Til dette formål beregnes et separat sandsynlighedsforhold for hvert niveau af testresultat og kaldes interval-eller stratumspecifikke sandsynlighedsforhold.

Eksempelrediger

et individ blev screenet med testen af fækalt okkult blod (FOB) for at estimere sandsynligheden for, at personen havde måltilstanden for tarmkræft, og det faldt positivt ud (blod blev påvist i afføring). Før testen havde denne person en præ-test Sandsynlighed for at have tarmkræft på for eksempel 3% (0, 03), som det kunne have været estimeret ved evaluering af for eksempel den medicinske historie, undersøgelse og tidligere test af den pågældende person.

følsomhed, specificitet osv. af FOB-testen blev etableret med en populationsprøve på 203 personer (uden sådan arvelighed) og faldt ud som følger:

patienter med tarmkræft
(som bekræftet ved endoskopi)
positiv negativ
fækal
okkult
blod
skærm
test
resultat
positiv TP = 2 FP = 18 )
= 2 / (2 + 18)
= 2 / 20
= 10%
negativ FN = 1 TN = 182 ren negativ prædiktiv værdi
= TN /(FN + TN)
= 182 / (1 + 182)
= 182 / 183
≈ 99.5%

følsomhed
= TP / (TP + FN)
= 2 / (2 + 1)
= 2 / 3
≈ 66.67%

specificitet
= TN / (FP + TN)
= 182 / (18 + 182)
= 182 / 200
= 91%

nøjagtighed
= (TP + TN) / i alt
= (2 + 182) / 203
= 184 / 203
= 90.64%

ud fra dette kan testens sandsynlighedsforhold etableres:

  1. Sandsynlighedsforhold positiv = følsomhed / (1-specificitet) = 66.67% / (1 − 91%) = 7.4
  2. Sandsynlighedsforhold negativ = (1-følsomhed) / specificitet = (1 − 66.67%) / 91% = 0.37
  • Pretest Sandsynlighed (i dette eksempel) = 0.03
  • Pretest odds = 0.03 / (1 – 0.03) = 0.0309
  • Positive posttest odds = 0.0309 * 7.4 = 0.229
  • positiv posttest Sandsynlighed = 0.229 / (0.229 + 1) = 0.186 eller 18.6%

således har denne person en sandsynlighed efter test (eller” risiko efter test”) på 18,6% af at have tarmkræft.

prævalensen i populationsprøven beregnes til at være:

  • prævalens = (2 + 1) / 203 = 0.0148 eller 1.48%

individets Sandsynlighed før test var mere end dobbelt så stor som en af populationsprøven, skønt individets Sandsynlighed efter test var mindre end dobbelt så stor som en af populationsprøven (som estimeres ved den positive forudsigelige værdi af testen på 10%), modsat hvad der ville resultere i en mindre nøjagtig metode til simpelthen at multiplicere relative risici.

specifikke kilder til unøjagtighedredit

specifikke kilder til unøjagtighed ved brug af sandsynlighedsforhold til bestemmelse af en sandsynlighed efter test inkluderer interferens med determinanter eller tidligere test eller overlapning af testmål, som forklaret nedenfor:

interferens med testEdit

post-test sandsynlighed, som estimeret ud fra præ-test Sandsynlighed med sandsynlighedsforhold, skal håndteres med forsigtighed hos personer med andre determinanter (såsom risikofaktorer) end den generelle befolkning såvel som hos personer, der har gennemgået tidligere test, fordi sådanne determinanter eller test også kan påvirke selve testen på uforudsigelig måde og stadig forårsage unøjagtige resultater. Et eksempel med risikofaktoren for fedme er, at yderligere abdominal fedt kan gøre det vanskeligt at palpere maveorganer og mindske opløsningen af abdominal ultralyd, og tilsvarende, restbariumkontrast fra en tidligere radiografi kan forstyrre efterfølgende abdominale undersøgelser, faktisk mindske følsomheden og specificiteterne ved sådanne efterfølgende tests. På den anden side kan effekten af interferens potentielt forbedre effektiviteten af efterfølgende tests sammenlignet med brugen i referencegruppen, såsom at nogle abdominale undersøgelser er lettere, når de udføres på undervægtige mennesker.

overlapning af testredit

endvidere afhænger gyldigheden af beregninger på enhver præ-test sandsynlighed, som i sig selv er afledt af en tidligere test, af, at de to tests ikke overlapper signifikant med hensyn til målparameteren, der testes, såsom blodprøver af stoffer, der tilhører en og samme forstyrrede metaboliske vej. Et eksempel på den ekstreme af en sådan overlapning er, hvor følsomheden og specificiteten er blevet etableret for en blodprøve, der detekterer “stof K”, og ligeledes for en detektering af “stof Y”. Hvis “stof” og “stof Y” faktisk er et og samme stof, kan det at foretage to på hinanden følgende test af et og samme stof muligvis slet ikke have nogen diagnostisk værdi, selvom beregningen ser ud til at vise en forskel. I modsætning til interferens som beskrevet ovenfor reducerer stigende overlapning af test kun deres effektivitet. I den medicinske indstilling øges diagnostisk gyldighed ved at kombinere test af forskellige modaliteter for at undgå væsentlig overlapning, for eksempel ved at lave en kombination af en blodprøve, en biopsi og røntgenbillede.

metoder til at overvinde unøjagtighedredit

for at undgå sådanne kilder til unøjagtighed ved hjælp af sandsynlighedsforhold ville den optimale metode være at samle en stor referencegruppe af ækvivalente individer for at etablere separate forudsigelige værdier til brug af testen hos sådanne individer. Men med mere viden om en persons sygehistorie, fysisk undersøgelse og tidligere test osv. denne person bliver mere differentieret med stigende vanskeligheder med at finde en referencegruppe til at etablere skræddersyede forudsigelige værdier, hvilket gør en estimering af sandsynligheden efter test ved hjælp af forudsigelige værdier ugyldig.

en anden metode til at overvinde sådanne unøjagtigheder er ved at evaluere testresultatet i forbindelse med diagnostiske kriterier som beskrevet i næste afsnit.

ved relativ risikoedit

post-test sandsynlighed kan undertiden estimeres ved at multiplicere præ-test Sandsynlighed med en relativ risiko givet af testen. I klinisk praksis anvendes dette normalt til evaluering af en persons medicinske historie, hvor “testen” normalt er et spørgsmål (eller endda antagelse) vedrørende forskellige risikofaktorer, for eksempel køn, tobaksrygning eller vægt, men det kan potentielt være en væsentlig test, såsom at sætte individet på en vejeskala. Når man bruger relative risici, er den resulterende Sandsynlighed normalt snarere relateret til den enkelte, der udvikler tilstanden over en periode (på samme måde som forekomsten i en befolkning), i stedet for at være sandsynligheden for, at et individ har tilstanden i nutiden, men kan indirekte være et skøn over sidstnævnte.

anvendelse af fareforhold kan anvendes noget på samme måde som relativ risiko.

en risikofaktorredit

for at etablere en relativ risiko divideres risikoen i en eksponeret gruppe med risikoen i en ikke-eksponeret gruppe.

hvis der kun tages højde for en enkelt risikofaktor, kan sandsynligheden efter testen estimeres ved at multiplicere den relative risiko med risikoen i kontrolgruppen. Kontrolgruppen repræsenterer normalt den ueksponerede befolkning, men hvis en meget lav brøkdel af befolkningen udsættes, kan forekomsten i den generelle befolkning ofte antages at være lig med forekomsten i kontrolgruppen. I sådanne tilfælde kan sandsynligheden efter test estimeres ved at multiplicere den relative risiko med risikoen i den generelle befolkning.

for eksempel anslås forekomsten af brystkræft hos en kvinde i Det Forenede Kongerige i alderen 55 Til 59 til ca.280 tilfælde pr. 100.000 om året, og risikofaktoren for at have været udsat for højdosis ioniserende stråling til brystet (for eksempel som behandlinger for andre kræftformer) giver en relativ risiko for brystkræft mellem 2.1 og 4.0 sammenlignet med ueksponeret. Fordi en lav del af befolkningen udsættes, kan forekomsten i den ueksponerede befolkning antages at være lig med forekomsten i den generelle befolkning. Derefter kan det anslås, at en kvinde i Det Forenede Kongerige, der er mellem 55 og 59 år, og som har været udsat for højdosis ioniserende stråling, bør have en risiko for at udvikle brystkræft over en periode på et år mellem 588 og 1.120 i 100.000 (det vil sige mellem 0,6% og 1.1%).

flere risikofaktorerredit

teoretisk set kan den samlede risiko i nærvær af flere risikofaktorer groft estimeres ved at multiplicere med hver relativ risiko, men er generelt meget mindre nøjagtig end at bruge sandsynlighedsforhold og udføres normalt kun fordi det er meget lettere at udføre, når der kun gives relative risici sammenlignet med for eksempel at konvertere kildedataene til følsomheder og specificiteter og beregne efter sandsynlighedsforhold. Ligeledes gives relative risici ofte i stedet for sandsynlighedsforhold i litteraturen, fordi førstnævnte er mere intuitiv. Kilder til unøjagtighed ved at multiplicere relative risici inkluderer:

  • Relative risici påvirkes af forekomsten af tilstanden i referencegruppen (i modsætning til sandsynlighedsforhold, som ikke er), og dette problem resulterer i, at gyldigheden af sandsynligheder efter test bliver mindre gyldig med stigende forskel mellem prævalensen i referencegruppen og sandsynligheden for præ-test for ethvert individ. Enhver kendt risikofaktor eller tidligere test af et individ giver næsten altid en sådan forskel, hvilket mindsker gyldigheden af at bruge relative risici ved estimering af den samlede effekt af flere risikofaktorer eller test. De fleste læger tager ikke passende hensyn til sådanne forskelle i prævalens ved fortolkning af testresultater, hvilket kan forårsage unødvendige test-og diagnostiske fejl.
  • en separat kilde til unøjagtighed ved at multiplicere flere relative risici, kun i betragtning af positive tests, er, at den har tendens til at overvurdere den samlede risiko sammenlignet med at bruge sandsynlighedsforhold. Denne overvurdering kan forklares ved metodens manglende evne til at kompensere for, at den samlede risiko ikke kan være mere end 100%. Denne overvurdering er ret lille for små risici, men bliver højere for højere værdier. For eksempel kan risikoen for at udvikle brystkræft i en alder yngre end 40 år hos kvinder i Det Forenede Kongerige estimeres til cirka 2%. Undersøgelser af Ashkenasiske Jøder har også vist, at en mutation i BRCA1 giver en relativ risiko for 21,6 for at udvikle brystkræft hos kvinder Under 40 år, og en mutation i BRCA2 giver en relativ risiko for 3.3 for at udvikle brystkræft hos kvinder Under 40 år. Ud fra disse data kan det estimeres, at en kvinde med en BRCA1-mutation ville have en risiko for cirka 40% af udviklingen af brystkræft i en alder yngre end 40 år, og kvinde med en BRCA2-mutation ville have en risiko på cirka 6%. I den temmelig usandsynlige situation med at have både en BRCA1 og en BRCA2-mutation ville simpelthen multiplicere med begge relative risici resultere i en risiko for over 140% af udviklingen af brystkræft inden 40 år, hvilket umuligt kan være nøjagtigt i virkeligheden.

den (sidstnævnte) effekt af overvurdering kan kompenseres ved at konvertere risici til odds og relative risici til odds-forhold. Dette kompenserer dog ikke for (tidligere nævnt) effekt af nogen forskel mellem præ-test Sandsynlighed for et individ og prævalensen i referencegruppen.

en metode til at kompensere for begge kilder til unøjagtighed ovenfor er at fastslå de relative risici ved multivariat regressionsanalyse. For at bevare sin gyldighed skal relative risici, der er etableret som sådan, multipliceres med alle de andre risikofaktorer i den samme regressionsanalyse og uden nogen tilføjelse af andre faktorer ud over regressionsanalysen.

derudover har multiplikation af flere relative risici den samme risiko for manglende vigtige overlapninger af de inkluderede risikofaktorer, på samme måde som ved brug af sandsynlighedsforhold. Forskellige risikofaktorer kan også virke i synergi med det resultat, at for eksempel to faktorer, som begge individuelt har en relativ risiko på 2, har en samlet relativ risiko på 6, når begge er til stede, eller kan hæmme hinanden, noget på samme måde som den interferens, der er beskrevet for anvendelse af sandsynlighedsforhold.

efter diagnostiske kriterier og kliniske forudsigelsesreglerredit

de fleste større sygdomme har etableret diagnostiske kriterier og/eller kliniske forudsigelsesregler. Etableringen af diagnostiske kriterier eller kliniske forudsigelsesregler består af en omfattende evaluering af mange tests, der betragtes som vigtige for at estimere sandsynligheden for en tilstand af interesse, nogle gange også, hvordan man opdeler den i undergrupper, og hvornår og hvordan man behandler tilstanden. En sådan etablering kan omfatte brug af forudsigelige værdier, sandsynlighedsforhold samt relative risici.

for eksempel definerer ACR-kriterierne for systemisk lupus erythematosus diagnosen som tilstedeværelse af mindst 4 ud af 11 fund, som hver kan betragtes som en målværdi af en test med sin egen følsomhed og specificitet. I dette tilfælde har der været evaluering af testene for disse målparametre, når de anvendes i kombination med hensyn til for eksempel interferens mellem dem og overlapning af målparametre, hvorved man stræber efter at undgå unøjagtigheder, der ellers kunne opstå, hvis man forsøgte at beregne sandsynligheden for sygdommen ved hjælp af sandsynlighedsforhold for de enkelte tests. Hvis der derfor er fastlagt diagnostiske kriterier for en tilstand, er det generelt mest hensigtsmæssigt at fortolke enhver sandsynlighed efter testen for denne tilstand i sammenhæng med disse kriterier.

der er også risikovurderingsværktøjer til estimering af den kombinerede risiko for flere risikofaktorer, såsom onlineværktøjet fra Framingham Heart Study til estimering af risikoen for koronar hjertesygdomsresultater ved hjælp af flere risikofaktorer, herunder alder, køn, blodlipider, blodtryk og rygning, hvilket er meget mere nøjagtigt end at multiplicere de individuelle relative risici for hver risikofaktor.

alligevel kan en erfaren læge estimere sandsynligheden efter testen (og de handlinger, den motiverer) ved en bred overvejelse, herunder kriterier og regler ud over andre tidligere beskrevne metoder, herunder både individuelle risikofaktorer og udførelsen af test, der er udført.



+