i klinisk praxis är sannolikheter efter test ofta bara grovt uppskattade eller till och med gissade. Detta är vanligtvis acceptabelt vid upptäckten av ett patognomoniskt tecken eller symptom, i vilket fall det är nästan säkert att måltillståndet är närvarande; eller i avsaknad av att hitta ett sinus qua non-tecken eller symptom, i vilket fall det är nästan säkert att måltillståndet är frånvarande.
i verkligheten är emellertid den subjektiva sannolikheten för närvaron av ett tillstånd aldrig exakt 0 eller 100%. Ändå finns det flera systematiska metoder för att uppskatta den sannolikheten. Sådana metoder är vanligtvis baserade på att tidigare ha utfört testet på en referensgrupp där närvaron eller frånvaron på villkoret är känd (eller åtminstone uppskattas av ett annat test som anses vara mycket exakt, såsom med ”guldstandard”), för att fastställa data om testprestanda. Dessa data används därefter för att tolka testresultatet för varje individ som testats med metoden. Ett alternativ eller komplement till referensgruppsbaserade metoder är att jämföra ett testresultat med ett tidigare test på samma individ, vilket är vanligare i test för övervakning.
de viktigaste systematiska referensgruppbaserade metoderna för att uppskatta sannolikheten efter testet inkluderar de som sammanfattas och jämförs i följande tabell och beskrivs vidare i enskilda avsnitt nedan.
metod | fastställande av prestandadata | metod för individuell tolkning | förmåga att exakt tolka efterföljande tester | ytterligare fördelar |
---|---|---|---|---|
med prediktiva värden | direkta kvoter från referensgrupp | mest enkla: prediktivt värde är lika med Sannolikhet | vanligtvis låg: Separat referensgrupp som krävs för varje efterföljande förtesttillstånd | tillgängligt både för binära och kontinuerliga värden |
med sannolikhetsförhållande | härledd från känslighet och specificitet | odds efter test som ges genom att multiplicera förtestodds med förhållandet | teoretiskt gränslöst | pre-test-tillstånd (och därmed sannolikheten före test) behöver inte vara samma som i referensgruppen |
med relativ risk | Riskkvot bland exponerade och risk bland oexponerade | Sannolikhet före testet multiplicerat med den relativa risken | låg, såvida inte efterföljande relativa risker härrör från samma multivariata regressionsanalys | relativt intuitiv att använda |
genom diagnostiska kriterier och kliniska prediktionsregler | variabel, men vanligtvis mest tråkiga | variabel | vanligtvis utmärkt för alla test som ingår i kriterier | vanligtvis mest föredraget om tillgängligt |
prediktiva värden kan användas för att uppskatta sannolikheten för en individ efter testet om sannolikheten för individen före testet kan antas ungefär lika med prevalensen i en referensgrupp där både testresultat och kunskap om närvaron eller frånvaron av tillståndet (till exempel en sjukdom, som kan bestämmas av ”guldstandard”) är tillgängliga.
om testresultatet är av binär klassificering i antingen positiva eller negativa tester kan följande tabell göras:
villkor (som bestäms av ”Gold standard”) |
||||
positiv | negativ | |||
Test resultat |
positivt | Sant positivt | falskt positivt (typ II-fel) |
positivt prediktivt värde i Brasilien |
negativt | falskt negativt (typ i-fel) |
Sant negativt | negativt prediktivt värde i | |
↓ känslighet |
↓ specificitet |
Brasilien noggrannhet |
Pre-test sannolikhet kan beräknas från diagrammet enligt följande:
Pretest probability = (True positive + False negative) / totalt prov
även i detta fall är den positiva sannolikheten efter testet (sannolikheten för att ha målförhållandet om testet faller ut positivt) numeriskt lika med det positiva prediktiva värdet och den negativa sannolikheten efter testet (sannolikheten för att ha målförhållandet om testet faller ut negativt) är numeriskt komplementärt till det negativa prediktiva värdet ( = 1 -), förutsatt att individen som testas inte har några andra riskfaktorer som resulterar i att individen har en annan Sannolikhet före testet än referensgruppen som används för att fastställa testets positiva och negativa prediktiva värden.
i diagrammet ovan beräknas denna positiva posttestsannolikhet, det vill säga posttestsannolikheten för ett måltillstånd som ges ett positivt testresultat, som:
positiv posttestsannolikhet = sanna positiva / (sanna positiva + falska positiva)
på samma sätt:
posttestsannolikheten för sjukdom som ges ett negativt resultat beräknas som::
negativ posttest Sannolikhet = falska negativa / (falska negativa + sanna negativa)
giltigheten av ekvationerna ovan beror också på att provet från befolkningen inte har väsentlig provtagningsförspänning som gör grupperna av dem som har tillståndet och de som inte väsentligt står i proportion till motsvarande prevalens och ”icke-prevalens” i befolkningen. I själva verket är ekvationerna ovan inte giltiga med bara en fallkontrollstudie som separat samlar en grupp med villkoret och en grupp utan det.
- med sannolikhetsförhållanderedigera
- ExampleEdit
- specifika källor till felaktighetredigera
- Interferens med testEdit
- överlappning av testsEdit
- metoder för att övervinna felaktighetredigera
- med relativ riskEdit
- en riskfaktordet
- multipla riskfaktorerredigera
- enligt diagnostiska kriterier och kliniska prediktionsreglerredigera
med sannolikhetsförhållanderedigera
ovanstående metoder är olämpliga att använda om förprovssannolikheten skiljer sig från prevalensen i referensgruppen som används för att fastställa bland annat testets positiva prediktiva värde. Sådan skillnad kan uppstå om ett annat test föregås, eller om personen som är involverad i diagnostiken anser att en annan Sannolikhet måste användas på grund av kunskap om till exempel specifika klagomål, andra delar av en medicinsk historia, tecken i en fysisk undersökning, antingen genom att beräkna på varje upptäckt som ett test i sig med sin egen känslighet och specificitet, eller åtminstone göra en grov uppskattning av den enskilda sannolikheten före testet.
i dessa fall är prevalensen i referensgruppen inte helt korrekt när det gäller att representera individens förtestssannolikhet, och följaktligen är det prediktiva värdet (oavsett om det är positivt eller negativt) inte helt korrekt när det gäller att representera sannolikheten för individen efter testet att ha måltillståndet.
i dessa fall kan en posttest Sannolikhet uppskattas mer exakt genom att använda ett sannolikhetsförhållande för testet. Sannolikhetsförhållandet beräknas utifrån testets känslighet och specificitet, och därmed beror det inte på prevalens i referensgruppen, och på samma sätt förändras det inte med förändrad Sannolikhet före testet, i motsats till positiva eller negativa prediktiva värden (vilket skulle förändras). I själva verket är giltigheten av sannolikheten efter testet bestämd från sannolikhetsförhållandet inte sårbar för provtagningsförspänning med avseende på dem med och utan tillståndet i populationsprovet och kan göras som en fallkontrollstudie som separat samlar dem med och utan villkoret.
uppskattning av sannolikhet efter test från Sannolikhet före test och sannolikhetsförhållande går enligt följande:
- Pretest odds = (Pretest Sannolikhet / (1 – Pretest Sannolikhet)
- posttest odds = Pretest odds * Sannolikhetsförhållande
i ekvationen ovan beräknas positiv Sannolikhet efter test med hjälp av sannolikhetsförhållandet positivt och den negativa sannolikheten efter test beräknas med hjälp av sannolikhetsförhållandet negativt.
- posttest Sannolikhet = posttest odds / (posttest odds + 1)
förhållandet kan också uppskattas med ett så kallat Fagan nomogram (visas till höger) genom att göra en rak linje från punkten för den givna sannolikheten före testet till det givna sannolikhetsförhållandet i deras skalor, vilket i sin tur uppskattar sannolikheten efter testet vid den punkt där den raka linjen korsar sin skala.
eftertestssannolikheten kan i sin tur användas som förtestssannolikhet för ytterligare tester om den fortsätter att beräknas på samma sätt.
-
Diagram som avser sannolikheter före och efter testet, med den gröna kurvan (övre vänstra halvan) som representerar ett positivt test och den röda kurvan (nedre högra halvan) som representerar ett negativt test, för fallet med 90% känslighet och 90% specificitet, motsvarande ett sannolikhetsförhållande positivt på 9 och ett sannolikhetsförhållande negativt på 0,111. Längden på de gröna pilarna representerar förändringen i absolut (snarare än relativ) Sannolikhet givet ett positivt test, och de röda pilarna representerar förändringen i absolut sannolikhet givet ett negativt test.
det kan ses från pilarnas Längd att vid låga sannolikheter före testet ger ett positivt test en större förändring i absolut sannolikhet än ett negativt test (en egenskap som i allmänhet är giltig så länge specificiteten inte är mycket högre än känsligheten). På samma sätt ger ett negativt test vid höga sannolikheter före testet en större förändring i absolut sannolikhet än ett positivt test (en egenskap som i allmänhet är giltig så länge känsligheten inte är mycket högre än specificiteten). -
förhållandet mellan pre-och post-test sannolikheter för olika sannolikhetsförhållande positiva (övre vänstra halvan) och olika sannolikhetsförhållande negativa (nedre högra halvan).
det är möjligt att göra en beräkning av sannolikhetsförhållanden för test med kontinuerliga värden eller mer än två resultat som liknar beräkningen för dikotoma resultat. För detta ändamål beräknas ett separat sannolikhetsförhållande för varje nivå av testresultat och kallas intervall-eller stratumspecifika sannolikhetsförhållanden.
ExampleEdit
en individ screenades med testet av fekalt ockult blod (FOB) för att uppskatta sannolikheten för den personen som har måltillståndet för tarmcancer, och det föll ut positivt (blod upptäcktes i avföring). Före testet hade den individen en sannolikhet före testet att ha tarmcancer på till exempel 3% (0, 03), vilket kunde ha uppskattats genom utvärdering av till exempel sjukdomshistoria, undersökning och tidigare tester av den individen.
känslighet, specificitet etc. av FOB-testet etablerades med ett befolkningsprov på 203 personer( utan sådan ärftlighet) och föll ut enligt följande:
patienter med tarmcancer (som bekräftat vid endoskopi) |
||||
positiv | negativ | |||
fekal ockult blod skärm test resultat |
positiv | TP = 2 | FP = 18 | positivt prediktivt värde för Brasilien = tp / (TP + FP) = 2 / (2 + 18) = 2 / 20 = 10% |
negativ | FN = 1 | TN = 182 | negativt prediktivt värde för kg = TN / (FN + TN) = 182 / (1 + 182) = 182 / 183 ≈ 99.5% |
|
↓ känslighet = TP / (TP + FN) = 2 / (2 + 1) = 2 / 3 ≈ 66.67% |
↓ specificitet = TN / (FP + TN) = 182 / (18 + 182) = 182 / 200 = 91% |
↘ noggrannhet = (TP + TN) / totalt = (2 + 182) / 203 = 184 / 203 = 90.64% |
från detta kan testets sannolikhetsförhållanden fastställas:
- Sannolikhetsförhållande positivt = känslighet / (1-specificitet) = 66.67% / (1 − 91%) = 7.4
- Sannolikhetsförhållande negativt = (1-känslighet) / specificitet = (1 − 66.67%) / 91% = 0.37
- Pretest Sannolikhet (i detta exempel) = 0.03
- pretest odds = 0.03 / (1 – 0.03) = 0.0309
- positiva posttest odds = 0.0309 * 7.4 = 0.229
- positiv posttest Sannolikhet = 0.229 / (0.229 + 1) = 0.186 eller 18.6%
således har den individen en sannolikhet efter testet (eller” risk efter testet”) på 18,6% av att ha tarmcancer.
prevalensen i populationsprovet beräknas vara:
- prevalens = (2 + 1) / 203 = 0.0148 eller 1.48%
individens Sannolikhet före testet var mer än dubbelt så stor som populationsprovet, även om individens Sannolikhet efter testet var mindre än dubbelt så stor som populationsprovet (vilket uppskattas av det positiva prediktiva värdet av testet på 10%), motsatt vad som skulle resultera med en mindre exakt metod för att helt enkelt multiplicera relativa risker.
specifika källor till felaktighetredigera
specifika källor till felaktighet vid användning av sannolikhetsförhållande för att bestämma en sannolikhet efter testet inkluderar störningar med determinanter eller tidigare tester eller överlappning av testmål, som förklaras nedan:
Interferens med testEdit
Sannolikhet efter test, som uppskattas från sannolikheten före testet med sannolikhetsförhållande, bör hanteras med försiktighet hos individer med andra determinanter (t.ex. riskfaktorer) än den allmänna befolkningen, liksom hos individer som har genomgått tidigare tester, eftersom sådana determinanter eller test också kan påverka själva testet på oförutsägbara sätt, vilket fortfarande orsakar felaktiga resultat. Ett exempel med riskfaktorn för fetma är att ytterligare bukfett kan göra det svårt att palpera bukorganen och minska upplösningen av buken ultraljud, och på liknande sätt, kvarleva barium kontrast från en tidigare röntgen kan störa efterföljande buken undersökningar, i själva verket minskar känsligheter och särdrag hos sådana efterföljande tester. Å andra sidan kan effekten av störningar potentiellt förbättra effekten av efterföljande tester jämfört med användning i referensgruppen, såsom att vissa bukundersökningar är lättare när de utförs på underviktiga personer.
överlappning av testsEdit
dessutom beror giltigheten av beräkningar på eventuell Sannolikhet före testet som i sig härrör från ett tidigare test på att de två testerna inte överlappar signifikant med avseende på målparametern som testas, såsom blodprov av ämnen som tillhör en och samma rubbade metaboliska väg. Ett exempel på det extrema av en sådan överlappning är där känsligheten och specificiteten har fastställts för ett blodprov som detekterar ”substans X” och på samma sätt för en som detekterar ”substans Y”. Om faktiskt ”substans X” och ”substans Y” är ett och samma ämne, kan det hända att två på varandra följande tester av ett och samma ämne inte har något diagnostiskt värde alls, även om beräkningen verkar visa en skillnad. I motsats till störningar som beskrivits ovan minskar ökande överlappning av test endast deras effektivitet. I medicinsk miljö ökas diagnostisk validitet genom att kombinera tester av olika metoder för att undvika väsentlig överlappning, till exempel vid en kombination av ett blodprov, en biopsi och röntgenbild.
metoder för att övervinna felaktighetredigera
för att undvika sådana källor till felaktighet genom att använda sannolikhetsförhållanden skulle den optimala metoden vara att samla en stor referensgrupp av ekvivalenta individer för att fastställa separata prediktiva värden för användning av testet hos sådana individer. Men med mer kunskap om en persons medicinska historia, fysisk undersökning och tidigare test etc. den individen blir mer differentierad, med ökande svårigheter att hitta en referensgrupp för att fastställa skräddarsydda prediktiva värden, vilket gör en uppskattning av sannolikheten efter testet med prediktiva värden ogiltiga.
en annan metod för att övervinna sådana felaktigheter är att utvärdera testresultatet i samband med diagnostiska kriterier, som beskrivs i nästa avsnitt.
med relativ riskEdit
Sannolikhet efter test kan ibland uppskattas genom att multiplicera sannolikheten före test med en relativ risk som ges av testet. I klinisk praxis tillämpas detta vanligtvis vid utvärdering av en individs medicinska historia, där ”testet” vanligtvis är en fråga (eller till och med antagande) om olika riskfaktorer, till exempel kön, tobaksrökning eller vikt, men det kan potentiellt vara ett väsentligt test som att sätta individen på en vågskala. När man använder relativa risker är den resulterande sannolikheten vanligtvis ganska relaterad till individen som utvecklar tillståndet under en tidsperiod (på samma sätt som förekomsten i en population), istället för att vara sannolikheten för att en individ har tillståndet i nuet, men kan indirekt vara en uppskattning av det senare.
användning av hazard ratio kan användas något på samma sätt som relativ risk.
en riskfaktordet
för att fastställa en relativ risk divideras risken i en exponerad grupp med risken i en oexponerad grupp.
om endast en riskfaktor för en individ beaktas kan sannolikheten efter testet uppskattas genom att multiplicera den relativa risken med risken i kontrollgruppen. Kontrollgruppen representerar vanligtvis den oexponerade befolkningen, men om en mycket låg del av befolkningen exponeras kan prevalensen i den allmänna befolkningen ofta antas vara lika med prevalensen i kontrollgruppen. I sådana fall kan sannolikheten efter testet uppskattas genom att multiplicera den relativa risken med risken i den allmänna befolkningen.
till exempel uppskattas förekomsten av bröstcancer hos en kvinna i Storbritannien i åldern 55 till 59 till cirka 280 fall per 100 000 per år, och riskfaktorn för att ha utsatts för högdos joniserande strålning till bröstet (till exempel som behandlingar för andra cancerformer) ger en relativ risk för bröstcancer mellan 2, 1 och 4, 0 jämfört med oexponerad. Eftersom en låg del av befolkningen exponeras kan prevalensen i den oexponerade befolkningen antas vara lika med prevalensen i den allmänna befolkningen. Därefter kan man uppskatta att en kvinna i Storbritannien som är mellan 55 och 59 år och som har utsatts för högdosjoniserande strålning bör ha en risk att utveckla bröstcancer under en period av ett år mellan 588 och 1.120 i 100.000 (det vill säga mellan 0,6% och 1.1%).
multipla riskfaktorerredigera
teoretiskt sett kan den totala risken i närvaro av multipla riskfaktorer grovt uppskattas genom att multiplicera med varje relativ risk, men är i allmänhet mycket mindre exakt än att använda sannolikhetsförhållanden, och görs vanligtvis bara för att det är mycket lättare att utföra när endast relativa risker ges, jämfört med att till exempel konvertera källdata till känsligheter och specificiteter och beräkna med sannolikhetsförhållanden. På samma sätt ges ofta relativa risker istället för sannolikhetsförhållanden i litteraturen eftersom den förra är mer intuitiv. Källor till felaktighet att multiplicera relativa risker inkluderar:
- relativa risker påverkas av förekomsten av tillståndet i referensgruppen (i motsats till sannolikhetsförhållanden, som inte är), och denna fråga resulterar i att giltigheten av sannolikheter efter testet blir mindre giltig med ökande skillnad mellan prevalensen i referensgruppen och sannolikheten före testet för varje individ. Varje känd riskfaktor eller tidigare test av en individ ger nästan alltid en sådan skillnad, vilket minskar giltigheten av att använda relativa risker vid uppskattning av den totala effekten av flera riskfaktorer eller test. De flesta läkare tar inte hänsyn till sådana skillnader i prevalens vid tolkning av testresultat, vilket kan orsaka onödiga test-och diagnosfel.
- en separat källa till felaktighet att multiplicera flera relativa risker, med tanke på endast positiva tester, är att den tenderar att överskatta den totala risken jämfört med att använda sannolikhetsförhållanden. Denna överskattning kan förklaras av metodens oförmåga att kompensera för det faktum att den totala risken inte kan vara mer än 100%. Denna överskattning är ganska liten för små risker, men blir högre för högre värden. Till exempel kan risken för att utveckla bröstcancer vid en ålder yngre än 40 år hos kvinnor i Storbritannien uppskattas till cirka 2%. Studier på Ashkenazi-judar har också visat att en mutation i BRCA1 ger en relativ risk för 21,6 för att utveckla bröstcancer hos kvinnor under 40 år, och en mutation i BRCA2 ger en relativ risk för 3.3 av att utveckla bröstcancer hos kvinnor under 40 år. Från dessa data kan det uppskattas att en kvinna med en BRCA1-mutation skulle ha en risk för cirka 40% av att utveckla bröstcancer vid en ålder yngre än 40 år, och kvinna med en BRCA2-mutation skulle ha en risk på cirka 6%. Men i den ganska osannolika situationen att ha både en BRCA1 och en BRCA2-mutation, skulle helt enkelt multiplicera med båda relativa riskerna leda till en risk för över 140% av att utveckla bröstcancer före 40 års ålder, vilket inte kan vara korrekt i verkligheten.
den (senare nämnda) effekten av överskattning kan kompenseras genom att konvertera risker till odds och relativa risker till oddsförhållanden. Detta kompenserar emellertid inte för (tidigare nämnda) effekt av någon skillnad mellan sannolikheten för en individ före testet och prevalensen i referensgruppen.
en metod för att kompensera för båda källorna till felaktighet ovan är att fastställa de relativa riskerna genom multivariat regressionsanalys. För att behålla sin giltighet måste dock relativa risker som fastställts som sådana multipliceras med alla andra riskfaktorer i samma regressionsanalys och utan tillägg av andra faktorer utöver regressionsanalysen.
dessutom har multiplicering av flera relativa risker samma risk att missa viktiga överlappningar av de inkluderade riskfaktorerna, på samma sätt som vid användning av sannolikhetsförhållanden. Olika riskfaktorer kan också verka i synergi, med resultatet att till exempel två faktorer som båda individuellt har en relativ risk för 2 har en total relativ risk för 6 när båda är närvarande, eller kan hämma varandra, något liknande den störning som beskrivs för användning av sannolikhetsförhållanden.
enligt diagnostiska kriterier och kliniska prediktionsreglerredigera
de flesta större sjukdomar har fastställt diagnostiska kriterier och/eller kliniska prediktionsregler. Fastställandet av diagnostiska kriterier eller kliniska prediktionsregler består av en omfattande utvärdering av många tester som anses vara viktiga för att uppskatta sannolikheten för ett tillstånd av intresse, ibland också hur man delar upp det i undergrupper, och när och hur man behandlar tillståndet. Sådan etablering kan innefatta användning av prediktiva värden, sannolikhetsförhållanden samt relativa risker.
till exempel definierar ACR-kriterierna för systemisk lupus erythematosus diagnosen som närvaro av minst 4 av 11 fynd, som var och en kan betraktas som ett målvärde för ett test med sin egen känslighet och specificitet. I detta fall har testerna för dessa målparametrar utvärderats när de använts i kombination med avseende på till exempel interferens mellan dem och överlappning av målparametrar, och strävar därmed efter att undvika felaktigheter som annars skulle kunna uppstå om man försöker beräkna sannolikheten för sjukdomen med hjälp av sannolikhetsförhållandena för de enskilda testerna. Om diagnostiska kriterier har fastställts för ett tillstånd är det därför i allmänhet lämpligast att tolka eventuell Sannolikhet efter testet för det tillståndet i samband med dessa kriterier.
det finns också riskbedömningsverktyg för att uppskatta den kombinerade risken för flera riskfaktorer, såsom onlineverktyget Från Framingham Heart Study för att uppskatta risken för kranskärlssjukdomsutfall med hjälp av flera riskfaktorer, inklusive ålder, kön, blodlipider, blodtryck och rökning, vilket är mycket mer exakt än att multiplicera de enskilda relativa riskerna för varje riskfaktor.
ändå kan en erfaren läkare uppskatta sannolikheten efter testet (och de åtgärder som den motiverar) med ett brett övervägande inklusive kriterier och regler utöver andra metoder som beskrivits tidigare, inklusive både individuella riskfaktorer och prestanda av tester som har utförts.