En pratique clinique, les probabilités après le test sont souvent simplement estimées ou même devinées. Ceci est généralement acceptable dans la recherche d’un signe ou d’un symptôme pathognomonique, auquel cas il est presque certain que la condition cible est présente; ou en l’absence de recherche d’un signe ou d’un symptôme sine qua non, auquel cas il est presque certain que la condition cible est absente.
En réalité, cependant, la probabilité subjective de la présence d’une condition n’est jamais exactement de 0 ou 100%. Pourtant, il existe plusieurs méthodes systématiques pour estimer cette probabilité. De telles méthodes sont généralement basées sur le fait d’avoir préalablement effectué le test sur un groupe de référence dans lequel la présence ou l’absence sur la condition est connue (ou du moins estimée par un autre test considéré comme très précis, tel que par « Gold standard »), afin d’établir des données de performance du test. Ces données sont ensuite utilisées pour interpréter le résultat du test de toute personne testée par la méthode. Une alternative ou un complément aux méthodes basées sur les groupes de référence consiste à comparer un résultat de test à un test précédent sur la même personne, ce qui est plus courant dans les tests de surveillance.
Les méthodes systématiques basées sur des groupes de référence les plus importantes pour estimer la probabilité post-test comprennent celles résumées et comparées dans le tableau suivant, et décrites plus en détail dans les sections individuelles ci-dessous.
Méthode | Établissement des données de performance | Méthode d’interprétation individuelle | Capacité d’interpréter avec précision les tests ultérieurs | Avantages supplémentaires |
---|---|---|---|---|
Par valeurs prédictives | Quotients directs du groupe de référence | Le plus simple: La valeur prédictive est égale à la probabilité | Généralement faible: Groupe de référence distinct requis pour chaque état de pré-test ultérieur | Disponible à la fois pour les valeurs binaires et continues |
Par rapport de vraisemblance | Dérivé de la sensibilité et de la spécificité | Cote post-test donnée en multipliant la cote pré-test avec le rapport | Théoriquement illimité | L’état pré-test (et donc la probabilité pré-test) ne doit pas nécessairement être le même que dans le groupe de référence |
Par risque relatif | Quotient de risque parmi les exposés et de risque parmi les non exposés | Probabilité pré-test multiplié par le risque relatif | Faible, à moins que les risques relatifs ultérieurs ne soient dérivés de la même analyse de régression multivariée | Relativement intuitive à utiliser |
Selon les critères diagnostiques et les règles de prédiction clinique | Variable, mais généralement la plus fastidieuse | Variable | Généralement excellente pour tous les tests inclus dans les critères | Généralement la plus préférable si disponible |
- Par valeurs prédictivesedit
- Par rapport de vraisemblancedit
- Exampledit
- Sources d’inexactitude spécifiquesmodifier
- Interférence avec le testmodifier
- Chevauchement des testsdit
- Méthodes pour surmonter l’inexactitude
- Par risque relatif
- Un facteur de risquemodifier
- Facteurs de risquemodifier
- Selon des critères diagnostiques et des règles de prédiction cliniquemodifier
Par valeurs prédictivesedit
Les valeurs prédictives peuvent être utilisées pour estimer la probabilité post-test d’un individu si la probabilité pré-test de l’individu peut être supposée à peu près égale à la prévalence dans un groupe de référence sur lequel les résultats des tests et les connaissances sur la présence ou l’absence de la condition (par exemple une maladie, telle que déterminée par « Gold standard ») sont disponibles.
Si le résultat du test est d’une classification binaire en tests positifs ou négatifs, le tableau suivant peut être établi:
Condition (telle que déterminée par « Gold standard ») |
||||
Positif | Négatif | |||
Test résultat |
Positif | Vrai Positif | Faux Positif (Erreur de type II) |
→ Valeur prédictive positive |
Négatif | Faux Négatif (Erreur de type I) |
Vrai Négatif | → Valeur prédictive négative | |
↓ Sensibilité |
↓ Spécificité |
Accuracy Précision |
La probabilité de pré-test peut être calculée à partir du diagramme comme suit:
Probabilité de pré-test = (Vrai positif + Faux négatif) / Échantillon total
Aussi, dans ce cas, la probabilité post-test positive (la probabilité d’avoir la condition cible si le test tombe positif), est numériquement égale à la valeur prédictive positive, et la probabilité post-test négative (la probabilité d’avoir la condition cible si le test tombe négatif) est numériquement complémentaire à la valeur prédictive négative (= 1-), en supposant encore que l’individu testé n’a pas de d’autres facteurs de risque qui font que cette personne a une probabilité pré-test différente de celle du groupe de référence utilisé pour établir les valeurs prédictives positives et négatives du test.
Dans le diagramme ci-dessus, cette probabilité post-test positive, c’est-à-dire la probabilité post-test d’une condition cible avec un résultat positif au test, est calculée comme suit:
Probabilité post-test positive = Vrais positifs / (Vrais positifs + Faux positifs)
De même:
La probabilité post-test de maladie avec un résultat négatif est calculée comme suit::
Probabilité post-test négative = Faux négatifs / (Faux négatifs + Vrais négatifs)
La validité des équations ci-dessus dépend également du fait que l’échantillon de la population n’a pas de biais d’échantillonnage substantiel qui rend les groupes de ceux qui ont la maladie et ceux qui ne sont pas substantiellement disproportionnés par rapport à la prévalence et à la « non-prévalence » correspondantes dans la population. En effet, les équations ci-dessus ne sont pas valables avec une simple étude cas-témoins qui recueille séparément un groupe avec la condition et un groupe sans elle.
Par rapport de vraisemblancedit
Les méthodes ci-dessus sont inappropriées à utiliser si la probabilité de pré-test diffère de la prévalence dans le groupe de référence utilisée pour établir, entre autres, la valeur prédictive positive du test. Une telle différence peut se produire si un autre test a précédé, ou si la personne impliquée dans le diagnostic considère qu’une autre probabilité de pré-test doit être utilisée en raison de la connaissance, par exemple, de plaintes spécifiques, d’autres éléments d’antécédents médicaux, de signes lors d’un examen physique, soit en calculant sur chaque constat comme un test en soi avec sa propre sensibilité et spécificité, soit en faisant au moins une estimation approximative de la probabilité individuelle de pré-test.
Dans ces cas, la prévalence dans le groupe de référence n’est pas complètement exacte pour représenter la probabilité pré-test de l’individu et, par conséquent, la valeur prédictive (qu’elle soit positive ou négative) n’est pas complètement exacte pour représenter la probabilité post-test de l’individu d’avoir la condition cible.
Dans ces cas, une probabilité post-test peut être estimée plus précisément en utilisant un rapport de vraisemblance pour le test. Le rapport de vraisemblance est calculé à partir de la sensibilité et de la spécificité du test et, par conséquent, il ne dépend pas de la prévalence dans le groupe de référence et, de même, il ne change pas avec la probabilité pré-test modifiée, contrairement aux valeurs prédictives positives ou négatives (qui changeraient). De plus, en fait, la validité de la probabilité post-test déterminée à partir du rapport de vraisemblance n’est pas vulnérable au biais d’échantillonnage en ce qui concerne les personnes avec et sans la condition dans l’échantillon de population, et peut être effectuée comme une étude cas-témoins qui rassemble séparément celles avec et sans la condition.
L’estimation de la probabilité post-test à partir du rapport de probabilité et de probabilité pré-test se présente comme suit:
- Chances de pré-test = (Probabilité de pré-test / (1 – Probabilité de pré-test)
- Chances de post-test = Chances de pré-test * Rapport de vraisemblance
Dans l’équation ci-dessus, la probabilité post-test positive est calculée en utilisant le rapport de vraisemblance positif, et la probabilité post-test négative est calculée en utilisant le rapport de vraisemblance négatif.
- Probabilité Posttest = Cotes Posttest /(Cotes Posttest + 1)
La relation peut également être estimée par un nomogramme dit de Fagan (illustré à droite) en faisant une ligne droite du point de la probabilité pré-test donnée au rapport de vraisemblance donné dans leurs échelles, qui, à son tour, estime la probabilité post-test au point où cette ligne droite croise son échelle.
La probabilité post-test peut, à son tour, être utilisée comme probabilité pré-test pour des tests supplémentaires si elle continue à être calculée de la même manière.
-
Diagramme relatant les probabilités pré et post-test, la courbe verte (moitié supérieure gauche) représentant un test positif, et la courbe rouge (moitié inférieure droite) représentant un test négatif, pour le cas d’une sensibilité à 90% et d’une spécificité à 90%, correspondant à un rapport de vraisemblance positif de 9, et un rapport de vraisemblance négatif de 0,111. La longueur des flèches vertes représente le changement de probabilité absolue (plutôt que relative) pour un test positif, et les flèches rouges représentent le changement de probabilité absolue pour un test négatif.
Il ressort de la longueur des flèches que, à de faibles probabilités pré-test, un test positif donne un plus grand changement de probabilité absolue qu’un test négatif (une propriété généralement valable tant que la spécificité n’est pas beaucoup plus élevée que la sensibilité). De même, à des probabilités pré-test élevées, un test négatif donne un changement de probabilité absolue plus important qu’un test positif (une propriété généralement valable tant que la sensibilité n’est pas beaucoup plus élevée que la spécificité). -
Relation entre les probabilités pré- et post-test pour divers positifs du rapport de vraisemblance (moitié supérieure gauche) et divers négatifs du rapport de vraisemblance (moitié inférieure droite).
Il est possible de faire un calcul des rapports de vraisemblance pour les tests avec des valeurs continues ou plus de deux résultats, ce qui est similaire au calcul pour les résultats dichotomiques. À cette fin, un rapport de vraisemblance distinct est calculé pour chaque niveau de résultat du test et est appelé rapport de vraisemblance spécifique à un intervalle ou à une strate.
Exampledit
Un individu a été testé avec le test de sang occulte fécal (FOB) pour estimer la probabilité que cette personne ait l’état cible du cancer de l’intestin, et il est tombé positif (du sang a été détecté dans les selles). Avant le test, cette personne avait une probabilité pré-test d’avoir un cancer de l’intestin de, par exemple, 3% (0,03), comme on aurait pu l’estimer en évaluant, par exemple, les antécédents médicaux, l’examen et les tests antérieurs de cette personne.
La sensibilité, la spécificité, etc. du test FOB ont été établis avec un échantillon de population de 203 personnes (sans une telle hérédité), et sont tombés comme suit:
Patients atteints d’un cancer de l’intestin (comme confirmé par endoscopie) |
||||
Positif | Négatif | |||
Fécale occulte sang écran test résultat |
Positif | TP = 2 | FP = 18 | → Valeur prédictive positive = TP /(TP + FP) = 2 / (2 + 18) = 2 / 20 = 10% |
Négatif | FN = 1 | TN = 182 | → Valeur prédictive négative = TN/(FN + TN) = 182 / (1 + 182) = 182 / 183 ≈ 99.5% |
|
↓ Sensibilité = TP/(TP + FN) = 2 / (2 + 1) = 2 / 3 ≈ 66.67% |
↓ Spécificité = TN/(FP + TN) = 182 / (18 + 182) = 182 / 200 = 91% |
↘ Précision = (TP + TN) / Total = (2 + 182) / 203 = 184 / 203 = 90.64% |
À partir de là, les rapports de vraisemblance du test peuvent être établis:
- Rapport de vraisemblance positif = sensibilité / (1- spécificité) = 66.67% / (1 − 91%) = 7.4
- Rapport de vraisemblance négatif = (1- sensibilité) / spécificité = (1 − 66.67%) / 91% = 0.37
- Probabilité de pré-test (dans cet exemple) = 0,03
- Chances de pré-test = 0.03 / (1 – 0.03) = 0.0309
- Cotes positives après le test = 0.0309 * 7.4 = 0.229
- Probabilité post-test positive = 0.229 / (0.229 + 1) = 0.186 ou 18.6%
Ainsi, cette personne a une probabilité post-test (ou « risque post-test ») de 18,6% d’avoir un cancer de l’intestin.
La prévalence dans l’échantillon de population est calculée comme suit ::
- Prévalence = (2 + 1) / 203 = 0.0148 ou 1.48%
La probabilité pré-test de l’individu était plus de deux fois supérieure à celle de l’échantillon de population, bien que la probabilité post-test de l’individu était moins de deux fois supérieure à celle de l’échantillon de population (estimée par la valeur prédictive positive du test de 10%), contrairement à ce qui résulterait d’une méthode moins précise consistant à simplement multiplier les risques relatifs.
Sources d’inexactitude spécifiquesmodifier
Les sources d’inexactitude spécifiques lors de l’utilisation du rapport de vraisemblance pour déterminer une probabilité post-test comprennent l’interférence avec des déterminants ou des tests antérieurs ou le chevauchement de cibles de test, comme expliqué ci-dessous:
Interférence avec le testmodifier
La probabilité post-test, telle qu’estimée à partir de la probabilité pré-test avec le rapport de vraisemblance, doit être manipulée avec prudence chez les personnes ayant d’autres déterminants (tels que des facteurs de risque) que la population générale, ainsi que chez les personnes ayant subi des tests antérieurs, car ces déterminants ou tests peuvent également influencer le test lui-même de manière imprévisible, entraînant toujours des résultats inexacts. Un exemple avec le facteur de risque d’obésité est que la graisse abdominale supplémentaire peut rendre difficile la palpation des organes abdominaux et diminuer la résolution de l’échographie abdominale, et de même, le contraste de baryum résiduel d’une radiographie précédente peut interférer avec les examens abdominaux ultérieurs, diminuant en effet les sensibilités et les spécificités de ces tests ultérieurs. D’autre part, l’effet de l’interférence peut potentiellement améliorer l’efficacité des tests ultérieurs par rapport à l’utilisation dans le groupe de référence, tels que certains examens abdominaux plus faciles lorsqu’ils sont effectués sur des personnes en insuffisance pondérale.
Chevauchement des testsdit
De plus, la validité des calculs sur toute probabilité pré-test qui est elle-même dérivée d’un test précédent dépend du fait que les deux tests ne se chevauchent pas de manière significative en ce qui concerne le paramètre cible testé, comme les tests sanguins de substances appartenant à une seule et même voie métabolique perturbée. Un exemple de l’extrême d’un tel chevauchement est celui où la sensibilité et la spécificité ont été établies pour un test sanguin détectant la « substance X », et de même pour un test détectant la « substance Y ». Si, en fait, la « substance X » et la « substance Y » sont une seule et même substance, alors, faire deux tests consécutifs d’une même substance peut ne pas avoir de valeur diagnostique du tout, bien que le calcul semble montrer une différence. Contrairement à l’interférence décrite ci-dessus, le chevauchement croissant des tests ne fait que diminuer leur efficacité. Dans le cadre médical, la validité diagnostique est augmentée en combinant des tests de différentes modalités pour éviter un chevauchement substantiel, par exemple en combinant un test sanguin, une biopsie et une radiographie.
Méthodes pour surmonter l’inexactitude
Pour éviter de telles sources d’inexactitude en utilisant des rapports de vraisemblance, la méthode optimale serait de rassembler un grand groupe de référence d’individus équivalents, afin d’établir des valeurs prédictives distinctes pour l’utilisation du test chez ces individus. Cependant, avec une meilleure connaissance des antécédents médicaux d’une personne, de l’examen physique et du test antérieur, etc. cet individu devient plus différencié, avec de plus en plus de difficulté à trouver un groupe de référence pour établir des valeurs prédictives personnalisées, rendant invalide une estimation de la probabilité post-test par des valeurs prédictives.
Une autre méthode pour surmonter de telles inexactitudes consiste à évaluer le résultat du test dans le contexte des critères de diagnostic, comme décrit dans la section suivante.
Par risque relatif
La probabilité post-test peut parfois être estimée en multipliant la probabilité pré-test par un risque relatif donné par le test. En pratique clinique, cela est généralement appliqué à l’évaluation des antécédents médicaux d’une personne, où le « test » est généralement une question (ou même une hypothèse) concernant divers facteurs de risque, par exemple le sexe, le tabagisme ou le poids, mais il peut potentiellement s’agir d’un test substantiel, tel que mettre l’individu sur une balance. Lors de l’utilisation des risques relatifs, la probabilité résultante est généralement plutôt liée à l’individu qui développe la maladie sur une période de temps (de la même manière que l’incidence dans une population), au lieu d’être la probabilité qu’un individu ait la maladie dans le présent, mais peut indirectement être une estimation de cette dernière.
L’utilisation du rapport de risque peut être utilisée de manière quelque peu similaire au risque relatif.
Un facteur de risquemodifier
Pour établir un risque relatif, le risque dans un groupe exposé est divisé par le risque dans un groupe non exposé.
Si un seul facteur de risque d’un individu est pris en compte, la probabilité post-test peut être estimée en multipliant le risque relatif par le risque dans le groupe témoin. Le groupe témoin représente généralement la population non exposée, mais si une fraction très faible de la population est exposée, la prévalence dans la population générale peut souvent être supposée égale à la prévalence dans le groupe témoin. Dans de tels cas, la probabilité post-test peut être estimée en multipliant le risque relatif par le risque dans la population générale.
Par exemple, l’incidence du cancer du sein chez une femme au Royaume-Uni âgée de 55 à 59 ans est estimée à environ 280 cas pour 100 000 par an, et le facteur de risque d’avoir été exposé à des rayonnements ionisants à forte dose dans la poitrine (par exemple, en tant que traitement d’autres cancers) confère un risque relatif de cancer du sein compris entre 2,1 et 4,0, par rapport à non exposé. Étant donné qu’une faible fraction de la population est exposée, la prévalence dans la population non exposée peut être supposée égale à la prévalence dans la population générale. Par la suite, on peut estimer qu’une femme au Royaume-Uni âgée de 55 à 59 ans et exposée à des rayonnements ionisants à forte dose devrait avoir un risque de développer un cancer du sein sur une période d’un an comprise entre 588 et 1.120 sur 100.000 (soit entre 0,6% et 1,1%).
Facteurs de risquemodifier
Théoriquement, le risque total en présence de facteurs de risques multiples peut être estimé grossièrement en multipliant avec chaque risque relatif, mais il est généralement beaucoup moins précis que d’utiliser des ratios de vraisemblance, et n’est généralement fait que parce qu’il est beaucoup plus facile à réaliser lorsque seuls les risques relatifs sont donnés, par exemple en convertissant les données sources en sensibilités et spécificités et en les calculant par des ratios de vraisemblance. De même, les risques relatifs sont souvent donnés à la place des ratios de vraisemblance dans la littérature parce que le premier est plus intuitif. Les sources d’inexactitude de la multiplication des risques relatifs comprennent:
- Les risques relatifs sont influencés par la prévalence de la maladie dans le groupe de référence (contrairement aux ratios de probabilité, qui ne le sont pas), et cette question entraîne que la validité des probabilités post-test devient moins valide avec l’augmentation de la différence entre la prévalence dans le groupe de référence et la probabilité pré-test pour tout individu. Tout facteur de risque connu ou test antérieur d’un individu confère presque toujours une telle différence, ce qui diminue la validité de l’utilisation des risques relatifs pour estimer l’effet total de plusieurs facteurs de risque ou tests. La plupart des médecins ne tiennent pas dûment compte de ces différences de prévalence lors de l’interprétation des résultats des tests, ce qui peut entraîner des tests inutiles et des erreurs de diagnostic.
- Une source distincte d’inexactitude de la multiplication de plusieurs risques relatifs, en ne considérant que les tests positifs, est qu’elle tend à surestimer le risque total par rapport à l’utilisation de ratios de vraisemblance. Cette surestimation peut s’expliquer par l’incapacité de la méthode à compenser le fait que le risque total ne peut pas dépasser 100%. Cette surestimation est plutôt faible pour les petits risques, mais devient plus élevée pour les valeurs plus élevées. Par exemple, le risque de développer un cancer du sein à un âge inférieur à 40 ans chez les femmes au Royaume-Uni peut être estimé à environ 2%. En outre, des études sur les Juifs ashkénazes ont indiqué qu’une mutation de BRCA1 confère un risque relatif de 21,6 de développer un cancer du sein chez les femmes de moins de 40 ans, et une mutation de BRCA2 confère un risque relatif de 3.3 de développer un cancer du sein chez les femmes de moins de 40 ans. À partir de ces données, on peut estimer qu’une femme avec une mutation BRCA1 aurait un risque d’environ 40% de développer un cancer du sein à un âge inférieur à 40 ans, et une femme avec une mutation BRCA2 aurait un risque d’environ 6%. Cependant, dans la situation plutôt improbable d’avoir à la fois une mutation BRCA1 et une mutation BRCA2, la simple multiplication avec les deux risques relatifs entraînerait un risque de plus de 140% de développer un cancer du sein avant l’âge de 40 ans, ce qui ne peut pas être exact dans la réalité.
L’effet (mentionné plus haut) de la surestimation peut être compensé en convertissant les risques en cotes et les risques relatifs en rapports de cotes. Cependant, cela ne compense pas l’effet (mentionné précédemment) d’une différence entre la probabilité pré-test d’un individu et la prévalence dans le groupe de référence.
Une méthode pour compenser les deux sources d’inexactitude ci-dessus consiste à établir les risques relatifs par analyse de régression multivariée. Cependant, pour conserver sa validité, les risques relatifs établis en tant que tels doivent être multipliés par tous les autres facteurs de risque dans la même analyse de régression, et sans ajout d’autres facteurs au-delà de l’analyse de régression.
De plus, la multiplication de plusieurs risques relatifs a le même risque de manquer des chevauchements importants des facteurs de risque inclus, de la même manière que lors de l’utilisation de ratios de vraisemblance. De plus, différents facteurs de risque peuvent agir en synergie, de sorte que, par exemple, deux facteurs qui ont tous deux individuellement un risque relatif de 2 ont un risque relatif total de 6 lorsque les deux sont présents, ou peuvent s’inhiber mutuellement, de manière quelque peu similaire à l’interférence décrite pour l’utilisation des rapports de vraisemblance.
Selon des critères diagnostiques et des règles de prédiction cliniquemodifier
La plupart des maladies majeures ont établi des critères diagnostiques et/ou des règles de prédiction clinique. L’établissement de critères diagnostiques ou de règles de prédiction clinique consiste en une évaluation complète de nombreux tests considérés comme importants pour estimer la probabilité d’une affection d’intérêt, comprenant parfois également comment la diviser en sous-groupes, et quand et comment traiter la maladie. Cet établissement peut inclure l’utilisation de valeurs prédictives, de rapports de vraisemblance ainsi que de risques relatifs.
Par exemple, les critères ACR pour le lupus érythémateux disséminé définissent le diagnostic comme la présence d’au moins 4 résultats sur 11, chacun pouvant être considéré comme une valeur cible d’un test avec sa propre sensibilité et spécificité. Dans ce cas, il y a eu évaluation des tests pour ces paramètres cibles lorsqu’ils sont utilisés en combinaison en ce qui concerne, par exemple, l’interférence entre eux et le chevauchement des paramètres cibles, s’efforçant ainsi d’éviter les inexactitudes qui pourraient autrement survenir si l’on tentait de calculer la probabilité de la maladie à l’aide des rapports de vraisemblance des tests individuels. Par conséquent, si des critères diagnostiques ont été établis pour une affection, il est généralement plus approprié d’interpréter toute probabilité post-test pour cette affection dans le contexte de ces critères.
En outre, il existe des outils d’évaluation des risques pour estimer le risque combiné de plusieurs facteurs de risque, tels que l’outil en ligne de l’étude Framingham Heart pour estimer le risque de maladie coronarienne en utilisant plusieurs facteurs de risque, y compris l’âge, le sexe, les lipides sanguins, la pression artérielle et le tabagisme, étant beaucoup plus précis que de multiplier les risques relatifs individuels de chaque facteur de risque.
Pourtant, un médecin expérimenté peut estimer la probabilité post-test (et les actions qu’elle motive) par une large considération comprenant des critères et des règles en plus d’autres méthodes décrites précédemment, incluant à la fois les facteurs de risque individuels et les performances des tests qui ont été effectués.