imprimer

Module 35:

Un test diagnostique est, en médecine, un test qui permet de poser un diagnostic, c'est à dire distinguer, pour une affection donnée, les individus malades des individus sains.

La validité d'un test diagnostique dépend de plusieurs paramètres comme la sensibilité, la spécificité, les valeurs prédictives, les rapports de vraisemblance, ...

L'analyse de la validité d'un test diagnostique doit tenir compte d'un certain nombre de biais et de problèmes (test de référence imparfait, personnes non-vérifiées, ...).

La comparaison de deux analyses de résultats par la même méthode diagnostique peut également constituer une information intéressante. Cela est rendu possible par le calcul de la concordance entre les deux résultats (index Kappa).

Les résultats d'un test diagnostique peuvent être représentés sous forme d'une table de contingence qui permet de croiser le résultat du test (positif ou négatif) avec le statut du sujet (malade ou non-malade).

Si l'événement A est "être malade" et l'événement B est "être positif au test", la table de contingence reprenant leurs fréquences (et non leurs probabilités) se construit comme suit:

	A	A*
B	A ∩ B	A* ∩ B	B
B*	A ∩ B*	A* ∩ B*	B*
	A	A*

Quatre combinaisons sont possibles:

a) un vrai positif (VP) est une personne qui est malade et qui présente un test positif.
b) un faux positif (FP) est une personne qui n'est pas malade et qui présente un test positif.
c) un faux négatif (FN) est une personne qui est malade et qui présente un test négatif.
d) un vrai négatif (VN) est une personne qui n'est pas malade et qui présente un test négatif.

	Malade	Non-malade
Positif	a	b	a + b
Négatif	c	d	c + d
	a + c	b + d	N

	Malade	Non-malade
Positif	VP	FP	VP + FP
Négatif	FN	VN	FN + VN
	VP + FN	FP + VN	N

On note N l'ensemble de tous les résultats obtenus.

Sensibilité

La sensibilité (Se) est la probabilité qu'un test réalisé sur une personne malade se révèle positif; autrement dit, que le test soit positif sachant que la personne est malade.

	Malade	Non-malade
Positif	a	b	a + b
Négatif	c	d	c + d
	a + c	b + d	N

La sensibilité correspond donc au nombre de personnes malades et positives au test (vrais positifs) parmi l'ensemble des personnes malades.

Spécificité

La spécificité (Sp) est la probabilité qu'un test réalisé sur une personne saine se révèle négatif; autrement dit, que le test soit négatif sachant que la personne n'est pas malade.

	Malade	Non-malade
Positif	a	b	a + b
Négatif	c	d	c + d
	a + c	b + d	N

La spécificité correspond donc au nombre de personnes non-malades et négatives au test (vrais négatifs) parmi l'ensemble des personnes non-malades.

Exemple

	Malade	Non-malade
Positif	90	10	100
Négatif	25	75	100
	115	85	200

Une sensibilité de 0,78 signifie que, lorsque le patient est malade, il y a 78% de chance que le test de dépistage de la maladie soit positif.

Une spécificité de 0,88 signifie que, lorsque le patient n'est pas malade, il y a 88% de chance que le test de dépistage de la maladie soit négatif.

Lorsque le médecin reçoit le résultat (positif ou négatif) d'un test pratiqué sur un de ses patients, il a besoin de connaitre la probabilité que son patient soit malade ou non.

Valeur prédictive positive

La valeur prédictive positive (VPP) est la probabilité que le patient, dont le test est positif, soit effectivement malade.

	Malade	Non-malade
Positif	a	b	a + b
Négatif	c	d	c + d
	a + c	b + d	N

La valeur prédictive positive correspond donc au nombre de personnes malades et positives au test (vrais positifs) parmi l'ensemble des personnes positives au test.

Valeur prédictive négative

La valeur prédictive négative (VPN) est la probabilité que le patient, dont le test est négatif, ne soit pas malade.

	Malade	Non-malade
Positif	a	b	a + b
Négatif	c	d	c + d
	a + c	b + d	N

La valeur prédictive négative correspond donc au nombre de personnes non-malades et négatives au test (vrais négatifs) parmi l'ensemble des personnes négatives au test.

Les valeurs prédictives, positive et négative, dépendent de la prévalence de la maladie.

Exemple

	Malade	Non-malade
Positif	90	10	100
Négatif	25	75	100
	115	85	200

Une valeur prédictive positive de 0,90 signifie que le patient a 90% de risque d'être malade quand le test de dépistage de la maladie est positif.

Une valeur prédictive négative de 0,75 signifie que le patient a 75% de chance de ne pas être atteint de la maladie quand le test de dépistage de cette maladie est négatif.

L'index de Youden (Y) est une mesure de la précision de la méthode de diagnostic. Il dépend de la spécificité et de la sensibilité du test mais pas de la prévalence de la maladie.

L'index de Youden est compris entre 0 (la méthode de diagnostic n'est pas efficace) et 1 (la méthode est parfaite).

Exemple

	Malade	Non-malade
Positif	90	10	100
Négatif	25	75	100
	115	85	200

L'efficacité diagnostique est la proportion de résultats corrects dans l'ensemble des résultats du test.
Les résultats corrects sont les personnes dont le diagnostic posé suite au test correspond à son statut; il s'agit donc des vrais positifs et des vrais négatifs.

	Malade	Non-malade
Positif	a	b	a+b
Négatif	c	d	c+d
	a+c	b+d	N

Exemple

	Malade	Non-malade
Positif	90	10	100
Négatif	25	75	100
	115	85	200

Une efficacité diagnostique de 0,825 signifie que 82,5% des résultats obtenus lors du test sont corrects.

Rapport de vraisemblance positif

Le rapport de vraisemblance positif (RV(+)) est le rapport entre la probabilité de présenter un test positif quand la personne est malade et la probabilité de présenter un test positif quand la personne n'est pas malade.

Rapport de vraisemblance négatif

Le rapport de vraisemblance négatif (RV(-)) est le rapport entre la probabilité de présenter un test négatif quand la personne est malade et la probabilité de présenter un test négatif quand la personne n'est pas malade.

Exemple

	Malade	Non-malade
Positif	90	10	100
Négatif	25	75	100
	115	85	200

Un rapport de vraisemblance positif de 6,5 signifie qu'il y a six fois et demi plus de chance de présenter un test positif lorsque la personne est malade que lorsque la personne n'est pas malade.

Un rapport de vraisemblance négatif de 0,25 signifie qu'il y a quatre fois plus de chance de présenter un test négatif lorsque la personne n'est pas malade que lorsque la personne est malade.

Le théorème de Bayes permet de déterminer les valeurs prédictives d'un test en connaissant la prévalence de la maladie, la sensibilité et la spécificité du test.

La formule générale du théorème de Bayes peut être retrouvée à partir de la loi des probabilités conditionnelles.

Loi des probabilités conditionnelles:

Or, il est possible de décomposer les membres de la fraction:

au num�rateur:

au d�nominateur:

La formule générale du théorème de Bayes est donc:

Soient les événements A "être malade " et B "être positif au test" et sachant que p(A) est la prévalence de la maladie (notée p), p(B/A) est la sensibilité et p(B*/A*) est la spécificité, alors le théorème de Bayes, appliqué aux tests diagnostiques, devient:

Pour qu'une personne soit classée comme malade ou non-malade, il est nécessaire d'utiliser une autre méthode de dépistage de cette maladie ayant déjà fait ses preuves (test de référence).
Toutefois, la vérification par ce test de référence peut ne pas être réalisée chez tous les participants de l'étude. Cela est particulièrement le cas si le test de référence est invasif ou risqué.

Ainsi, une personne ayant subi le nouveau test de dépistage peut être classée dans une des trois catégories suivantes:

vérifiée et malade (on est certain du résultat du test);
vérifiée et non-malade (on est certain du résultat du test);
non-vérifiée (on n'a pas la certitude que le résultat est correct; donc, souvent, on ne les prend pas en compte).

	Vérifié			Non-vérifié
	Malade	Non-malade	Total	Non-vérifié
Positif	a	b	t₁	u₁
Négatif	c	d	t₀	u₀

On note:

t₁, l'ensemble des personnes positives et vérifiées;
t₀, l'ensemble des personnes négatives et vérifiées;
u₁, l'ensemble des personnes positives mais non-vérifiées;
u₀, l'ensemble des personnes négatives mais non-vérifiées.

Bien qu'elles ne puissent être classées comme malades ou non-malades, les personnes non-vérifiées doivent être prises en compte lors du calcul de la sensibilité et de la spécificité. Ainsi, les formules utilisées sont modifiées et deviennent:

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test. Toutefois, 5 personnes positives et 20 personnes négatives au test n'ont pas pu être classées comme malades ou non-malades. En tenant compte de ces personnes non-vérifiées, quelles sont la sensibilité et la spécificité de ce test ?

	Vérifié			Non-vérifié
	Malade	Non-malade	Total	Non-vérifié
Positif	90	10	100	5
Négatif	25	75	100	20

La sensibilité du test est de 75,9% tandis que sa spécificité est de 89,6%.
Si on ne tient pas compte des personnes non-vérifiées, la sensibilité et la spécificité apparentes valent respectivement 78% et 88%.

On constate donc que, si on néglige le biais de vérification, la sensibilité réelle du test est sur-estimée tandis que la spécificité réelle est sous-estimée.

Le test de référence qui a permis de classer les sujets comme malade ou non-malade n'est pas parfait; il présente une sensibilité et une spécificité propre. Il est indispensable de tenir compte de cette imperfection pour déterminer la sensibilité et la spécificité du test étudié.

Si Se_R et Sp_R sont respectivement la sensibilité et la spécificité du test de référence, les formules utilisées pour le calcul de la sensibilité et de la spécificité réelles du test étudié deviennent:

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test. Le test qui a permis de classer les participants de cette étude en malade et non-malade a une sensibilité de 0,90 et une spécificité de 0,95. En tenant compte de l'imperfection du test de référence, quelles sont la sensibilité et la spécificité du test étudié ?

	Malade	Non-malade
Positif	90	10	100
Négatif	25	75	100
	115	85	200

La sensibilité et la spécificité réelles du test étudié sont respectivement de 81% et 100%.

Lorsqu'un test est réalisé, il est possible qu'une partie des résultats ne soient ni positifs, ni négatifs; ils sont alors considérés comme incertains.

La table de contingence construite pour illustrer les résultats est adaptée à cette situation. Deux nouvelles possibilités apparaissent:

i₁, le nombre de résultats incertains chez les personnes malades;
i₀, le nombre de résultats incertains chez les personnes saines.

	Malade	Non-malade
Positif	a	b
Incertain	i₁	i₀
Négatif	c	d
	a+i₁+c	b+i₀+d

Plusieurs approches sont possibles pour tenir compte des résultats incertains lors de la détermination de la sensibilité et de la spécificité du test étudié.

Approche 1: situation la plus défavorable.

Dans cette approche, les résultats incertains sont considérés comme:

négatifs lors du calcul de la sensibilité,
positifs lors du calcul de la spécificité.

Les formules utilisées pour la détermination de la sensibilité et de la spécificité sont adaptées à cette situation.

La sensibilité devient le rapport entre le nombre de personnes malades et positives et l'ensemble des personnes malades.

	Malade	Non-malade
Positif	a	b
Incertain	i₁	i₀
Négatif	c	d
	a+i₁+c	b+i₀+d

La spécificité devient le rapport entre le nombre de personnes saines (non-malades) et négatives et l'ensemble des personnes saines.

	Malade	Non-malade
Positif	a	b
Incertain	i₁	i₀
Négatif	c	d
	a+i₁+c	b+i₀+d

Approche 2: intervalle entre deux bornes.

Lors de cette approche, la borne inférieure est calculée dans la situation la plus défavorable tandis que la borne supérieure est calculée dans la situation la plus favorable. Ainsi, les résultats incertains sont considérés comme:

positifs lors du calcul de la sensibilité;
négatifs lors du calcul de la spécificité.

La borne supérieure de la sensibilité est le rapport entre le nombre de personnes malades et positives, ou considérées comme positives, et l'ensemble des personnes malades.

	Malade	Non-malade
Positif	a	b
Incertain	i₁	i₀
Négatif	c	d
	a+i₁+c	b+i₀+d

La borne supérieure de la spécificité est donc le rapport entre le nombre de personnes saines (non-malades) et négatives, ou considérées comme négatives, et l'ensemble des personnes saines.

	Malade	Non-malade
Positif	a	b
Incertain	i₁	i₀
Négatif	c	d
	a+i₁+c	b+i₀+d

Ainsi, la sensibilité et la spécificité réelles du test sont comprises entre une borne inférieure (cf approche 1) et une borne supérieure.

Approche 3: rendements.

Cette approche consiste à déterminer la sensibilité et la spécificité sans tenir compte des résultats incertains mais en précisant la proportion de résultats certains (rendements).

La sensibilité est accompagnée de la valeur du rendement positif du test. Ce rendement correspond au rapport entre le nombre de résultats certains chez les malades et l'ensemble des personnes malades.

	Malade	Non-malade
Positif	a	b
Incertain	i₁	i₀
Négatif	c	d
	a+i₁+c	b+i₀+d

La spécificité est accompagnée de la valeur du rendement négatif du test. Ce rendement correspond au rapport entre le nombre de résultats certains chez les personnes saines (non-malades) et l'ensemble des personnes saines.

	Malade	Non-malade
Positif	a	b
Incertain	i₁	i₀
Négatif	c	d
	a+i₁+c	b+i₀+d

La comparaison des résultats d'une même méthode diagnostique interprétés par deux personnes différentes, ou par une même personne mais à des moments différents, est possible grâce à la détermination de la concordance entre les résultats. L'index Kappa permet de quantifier le niveau de cette concordance.

Lors de la première interprétation (test A), les résultats sont soit positifs, soit négatifs. Lors de la seconde interprétation (test B), par une autre personne ou par la même personne mais à un moment différent, les résultats sont également positifs ou négatifs. Ainsi, quatre combinaisons de résultats apparaissent:

(a) résultat positif au test A et positif au test B;
(b) résultat positif au test A et négatif au test B;
(c) résultat négatif au test A et positif au test B;
(d) résultat négatif au test A et négatif au test B.

Ces combinaisons peuvent être représentées sous forme d'un tableau croisant le résultat obtenu au test A avec celui obtenu au test B.

		Test B
		Positif	Négatif
Test A	Positif	a	b	n₁
Test A	Négatif	c	d	n₂
		n₃	n₄	N

On note:

n₁, l'ensemble des résultats positifs lors de la première interprétation (test A);
n₂, l'ensemble des résultats négatifs lors de la première interprétation (test A);
n₃, l'ensemble des résultats positifs lors de la seconde interprétation (test B);
n₄, l'ensemble des résultats négatifs lors de la seconde interprétation (test B);
N, l'ensemble de tous les résultats.

Les résultats concordent lorsque les deux interprétations amènent à la même conclusion; c'est le cas dans les situations a (test A et test B positifs) et d (test A et test B négatifs).
La comparaison de la fréquence de ces résultats concordants par rapport à l'ensemble des résultats permet d'obtenir la proportion de réponses concordantes observée (Po).

		Test B
		Positif	Négatif
Test A	Positif	a	b	n₁
Test A	Négatif	c	d	n₂
		n₃	n₄	N

Toutefois, une partie de la concordance observée est en fait due au hasard; c'est la concordance aléatoire ou la proportion de résultats concordant par chance (Pc). Cette proportion correspond au rapport entre la somme des produits marginaux des résultats concordants et le carré du nombre total de résultats.

		Test B
		Positif	Négatif
Test A	Positif	a	b	n₁
Test A	Négatif	c	d	n₂
		n₃	n₄	N

L'index Kappa (κ), qui quantifie le niveau de concordance réel entre des résultats, est déterminé en tenant compte des concordances observée et aléatoire.

Plus la valeur de l'index Kappa se rapproche de 1, plus la concordance des résultats est importante. Celle-ci est qualifiée par différents adjectifs en fonction de la valeur de l'index Kappa.

Accord	Index Kappa
Excellent	≥ 0,80
Bon	0,60 ≤ κ < 0,80
Moyen	0,40 ≤ κ < 0,60
M�diocre	0,20 ≤ κ < 0,40
Mauvais	0 ≤ κ < 0,20
Ex�crable	< 0

L'index Kappa est sensible à la prévalence de la maladie.

Exercice 1

Afin de diagnostiquer la présence d'une appendicite chez des patients présentant des douleurs abdominales aigues, on réalise une échographie de la région abdominale. Parmi les 255 patients chez lesquels l'échographie était positive, 235 présentaient effectivement une appendicite. Toutefois, 75 des 585 patients dont l'échographie était négative, présentaient également une appendicite.

Représentez les données sous forme d'une table de contingence.
Quelle est la spécificité du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?
Quelle est la sensibilité du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?
Quelle est la valeur prédictive positive du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?
Quelle est la valeur prédictive négative du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?

Correction

Exercice 2

Une firme désire commercialiser un nouveau test de dépistage d'infection urinaire pour les femmes enceintes (bandelettes urinaires). Afin de vérifier son efficacité, ce nouveau produit est testé sur des échantillons d'urine contenant un taux de leucocytes inférieur à la normale (pas d'infection) et supérieur à la normale (infection). Les résultats de ce test se présentent comme décrits dans le tableau suivant.

	Infection	Pas d'infection
Test positif	27	3
Test négatif	5	75

Toutefois, en plus des résultats positifs et négatifs, 4 tests ont été considérés comme douteux; 2 chez les femmes présentant une infection et 2 chez les femmes ne présentant pas d'infection urinaire.

Représentez l'ensemble des résultats sous forme d'une table de contingence et déterminez la sensibilité et la spécificité du test en tenant compte des résultats incertains.

Correction

Exercice 3

Afin de déceler la présence de calculs rénaux chez des patients se plaignant de douleurs caractéristiques intenses, des radiographies des voies urinaires sont réalisées et interprétées par deux médecins. Sur les 150 clichés analysés, 80 sont jugés positifs par les deux médecins tandis que 15 sont considérés comme positifs par le premier médecin mais négatifs par le second médecin. Ce dernier juge comme positives 90 radiographies.

Déterminez la concordance entre les résultats des deux médecins.

Correction

Exercice 1

Représentez les données sous forme d'une table de contingence.

	Appendicite	Pas d'appendicite
Echographie positive	235	20
Echographie négative	75	510

Quelle est la spécificité du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?

Une spécificité de 0,96 signifie que, lorsque le patient ne souffre pas d'une appendicite, il y a 96% de chance que l'échographie abdominale soit négative.

Quelle est la sensibilité du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?

Une sensibilité de 0,76 signifie que, lorsque le patient souffre d'une appendicite, il y a 76% de chance que l'échographie abdominale soit positive.

Quelle est la valeur prédictive positive du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?

Cela signifie que, si l'échographie abdominale est positive, il y a 92% de chance que le patient souffre d'une appendicite.

Quelle est la valeur prédictive négative du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?

Il y a donc 87% de chance qu'un patient pour lequel l'échographie abdominale est négative ne présente pas d'appendicite.

Retour à l'énoncé

Exercice 2

	Infection	Pas d'infection
Test positif	27	3
Test négatif	5	75

Représentez l'ensemble des résultats sous forme d'une table de contingence.

	Infection	Pas d'infection
Test positif	27	3
Test incertain	2	2
Test négatif	5	75
	34	80

Déterminez la sensibilité et la spécificité du test en tenant compte des résultats incertains.

Méthode 1: situation la plus défavorable.

Dans la situation la plus défavorable la sensibilité et spécificité valent respectivement 79% et 94%.

Méthode 2: intervalle entre deux bornes.

La borne inférieure est calculée selon la situation la plus défavorable (cf. méthode 1) et la borne supérieure selon la situation la plus favorable.

La sensibilité est comprise entre 79% et 85% et la spécificité est comprise entre 94% et 96%.