Collecte des données

La base de données utilisée dans cette étude se compose d’images d’infections cutanées, principalement de différentes infections sexuellement transmissibles (IST). Elle a été constituée par une recherche systématique d’articles publiés sur Google Scholar jusqu’au 30 juin 2023, en utilisant des mots-clés tels que «syphilis», «condylomes», «herpès» et «lichen scléreux». Bien que le lichen scléreux ne soit pas classé parmi les IST, il s’agit d’une affection cutanée inflammatoire chronique touchant principalement les zones génitales et périnéales, bien qu’elle puisse apparaître ailleurs dans le corps. Même s’il n’est pas transmis par contact sexuel, il concerne souvent la région génitale [15]. Par conséquent, le lichen scléreux a été inclus dans notre étude. Trois experts en IST (LL, JO et KF) ont ensuite examiné minutieusement toutes les études de cas accessibles publiquement, selon des critères d’inclusion et d’exclusion définis. Les critères d’inclusion étaient : (i) les infections cutanées doivent être visibles sur l’image, (ii) l’image doit correspondre à des régions anatomiques telles que les organes génitaux, les mains, les jambes, le dos, et la muqueuse buccale, (iii) le diagnostic doit être confirmé par des tests sérologiques, et (iv) le diagnostic doit indiquer qu’il n’existe qu’un seul type d’infection. Les critères d’exclusion comprenaient : (a) les images contenant des informations identifiables sur le patient, (b) les patients présentants d’autres maladies ou conditions susceptibles de compliquer l’analyse, et (c) les patients sans résultats de tests sérologiques. Au total, comme indiqué dans les Tableaux 1 et 2, 260 images d’infections cutanées ont été intégrées dans cette étude, comprenant 115 images de syphilis et 145 images d’autres types d’infections.

Tableau 1 Informations générales du jeu de données d’images cutanées

Processus basé sur les radiomiques de cette étude

Pour développer un modèle de diagnostic basé sur l’IA capable de distinguer la syphilis précoce des autres IST, comme montré à la Fig. 1, le processus basé sur les radiomiques proposé se compose principalement des étapes suivantes : (a) prétraitement des images, (b) segmentation des images de lésions cutanées, (c) extraction et sélection des caractéristiques radiomiques, et (d) construction du modèle de classification.

Fig. 1

figure 1

Processus basé sur les radiomiques de cette étude pour différencier la syphilis précoce des autres IST, tels que les condylomes, l’herpès et le lichen scléreux.

Prétraitement des images : application de filtres d’image pour améliorer le diagnostic

Pour améliorer le diagnostic de la syphilis précoce, neuf filtres d’image différents ont été comparés afin d’évaluer leur impact sur les performances diagnostiques. Ces filtres variés ont été appliqués comme méthodes de prétraitement aux images originales avant l’extraction des caractéristiques radiomiques. La Fig. supplémentaire 1 propose une comparaison visuelle de l’application de différents filtres sur la même image.

Plus précisément, les neuf filtres d’image incluent : (a) image originale sans application de filtrage, (b) filtre wavelet, offrant une représentation multi-résolution des images, (c) Laplacien de Gauss (LoG) pour identifier les changements brusques d’intensité des contours en calculant la dérivée seconde de la matrice d’image, (d) filtre carré et (e) filtre racine carrée, (f) filtres logarithmique et (g) exponentiel, (h) filtre de gradient pour déterminer la différence d’intensité entre les pixels adjacents, et (i) filtre des motifs binaires locaux (LBP), calculant les caractéristiques de texture en fonction des valeurs des pixels environnants.

Segmentation des images de lésions cutanées

Les infections cutanées de chaque image ont été segmentées manuellement à l’aide d’un outil d’annotation ouvert nommé LabelMe [22](v5.3.1) et vérifiées par deux autres spécialistes des IST (JT et CF). Cette segmentation définit des zones d’infections cutanées précises, utilisées comme Région d’Intérêt (ROI) dans notre processus basé sur les radiomiques. La Fig. 2 illustre quelques exemples d’images d’infection cutanée originales et leurs segmentations correspondantes.

Fig. 2

figure 2

Visualisation des lésions cutanées causées par différentes infections et des zones d’intérêt (ROIs) correspondantes utilisées dans la méthode radiomique. Première rangée : Images de lésions cutanées non filtrées. Deuxième rangée : ROI délimité pour chaque lésion. Troisième rangée : Fusion des images originales avec les ROIs. De gauche à droite : Syphilis primaire, Syphilis secondaire, Condylomes, Infection HSV, et Lichen scléreux.

Extraction et sélection des caractéristiques radiomiques

102 caractéristiques radiomiques ont été extraites de chaque ROI à l’aide d’un paquet Python open-source nommé Pyradiomics [23]. Les expériences ont été réalisées avec la version 3.0.1 de Pyradiomics. Les 102 caractéristiques comprenaient 18 caractéristiques de premier ordre, 24 caractéristiques de la matrice de co-occurrence en niveau de gris (GLCM), 14 caractéristiques de la matrice de dépendance en niveau de gris (GLDM), 16 caractéristiques de la matrice de longueur d’exécution en niveau de gris (GLRLM), 16 caractéristiques de matrice de taille de région en niveau de gris (GLSZM), 5 caractéristiques de la matrice de différence de tonalité grise voisine (NGTDM), et 9 caractéristiques de forme 2D [24].

Pour éviter le surajustement et améliorer la généralisation du modèle de diagnostic basé sur l’IA développé, une approche standard de sélection des caractéristiques a été utilisée [25] : l’une des caractéristiques fortement corrélées (avec un coefficient de corrélation de Pearson supérieur à 0,8) a été éliminée. De plus, chaque caractéristique a été standardisée pour maintenir une échelle cohérente entre toutes les caractéristiques.

Construction du modèle de classification

Dans cette étude, 11 algorithmes de classification en apprentissage automatique ont été utilisés, parmi lesquels la régression logistique, la machine à vecteurs de soutien (SVM), les voisins les plus proches (KNN), et d’autres. Ces modèles ont été entraînés sur des ensembles de données avec des diagnostics connus de syphilis afin de fournir des prédictions précises sur des nouvelles données non vues.

Comme illustré dans la Fig. supplémentaire 2, le jeu de données a été divisé en deux sous-ensembles, un pour le développement du modèle et l’autre pour le test, dans un rapport de 80:20. Pendant la phase de développement, une validation croisée stratifiée en 5 plis a été appliquée pour identifier la meilleure combinaison entre le filtre d’image et l’algorithme de classification le plus efficace.

Les performances des modèles ont été évaluées principalement à l’aide de la courbe ROC et de l’aire sous la courbe (AUC), afin d’identifier celui offrant les meilleures performances. Enfin, la méthode de Shapley Additive exPlanations (SHAP) a été utilisée pour évaluer l’importance de chaque caractéristique dans le modèle de diagnostic basé sur l’IA développé, identifiant ainsi les caractéristiques radiomiques clés associées au diagnostic de la syphilis précoce.

Points à retenir

  • Une base de données d’images d’infections cutanées a été constituée, incluant des IST et des cas de lichen scléreux.
  • Un processus radiomique a été élaboré pour extraire et sélectionner des caractéristiques pertinentes des images afin d’aider au diagnostic de la syphilis.
  • Différents filtres d’image ont été testés pour améliorer les diagnostics, avec une attention particulière à l’impact des caractéristiques radiomiques sur la performance de classification.

Cette étude met en lumière l’importance de l’IA et de l’analyse d’image dans le domaine médical, ouvrant la voie à des diagnostics plus rapides et plus précis pour différentes infections. La question se pose alors de l’intégration de ces technologies dans des scénarios cliniques concrets : quel sera l’impact des méthodes basées sur l’IA sur les pratiques médicales habituelles ?



  • Source image(s) : bmcinfectdis.biomedcentral.com
  • Source : https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-024-10438-5


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *