Sujets de l’étude, conception et population

Cette étude rétrospective a examiné les examens ultrasonographiques réalisés à l’hôpital des personnes du district de Guangming à Shenzhen entre juillet 2022 et octobre 2024. Les critères d’inclusion étaient les suivants : (1) aucune antécédente d’hypertension, de diabète ou d’autres maladies pouvant causer une mauvaise visualisation avant la grossesse, (2) grossesse unique, avec une longueur cranio-caudale (LCC) de 45 à 84 mm et une translucence nucale (TN) ≤ 3 mm, (3) aucune anomalie détectée lors de l’examen effectué entre 11 et 13+ 6 semaines.

Cette étude a été approuvée par le Comité d’éthique médicale de l’Hôpital des personnes du district de Guangming, Shenzhen, Chine (numéro d’approbation : LL-KT-2023090). Toutes les femmes enceintes ont donné leur consentement éclairé, et les examens ont été réalisés conformément aux directives de l’ISUOG pour les échographies entre 11 et 14 semaines. Au total, 418 échographies 3D de haute qualité provenant de 288 femmes enceintes ont été obtenues selon des standards d’inclusion et d’annotation. Ces volumes comprenaient 24 cas de fente labio-palatine obtenus auprès de 13 femmes enceintes et 394 cas normaux provenant de 275 femmes. Parmi les volumes normaux, 320 cas ont été sélectionnés comme ensembles de formation et de validation, utilisant une validation croisée en quatre fois pour obtenir le meilleur modèle. Les 74 cas restants ont été combinés avec les 24 cas de fente pour créer un ensemble de données permettant de comparer les différences spatiales, les similarités et les analyses visuelles entre CLP-Net et la vérité terrain (GT). La Figure 2 illustre le schéma global de la conception de l’étude.

Fig. 2
figure 2

Diagramme récapitulant la conception de l’étude

Équipement, logiciel et contrôle qualité

Toutes les données ont été obtenues à l’aide du système de diagnostic échographique Doppler couleur GE Voluson E10 (General Electric Company, Boston, USA). Ce système était équipé d’une sonde volumétrique 3D (RM6C) fonctionnant à des fréquences de 2 à 8 MHz. Les mesures d’échographie utilisées pour l’évaluation fœtale comprenaient l’estimation de la LCC et de l’épaisseur de la TN, l’évaluation de l’os nasal fœtal et un scan complet des principales structures fœtales, telles que la tête, le visage, la colonne vertébrale, le cœur, les cavités thoraciques et abdominales, la paroi thoraco-abdominale, les reins, la vessie et les membres. Le placenta, le liquide amniotique, le cordon ombilical, les appendices fœtaux et le col de l’utérus ont également été observés.

Après les évaluations initiales, le radiologue a utilisé un transducteur volumétrique 3D pour acquérir les données ultrasoniques 3D. La qualité de l’image était réglée sur “Qualité Élevée MAX”, et le cadre d’imagerie comprenait la tête fœtale et le haut du thorax. L’imagerie par échographie 3D a commencé depuis le plan sagittal médian lorsque le fœtus était dans un état naturel et calme. La future mère a été instruite de retenir sa respiration pendant la capture pour minimiser les artefacts de mouvement. Les données ont été exportées et sauvegardées au format non compressé « Voluson Format (*.4dv) » pour une analyse et un traitement ultérieurs. Toutes les procédures d’acquisition par échographie respectent les principes ALARA.

Marqueurs et annotations

Deux radiologues seniors, dotés d’une vaste expérience en échographie, ont annoté le volume. L’un d’eux possède 16 ans d’expérience et détient la certification de la Chinese Fetal Medicine Foundation (CFMF) pour l’échographie obstétricale, ayant réalisé les annotations initiales, tandis que l’autre, avec 30 années d’expérience également certifié par la CFMF, a vérifié et validé les résultats. En cas de divergences, les deux radiologues ont discuté et révisé les annotations ensemble jusqu’à obtenir un consensus. Le logiciel « Pair » [20] (version : 2.6.0), développé indépendamment par Shenzhen RayShape Medical Technology Co., Ltd (Shenzhen, Guangdong, Chine), a été utilisé pour annoter les données échographiques 3D exportées. Les plans suivants ont été annotés dans cette étude :

  1. 1)

    MSP : La structure faciale en vue sagittale, incluant l’os nasal, la ligne de peau de surface, la ligne du palais et la mandibule.

  2. 2)

    RTP : Montre clairement l’os nasal, le processus frontal et le processus alvéolaire supérieur en vue coronale.

  3. 3)

    MAP : Révèle des structures lisses et intactes de la crête alvéolaire supérieure et du palais dur en vue axiale.

La Figure 3 montre les structures des trois plans mentionnés ci-dessus

Fig. 3
figure 3

Illustration des caractéristiques structurelles des plans standards. (a) Ligne cutanée (SL), os nasal (NB), ligne palatine (PL), et mandibule (M) des MSP. (b) Os nasal (NB), processus frontal (FP), et palais (P) des RTP. (c) Crête alvéolaire (AR) et palais dur (HP) sur MAP

Développement du CLP-Net

Le cadre du CLP-Net proposé, basé sur l’apprentissage par renforcement (RL), est illustré dans la Fig. 4. Ce travail prolonge les découvertes de Zou et al. [17], où les réseaux de neurones convolutifs (CNN) étaient utilisés comme agents, et la similarité spatiale-anatomique comme récompense. Les agents interagissent avec l’environnement de volume, prenant des mesures pour prédire les coordonnées des plans en se basant sur l’algorithme de Q-learning. Nous avons appliqué la méthode proposée au placement des plans standards de la lèvre et du palais. Lors de la phase d’entraînement, CLP-Net a ajusté itérativement les plans de prédiction pour se rapprocher des GT. Ce processus comprend les étapes suivantes : (1) les agents ont agi en fonction des caractéristiques de l’image des trois étapes précédentes, interagissant avec l’environnement pour sortir les coordonnées des plans et reconstruire les tranches à chaque étape ; (2) l’environnement renvoyait des retours aux agents par le biais d’une récompense pour la structure anatomique et la position spatiale, calculée entre les GT et les plans de prédiction ; (3) l’interaction agent-environnement s’arrête en fonction d’une stratégie de terminaison préétablie (c’est-à-dire atteignant 60 étapes maximum). Dans la phase de test, les agents peuvent directement exploiter les connaissances acquises lors de l’entraînement pour déterminer les coordonnées des multiples plans standards MSP, RTP et MAP.

Fig. 4
figure 4

Architecture de CLP-Net basé sur RL pour la localisation des plans standards en échographie 3D

Analyse statistique

L’analyse statistique a été réalisée à l’aide de SPSS (version 25.0 ; Chicago, Illinois, USA) pour évaluer les différences spatiales entre CLP-Net et GT. Cette évaluation a impliqué la distance euclidienne entre les coordonnées du point central de GT et les prédictions de CLP-Net, ainsi que l’angle entre deux plans au sein de l’échographie 3D. L’étude a également comparé la similarité à l’aide de deux métriques : la corrélation croisée normalisée (NCC) et le coefficient de similarité structurelle (SSIM). La NCC est une méthode qui utilise les informations en niveaux de gris pour évaluer la similarité entre deux images, qui peut être exprimée comme suit :

$$\:\text{NCC}(X,Y)=\frac{\sum\:(X-\stackrel{-}{X})(Y-\stackrel{-}{Y})}{\sqrt{\sum\:{(X-\stackrel{-}{X})}^{2}\sum\:{(Y-\stackrel{-}{Y})}^{2}}},$$

(1)

\(\:X\) et \(\:Y\) représentent les deux images utilisées pour calculer la similarité, \(\:\stackrel{-}{X}\) et \(\:\stackrel{-}{Y}\) représentent leurs moyennes respectives. Le SSIM est une métrique conçue pour quantifier la similarité d’image en examinant la luminance, le contraste et l’information structurelle. Comparé aux métriques traditionnelles, le SSIM s’aligne davantage avec les modèles perceptuels humains. Le SSIM est défini comme suit :

$$\:SSIM\left(X,Y\right)=\frac{\left(2{\mu\:}_{X}{\mu\:}_{Y}+{C}_{1}\right)\left(2{\sigma\:}_{XY}+{C}_{2}\right)}{\left({\mu\:}_{X}^{2}+{\mu\:}_{Y}^{2}+\:{C}_{1}\right)\left({\sigma\:}_{X}^{2}+{\sigma\:}_{Y}^{2}+\:{C}_{2}\right)},$$

(2)

\(\:X\) et \(\:Y\:\) représentent les deux images utilisées pour calculer la similarité, \(\:{\mu\:}_{X}\), \(\:{\mu\:}_{Y}\) et \(\:{\sigma\:}_{Y}\), \(\:{\sigma\:}_{Y}\) représentent la moyenne et la variance de \(\:X\) et \(\:Y\) respectivement, \(\:{\sigma\:}_{XY}\) étant la covariance de \(\:X\) et \(\:Y\). \(\:{C}_{1}\), \(\:{C}_{2}\) sont des constantes pour éviter que le dénominateur soit nul. De plus, pour évaluer l’acceptabilité de CLP-Net, un radiologue possédant une large expérience clinique a évalué le rapport d’acceptation visuelle des plans de prédiction de CLP-Net. Pour toutes les analyses, le test du chi carré a été utilisé pour les variables catégorielles, et le test t pour les variables continues. La signification statistique a été fixée à p < 0,05.

Points à retenir

  • L’étude a porté sur des femmes enceintes avec des critères stricts pour identifier les cas normaux et ceux de fente labio-palatine.
  • Les mesures ultrasonographiques incluent l’évaluation de plusieurs structures fœtales essentielles.
  • La méthode CLP-Net utilise un apprentissage par renforcement pour améliorer la localisation des plans standards en échographie 3D.
  • L’analyse statistique a été conçue pour mesurer la précision des prédictions et l’acceptabilité clinique des résultats obtenus.

Cette recherche met en lumière les avancées en échographie prénatale, notamment grâce à l’utilisation de technologies innovantes pour le meilleur suivi des grossesses. De récentes innovations dans le domaine médical montrent un potentiel remarquable d’amélioration des diagnostics prénataux. Il serait intéressant de discuter des implications futures de ces technologies sur la santé des futures mamans et de leurs bébés.



  • Source image(s) : bmcpregnancychildbirth.biomedcentral.com
  • Source : https://bmcpregnancychildbirth.biomedcentral.com/articles/10.1186/s12884-024-07108-4


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *