mar. Juin 30th, 2026

Étude sur l’analyse des sentiments liée aux médicaments : une approche innovante utilisant l’IA

Un ensemble de données provenant de Drugs.com a été utilisé pour cette recherche, qui est accessible publiquement dans le référentiel « Drug Review Dataset (Drugs.com) » de l’UC Irvine Machine Learning. Ce jeu de données comprend les sentiments de 215 063 patients concernant les médicaments qu’ils ont pris, accompagnés d’une note allant de 1 à 10 ainsi que des informations sur l’état des médicaments. Le schéma méthodologique de cette étude est illustré à la Figure 1.

Workflow diagram illustrating the steps performed in this study.

Prétraitement des données

Pour ce projet, les bibliothèques NumPy et NLTK ont été employées pour réaliser le prétraitement des textes des avis sur les médicaments. Cette phase se décompose en cinq étapes :

  1. Suppression des enregistrements incomplets.
  2. Élimination des ponctuations et caractères redondants.
  3. Conversion des lettres majuscules en lettres minuscules.
  4. Retrait des mots courants, qui ajoutent peu d’informations pertinentes.
  5. Utilisation du Snowball Stemmer pour en déterminer les racines.

À l’issue du prétraitement, 213 869 échantillons restaient disponibles.

Extraction des caractéristiques des textes

Après cette étape de prétraitement, un ensemble de données propre et cohérent a été constitué. Les modèles d’apprentissage automatique (ML) et d’apprentissage profond (DL) nécessitent des transformations des textes en vecteurs numériques. Pour cela, les techniques de Bag of Words (BoW) et d’embeddings ont été appliquées. BoW est une méthode simple qui compte les répétitions des mots, ce qui facilite la conversion des textes en vecteurs pour les modèles de classification.

L’embedding des mots est une méthode plus avancée qui permet de représenter chaque mot par un vecteur de nombres, où chaque valeur représente une caractéristique latente du mot. Word2Vec, une technique d’embedding basée sur des réseaux de neurones, utilise trois couches : d’entrée, cachée et de sortie, avec deux structures, Skip-Gram et Continuous BoW. Pour les modèles DL, des embeddings pré-entraînés, dont Glove et d’autres spécifiques au domaine clinique, ont été considérés.

Conception de l’étude

Trois scénarios ont été élaborés :

  1. Dans le premier, les scores ont été divisés en deux classes : Négatif (score ≤ 5) et Positif (score > 5).
  2. Dans le second, les scores ont été classés en trois catégories : Négatif (score < 5), Neutre (scores de 5 et 6) et Positif (score > 6).
  3. Enfin, le troisième scénario a considéré les scores sur une échelle de 1 à 10 pour chaque revue.

Séparation du jeu de données

La méthode de validation croisée Hold-Out a été utilisée pour diviser le jeu de données, résultant en un ensemble de formation de 75 % (160 093 échantillons) et un ensemble de test de 25 % (53 776 échantillons).

Modèles de prédiction

Neuf modèles communs en ML, DL et ENS, comprenant KNN, DT, RF, réseau de neurones artificiels (ANN), et divers types de RNN, ont été dévelopés pour prédire les sentiments des patients. Chaque algorithme ML est détaillé dans l’annexe.

Les modèles DL utilisent des fonctions d’activation et de perte pour leur apprentissage. Parmi celles-ci, on trouve la fonction ReLU, qui aide à apprendre des motifs complexes en transformant les valeurs d’entrée négatives à zéro et en laissant inchangées les valeurs positives. De plus, les fonctions Sigmoid et Softmax jouent un rôle crucial dans les tâches de classification binaire et multivariée.

Évaluation des modèles

Les performances des modèles proposés ont été évaluées selon plusieurs critères, notamment la précision, le rappel, et le score F1. La méthode LIME a également été utilisée pour fournir des interprétations des décisions des modèles d’IA.


Points à retenir

  • Jeu de données riche : 215 063 sentiments de patients sur des médicaments, utiles pour l’analyse.
  • Prétraitement efficace : Cinq étapes pour nettoyer et normaliser les données textuelles.
  • Modèles variés : Neuf modèles dont six basés sur des réseaux de neurones pour des prédictions des sentiments des patients.
  • Utilisation de LIME : Pour interpréter et expliquer les décisions des modèles d’IA.

En conclusion, cette étude met en lumière l’importance croissante de l’intelligence artificielle dans l’analyse des sentiments en matière de santé. L’utilisation d’approches novatrices offre des perspectives prometteuses pour améliorer la compréhension des expériences des patients vis-à-vis de leurs traitements. Cette recherche ouvre la voie à des discussions sur l’avenir de l’IA dans le domaine médical, posant la question de la complexité des analyses de sentiments face à la diversité des expériences humaines.


Partager : X Facebook WhatsApp LinkedIn Reddit
4 thoughts on “Anticiper les sentiments des patients sur les médicaments grâce à l’intelligence artificielle”
  1. Cette étude illustre parfaitement comment l’IA peut transformer l’analyse des sentiments, ouvrant la voie à une meilleure compréhension des retours patients sur les médicaments.

  2. Sandrine, votre étude sur l’analyse des sentiments des patients avec l’IA est fascinante. Elle ouvre de nouvelles perspectives pour la santé et le bien-être. Bravo !

  3. Cette étude sur l’analyse des sentiments me touche profondément. Elle révèle la beauté des expériences humaines face aux traitements, un véritable reflet de nos cœurs fragiles.

  4. Cette étude montre comment l’IA peut transformer notre compréhension des sentiments des patients. C’est fascinant de voir comment des données massives peuvent être analysées pour améliorer la santé!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *