Optimiser les opérations en sciences de la vie avec SageMaker Canvas

BySerge Jérôme

Fév 15, 2025

Le secteur des sciences de la vie connaît une croissance significative, avec une prévision d’augmentation du marché mondial des fournitures de laboratoire d’un taux de croissance annuel composé de 7,5 % entre 2023 et 2030, selon Grand View Research. Face à la pression croissante d’optimisation des opérations, Amazon SageMaker Canvas propose des fonctionnalités pour relever ces défis. Cet article explorera des applications concrètes de SageMaker Canvas, mettant en lumière son utilisation pour optimiser la gestion des stocks dans les laboratoires de recherche et améliorer la prédiction des défauts dans la fabrication pharmaceutique.

Sommaire

Prévision des Stocks de Laboratoire par l’Analyse de Séries Temporelles

Nous commencerons par la prévision des stocks de laboratoire à l’aide de l’analyse de séries temporelles. L’objectif est de prédire l’utilisation future des stocks de laboratoire, tels que les réactifs et autres consommables, en s’appuyant sur les données d’utilisation historiques. Ceci permet aux laboratoires de planifier efficacement leurs dépenses en stock.

Pour notre analyse, nous avons utilisé un jeu de données synthétique, élaboré par nos soins pour simuler les stocks de réactifs et de consommables. Ces données intègrent des motifs d’utilisation réalistes, des variations saisonnières, des tendances et des corrélations entre produits. Les laboratoires peuvent obtenir des données similaires de leurs systèmes, tels que le carnet de laboratoire électronique (ELN), le système de gestion des informations de laboratoire (LIMS) ou les systèmes d’approvisionnement. La Figure 1 présente un aperçu de ce jeu de données synthétique et sa distribution.

Figure 1 - Tableau présentant les types de données et la distribution du jeu de données sur les stocks de laboratoire Figure 1 – Tableau présentant les types de données et la distribution du jeu de données sur les stocks de laboratoire

Nous avons importé les données et passé en revue le Rapport de Qualité et d’Insights des Données d’Amazon SageMaker Data Wrangler. Ensuite, nous avons demandé à Chat d’effectuer une préparation des données pour trier les données et créer des caractéristiques avec délai. Les caractéristiques avec délai sont des versions transformées de la variable cible où chaque valeur est décalée d’un certain nombre de périodes dans le passé. Nous avons également demandé à Chat de préparer les données pour gérer les valeurs manquantes et nettoyer les valeurs par défaut.

Ces étapes préparatoires aident à révéler les motifs et tendances sous-jacents, conduisant à des prévisions plus fiables et à une prise de décision éclairée.

Figure 2 – Flux de données de SageMaker Data Wrangler montrant les transformations et le Rapport de Qualité des Données

Figure 2 – Flux de données de SageMaker Data Wrangler montrant les transformations et le Rapport de Qualité des Données

Analyse du Modèle de Prévision des Stocks
Après la préparation des données, nous avons construit un modèle de prévision pour prédire l’utilisation des stocks. Nous avons choisi une configuration de Standard Build, car elle offre un bon équilibre entre précision et temps de traitement pour ce type de problème de prévision.

Le modèle de prévision a montré des performances constantes avec une perte quantile moyenne pondérée de 0.152. Il a affiché une forte précision avec une erreur d’estimation absolue moyenne de 24,7 % et une erreur d’estimation absolue pondérée de 20,1 %. En termes pratiques, cela signifie que si le modèle prédit un besoin de 100 unités d’un réactif, l’utilisation réelle se situe généralement entre 75 et 125 unités – suffisamment pour une planification à un mois à l’avance, mais nécessitant des considérations de stock de sécurité.

L’erreur quadratique moyenne de 12,374 a indiqué une faible déviation entre les valeurs prévues et réelles, tandis que l’erreur absolue moyenne mise à l’échelle de 0,670 a montré que les erreurs de ce modèle sont environ 33 % plus petites que celles d’une méthode de prévision naïve. Cette amélioration par rapport aux approches de prévision basiques suggère que le modèle a réussi à capturer des motifs significatifs dans l’utilisation des stocks.

Pour les responsables de laboratoire, ces résultats indiquent que le modèle peut soutenir de manière fiable les décisions de planification des stocks, bien qu’il soit prudent de maintenir un tampon de sécurité de 25 % pour tenir compte des incertitudes de prévision. Pour des explications détaillées de ces métriques, explorez la référence sur les métriques.

Lors de l’utilisation d’un modèle, il est important d’examiner la cohérence de sa performance à travers les quantiles, l’amélioration par rapport aux méthodes de prévision simples et l’exactitude globale. Il convient de considérer comment ces caractéristiques s’alignent sur vos besoins de prévision spécifiques et votre tolérance à la variance. Pour en savoir plus, lisez « Votre modèle est-il bon ? Un examen approfondi des métriques avancées d’Amazon SageMaker Canvas. » Détails sur les métriques actuelles sont disponibles en consultant la description des métriques objectif.

Figure 3 - Le statut du modèle fournit des métriques

Figure 3 – Le statut du modèle fournit des métriques

Prédictions et Déploiement du Modèle de Stocks
Pour faire des prédictions uniques, vous pouvez utiliser les étapes de prévisions avec des modèles de séries temporelles. Cela construira une prédiction pour un seul point de données et modifiera des valeurs individuelles pour voir comment elles impactent les résultats de la prévision. La Figure 4 montre l’exemple d’un kit d’extraction d’ADN durant la période allant du 31 décembre 2024 au 30 janvier 2025. Quatre prédictions différentes sont présentées. P50 représente la médiane (50ème percentile) indiquant la meilleure estimation. P25 est le 25ème percentile (estimation inférieure), tandis que P75 et P90 représentent respectivement les estimations du 75ème et 90ème percentile (estimations supérieures).

Figure 4 - Type de prédiction unique pour un article spécifique et une plage Figure 4 – Type de prédiction unique pour un article spécifique et une plage

Lorsque vous êtes prêt à déployer un modèle vers un point de terminaison, afin de l’utiliser en dehors d’Amazon SageMaker Canvas pour effectuer des prédictions en temps réel et l’intégrer dans vos applications existantes, il suffit de suivre la documentation sur le déploiement de vos modèles vers un point de terminaison.

Prévision des Défauts de Fabrication

Dans notre prochain exemple, nous démontrons comment construire un modèle prédictif pour identifier les défauts dans les processus de fabrication pharmaceutique. Cette capacité est essentielle pour optimiser l’efficacité de la production, réduire les reprises coûteuses et améliorer la qualité globale des produits.

Notre jeu de données d’exemple inclut des métriques complètes influençant les taux de défauts, telles que les volumes de production, la qualité de la chaîne d’approvisionnement, le contrôle de la qualité, la maintenance, les inventaires, la productivité du personnel, la consommation d’énergie, et des détails sur la fabrication additive.

Préparation des Données et Analyse des Caractéristiques

Nous avons utilisé Amazon SageMaker Data Wrangler pour importer nos données, créer un flux de données, et générer un Rapport de Qualité et d’Insights des Données. La Figure 5 fournit un résumé des caractéristiques avec des informations détaillées sur les données, y compris la validité, les valeurs manquantes, les alertes de gravité élevée et moyenne, ainsi que le pouvoir prédictif. Le résumé indique que le jeu de données est 100 % valide, sans aucune valeur manquante et zéro avertissement de gravité. Cela signifie que les données sont propres et complètes, ne nécessitant pas de prétraitement supplémentaire.

Figure 5 - Résumé des caractéristiques montrant le pouvoir prédictif, type, et avertissements de gravité Figure 5 – Résumé des caractéristiques montrant le pouvoir prédictif, type, et avertissements de gravité

Nous avons sélectionné la colonne cible des heures de maintenance. SageMaker Canvas a détecté pour nous que le type de modèle à utiliser était une prédiction à 2 catégories. Vous pouvez explorer des détails supplémentaires sur le fonctionnement des modèles personnalisés. Cependant, nous sommes intéressés à effectuer un Build rapide, afin de privilégier la vitesse plutôt que la précision à ce stade initial. Une fois notre Build rapide terminé, examinons maintenant les performances du modèle et les perspectives dans la section Analyse.

Performance et Insights du Modèle

Dans l’aperçu de l’analyse du modèle, SageMaker Canvas montre l’impact des colonnes par ordre d’impact, de la plus importante à la moins importante. Dans cet exemple, les heures de maintenance sont les plus influentes pour prédire l’état des défauts. La Figure 6 illustre l’analyse du modèle, montrant la précision, le score F1, l’impact des colonnes sur la prévisibilité et un nuage de points des heures de maintenance sur la prédiction de l’état des défauts. Ici, les heures de maintenance sont la colonne la plus impactante sur l’état des défauts.

Figure 6 - Analyse du modèle Figure 6 – Analyse du modèle

Pour la prédiction des défauts de machine, nous avons obtenu des résultats prometteurs :

Précision : 95,686%
Score F1 (métrique d’optimisation) : 0,849

La haute précision indique que notre modèle classe correctement l’état des machines (défectueuse ou non-défectueuse) dans plus de 95 % des cas. Le score F1 de 0,849, notre métrique d’optimisation, suggère un bon équilibre entre la précision et le rappel dans l’identification des défauts. Pour en savoir plus, consultez notre documentation sur les métriques de prédiction catégorique.

Figure 7- Comparer les Prédictions avec les mesures réelles.

Nous pouvons tester différentes valeurs pour observer comment elles influencent le résultat prédictif. Nous avons également la possibilité de tester notre modèle en suivant les étapes pour utiliser des prédictions par lot manuelles, ou opter pour des mises à jour automatiques lors d’une mise à jour du jeu de données pour des prédictions par lot automatiques.

Figure 8 - Prédire la valeur cible en utilisant une prédiction unique) Figure 8 – Prédire la valeur cible en utilisant une prédiction unique

Une fois que vous êtes prêt à déployer le modèle en dehors d’Amazon SageMaker Canvas, vous pouvez créer un point de terminaison. Vous pouvez ensuite configurer Amazon SageMaker Model Monitor pour une surveillance continue. Découvrez comment fonctionne SageMaker Model Monitor.

Conclusion

Les équipes en charge des opérations de laboratoire et de fabrication pharmaceutique recherchent la simplicité, une plus grande efficacité, moins de reprises, et une découverte proactive des problèmes dans leur travail. Cependant, la séparation des compétences peut laisser les data scientists sans l’expertise nécessaire pour comprendre les données des sciences de la vie, ou les experts des sciences de la vie sans les compétences logicielles pour développer des applications d’apprentissage machine évolutives.

Amazon SageMaker Canvas répond à ce besoin en permettant aux équipes des sciences de la vie d’améliorer leurs résultats opérationnels grâce à une interface visuelle conviviale et des capacités de formation de modèles puissantes. En tirant parti de SageMaker Canvas, les organisations peuvent démocratiser l’apprentissage machine et faciliter la prise de décision basée sur les données à travers leurs flux de travail en sciences de la vie.

Notre Opinion Tech

Dans un contexte où les exigences en matière d’efficacité et de rapidité sont croissantes dans le secteur des sciences de la vie, Amazon SageMaker Canvas illustre élégamment comment l’intelligence artificielle peut transformer l’approche des laboratoires et des fabricants pharmaceutiques. En rendant l’analyse des données plus accessible et intuitive, cette solution pourrait bien inciter d’autres industries à adopter des technologies similaires, initiant ainsi une nouvelle ère dans la gestion des processus industriels. À l’avenir, nous pourrions assister à une intégration encore plus poussée de l’IA dans les processus décisionnels, créant des environnements plus réactifs et adaptables.

Bon à savoir : L’utilisation de l’analyse de données avancée, comme celle proposée par Amazon SageMaker Canvas, est particulièrement pertinente dans le domaine des sciences de la vie où une gestion précise des stocks et une réduction des défauts peuvent avoir un impact significatif sur la productivité et la qualité des produits.

By Serge Jérôme

Articles de la même catégorie

Sciences

3 thoughts on “Optimiser les opérations en sciences de la vie avec SageMaker Canvas”

Liora Pierreau dit :
28 août 2025 à 13:07
C’est fascinant de voir comment des outils comme SageMaker Canvas transforment les opérations en sciences de la vie. On a vraiment besoin d’innovation dans ce domaine!
Répondre
Liora Verne dit :
28 août 2025 à 13:07
SageMaker Canvas semble vraiment prometteur pour aider les laboratoires à optimiser leurs opérations ! J’adore voir l’IA transformer ce secteur dynamique.
Répondre
Elowen Dufresne dit :
28 août 2025 à 13:07
Cet article met en lumière l’importance de l’intelligence artificielle pour optimiser les opérations en laboratoire. C’est fascinant de voir comment la technologie peut transformer notre façon de travailler !
Répondre

Optimiser les opérations en sciences de la vie avec SageMaker Canvas

BySerge Jérôme

Prévision des Stocks de Laboratoire par l’Analyse de Séries Temporelles

Prévision des Défauts de Fabrication

Conclusion

Notre Opinion Tech

By Serge Jérôme

Articles de la même catégorie

Super Typhon Bavi frappe la Chine : alerte maximale en Asie !

Les zones d’ombre du nouveau traité de Gibraltar : enjeux politiques, juridiques, fiscaux et territoriaux à éclaircir !

Psychologie : Souvent, nous jugeons nos véritables selves.

3 thoughts on “Optimiser les opérations en sciences de la vie avec SageMaker Canvas”

Laisser un commentaire Annuler la réponse

Ne ratez pas

Ducati, Aprilia, Honda : des changements de concessions en MotoGP après la pause estivale révélés !

TikTok : la révolution de la consommation mondiale, avec un marché où la popularité atteint 95 % !

La Formula E : plus proche que jamais de la Formule 1 dès 2026 !

Super Typhon Bavi frappe la Chine : alerte maximale en Asie !