Elon Musk a récemment déclaré que les entreprises d’intelligence artificielle avaient épuisé les données nécessaires à l’entraînement de leurs modèles, ayant ainsi atteint la limite de la connaissance humaine.
Le milliardaire a suggéré que les firmes technologiques devraient se tourner vers des données « synthétiques » – c’est-à-dire des matériaux générés par des modèles d’IA – pour développer et affiner de nouveaux systèmes, un processus qui est déjà en cours dans ce domaine en rapide évolution.
« La somme cumulative de la connaissance humaine a été épuisée dans l’entraînement des IA. Cela s’est produit l’année dernière, en gros », a affirmé Musk lors d’une interview diffusée en direct sur sa plateforme sociale, X.
Les modèles d’IA, tels que le GPT-4 qui alimente le chatbot ChatGPT, sont formés sur une vaste quantité de données provenant d’internet, apprenant à identifier des motifs dans ces informations – ce qui leur permet de prédire le mot suivant dans une phrase, par exemple.
Selon Musk, la « seule façon » de pallier le manque de matériel source pour entraîner de nouveaux modèles est de passer à des données synthétiques générées par IA.
Concernant l’épuisement des réserves de données, il a déclaré : « La seule manière de compléter cela est avec des données synthétiques, où… cela écrira en quelque sorte un essai ou proposera une thèse, puis se notera lui-même et … passera par ce processus d’auto-apprentissage. »
Des entreprises comme Meta, propriétaire de Facebook et Instagram, ont déjà utilisé des données synthétiques pour perfectionner leur modèle d’IA Llama, tandis que Microsoft a également intégré du contenu généré par IA dans son modèle Phi-4. Google et OpenAI, la société à l’origine de ChatGPT, ont également eu recours à des données synthétiques dans leurs travaux d’IA.
Cependant, Musk a aussi mis en garde contre le phénomène des « hallucinations », terme désignant les réponses inexactes ou absurdes générées par les modèles d’IA, un danger pour le processus de données synthétiques.
Lors de l’interview en direct avec Mark Penn, président du groupe publicitaire Stagwell, il a souligné que les hallucinations rendaient l’utilisation de matériels artificiels « problématique » car « comment savoir si l’IA a halluciné la réponse ou si c’est une réponse réelle ? »
L’accès à des données de haute qualité et le contrôle de celles-ci figurent parmi les enjeux juridiques majeurs de l’essor de l’IA. OpenAI a admis l’année dernière qu’il serait impossible de créer des outils tels que ChatGPT sans avoir accès à des contenus protégés par le droit d’auteur, alors que les industries créatives et les éditeurs exigent une compensation pour l’utilisation de leurs œuvres dans le processus d’entraînement des modèles.
Points à retenir
- Les entreprises d’IA font face à un épuisement des données pour l’entraînement de modèles.
- Musk évoque un recours accru aux données synthétiques pour pallier ce manque.
- Des entreprises comme Meta et Microsoft utilisent déjà ce type de données pour améliorer leurs modèles.
- Les “hallucinations” des modèles d’IA posent un risque lors de l’utilisation de données synthétiques.
- L’accès aux données de qualité et les questions de droits d’auteur sont des enjeux cruciaux dans le secteur.
Le domaine de l’IA continue d’évoluer rapidement, et les défis liés à l’accès aux données et la fiabilité des réponses générées soulèvent des interrogations. Dans cette course pour fournir des modèles performants, la manière dont les entreprises navigueront entre innovation et respect des droits d’auteur sera déterminante pour l’avenir de l’intelligence artificielle. Comment pouvons-nous garantir un équilibre entre progrès technologique et respect des valeurs éthiques ?
- Source image(s) : www.theguardian.com
- Source : https://www.theguardian.com/technology/2025/jan/09/elon-musk-data-ai-training-artificial-intelligence
Nos rédacteurs utilisent l'IA pour les aider à proposer des articles frais de sources fiables à nos utilisateurs. Si vous trouvez une image ou un contenu inapproprié, veuillez nous contacter via le formulaire DMCA et nous le retirerons rapidement. / Our editors use AI to help them offer our readers fresh articles from reliable sources. If you find an image or content inappropriate, please contact us via the DMCA form and we'll remove it promptly.