Un réseau antagoniste génératif (GAN, pour Generative Adversarial Network en anglais) est un modèle d’intelligence artificielle (IA) composé de deux réseaux neuronaux, le générateur et le discriminateur, qui se font concurrence pour améliorer leurs fonctions; le générateur crée de fausses données qui ressemblent à la base d’apprentissage, tandis que le discriminateur tente de déterminer si les données sont authentiques.
L’intelligence artificielle générative (IAG) constitue l’une des plus importantes avancées en matière d’intelligence artificielle des dernières années. À première vue, ce bond en avant peut sembler s’être produit du jour au lendemain, transformant le monde par l’introduction de solutions d’IA puissantes, efficaces et largement disponibles. Cependant, la réalité est que les nouvelles capacités génératives de l’IA sont le point culminant de décennies de recherche et de développement dans plusieurs secteurs technologiques de soutien. Le concept du réseau antagoniste génératif, ou GAN, compte parmi ces innovations qui a joué un rôle central dans la définition du paysage de l’intelligence artificielle.
Origines des GAN
Au commencement, les GAN ont été conceptualisés par Ian Goodfellow et plusieurs de ses collègues en 2014. Le problème auquel ils faisaient face était la question de savoir comment mettre au point un système informatique capable de produire des « photographies » originales et réalistes fondées sur les données fournies. Face à la simple perspective décourageante des calculs mathématiques nécessaires, Goodfellow a lancé une idée : Pourquoi ne pas simplement demander à un réseau de créer les images, et à un autre de détecter les défauts dans les images? Les deux réseaux travailleraient ensuite en tandem, présentant de façon itérative de nouvelles versions et repérant les erreurs jusqu’à ce que les fausses images puissent passer l’inspection.
Le premier réseau antagoniste génératif est né de cette idée. Telle qu’elle a été proposée, cette infrastructure novatrice implique deux systèmes opposés engagés dans un concours où le gain de l’un est la perte de l’autre. Au fil du temps, les deux réseaux améliorent leurs capacités, ce qui mène à une production de données toujours plus sophistiquée.
Les réseaux antagonistes génératifs ont suscité un intérêt considérable en raison de leur capacité unique à générer des données réalistes et de grandes qualités dans divers domaines, de la création d’œuvres générées par l’IA et d’images ou de vidéos synthétiques à l’aide à la personnalisation de produits et à la modélisation par distribution probabiliste. En termes simples, ce qui a commencé comme une expérience de pensée impromptue est devenu une technologie éprouvée qui offre d’importantes applications pratiques. Cela a transformé la façon dont les machines apprennent et créent, ainsi que la façon dont les entreprises peuvent en tirer parti.
Il existe plusieurs avantages incontestables à appliquer les solutions GAN aux applications d’affaires. Tenez compte des points suivants :
Les GAN excellent dans la génération de nouvelles données qui imitent les distributions de données réelles. C’est incroyablement utile pour l’augmentation des données, l’amélioration des modèles d’apprentissage machine sans données réelles supplémentaires. Ils permettent également une détection efficace des anomalies et favorisent la créativité dans la création de nouveaux concepts et conceptions.
Reconnus pour produire des résultats photoréalistes et haute-fidélité, les GAN sont essentiels dans les domaines nécessitant une synthèse détaillée de l’image et de la vidéo. Qu’il s’agisse de générer des environnements réalistes dans des systèmes virtuels ou de créer de nouvelles séquences audio en musique, la qualité des sorties GAN est souvent impossible à distinguer d’enregistrements ou d’images réels. Cela se retrouve également dans les données qui ne sont pas liées à des médias; le processus GAN peut affiner l’information synthétique de tous types jusqu’à ce qu’elle corresponde à la qualité des ensembles de données réels.
L’une des caractéristiques remarquables des GAN est leur capacité à apprendre sans ensembles de données étiquetés. Cela s’avère utile dans les situations où les données étiquetées sont limitées ou coûteuses à obtenir. L’autonomie des GAN élimine l’un des principaux obstacles qui pourraient autrement empêcher certaines organisations ou personnes de travailler à l’intérieur de l’infrastructure.
Les GAN ont la capacité unique d’imiter de façon autonome des distributions de données complexes, ce qui permet une production efficace d’ensembles de données très précises. Cette fonctionnalité est particulièrement utile dans les cas d’utilisation nécessitant la génération rapide de grands volumes de données, ce qui réduit considérablement le besoin de créer des données manuellement.
En automatisant certaines parties des processus de génération et d’amélioration des données, les GAN permettent de réduire considérablement le nombre d’heures habituellement associées à ces tâches. Cette réduction du besoin en main-d’œuvre permet non seulement de réduire les coûts, mais aussi de réorienter les ressources humaines vers des activités plus stratégiques, optimisant ainsi l’attribution de la main-d’œuvre et améliorant la productivité.
Comme nous l’avons mentionné, les réseaux antagonistes génératifs sont composés de deux principaux modèles de réseau neuronal formés simultanément au moyen de processus antagonistes. Ces réseaux antagonistes sont appelés « modèle générateur » et « modèle discriminateur ».
La tâche principale du générateur est de créer des données qui sont indiscernables des données authentiques. Le générateur est en mesure d’utiliser une entrée de bruit aléatoire pour générer des débits de données au moyen d’un réseau de couches conçu pour affiner progressivement les détails et la qualité des données. Le générateur s’améliore avec le temps, guidé par la rétroaction du discriminateur quant à l’authenticité de ses sorties, l’objectif ultime étant de produire des données si convaincantes qu’elles peuvent amener le discriminateur à penser qu’elles sont authentiques.
Le discriminateur agit à titre de juge dans la configuration GAN. Il évalue les données pour déterminer si elles sont réelles (à partir de l’ensemble de données réel) ou fausses (à partir du générateur). L’objectif du discriminateur est de classer avec exactitude les données d’entrée, en fournissant une rétroaction critique au générateur quant à la qualité de ses sorties. Ce modèle contribue à peaufiner le générateur en le poussant à produire des sorties de meilleure qualité et plus réalistes.
Au cours de la dizaine d’années qui s’est écoulée depuis leur invention, les réseaux antagonistes génératifs ont évolué en plusieurs variantes distinctes, chacune convenant à des applications et à des défis différents. Encore une fois, bien que bon nombre de ces variations soient tout particulièrement adaptées à la génération d’images, elles peuvent souvent être appliquées également à d’autres utilisations.
Les types courants de GAN comprennent les suivants :
GAN traditionnel
Il s’agit de la forme de GAN la plus simple, où le générateur et le discriminateur sont des réseaux neuronaux simples. Les GAN traditionnels établissent l’architecture de base pour des modèles plus complexes, mais pourraient ne pas être suffisants pour des tâches très complexes.GAN conditionnel (cGAN)
Ces GAN conditionnent à la fois le générateur et le discriminateur en fonction de renseignements supplémentaires, ce qui permet au modèle de générer des données précises à des étiquettes ou étiquettes données. Cette approche permet de générer des données plus ciblées et pertinentes.GAN convolutif profond (DCGAN)
L’intégration de réseaux neuronaux convolutifs, les DCGAN, est particulièrement efficace dans les tâches impliquant des images. Ces réseaux utilisent des couches convolutives et des couches de convolutions transposées dans le générateur et le discriminateur, ce qui améliore la qualité de la génération d’images.GAN à pyramide laplacienne (LAPGAN)
Les GAN à pyramide laplacienne (LAPGAN) utilisent une série de GAN disposés dans une structure pyramidale pour générer des images allant de grossièrement à finement détaillées. Chaque niveau de la pyramide affine les détails de l’image, ce qui permet de générer des sorties à plus haute résolution.GAN à super résolution (SRGAN)
Axés sur la conversion d’images à faible résolution en images à haute résolution, les SRGAN appliquent un entraînement antagoniste pour apprendre à cartographier des images de faible résolution en haute résolution, ce qui aide à récupérer des textures photoréalistes à partir d’images fortement échantillonnées.
Les GAN fonctionnent grâce à un processus dynamique et concurrentiel entre les modèles générateurs et discriminateurs. Ce processus permet de s’assurer que les sorties générées s’améliorent progressivement sur le plan de la qualité et du réalisme. Voici le détail des étapes à suivre :
Initialisation
Le générateur et le discriminateur sont initialisés selon des paramètres d’entraînement aléatoires afin d’éliminer le risque de biais à l’égard d’un résultat particulier; ces « poids » sont peaufinés tout au long du processus.Le générateur présente des données synthétiques
Le générateur crée des données à partir d’une entrée de bruit aléatoire, en essayant d’imiter la distribution des données réelles.Le discriminateur évalue et répond
Ce modèle évalue à la fois les données réelles et les données synthétiques du générateur. Il tente de classer correctement les données qui sont réelles et celles qui sont fausses.Les récompenses sont fournies à mesure que les données sont définies et que la rétroaction est fournie.
Les récompenses dans l’entraînement des GAN renvoient aux ajustements apportés aux paramètres du modèle en fonction de la performance du discriminateur. Si le discriminateur repère correctement les données réelles des données fausses, il est « récompensé » par le fait que ses paramètres nécessitent moins d’ajustements. À l’inverse, en cas d’échec, des modifications plus importantes sont apportées pour améliorer sa précision. Le générateur est également ajusté en fonction de sa capacité à tromper le discriminateur.Le processus d’apprentissage itératif se poursuit
Le processus est répété au moyen d’échanges continus entre le générateur et le discriminateur, s’améliorant à chaque cycle jusqu’à ce que le discriminateur ne puisse plus discerner de façon fiable les données synthétiques des données réelles.
La mise en œuvre des réseaux antagonistes génératifs inclut plusieurs processus clés conçus pour assurer le fonctionnement efficace du réseau. Chacun des éléments suivants fait partie intégrante de l’architecture et de la fonction du GAN :
Importation des bibliothèques requises
La configuration de l’environnement de codage par l’importation de bibliothèques logicielles nécessaires fournit les outils et les fonctions nécessaires à l’apprentissage machine et au traitement des données.Définition d’une transformation
Les transformations sont utilisées pour traiter à l’avance les données dans un format adapté au réseau neuronal, en veillant à ce que les données d’entrée soient normalisées ou augmentées afin d’améliorer l’entraînement.Chargement de l’ensemble de données
Cette étape consiste à préparer et charger les données desquelles le GAN apprendra; il peut s’agir d’images, de textes ou de toute autre forme de données applicables au problème.Définition des paramètres à utiliser dans les processus ultérieurs
L’établissement de paramètres clés, comme le taux d’apprentissage, le nombre d’époques et la taille des lots, contribue à déterminer la façon dont le modèle s’entraîne.Définition d’une classe utilitaire pour construire le générateur
Cette classe englobe l’architecture du générateur, en détaillant les couches et leurs fonctions essentielles à la génération de nouvelles données.Définition d’une classe utilitaire pour construire le discriminateur
À l’instar de celle du générateur, cette classe décrit la structure du discriminateur, qui évaluera l’authenticité des données générées.Construction du GAN
Cette étape consiste à intégrer le générateur et le discriminateur dans une infrastructure modèle unique, prête pour l’entraînement.Entraînement du GAN
L’élément voit le discriminateur et le générateur entraînés dans leur dynamique antagoniste, chacun s’améliorant en réponse à la performance de l’autre.
Les réseaux antagonistes génératifs sont des outils puissants de l’IA; ils ont contribué à jeter les bases des solutions génératives modernes, mais ils ne sont pas sans défauts. Les GAN présentent plusieurs défis qui peuvent avoir une incidence sur leur efficacité et leur application. Les obstacles potentiels suivants nécessitent une réflexion approfondie et des approches adaptées pour que nous puissions nous assurer que les GAN sont utilisés de façon efficace et responsable :
Les GAN sont sujets à l’instabilité pendant l’entraînement, c’est-à-dire que le générateur et le discriminateur peuvent ne pas apprendre efficacement. Pour y remédier, les chercheurs modifient généralement les fonctions de perte et optimisent l’architecture afin de mieux répondre aux besoins du réseau.
Bien que les GAN puissent aider les organisations à réaliser des économies en matière d’heures de main-d’œuvre et à améliorer la productivité, les investissements importants nécessaires pour entraîner les GAN sur le plan informatique, surtout avec des ensembles de données vastes et complexes, peuvent constituer un obstacle. L’utilisation de conceptions de réseau plus efficaces et la mise à profit des accélérations matérielles pour gérer ces demandes peuvent constituer une solution.
Comme de nombreux modèles d’apprentissage machine, les GAN peuvent surapprendre les données d’entraînement (surtout lorsque la diversité des données est faible), ce qui les rend moins efficaces pour les nouvelles données invisibles. Les techniques de régularisation, l’augmentation des données et l’accroissement de la diversité des ensembles de données peuvent aider à atténuer ce risque.
Les GAN ne sont pas sans risques : ils peuvent reproduire ou amplifier les préjugés présents dans les données d’entraînement, ce qui entraîne des problèmes d’iniquité ou de discrimination. Pour lutter contre ce risque, les organisations et les chercheurs devraient accorder la priorité à divers ensembles de données d’entraînement tout en mettant en œuvre des algorithmes conçus pour repérer et corriger d’éventuels préjugés.
La nature de « boîte noire » des GAN peut entraver l’interprétation de leurs processus décisionnels, ce qui peut être particulièrement problématique dans certaines applications sensibles. Il est essentiel de mettre au point des méthodes pour mieux repérer, comprendre et expliquer les comportements des GAN afin d’assurer la responsabilisation et la confiance placée dans leurs applications.
En tant que technologie fondamentale de l’IA générative moderne, les réseaux antagonistes génératifs ont démontré un potentiel important dans un large éventail de secteurs et de domaines, depuis l’augmentation des données et la génération de données synthétiques jusqu’à des applications plus complexes comme l’apprentissage non supervisé. Ces réseaux offrent des perspectives prometteuses aux entreprises qui cherchent à améliorer le réalisme et la diversité des données.
Now PlatformMD de ServiceNow intègre des capacités avancées en matière d’IA qui sont idéales pour appuyer les initiatives de GAN et d’autres initiatives axées sur l’IA. L’outil offre des fonctionnalités comme la compréhension du langage naturel, l’analyse prédictive et l’automatisation intelligente, ce qui simplifie la prise de décisions et l’efficacité opérationnelle afin que les entreprises puissent consacrer plus de temps et de ressources à la croissance. De plus, la capacité de la plateforme à gérer des tâches complexes liées à l’IA en toute sécurité et à grande échelle permet aux entreprises de tirer pleinement parti du potentiel des technologies de l’IA générative sans sacrifier la performance ou la sécurité.
Découvrez par vous-même comment ServiceNow et l’IA peuvent transformer vos affaires; demandez une démonstration de ServiceNow dès aujourd’hui!