Was sind Generative Adversarial Networks?

Ein Generative Adverserial Network (GAN) ist ein KI-Modell, das aus zwei neuronalen Netzwerken besteht, dem Generator und dem Diskriminator, die konkurrieren, um ihre Funktionen zu verbessern. Der Generator erstellt gefälschte Daten, die dem Trainingssatz ähneln, während der Diskriminator versucht, zu bestimmen, ob die Daten authentisch sind.

KI-Demo
Wissenswertes über Generative Adversarial Networks
Warum ein GAN? Welche Vorteile bieten GANs? Wie sieht die GAN-Struktur aus? Welche Kategorien von GANs gibt es? Wie funktionieren Generative Adversarial Networks? Wie werden Generative Adversarial Networks implementiert? Welche Herausforderungen bringen GANs mit sich? Generative Adversarial Networks mit ServiceNow

Generative KI (GenAI) ist eine der bedeutendsten Fortschritte im Bereich künstliche Intelligenz in den letzten Jahren. Auf den ersten Blick kann sich dieser Sprung nach vorne wie eine plötzliche Entwicklung anfühlen – die Einführung leistungsstarker, leistungsfähiger und breit verfügbarer KI-Lösungen, die die Welt transformieren. In Wahrheit sind die neuen, generativen Fähigkeiten von KI jedoch der Höhepunkt jahrzehntelanger Forschung und Entwicklung in verschiedenen unterstützenden Technologien. Das Konzept des Generative Adversarial Network (GAN) ist eine solche Innovation, die eine zentrale Rolle bei der Gestaltung der Landschaft künstlicher Intelligenz gespielt hat.

 

GAN-Ursprünge

GANs wurden erstmals 2014 von Ian Goodfellow und einigen Kollegen konzipiert. Das Problem, mit dem sie konfrontiert waren, bestand darin, ein Computersystem zu entwickeln, das eigene, realistisch aussehende „Fotos“ basierend auf bereitgestellten Daten erstellen konnte. Angesichts der entmutigenden Aussicht auf die damit verbundenen mathematischen Berechnungen kam Goodfellow auf eine Idee: Warum sollte er nicht einfach ein Netzwerk mit der Erstellung der Bilder und ein anderes mit der Suche nach Fehlern in den Bildern beauftragen? Die beiden würden dann zusammen funktionieren, iterativ neue Versionen präsentieren und Fehler identifizieren, bis die gefälschten Bilder endlich die Inspektion bestehen.

Das erste Generative Adversarial Network entstand aus dieser Idee. Wie vorgeschlagen, umfasst dieses innovative Framework zwei gegensätzliche Systeme, die an einem Wettbewerb teilnehmen, in dem der eigene Gewinn den Verlust des anderen bedeutet. Im Laufe der Zeit erweitern beide Netzwerke ihre Fähigkeiten, was zu einer immer raffinierteren Datengenerierung führt.

Alle erweitern Alle reduzieren Warum ein GAN?

Generative Adversarial Networks haben aufgrund ihrer einzigartigen Fähigkeit, hochwertige, realistische Daten über verschiedene Bereiche hinweg zu generieren, großes Interesse geweckt: von der Erstellung KI-generierter Grafiken und synthetischer Bilder oder Videos bis hin zur Unterstützung bei der Produkpersonalisierung oder probabilistischen Verteilungsmodellierung. Einfach ausgedrückt: Was als spontanes Gedankenexperiment begann, hat sich zu einer bewährten Technologie entwickelt, die bedeutende praktische Anwendungen bietet. Das hat die Art und Weise transformiert, wie Maschinen lernen und Inhalte generieren – und wie Unternehmen davon profitieren können.

Wir stellen vor: Now Intelligence Erfahren Sie, wie ServiceNow KI und Analytics aus dem Labor holt, um die Arbeitsweise von Unternehmen zu verändern und die digitale Transformation zu beschleunigen. Zum E-Book
Welche Vorteile bieten GANs?

Der Einsatz von GAN-Lösungen für Geschäftsanwendungen bietet mehrere überzeugende Vorteile, darunter beispielsweise folgende:

Generierung synthetischer Daten

GANs zeichnen sich durch die Generierung neuer Daten aus, die echte Datenverteilungen imitieren. Dies ist unglaublich nützlich für die Datenerweiterung und die Verbesserung von ML-Modellen ohne zusätzliche reale Daten. Es ermöglicht auch eine effektive Anomalie-Erkennung und fördert die Kreativität bei der Erstellung neuer Designs und Konzepte.

Bessere Ergebnisse

GANs sind dafür bekannt, dass sie fotorealistische und naturgetreue Ergebnisse liefern, und sind daher in Bereichen, die eine detaillierte Bild- und Videosynthese erfordern, von entscheidender Bedeutung. Ob für die Generierung realistischer Umgebungen in virtuellen Systemen oder für die Erstellung neuer Audiosequenzen in Musik – die Qualität der GAN-Ausgaben lässt sich oft nicht von tatsächlichen Aufnahmen oder Bildern unterscheiden. Dies gilt auch für Nicht-Mediendaten: Der GAN-Prozess kann synthetische Informationen aller Arten verfeinern, bis sie der Qualität der tatsächlichen Datensätze entsprechen.

Weniger Überwachungsbedarf

Eine der herausragenden Merkmale von GANs ist ihre Fähigkeit, ohne gekennzeichnete Datensätze zu lernen. Das erweist sich in Szenarien als wertvoll, in denen die Beschaffung gekennzeichneter Daten eingeschränkt oder teuer ist. GAN-Autonomie beseitigt eine der größten Hindernisse, die Unternehmen oder Personen daran hindern könnten, innerhalb des Frameworks zu arbeiten.

Gesteigerte Datenproduktion

GANs verfügen über die einzigartige Fähigkeit, komplexe Datenverteilungen autonom nachzuahmen, und ermöglichen so die effiziente Erstellung hochspezifischer Datensätze. Diese Funktion ist besonders nützlich in Anwendungsfällen, die eine schnelle Generierung großer Datenmengen erfordern. Sie reduziert den Bedarf an manueller Datenerstellung erheblich.

Geringere Arbeitskosten

Durch die Automatisierung von Teilen der Datengenerierungs- und -verbesserungsprozesse können GANs die Arbeitsstunden, die normalerweise mit diesen Aufgaben verbunden sind, erheblich reduzieren. Dieser reduzierte Arbeitsaufwands senkt nicht nur die Kosten, sondern ermöglicht es auch, die Personalressourcen auf strategischere Aktivitäten umzuverteilen. So wird die Personalzuteilung optimiert und die Produktivität gesteigert.

Wie sieht die GAN-Struktur aus?

Wie bereits erwähnt, bestehen Generative Adversarial Networks aus zwei zentralen neuronalen Netzwerkmodellen, die gleichzeitig durch Konkurrenzprozesse trainiert werden. Diese konkurrierenden Netzwerke werden als Generator-Modell und Diskriminator-Modell bezeichnet.

Generator-Modell

Die Hauptaufgabe des Generators besteht darin, Daten zu erstellen, die sich nicht von echten Daten unterscheiden lassen. Er beginnt mit einer zufälligen Rauscheingabe und verwendet sie, um Datenausgaben zu generieren – über ein Netzwerk von Schichten, das die Details und Qualität der Daten schrittweise verfeinert. Der Generator verbessert sich im Laufe der Zeit, geleitet vom Diskriminator-Feedback zur Authentizität seiner Ausgaben. Das ultimative Ziel besteht darin, so überzeugende Daten zu liefern, dass der Diskriminator sie für echt hält.

Diskriminator-Modell

Der Diskriminator fungiert im GAN-Setup als Richter. Er wertet Daten aus, um festzustellen, ob sie real (aus dem tatsächlichen Datensatz) oder falsch (vom Generator) sind. Das Ziel des Diskriminators besteht darin, die Eingabedaten genau zu klassifizieren und dem Generator kritisches Feedback zur Qualität seiner Ausgaben zu geben. Dieses Modell hilft bei der Optimierung des Generators, indem es ihn dazu antreibt, bessere und realistischere Ausgaben zu erzielen.

Welche Kategorien von GANs gibt es?

In den letzten zehn Jahren haben sich aus Generative Adversarial Networks verschiedene Varianten entwickelt, die sich für unterschiedliche Anwendungen und Herausforderungen eignen. Viele dieser Varianten sind zwar speziell auf die Bildgenerierung zugeschnitten, können aber oft auch für andere Anwendungen genutzt werden.

Zu den gängigen GAN-Typen gehören: 

  • Vanilla GAN 
    Dies ist die einfachste Form eines GAN, bei der Generator und Diskriminator einfache neuronale Netzwerke sind. Vanilla GANs bilden die Grundarchitektur für komplexere Modelle, reichen aber möglicherweise nicht für hochkomplexe Aufgaben aus.

  • Conditional GAN (cGAN) 
    Diese GANs stellen sowohl Generator als auch Diskriminator zusätzliche Informationen als Bedingungen bereit, sodass das Modell Daten generieren kann, die für bestimmte Bezeichnungen oder Tags spezifisch sind. Dieser Ansatz ermöglicht eine gezieltere und relevantere Datengenerierung.

  • Deep Convolutional GAN (DCGAN) 
    DCGANs integrieren Convolutional Neural Networks und sind besonders effektiv bei Aufgaben, die Bilder betreffen. Sie verwenden Faltungsschichten und Faltungs-Transpositionsschichten im Generator und Diskriminator, wodurch die Qualität der Bilderzeugung verbessert wird.

  • Laplacian Pyramid GAN (LAPGAN) 
    LAPGANs verwenden eine Reihe von GANs, die in einer Pyramidenstruktur angeordnet sind, um Bilder von grob bis fein zu generieren. Jede Ebene der Pyramide verfeinert die Details des Bildes, wodurch Ausgaben in höherer Auflösung generiert werden können.

  • Super-Resolution GAN (SRGAN) 
    SRGANs konzentrieren sich auf die Umwandlung von Bildern mit niedriger Auflösung in Bilder mit hoher Auflösung und wenden Konkurrenztraining an, um eine Zuordnung zwischen niedriger und hoher Auflösung zu erlernen. So können fotorealistische Texturen aus stark verkleinerten Bildern wiederhergestellt werden.

Wie funktionieren Generative Adversarial Networks?

GANs funktionieren durch einen dynamischen und wettbewerbsorientierten Prozess zwischen den Generator- und Diskriminator-Modellen. Dieser Prozess stellt sicher, dass sich die generierten Ausgaben schrittweise in Qualität und Realismus verbessern. Im Folgenden finden Sie eine Aufgliederung der erforderlichen Schritte:

  1. Initialisierung
    Der Generator und der Diskriminator werden mit zufälligen Trainingsparametern initialisiert, um das Risiko einer Verzerrung (Bias) gegenüber bestimmten Ergebnissen zu eliminieren. Diese „Gewichtungen“ werden während des gesamten Prozesses optimiert.

  2. Generator präsentiert synthetische Daten
    Der Generator erstellt Daten aus einer zufälligen Rauscheingabe und versucht, die tatsächliche Datenverteilung nachzuahmen.

  3. Diskriminator bewertet und reagiert
    Dieses Modell bewertet sowohl reale Daten als auch die synthetischen Daten des Generators. Es versucht, richtig zu klassifizieren, welche Daten echt und welche gefälscht sind.

  4. Belohnungen werden bereitgestellt, wenn Daten identifiziert und Feedback gegeben wird
    Belohnungen in GAN-Schulungen beziehen sich auf die Anpassungen, die basierend auf der Leistung des Diskriminators an den Modellparametern vorgenommen wurden. Wenn der Diskriminator echte oder gefälschte Daten richtig identifiziert, wird er dadurch „belohnt“, dass weniger Anpassungen an seinen Parametern erforderlich sind. Wenn er hingegen danebenliegt, werden bedeutendere Änderungen vorgenommen, um die Genauigkeit zu verbessern. Der Generator wird auch basierend darauf angepasst, ob er den Diskriminator erfolgreich täuscht.

  5. Der iterative Lernprozess wird fortgesetzt
    Der Prozess wird mit einem kontinuierlichen Austausch zwischen Generator und Diskriminator wiederholt und verbessert sich in jedem Zyklus, bis der Diskriminator die synthetischen Daten nicht mehr zuverlässig von den tatsächlichen Daten unterscheiden kann.

Wie werden Generative Adversarial Networks implementiert?

Die Implementierung von GANs umfasst mehrere Schlüsselprozesse, um die effektive und effiziente Netzwerkfunktion sicherzustellen. Jedes der folgenden Elemente ist integraler Bestandteil der Architektur und Funktion des GAN:

  • Import der erforderlichen Bibliotheken
    Nach der Einrichtung der Codierungsumgebung durch den Import der erforderlichen Softwarebibliotheken stehen die Tools und Funktionen bereit, die für maschinelles Lernen und Datenverarbeitung erforderlich sind.

  • Definition einer Umwandlung
    Umwandlungen werden verwendet, um die Daten vorab in ein Format zu konvertieren, das für das neuronale Netzwerk geeignet ist. Hierdurch werden Eingabedaten normalisiert oder erweitert, um das Training zu verbessern.

  • Laden des Datensatzes
    Dazu gehören die Vorbereitung und das Laden der Daten, aus denen das GAN lernt, z. B. Bilder, Texte oder andere für das Problem relevante Daten.

  • Definition von Parametern, die in späteren Prozessen verwendet werden sollen
    Die Festlegung wichtiger Parameter wie Lernrate, Anzahl der Epochen und Batch-Größen hilft dabei, das Training des Modells zu bestimmen.

  • Definition einer Anwendungsklasse zum Erstellen des Generators
    Diese Klasse umfasst die Architektur des Generators und beschreibt im Detail die Schichten und ihre Funktionen, die für die Generierung neuer Daten entscheidend sind.

  • Definition einer Anwendungsklasse zum Erstellen des Diskriminators
    Ähnlich wie beim Generator beschreibt diese Klasse die Struktur des Diskriminators, der die Authentizität der generierten Daten beurteilt.

  • GAN-Entwicklung
    Dazu gehört die Integration von Generator und Diskriminator in ein einheitliches Modell-Framework, das für das Training bereit ist.

  • GAN-Training
    Hier werden Diskriminator und Generator durch ihre Konkurrenzdynamik trainiert, wobei sich beide als Reaktion auf die Leistung des anderen verbessern.

Welche Herausforderungen bringen GANs mit sich?

Generative Adversarial Networks sind leistungsstarke Tools in der KI und haben dazu beigetragen, die Grundlage für moderne generative Lösungen zu schaffen – aber sie haben auch Nachteile. GANs bringen mehrere Herausforderungen mit sich, die sich auf ihre Effektivität und Anwendbarkeit auswirken können. Die folgenden potenziellen Hindernisse erfordern durchdachte Überlegungen und maßgeschneiderte Ansätze, um sicherzustellen, dass GANs sowohl effektiv als auch verantwortungsvoll eingesetzt werden:

Instabiles Training

GANs sind anfällig für Instabilität während des Trainings, wodurch Generator und Diskriminator möglicherweise nicht effektiv lernen. Um das zu beheben, ändern Forscher normalerweise Verlustfunktionen und optimieren die Architektur, um den Anforderungen des Netzwerks besser gerecht zu werden.

Rechenkosten

GANs können Unternehmen zwar dabei helfen, durch reduzierte Arbeitsstunden und höhere Produktivität Geld zu sparen, doch die erheblichen Investitionen in die Rechenleistung, die für die Schulung von GANs erforderlich sind, können – insbesondere bei großen und komplexen Datensätzen – eine Hürde darstellen. Effizientere Netzwerkdesigns und der Einsatz von Hardwarebeschleunigungen können eine Lösung für diese Anforderungen darstellen.

Überanpassung

Wie viele ML-Modelle können GANs zu eng auf Trainingsdaten ausgerichtet sein (insbesondere bei geringer Datenvielfalt). Das macht sie bei neuen, bisher unbekannten Daten weniger effektiv. Regularisierungstechniken, Datenerweiterung und gesteigerte Datenvielfalt können dazu beitragen, dieses Risiko zu mindern.

Bias und Fairness

Es besteht die Gefahr, dass GANs in den Trainingsdaten vorhandene Vorurteile oder Verzerrungen (Bias) replizieren oder verstärken, was zu Ungerechtigkeit oder Diskriminierung führt. Um diesem Problem entgegenzuwirken, sollten Unternehmen und Forscher vielfältige Trainingsdatensätze priorisieren und gleichzeitig Algorithmen implementieren, die mögliche Bias identifizieren und korrigieren.

Interpretierbarkeit und Verantwortlichkeit

Die „Blackbox“ von GANs kann es schwierig machen, ihre Entscheidungsprozesse zu interpretieren, was in bestimmten sensiblen Anwendungen besonders problematisch sein kann. Die Entwicklung von Methoden zur besseren Nachverfolgung, zum besseren Verständnis und zur Erklärung des Verhaltens von GANs ist unerlässlich, um die Verantwortlichkeit und das Vertrauen in ihre Anwendungen zu gewährleisten.

Preise von ServiceNow ServiceNow bietet wettbewerbsfähige Produktpakete, die mit Ihrem Unternehmen wachsen und sich an Ihre Anforderungen anpassen. Preise anzeigen
Generative Adversarial Networks mit ServiceNow

Als grundlegende Technologie der modernen GenAI haben Generative Adversarial Networks in einer Reihe von Branchen und Bereichen beträchtliches Potenzial gezeigt: von Datenerweiterung und der Generierung synthetischer Daten bis hin zu komplexeren Anwendungen wie unüberwachtem Lernen. Diese Netzwerke bieten Unternehmen, die Datenrealismus und -vielfalt verbessern wollen, vielversprechende Vorteile.

Die Now Platform® von ServiceNow umfasst fortschrittliche KI-Funktionen, die sich ideal für die Unterstützung von GANs und anderen KI-gestützten Initiativen eignen. Sie bietet Funktionen wie Natural Language Understanding, prädiktive Analytics und intelligente Automatisierung, um die Entscheidungsfindung und betriebliche Effizienz zu optimieren. So können Unternehmen ihre Zeit und Ressourcen stärker auf das Wachstum konzentrieren. Darüber hinaus ist die Plattform in der Lage, komplexe KI-Aufgaben sicher und in großem Umfang zu verarbeiten. So wird gewährleistet, dass Unternehmen das Potenzial von GenAI-Technologien voll nutzen können, ohne hierdurch Leistung oder Sicherheit zu beeinträchtigen.

Erfahren Sie selbst, wie ServiceNow und KI Ihr Unternehmen transformieren können: Schauen Sie sich noch heute eine ServiceNow-Demo an.

Weitere Informationen über generative KI Beschleunigen Sie die Produktivität mit Now Assist – einer generativen KI, die direkt in die Now Platform integriert ist. KI entdecken Kontakt
Ressourcen Artikel Was ist KI? Was ist generative KI? Was ist ein LLM? Analystenberichte IDC InfoBrief: KI-Wert mit einer digitalen Plattform maximieren Generative KI im IT-Betrieb Implementierung von GenAI in der Tk-Branche Datenblätter KI-Suche Mit ServiceNow® Prädiktive AIOps Ausfälle prognostizieren und verhindern E-Books IT-Services und -Betrieb mit KI modernisieren GenAI: Ist es wirklich so eine große Sache? Produktivität mit GenAI unternehmensweit steigern Whitepaper KI-Reifeindex für Unternehmen GenAI für die Telekommunikation