¿Qué son las redes generativas adversarias?

Las redes generativas adversarias (GAN) son un modelo de IA compuesto por dos redes neuronales, generador y discriminador, que compiten para mejorar sus funciones; el generador crea datos falsos que se asemejan al conjunto de formación, mientras que el discriminador intenta determinar si los datos son auténticos.

Demostración de IA
Cosas que debes saber sobre las redes generativas adversarias
¿Por qué usar las GAN? ¿Cuáles son las ventajas de las GAN? ¿Cuál es la estructura de las GAN? ¿Cuáles son las diferentes categorías de las GAN? ¿Cómo funcionan las redes generativas adversarias? ¿Cómo se implementan las redes generativas adversarias? ¿Cuáles son algunos de los desafíos de las GAN? ServiceNow para redes generativas adversarias

La IA generativa (GenAI) representa uno de los avances más importantes en inteligencia artificial en los últimos años. A primera vista, puede parecer que este avance ocurrió de la noche a la mañana y transformó el mundo introduciendo soluciones de IA potentes, capaces y ampliamente disponibles. Sin embargo, la realidad es que las nuevas competencias generativas de la IA son la culminación de décadas de investigación y desarrollo de varias tecnologías secundarias. El concepto de red generativa adversaria, o GAN, es una de esas innovaciones que ha desempeñado un rol fundamental en la configuración del panorama de la inteligencia artificial.

 

Orígenes de las GAN

En 2014, Ian Goodfellow y varios colegas conceptualizaron las GAN por primera vez. El problema al que se enfrentaban era cómo desarrollar un sistema informático capaz de producir “fotografías” originales y realistas basadas en los datos proporcionados. Cuando se encontraron con el panorama desalentador del mero cálculo matemático que estaría involucrado, Goodfellow tuvo una idea: ¿Por qué no asignar simplemente la tarea de crear imágenes a una red y la de buscar fallas en las imágenes a otra? Las dos funcionarían en tándem, presentando iterativamente nuevas versiones e identificando errores hasta que las imágenes falsas pudieran pasar la inspección.

Las primeras redes generativas adversarias nacieron de esa idea. Tal como se planteó, este marco de trabajo innovador implica dos sistemas opuestos que participan en un concurso en el que gana uno y pierde el otro. Con el tiempo, ambas redes mejoran sus competencias, lo que lleva a una generación de datos cada vez más sofisticada.

Ver todo Contraer todo ¿Por qué usar las GAN?

Las redes generativas adversarias han despertado un interés considerable debido a su capacidad única de generar datos realistas y de gran calidad en varios dominios, desde la creación de ilustraciones generadas por IA e imágenes o videos sintéticos hasta la asistencia con la personalización de productos y el modelado de distribución probabilístico. En pocas palabras, lo que comenzó como un experimento de pensamiento improvisado se convirtió en una tecnología demostrada con aplicaciones prácticas importantes. Esto transformó la forma en que las máquinas aprenden y crean, y cómo las empresas pueden beneficiarse de ellas.

Presentamos Now Intelligence Descubre cómo ServiceNow saca la IA y los análisis de los laboratorios para transformar la forma en que las empresas trabajan y acelerar la transformación digital. Obtener eBook
¿Cuáles son las ventajas de las GAN?

Hay varias ventajas convincentes de aplicar soluciones de GAN para aplicaciones empresariales. Considera lo siguiente:

Generación de datos sintéticos

Las GAN se destacan en la generación de nuevos datos que imitan las distribuciones de datos reales. Esto es increíblemente útil para el aumento de datos, ya que mejora los modelos de aprendizaje automático sin datos reales adicionales. También permite una detección eficaz de anomalías y fomenta la creatividad en la generación de nuevos diseños y conceptos.

Mejores resultados

Conocidas por producir resultados fotorrealistas y de alta fidelidad, las GAN son fundamentales en los campos que requieren una síntesis detallada de imágenes y videos. Ya sea para generar entornos realistas en sistemas virtuales o para crear nuevas secuencias de audio en la música, la calidad de las salidas de las GAN a menudo no puede distinguirse de las grabaciones o imágenes reales. Esto también se traslada a los datos que no son multimedia; el proceso de las GAN puede pulir la información sintética de cualquier tipo hasta que coincida con la calidad de los conjuntos de datos reales.

Menor necesidad de supervisión

Una de las características destacadas de las GAN es su capacidad de aprender sin conjuntos de datos etiquetados. Esto es valioso en situaciones en las que los datos etiquetados son limitados o costosos de obtener. La autonomía de las GAN elimina una de las principales barreras que, de otro modo, podrían impedir que determinadas organizaciones o personas trabajen dentro del marco de trabajo.

Mayor producción de datos

Las GAN tienen la competencia única de imitar de forma autónoma distribuciones de datos complejas, lo que permite la producción eficiente de conjuntos de datos altamente específicos. Esta característica es particularmente útil en casos de uso que requieren la generación rápida de grandes volúmenes de datos, lo que reduce significativamente la necesidad de creación manual de datos.

Reducción de los costos de mano de obra

Al automatizar parte de los procesos de generación y mejora de datos, las GAN pueden reducir significativamente las horas normalmente asociadas con estas tareas. Esta reducción de la mano de obra no solo reduce los costos, sino que también permite redirigir los recursos humanos hacia actividades más estratégicas, lo que optimiza la asignación de la fuerza laboral y aumenta la productividad.

¿Cuál es la estructura de las GAN?

Tal como se indica, las redes generativas adversarias se componen de dos modelos principales de redes neuronales formados simultáneamente a través de procesos adversarios. Estas redes opuestas se denominan modelo generador y modelo discriminador.

Modelo generador

La tarea principal del generador es crear datos que no puedan distinguirse de los datos genuinos. A partir de una entrada de ruido aleatoria, utiliza esta entrada para generar salidas de datos a través de una red de capas diseñadas para pulir progresivamente los detalles y la calidad de los datos. El generador mejora con el tiempo, con el asesoramiento del discriminador sobre la autenticidad de sus salidas, y tiene como objetivo final producir datos tan convincentes que puedan engañar al discriminador para que piense que es genuino.

Modelo discriminador

El discriminador actúa como juez en la configuración de las GAN. Evalúa los datos para determinar si son reales (del conjunto de datos real) o falsos (del generador). El objetivo del discriminador es clasificar con precisión los datos de entrada y proporciona comentarios críticos al generador sobre la calidad de sus salidas. Este modelo ayuda a pulir el generador presionándolo para producir salidas mejores y más realistas.

¿Cuáles son las diferentes categorías de las GAN?

En su primer década de existencia, las redes generativas adversarias han evolucionado hasta convertirse en diversas variantes específicas, cada una adecuada para diferentes aplicaciones y desafíos. Una vez más, si bien muchas de estas variaciones se adaptan específicamente a la generación de imágenes, a menudo también se pueden aplicar a otros usos.

Los tipos comunes de GAN incluyen los siguientes: 

  • Vanilla GAN 
    Esta es la forma más sencilla de las GAN, en la que el generador y el discriminador son redes neuronales simples. Las Vanilla GAN establecen la arquitectura esencial para modelos más complejos, pero pueden no ser suficiente para tareas de alta complejidad.

  • GAN condicional (cGAN) 
    Estas GAN condicionan tanto al generador como al discriminador a información adicional, lo que permite que el modelo genere datos específicos para etiquetas o indicadores determinados. Este enfoque hace posible una generación de datos más específica y relevante.

  • GAN convolucional profunda (DCGAN) 
    Al integrar redes neuronales convolucionales, las DCGAN son particularmente eficaces para tareas que involucran imágenes. Utilizan capas convolucionales y convolucionales transpuestas en el generador y el discriminador, lo que mejora la calidad de la generación de imágenes.

  • GAN de la pirámide Laplaciana (LAPGAN) 
    LAPGAN utiliza una serie de GAN dispuestas en una estructura piramidal para generar imágenes desde una manera tosca hasta una refinada. Cada nivel de la pirámide pule los detalles de la imagen, lo que permite la generación de salidas de mayor resolución.

  • GAN de superresolución (SRGAN) 
    Centradas en convertir imágenes de baja resolución en imágenes de alta resolución, las SRGAN aplican formación contradictoria para aprender un mapeo que va desde la resolución baja a la alta, lo que ayuda a recuperar texturas fotorrealistas de imágenes con una resolución inferior.

¿Cómo funcionan las redes generativas adversarias?

Las GAN funcionan a través de un proceso dinámico y competitivo entre el modelo generador y el discriminador. Este proceso garantiza una mejora progresiva de la calidad y el realismo de las salidas generadas. A continuación, se muestra un desglose de los pasos involucrados:

  1. Inicialización
    El generador y el discriminador se inicializan con parámetros de formación aleatorios para eliminar el riesgo de sesgo hacia cualquier resultado específico; estos “pesos” se ajustan a lo largo del proceso.

  2. El generador presenta datos sintéticos
    El generador crea datos a partir de una entrada de ruido aleatoria e intenta imitar la distribución real de los datos.

  3. El discriminador evalúa y responde
    Este modelo evalúa tanto los datos reales como los datos sintéticos del generador. Trata de clasificar correctamente qué datos son reales y cuáles son falsos.

  4. Las recompensas se proporcionan a medida que se identifican los datos y se proporcionan comentarios
    Las recompensas en la formación de GAN se refieren a los ajustes realizados a los parámetros del modelo en función del rendimiento del discriminador. Si el discriminador identifica correctamente los datos reales o falsos, su “recompensa” será que sus parámetros requerirán menos ajustes. Por el contrario, si falla, se harán cambios más importantes para mejorar su precisión. El generador también se ajusta en función del éxito que tenga para engañar al discriminador.

  5. El proceso de aprendizaje iterativo continúa
    El proceso se repite con intercambios continuos entre el generador y el discriminador, lo que mejora a lo largo de cada ciclo hasta que el discriminador ya no puede distinguir de manera confiable entre los datos sintéticos y los reales.

¿Cómo se implementan las redes generativas adversarias?

La implementación de GAN implica varios procesos clave diseñados para garantizar que la red funcione de manera eficaz y eficiente. Cada uno de los siguientes elementos es esencial para la arquitectura y las funciones de las GAN:

  • Importación de las bibliotecas requeridas
    La configuración del entorno de codificación mediante la importación de bibliotecas de software necesarias proporciona las herramientas y funciones necesarias para el aprendizaje automático y el procesamiento de datos.

  • Definición de la transformación
    Las transformaciones se utilizan para preprocesar los datos en un formato adecuado para la red neuronal, lo que garantiza que los datos de entrada se normalicen o aumenten para mejorar la formación.

  • Carga del conjunto de datos
    Esto implica preparar y cargar los datos de los que las GAN aprenderán, que podrían ser imágenes, textos o cualquier otra forma de datos aplicables al problema.

  • Definición de parámetros que se utilizarán en procesos posteriores
    Establecer parámetros clave, como la tasa de aprendizaje, la cantidad de épocas y el tamaño de los lotes, ayuda a determinar cómo se entrena el modelo.

  • Definición de una clase de utilidad para desarrollar el generador
    Esta clase encapsula la arquitectura del generador y detalla las capas y sus funciones, que son cruciales para generar nuevos datos.

  • Definición de una clase de utilidad para desarrollar el discriminador
    Al igual que el generador, esta clase describe la estructura del discriminador, que juzgará la autenticidad de los datos generados.

  • Desarrollo de las GAN
    Esto implica integrar el generador y el discriminador en un marco de trabajo de modelo único, listo para la formación.

  • Formación de las GAN
    El elemento ve cómo el discriminador y el generador se forman a través de su dinámica adversaria, cada uno mejora en respuesta al rendimiento del otro.

¿Cuáles son algunos de los desafíos de las GAN?

Las redes generativas adversarias son herramientas poderosas en IA y han ayudado a sentar las bases para soluciones generativas modernas, aunque no están exentas de fallas. Las GAN presentan varios desafíos que pueden afectar su eficacia y aplicación. Los siguientes obstáculos potenciales requieren una consideración cuidadosa y enfoques adaptados para garantizar que las GAN se utilicen de manera eficaz y responsable:

Inestabilidad de la formación

Las GAN son propensas a la inestabilidad durante la formación, durante la cual el generador y el discriminador pueden no aprender de manera efectiva. Para abordar esto, los investigadores suelen modificar las funciones de pérdida y optimizar la arquitectura para que se adapte mejor a las necesidades de la red.

Costo computacional

Si bien las GAN pueden ayudar a las organizaciones a ahorrar dinero en términos de horas de trabajo y productividad mejorada, las importantes inversiones computacionales necesarias para la formación de las GAN, especialmente con conjuntos de datos grandes y complejos, pueden ser un obstáculo. Usar diseños de red más eficientes y aprovechar las aceleraciones de hardware para administrar estas demandas puede proporcionar una solución.

Sobreajuste

Al igual que muchos modelos de aprendizaje automático, las GAN pueden sobreajustarse a los datos de formación (especialmente cuando la diversidad de datos es baja), lo que las hace menos eficaces con datos nuevos y nunca vistos. Las técnicas de regularización, el aumento de datos y la creciente diversidad de conjuntos de datos pueden ayudar a mitigar este riesgo.

Sesgo e imparcialidad

Existe el peligro de que las GAN reproduzcan o amplifiquen los sesgos presentes en los datos de formación, lo que genera problemas de injusticia o discriminación. Para combatir esto, las organizaciones y los investigadores deben priorizar diversos conjuntos de datos de formación al tiempo que implementan algoritmos diseñados para identificar y corregir posibles sesgos.

Interpretabilidad y rendición de cuentas

La naturaleza de “caja negra” de las GAN puede dificultar la interpretación de sus procesos de toma de decisiones, lo que puede ser especialmente problemático en ciertas aplicaciones confidenciales. Desarrollar métodos para rastrear, comprender y explicar mejor los comportamientos de las GAN es esencial para garantizar la responsabilidad y la confianza en sus aplicaciones.

Precios de ServiceNow ServiceNow ofrece paquetes de productos competitivos que escalan contigo a medida que tu empresa crece y tus necesidades cambian. Ver precios
ServiceNow para redes generativas adversarias

Como una tecnología fundamental de la GenAI moderna, las redes generativas adversarias han demostrado un potencial significativo en una variedad de industrias y campos, desde el aumento de datos y la generación de datos sintéticos hasta aplicaciones más complejas como el aprendizaje no supervisado. Estas redes ofrecen perspectivas prometedoras para las empresas que buscan mejorar el realismo y la diversidad de los datos.

Now Platform® de ServiceNow incorpora competencias avanzadas de IA que son ideales para apoyar a las GAN y otras iniciativas impulsadas por la IA. Ofrece características como la comprensión del lenguaje natural, el análisis predictivo y la automatización inteligente, lo que optimiza la toma de decisiones y la eficiencia operativa para que las empresas puedan centrar más su tiempo y recursos en el crecimiento. Además, la capacidad de la plataforma para manejar tareas complejas de IA de forma segura y a escala garantiza que las empresas puedan aprovechar todo el potencial de las tecnologías de GenAI sin comprometer el rendimiento ni la seguridad.

Descubre por ti mismo cómo ServiceNow y la IA pueden transformar tu empresa; ¡mira una demostración de ServiceNow hoy mismo!

Sumérgete incluso más en la IA generativa Acelera la productividad con Now Assist: la IA generativa integrada en Now Platform. Explorar la IA Comunícate con nosotros
Recursos Artículos ¿Qué es la IA? ¿Qué es la IA generativa? ¿Qué es una LLM? Informes de analista Resumen informativo de IDC: Maximiza el valor de la IA con una plataforma digital IA generativa en operaciones de TI Implementación de GenAI en la industria de las telecomunicaciones Fichas técnicas AI Search Predecir y evitar interrupciones con ServiceNow® Predictive AIOps eBooks Moderniza los servicios y las operaciones de TI con IA GenAI: ¿es realmente la gran cosa? Libere la productividad empresarial con GenAI White papers Índice de madurez de la IA empresarial GenAI para telecomunicaciones