¿Qué son las redes generativas antagónicas?

Una red generativa antagónica (GAN) es un modelo de IA compuesto por dos redes neuronales que compiten entre sí por mejorar sus funciones: el generador y el discriminador. El generador crea datos ficticios que se asemejan al conjunto de entrenamiento, mientras que el discriminador intenta determinar si los datos son auténticos o no.

Demostración de la IA
Cosas que hay que saber acerca de las redes generativas antagónicas
¿Cuál es la importancia de las GAN? ¿Cuáles son los beneficios de las GAN? ¿Cómo está estructurada una GAN? ¿Cómo se clasifican las GAN? ¿Cómo funcionan las redes generativas antagónicas? ¿Cómo se implementan las redes generativas antagónicas? ¿Qué desafíos plantean las GAN? ServiceNow para redes generativas antagónicas

La IA generativa (GenAI) representa uno de los avances más significativos en inteligencia artificial de los últimos años. A simple vista, puede parecer que este gran avance —que ha cambiado el mundo con soluciones de IA potentes, capaces y ampliamente disponibles— tuvo lugar de la noche a la mañana. Sin embargo, la realidad es que las nuevas capacidades generativas de la IA son el producto de décadas de investigación y desarrollo en varias tecnologías auxiliares. El concepto de "red generativa antagónica" (GAN) es una de esas innovaciones que ha desempeñado un papel fundamental en la definición del panorama de la inteligencia artificial.

 

Historia de las redes generativas antagónicas

El concepto de red generativa antagónica se desarrolló por primera vez en 2014, de la mano de Ian Goodfellow y otros especialistas en la materia. Este grupo se enfrentaba a un problema: cómo desarrollar un sistema informático capaz de generar "fotografías" originales y realistas a partir de los datos proporcionados. Al ver la abrumadora cantidad de cálculos matemáticos que implicaría la solución, Goodfellow tuvo una idea: ¿y si encargaban la creación de las imágenes a una red y la búsqueda de fallos en esas imágenes a otra? Ambas redes actuarían conjuntamente, presentando nuevas versiones de forma iterativa e identificando errores hasta que las imágenes falsas fueran satisfactorias.

Así surgió el primer modelo de redes generativas antagónicas. Según la propuesta, este marco de trabajo innovador está formado por dos sistemas opuestos que compiten entre sí, en una contienda en la que la victoria de uno se traduce en la derrota del otro. Con el tiempo, ambas redes mejoran sus capacidades, lo que lleva a una generación de datos cada vez más sofisticada.

Expandir todo Contraer todo ¿Cuál es la importancia de las GAN?

Las redes generativas antagónicas han despertado un interés considerable debido a su capacidad única para generar datos realistas y de alta calidad en varios ámbitos: desde la creación de obras de arte generadas por la IA e imágenes y vídeos artificiales, hasta la asistencia en la personalización de productos y el modelado de distribuciones probabilísticas. En pocas palabras, lo que comenzó como un experimento improvisado se ha convertido en una tecnología probada que tiene importantes aplicaciones prácticas y ha transformado la manera que tienen las máquinas de aprender y quedar, así como el modo en que las empresas pueden beneficiarse de ellas.

Presentamos Now Intelligence Descubre cómo ServiceNow® saca la IA y los análisis fuera del laboratorio para transformar la forma de trabajar de las empresas y acelerar la transformación digital. Descargar eBook
¿Cuáles son los beneficios de las GAN?

Aplicar soluciones de GAN en aplicaciones empresariales ofrece ventajas muy atractivas. Veamos algunos ejemplos:

Generación de datos artificiales

Las GAN destacan en la generación de nuevos datos que imitan las distribuciones de datos reales, lo que es increíblemente útil para las tareas de aumento de datos y para mejorar los modelos de aprendizaje automático sin datos reales adicionales. Además, permite detectar anomalías con eficacia y fomenta la creatividad a la hora de generar nuevos diseños y conceptos.

Mejores resultados

Por su conocida capacidad para generar resultados fotorrealistas y de alta fidelidad, las GAN son cruciales en los campos que requieren una síntesis detallada de imágenes y vídeos. Ya sea para generar entornos realistas en sistemas virtuales o para crear nuevas secuencias de audio en música, la calidad de las salidas de las GAN a menudo no se puede distinguir de la de grabaciones o imágenes reales. Esto puede trasladarse también a datos que no son multimedia, ya que el proceso de las GAN puede perfeccionar todo tipo de informaciones artificiales hasta igualar la calidad de los conjuntos de datos reales.

Menor necesidad de supervisión

Una de las características más destacadas de las GAN es su capacidad para aprender sin conjuntos de datos etiquetados, algo especialmente útil en contextos en los que los datos etiquetados son limitados o caros de adquirir. La autonomía de las GAN elimina así una de las principales barreras que podrían impedir que determinadas organizaciones o personas trabajasen en este marco de trabajo.

Mayor producción de datos

Las GAN tienen la capacidad única de imitar de forma autónoma las distribuciones de datos complejos, y pueden generar de manera eficiente conjuntos de datos muy específicos. Esta característica es especialmente útil en casos de uso donde es necesario generar con rapidez grandes volúmenes de datos, ya que reduce significativamente la necesidad de crear datos manualmente.

Menores costes de mano de obra

Mediante la automatización de partes de los procesos de generación y mejora de datos, las GAN pueden reducir significativamente las horas de trabajo que suelen requerir estas tareas. Esta reducción de la mano de obra no solo reduce los costes, sino que también permite que los recursos humanos se centren en actividades más estratégicas, con lo que se optimiza la asignación de la mano de obra y se mejora la productividad.

¿Cómo está estructurada una GAN?

Como hemos mencionado, las redes generativas antagónicas están formadas por dos modelos principales de redes neuronales que se entrenan al mismo tiempo mediante procesos opuestos. Estas redes rivales se denominan modelo generador y modelo discriminador.

Modelo generador

La tarea principal del generador consiste en crear datos que no se puedan distinguir de los reales. A partir de una entrada de ruido aleatoria, utiliza esta entrada para generar salidas de datos a través de una red de capas diseñadas para perfeccionar progresivamente los detalles y la calidad de los datos. El generador mejora con el tiempo gracias a los comentarios del discriminador sobre la autenticidad de sus salidas, y su objetivo final es generar datos tan convincentes que logren engañar al discriminador y convencerlo de que son auténticos.

Modelo discriminador

El discriminador actúa como el juez de la configuración de GAN. Evalúa los datos para determinar si son reales (del conjunto de datos real) o ficticios (del generador). El objetivo del discriminador es clasificar con precisión los datos de entrada y proporcionar comentarios relevantes al generador sobre la calidad de sus salidas. Este modelo ayuda a perfeccionar la calidad del generador, ya que hace que produzca resultados más realistas y de mayor calidad.

¿Cómo se clasifican las GAN?

Durante la década que llevan existiendo, las redes generativas antagónicas han evolucionado hasta conformar distintas categorías, cada una de ellas adecuada para diferentes aplicaciones y desafíos. Una vez más, aunque muchas de estas variantes se adaptan específicamente a la generación de imágenes, a menudo se pueden aplicar también a otros usos.

Entre los tipos más comunes de GAN se incluyen los siguientes: 

  • GAN básica (Vanilla GAN)
    Esta es la GAN más sencilla; el generador y el discriminador son redes neuronales simples. La GAN básica establece la arquitectura de base para modelos más complejos, pero puede no ser suficiente para tareas de gran complejidad.

  • GAN condicional (cGAN) 
    Estas GAN condicionan tanto al generador como al discriminador con información adicional, lo que permite al modelo generar datos específicos para etiquetas o marcas dadas. En este enfoque, la generación de datos es más específica y relevante.

  • GAN convolucional profunda (DCGAN) 
    Las DCGAN integran redes neuronales convolucionales y son particularmente efectivas en tareas relacionadas con imágenes. Utilizan capas convolucionales y convolucionales-transpuestas en el generador y el discriminador, lo que mejora la calidad de la generación de imágenes.

  • GAN de pirámide laplaciana (LAPGAN) 
    La LAPGAN utiliza varias redes generativas antagónicas dispuestas en una estructura piramidal para generar imágenes de manera gradual, comenzando por versiones más simples hasta llegar a imágenes detalladas. En cada nivel de la pirámide, los detalles de la imagen se refinan, gracias a lo cual se generan salidas de mayor resolución.

  • GAN de superresolución (SRGAN) 
    Las SRGAN se centran en convertir imágenes de baja resolución en imágenes de alta resolución. Este modelo aplica el entrenamiento antagonista para aprender un mapeo entre imágenes de baja resolución y alta resolución, lo que ayuda a recuperar texturas fotorrealistas de imágenes con muy poca resolución.

¿Cómo funcionan las redes generativas antagónicas?

Las GAN funcionan a través de un proceso dinámico y competitivo entre el generador y el discriminador. Este proceso garantiza que las salidas generadas mejoren progresivamente en términos de calidad y realismo. A continuación, veremos un desglose de los pasos del proceso:

  1. Inicialización
    El generador y el discriminador se inicializan con parámetros de entrenamiento aleatorios para eliminar el riesgo de sesgo hacia un resultado específico; estos "pesos" se ajustan a lo largo del proceso

  2. El generador presenta datos artificiales
    El generador crea datos a partir de una entrada de ruido aleatoria e intenta imitar la distribución de los datos reales.

  3. El discriminador evalúa y responde
    Este modelo evalúa tanto los datos reales como los artificiales que ha enviado el generador. Trata de clasificar correctamente qué datos son reales y cuáles se han generado artificialmente.

  4. Se proporcionan recompensas a medida que los datos se identifican y se dan comentarios
    En el entrenamiento de GAN, el término "recompensas" se refiere a los ajustes que se realizan en los parámetros del modelo en función del rendimiento del discriminador. Si el discriminador identifica correctamente los datos reales y ficticios, se le "recompensa" con menos ajustes en los parámetros. En cambio, si falla se realizan cambios más significativos para mejorar la precisión. El generador también se ajusta dependiendo de si consigue engañar al discriminador.

  5. El proceso de aprendizaje iterativo continúa
    El proceso de intercambios continuos entre el generador y el discriminador se repite y mejora en cada ciclo, hasta que el discriminador ya no es capaz de distinguir con eficacia los datos artificiales de los datos reales.

¿Cómo se implementan las redes generativas antagónicas?

Para implementar las GAN es necesario aplicar varios procesos clave diseñados para garantizar que la red funcione de manera eficaz y eficiente. Cada una de las siguientes acciones es esencial para la arquitectura y el funcionamiento de la GAN:

  • Importar las bibliotecas necesarias
    Configurar el entorno de codificación con las bibliotecas de software necesarias proporciona las herramientas y funciones que requieren el aprendizaje automático y el procesamiento de datos.

  • Definir una transformación
    Las transformaciones se utilizan para preprocesar los datos y convertirlos a un formato adecuado para la red neuronal, lo que garantiza que los datos de entrada se normalicen o aumenten para mejorar el entrenamiento.

  • Cargar el conjunto de datos
    Aquí se preparan y se cargan los datos que utilizará la GAN para aprender, como imágenes, textos o cualquier otra forma de datos aplicable al problema.

  • Definir los parámetros que se utilizarán en procesos posteriores
    Definir parámetros clave, como la tasa de aprendizaje, el número de épocas o el tamaño de los lotes, ayuda a determinar cómo se entrena el modelo.

  • Establecer una clase de utilidad para desarrollar el generador
    Esta clase encarna la arquitectura del generador y detalla las capas y funciones que son cruciales para generar nuevos datos.

  • Establecer una clase de utilidad para desarrollar el discriminador
    De forma parecida al caso del generador, esta clase describe la estructura del discriminador que evaluará la autenticidad de los datos generados.

  • Desarrollar la GAN
    En este punto hay que integrar el generador y el discriminador en un marco de trabajo de un único modelo, listo para el entrenamiento.

  • Entrenar la GAN
    El discriminador y el generador se entrenan a través de la dinámica antagonista, de manera que cada uno mejora sus respuestas en función del desempeño del otro.

¿Qué desafíos plantean las GAN?

Las redes generativas antagónicas son herramientas potentes en el contexto de la IA y han contribuido a sentar las bases de las soluciones generativas modernas, pero eso no significa que no tengan carencias. Las GAN presentan algunos problemas que pueden afectar a su eficacia y aplicación. Es necesario analizar cuidadosamente los siguientes posibles obstáculos y adaptar el enfoque para garantizar que las GAN se utilicen de manera eficaz y responsable:

Inestabilidad en el entrenamiento

Las GAN son propensas a sufrir inestabilidad durante el entrenamiento, lo que puede hacer que el generador y el discriminador no aprendan con eficacia. Para solucionar este problema, los investigadores suelen modificar las funciones de pérdida y optimizar la arquitectura para adaptarse mejor a las necesidades de la red.

Coste informático

Aunque las GAN puedan suponer un ahorro en términos de horas de mano de obra y mejora de la productividad, la envergadura de las inversiones informáticas necesarias para entrenarlas, especialmente con conjuntos de datos grandes y complejos, puede constituir un impedimento. Optar por redes con un diseño más eficiente y utilizar aceleraciones de hardware para gestionar estas exigencias puede ser una solución.

Sobreajuste

Al igual que muchos modelos de aprendizaje automático, las GAN pueden ajustarse en exceso a los datos de formación (especialmente cuando hay poca diversidad de datos), lo que hace que sean menos eficaces con los datos nuevos y no vistos. Las técnicas de regularización, el aumento de datos y la creciente diversidad en los conjuntos de datos pueden ayudar a mitigar este riesgo.

Sesgo y equidad

Existe el peligro de que las GAN reproduzcan o exacerben los sesgos que contienen los datos de entrenamiento, lo que daría lugar a problemas de injusticia o discriminación. Para abordar esta cuestión, las organizaciones e investigadores deben dar prioridad a los conjuntos de datos de entrenamiento diversos y, al mismo tiempo, implementar algoritmos diseñados para identificar y corregir posibles sesgos.

Interpretabilidad y responsabilidad

La naturaleza opaca de las GAN puede hacer que sus procesos de toma de decisiones sean difíciles de interpretar, algo especialmente preocupante en aplicaciones delicadas. Para garantizar la responsabilidad y fomentar la confianza al utilizar estas tecnologías avanzadas, es fundamental desarrollar métodos más efectivos para rastrear, entender y explicar con mayor precisión los comportamientos de las GAN.

Precios de ServiceNow ServiceNow ofrece paquetes de productos competitivos que se adaptan a medida que tu empresa crece y tus necesidades cambian. Ver precios
ServiceNow para redes generativas antagónicas

Como tecnología de base de la IA generativa moderna, las redes generativas antagónicas han demostrado tener un gran potencial para una gran variedad de sectores y campos, como el aumento de datos, la generación de datos artificiales o incluso aplicaciones más complejas, como el aprendizaje sin supervisión. Estas redes ofrecen perspectivas prometedoras para las empresas que buscan mejorar el realismo y la diversidad de los datos.

Now Platform® de ServiceNow incorpora capacidades de IA avanzadas, perfectas para respaldar a las GAN y otras iniciativas basadas en la IA. Incluye características como la interpretación del lenguaje natural, el análisis predictivo y la automatización inteligente, que optimizan la toma de decisiones y la eficiencia operativa para que las empresas puedan dedicar más tiempo y recursos a crecer. Además, la capacidad de la plataforma para gestionar tareas complejas de IA de forma segura y a escala garantiza que las empresas puedan aprovechar todo el potencial de las tecnologías de IA generativa sin poner en riesgo el rendimiento ni la seguridad.

Descubre cómo ServiceNow y la IA pueden transformar tu negocio; prueba hoy mismo la demostración de ServiceNow.

Profundiza en la IA generativa Acelera la productividad con Now Assist: IA generativa integrada en Now Platform. Explorar la IA Contactar
Recursos Artículos ¿Qué es la IA? ¿Qué es la IA generativa? ¿Qué es un LLM? Informes de analistas IDC InfoBrief: Maximiza el valor de la IA con una plataforma digital IA generativa en las operaciones de TI Implementación de la IA generativa en el sector de las telecomunicaciones Fichas técnicas Búsqueda IA Predice y evita interrupciones con AIOps predictivos de ServiceNow® eBooks Moderniza los servicios y las operaciones de TI con la IA IA generativa: ¿es tan grande como parece? Aumenta la productividad empresarial con la IA generativa White papers Índice de madurez de la IA empresarial IA generativa para telecomunicaciones