Las redes neuronales convolucionales sobresalen en el procesamiento de datos similares a la cuadrícula (como imágenes) mediante la detección de patrones locales. Sin embargo, las CNN son menos eficaces para capturar las relaciones globales dentro de los datos. Los transformadores superan esto mediante el uso de la autoatención para sopesar la importancia de diferentes partes de los datos de entrada como parte del todo general. Si bien las CNN se utilizan principalmente para tareas como el reconocimiento de imágenes, los transformadores se han adaptado para el procesamiento tanto de texto como de imágenes, lo que proporciona un conjunto de soluciones más versátil.
- Incrustaciones de entrada
- Codificación posicional
- Bloque de transformador
- Bloques lineales/softmax
- La secuencia de entrada se transforma en representaciones numéricas llamadas incrustaciones, que capturan el significado semántico de los tokens.
- La codificación posicional agrega señales únicas a la incrustación de cada token para preservar el orden de los tokens en la secuencia.
- El mecanismo de atención de varias cabezas procesa estas incrustaciones para capturar diferentes relaciones entre tokens.
- La normalización de capas y las conexiones residuales estabilizan y aceleran el proceso de formación.
- El resultado de la capa de autoatención pasa a través de redes neuronales prealimentadas para transformaciones no lineales.
- Se apilan varios bloques de transformador, y cada uno ajusta el resultado de la capa anterior.
- En tareas como la traducción, un módulo de decodificador separado genera la secuencia de salida.
- El modelo se forma mediante el aprendizaje supervisado para minimizar la diferencia entre las predicciones y la verdad básica.
- Durante la inferencia, el modelo formado procesa nuevas secuencias de entrada para generar predicciones o representaciones.
- Procesamiento del lenguaje natural
- Traducción automática
- Reconocimiento de voz
- Generación de imágenes
- Análisis de secuencias de ADN
- Análisis de la estructura de proteínas