O que é geração aumentada de recuperação (RAG)?

A geração aumentada de recuperação (RAG) aprimora modelos de linguagem grandes incorporando dados de bases de conhecimento externas para melhorar a precisão e a relevância dos resultados sem repetir treinamentos. Isso a torna eficiente e adaptável para domínios específicos.

Demonstração da IA
Fatos importantes sobre redes adversariais generativas
Por que a RAG é importante? Quais são alguns casos de uso da geração aumentada de recuperação? Qual é a diferença entre RAG e pesquisa semântica? Quais são os componentes que possibilitam a RAG? Quais são os desafios da RAG? Quais são os benefícios da RAG? Como funciona a geração de recuperação aumentada? Como implementar um sistema de RAG? Quais são algumas maneiras de medir a performance da RAG? Qual é o futuro da geração de recuperação aumentada? ServiceNow para geração de recuperação aumentada

A geração de recuperação aumentada é um termo que se originou em um artigo de 2020 escrito por Patrick Lewis. No artigo, Lewis introduziu um método que expandiu significativamente os recursos dos modelos de IA generativa integrando-os a fontes de conhecimento externas. Essa integração foi projetada para melhorar a precisão e a aplicabilidade dos modelos em vários contextos, impulsionando a RAG para uma área de pesquisa e aplicação em rápida expansão.

O termo "geração de recuperação aumentada" descreve com precisão a função principal da metodologia, aumentando o processo generativo de modelos de IA por meio da recuperação de dados externos. O conceito rapidamente ganhou força, levando à adoção generalizada nas esferas acadêmica e comercial. Hoje, a RAG sustenta vários sistemas de IA em ambientes de pesquisa e aplicações do mundo real, o que representa uma evolução crucial na forma como os modelos generativos são utilizados e desenvolvidos.

A RAG começa com a coleta de dados de várias fontes, como sites, bancos de dados ou documentos. Esses dados são então convertidos em um formato que o modelo pode pesquisar e usar, criando uma espécie de biblioteca de conhecimento externa.

 

Expandir tudo Fechar tudo Por que a RAG é importante?

Modelos de linguagem grandes (LLMs) estão na vanguarda dos avanços na inteligência artificial, especialmente em aplicações de processamento de linguagem natural, como chatbots inteligentes. Esses modelos são desenvolvidos para entender e gerar texto semelhante ao humano com o objetivo de fornecer respostas precisas em vários contextos. No entanto, há alguns desafios inerentes aos LLMs que afetam a confiabilidade.

Um dos principais problemas com LLMs é a tendência de gerar respostas que podem ser imprecisas, desatualizadas ou baseadas em fontes não confiáveis. Como os LLMs operam em conjuntos de dados fixos, seu conhecimento é efetivamente congelado no momento da última atualização de treinamento.

A RAG lida com esses desafios integrando um mecanismo de recuperação que usa fontes de conhecimento externas autorizadas e atualizadas antes de gerar respostas. Essa abordagem aumenta a precisão e a relevância das informações fornecidas pelos LLMs e, ao mesmo tempo, garante que as respostas sejam baseadas em dados verificados. Ao fazer isso, a RAG melhora a confiança do usuário e o controle sobre os resultados das aplicações de IA.

Conheça o Now Intelligence Descubra como a ServiceNow está tirando a IA e a análise dos laboratórios para transformar a maneira como as empresas trabalham e acelerar a transformação digital. Receba o eBook
Quais são alguns casos de uso da geração aumentada de recuperação?

A geração de recuperação aumentada está revolucionando várias funções de negócios, aprimorando a precisão e a personalização de tarefas orientadas por IA. Confira alguns dos principais casos de uso em que a RAG está causando um impacto significativo.

Melhoria no suporte ao cliente

A tecnologia RAG transforma o atendimento ao cliente potencializando chatbots avançados e assistentes virtuais que geram respostas mais precisas e relevantes de acordo com o contexto. Ao acessar as informações e os dados mais recentes de fontes confiáveis, esses sistemas de IA podem oferecer soluções rápidas e personalizadas para pesquisas dos clientes. Esse recurso melhora a velocidade de resposta, além de aumentar a satisfação do cliente e a eficiência operacional.

Criação de conteúdo

A RAG também ajuda as empresas a criar conteúdo relevante e de alta qualidade, como posts de blogs, artigos e descrições de produtos. Com a capacidade de extrair e integrar dados de várias fontes externas e internas, a RAG garante que o conteúdo seja cativante e rico em informações verificadas. Isso economiza tempo e recursos consideráveis nos processos de desenvolvimento de conteúdo.

Realização de pesquisas de mercado

A RAG tem valor inestimável para realizar pesquisas de mercado completas, pois compila e analisa informações de uma ampla variedade de fontes on-line, incluindo veículos de notícias, relatórios do setor e mídias sociais. Isso permite que as empresas fiquem à frente das tendências de mercado e tomem decisões orientadas por dados alinhadas à dinâmica atual do mercado e aos comportamentos dos consumidores.

Suporte às vendas

O uso da RAG pode melhorar muito o processo de vendas, fornecendo assistência virtual que pode acessar e transmitir informações sobre produtos, como especificações e níveis de estoque. Ela é capaz de responder às perguntas dos clientes em tempo real e oferecer recomendações personalizadas com base em preferências e interações anteriores. Ela pode até mesmo extrair revisões e informações de vários canais para ajudar os consumidores a tomar decisões de compra mais bem informadas.

Experiência dos funcionários aprimorada

A RAG pode melhorar a experiência dos funcionários por meio da criação de um hub de conhecimento central fácil de acessar. Integrando-se a bancos de dados internos, a RAG oferece aos funcionários informações precisas e atualizadas sobre tudo, das políticas da empresa aos procedimentos operacionais. Isso estabelece uma base para uma força de trabalho mais informada e pode simplificar os processos internos, reduzindo o tempo gasto na pesquisa de informações.

Qual é a diferença entre RAG e pesquisa semântica?

Tanto a RAG quanto a pesquisa semântica melhoram os LLMs, mas elas cumprem funções distintas. A RAG melhora os LLMs integrando-os a fontes de conhecimento externas, ajudando a gerar respostas precisas e relevantes. Ela é especialmente útil em aplicações de suporte ao cliente ou de geração de conteúdo que demandam informações precisas e atuais.

A pesquisa semântica, no entanto, é voltada a entender a intenção e o significado contextual das consultas. Ela usa a compreensão de linguagem natural para navegar por grandes bancos de dados e recuperar informações que se alinham semanticamente às consultas dos usuários.

Embora a RAG utilize dados externos para enriquecer as saídas de LLMs, a pesquisa semântica automatiza o processo de recuperação de dados, lidando com complexidades como embeddings de palavras e agrupamento de documentos. Isso reduz os esforços manuais na preparação de dados e garante a relevância e a qualidade das informações usadas pelos LLMs.

Juntos, a RAG e a pesquisa semântica aprimoram a funcionalidade e a precisão dos aplicativos de IA, melhorando os processos de recuperação e geração.

Quais são os componentes que possibilitam a RAG?

A RAG conta com vários componentes críticos na sua arquitetura para aprimorar a funcionalidade dos LLMs.

  • A camada de orquestração
    Este componente atua como o coordenador central no sistema de RAG. Ele processa a entrada do usuário juntamente com quaisquer metadados associados, como histórico de conversas. A camada de orquestração direciona consultas para o LLM e lida com a entrega da resposta gerada. Essa camada normalmente integra várias ferramentas e scripts personalizados, geralmente escritos em Python, para garantir uma operação sem problemas em todo o sistema.
  • Ferramentas de recuperação
    São essenciais para entender o contexto necessário para ancorar e informar as respostas dos LLMs. As ferramentas de recuperação incluem bancos de dados que servem como bases de conhecimento e sistemas baseados em API que extraem informações relevantes. Essas ferramentas são a fundamentação fática das respostas, garantindo que elas sejam precisas e contextualmente relevantes.
  • LLM
    O modelo de linguagem grande em si é o componente principal que gera respostas com base nos comandos e nas informações recuperadas. Seja operado internamente ou hospedado por um provedor terceirizado, como a OpenAI, o LLM usa parâmetros amplos treinados com dados para produzir resultados diferenciados e contextualmente adequados.
Quais são os desafios da RAG?

A implementação da geração de recuperação aumentada tem um conjunto de desafios que as organizações precisam enfrentar. Confira abaixo algumas coisas importantes.

Novidade do conceito

Sendo uma tecnologia relativamente nova, a RAG exige um entendimento profundo e uma equipe qualificada para implementá-lo de forma eficaz. Essa novidade pode levar a incertezas na implantação e integração com sistemas já existentes.

Custos iniciais mais altos

A integração da RAG às infraestruturas já implementadas geralmente envolve investimentos iniciais em tecnologia e treinamento. As organizações podem enfrentar custos iniciais significativos à medida que adquirem recursos e conhecimentos específicos.

Modelagem adequada dos dados

Definir as forma mais eficazes de modelar e estruturar dados para uso em um sistema de RAG é crucial. Fazer isso envolve a seleção das fontes e formatos de dados certos que se alinham às necessidades organizacionais e aos recursos dos LLMs.

Melhoria de requisitos dos processos

Estabelecer requisitos claros para processos que utilizarão a RAG é essencial. Isso inclui definir os objetivos e os resultados esperados da implementação de aplicações orientadas por RAG.

Manipulação de imprecisões

Criar processos para lidar com possíveis imprecisões nas saídas geradas pelos sistemas RAG é essencial. Isso significa desenvolver mecanismos para identificar, corrigir e aprender com os erros cometidos para aumentar a confiabilidade das respostas.

Quais são os benefícios da RAG?

A RAG oferece vários benefícios que podem melhorar significativamente os recursos dos sistemas de IA.

  • Implementação eficiente e econômica
    Com a RAG, as organizações podem aproveitar os bancos de dados e as fontes de conhecimento que elas já têm sem precisar repetir o treinamento de modelos. Isso significa que a implementação é eficiente em termos de tempo e custo.
  • Informações precisas e atualizadas
    Ao recuperar informações de fontes autorizadas e em tempo real, a RAG garante que os dados usados ao gerar respostas sejam precisos e atualizados, o que melhora a qualidade dos resultados.
  • Maior confiança do usuário
    A precisão e a relevância das informações fornecidas pelos sistemas de RAG ajudam a melhorar a confiança por parte dos usuários, pois as respostas são mais confiáveis e baseadas em dados verificados.
  • Mais controle para o desenvolvedor
    Os desenvolvedores têm maior controle sobre as respostas geradas pelos sistemas de IA com a RAG. Eles podem especificar as fontes das quais as informações são recuperadas e adaptar as saídas às necessidades e aos contextos específicos.
  • Menos respostas imprecisas e alucinações
    Com a fundamentação das respostas em dados fatuais, a RAG reduz significativamente a probabilidade de gerar respostas incorretas ou inventadas, também chamadas de "alucinações" na terminologia de IA.
  • Respostas relevantes e específicas do domínio
    A RAG também se destaca na entrega de respostas personalizadas com base em conhecimento específico do setor ou em domínios especializados. Isso a torna altamente eficaz para aplicações direcionadas.
  • Mais fácil de treinar
    Os modelos de RAG podem ser mais fáceis de treinar, porque usam bases de conhecimento e dados existentes, reduzindo a complexidade e a intensidade dos recursos do processo de treinamento.
Como funciona a geração de recuperação aumentada?

Aqui está uma explicação passo a passo de como a RAG opera.

1. Criação dos dados externos

A RAG começa com a coleta de dados de várias fontes, como sites, bancos de dados ou documentos. Esses dados são então convertidos em um formato que o modelo pode pesquisar e usar, criando uma espécie de biblioteca de conhecimento externa.

2. Recuperação de informações relevantes

Quando um usuário faz uma pergunta, a RAG a transforma em um formulário pesquisável e encontra as informações mais relevantes na biblioteca de conhecimento relacionada. Por exemplo, se alguém pesquisar sobre saldo de férias, a RAG vai encontrar e usar as políticas de férias da empresa e o registro de férias da própria pessoa.

3. Melhoria do comando do LLM

Em seguida, a RAG combina a pergunta original do usuário com as informações que acabou de encontrar. Essas informações combinadas são então dadas ao LLM, que as usa para gerar uma resposta mais precisa e informada.

4. Atualizar dados externos

Para manter as respostas relevantes, a RAG atualiza as fontes de dados externas regularmente. Isso pode ser feito automaticamente ou em horários programados, garantindo que as informações usadas estejam sempre atualizadas.

Como implementar um sistema de RAG?

A implementação de um sistema de recuperação de geração aumentada envolve várias etapas essenciais. Ao acompanhá-las, um sistema de RAG melhora efetivamente a capacidade de um LLM de gerar respostas que não sejam apenas baseadas no conhecimento interno, mas também informadas por dados externos atualizados.

1. Preparação dos dados

O primeiro passo é reunir e preparar os dados que serão usados pelo sistema de RAG. Os dados precisam ser limpos e formatados corretamente para garantir a consistência e a precisão. Essa fase pode envolver a remoção de dados duplicados e a solução de problemas com a qualidade dos dados.

2. Indexação dos dados relevantes

Assim que os dados são preparados, eles precisam ser indexados para que sejam pesquisáveis. Isso significa criar um formato estruturado, muitas vezes em um banco de dados ou um índice de pesquisa, em que cada parte dos dados é marcada com palavras-chave específicas ou convertida em uma representação numérica. Esse processo de indexação define a eficiência com que o sistema poderá recuperar informações relevantes nas fases posteriores.

3. Recuperação dos dados relevantes

Com os dados indexados, o sistema de RAG é capaz de recuperar informações relevantes com base nas consultas dos usuários. Essa etapa envolve corresponder a consulta ou certas palavras-chave da consulta aos dados indexados. Algoritmos avançados são usados para garantir que os dados mais relevantes e precisos sejam recuperados para utilização na geração de respostas.

4. Criação de aplicações de LLM

Por fim, integre os dados recuperados no fluxo de trabalho do LLM. Esta etapa envolve configurar o LLM para aceitar a entrada do usuário juntamente com os dados recuperados como parte do comando de entrada. Em seguida, o LLM usa tanto o conhecimento pré-treinado quanto os dados externos recém-recuperados para gerar respostas mais precisas.

Quais são algumas maneiras de medir a performance da RAG?

Para melhorar o desempenho de um sistema de RAG, considere implementar as seguintes estratégias:

  • Use dados de alta qualidade
    Dados limpos e precisos ajudam a evitar o problema comum de "garbage in, garbage out". Isso inclui remover marcações irrelevantes e garantir que os dados sempre estejam atualizados. Isso também significa manter a integridade dos dados (por exemplo, preservando cabeçalhos de planilhas importantes). Dados de alta qualidade melhoram a capacidade do LLM de entender e gerar respostas relevantes.

  • Teste tamanhos diferentes de bloco de texto
    A forma como os dados são segmentados em blocos pode afetar significativamente o desempenho do seu sistema de RAG. Blocos menores podem não ter contexto suficiente, e os maiores podem ser difíceis para o modelo processar com eficiência. Testar tamanhos de blocos diferentes pode ajudar você a encontrar o equilíbrio ideal que mantém o contexto sem sobrecarregar o sistema.

  • Atualize o comando do sistema
    O comando que você usa para interagir com o LLM pode influenciar as respostas geradas. Se os resultados não forem satisfatórios, considere revisar o comando para especificar melhor como o modelo deve interpretar e usar os dados fornecidos. Pode ser que você precise esclarecer o contexto ou ajustar o linguajar para guiar o foco do modelo.

  • Filtre os resultados do armazenamento de vetores
    Para aumentar a relevância e a precisão, considere filtrar os resultados recuperados do seu armazenamento de vetores. Por exemplo, você pode definir filtros para excluir ou priorizar certos tipos de documentos com base em metadados, como tipo de documento ou data de publicação. Isso ajuda a garantir que as informações que estão sendo recuperadas sejam mais relevantes para as consultas.

  • Teste modelos de incorporação diferentes
    Diferentes modelos de incorporação podem variar na forma de processar e representar dados. Experimentar modelos variados pode ajudar você a identificar qual deles se adapta melhor às suas necessidades específicas. Considere ajustar seus próprios modelos de incorporação usando seu conjunto de dados para deixar o modelo ainda mais sintonizado com a terminologia e as nuances específicas do seu domínio.

Ao implementar cuidadosamente essas estratégias, você pode melhorar significativamente a eficácia e a precisão do seu sistema de RAG para ter um desempenho melhor e resultados mais confiáveis. 

Qual é o futuro da geração de recuperação aumentada?

A geração de recuperação aumentada está passando por avanços significativos no aprimoramento dos recursos de aplicativos de IA de conversação, gerando respostas mais relevantes ao contexto. No entanto, as possíveis aplicações futuras da RAG vão muito além dos usos atuais.

Olhando para o futuro, a tecnologia de RAG poderia evoluir para permitir que a IA generativa não apenas gere informações, mas também tome ações apropriadas com base no contexto de entradas do usuário e dados externos. Por exemplo, uma IA aprimorada pela RAG pode analisar várias opções para encontrar o melhor aluguel de temporada, reservar acomodações automaticamente durante eventos específicos e até mesmo cuidar dos acordos de viagem relacionados, tudo em resposta à solicitação do usuário.

A RAG pode até mesmo avançar a profundidade da interação em domínios informativos mais complexos. Por exemplo, além de apenas informar um funcionário sobre as políticas de reembolso de mensalidades, a RAG poderia integrar um aconselhamento detalhado e personalizado sobre programas educacionais adequados que se alinhem aos objetivos de carreira e ao treinamento anterior de um funcionário. Ela também poderia facilitar o processo de inscrição para esses programas e gerenciar as tarefas administrativas subsequentes, tais como iniciar solicitações de reembolso.

À medida que a tecnologia da RAG continua a amadurecer, sua integração à IA pode redefinir os limites da assistência automatizada e do suporte à tomada de decisões. 

Preços da ServiceNow A ServiceNow oferece pacotes de produtos competitivos que se adaptam ao crescimento e às necessidades em constante mudança da sua empresa. Peça um orçamento
ServiceNow para geração de recuperação aumentada

A RAG está preparada para aprimorar os recursos da IA em uma ampla variedade de setores. A Now Platform® da ServiceNow integra tecnologias de IA, como aprendizado de máquina e compreensão de linguagem natural, para simplificar operações, automatizar tarefas e aprimorar a tomada de decisões. Com os sistemas de RAG, a ServiceNow pode oferecer soluções de IA ainda mais precisas e sensíveis ao contexto, ajudando a aumentar a produtividade e a eficiência em vários fluxos de trabalho.

Para entender melhor como a ServiceNow pode transformar suas operações de negócios com tecnologias avançadas de IA, faça uma demonstração da ServiceNow hoje mesmo

Conheça melhor a IA generativa Acelere a produtividade com o Now Assist: a IA generativa integrada diretamente à Now Platform. Explore a IA Fale conosco
Recursos Artigos O que é AI? O que é IA generativa? O que é um LLM? Relatórios dos analistas InfoBrief da IDC: Maximize AI Value with a Digital Platform (Maximize o valor da IA com uma plataforma digital) IA generativa em operações de TI Implementação da IA generativa no setor de telecomunicações Folhas de dados Pesquisa com IA Preveja e evite indisponibilidades com a AIOps preditiva da ServiceNow® eBooks Modernize serviços e operações de TI com a IA GenAI: Is it really that big of a deal? (IA generativa: é tudo isso mesmo?) Libere a produtividade empresarial com a IA generativa White papers Índice de maturidade da IA empresarial IA generativa para telecomunicações