Use o componente Texto OCR

  • Versão de lançamento: Zurich
  • Atualizado 31 de jul. de 2025
  • 2 min. de leitura
  • Extraia o texto de uma imagem usando o componente de texto OCR (reconhecimento óptico de caracteres) em Design studio de RPA para desktop.

    Antes de Iniciar

    Função necessária: nenhuma

    Por Que e Quando Desempenhar Esta Tarefa

    Importante:

    Começando com Yokohama versão, o. Design studio de RPA para desktop Utiliza a versão mais recente do mecanismo de OCR Tesseract. Esta atualização melhora o pré-processamento de imagem e as otimizações de desempenho. Ao atualizar automações mais antigas que incluem o componente de texto OCR, você pode notar pequenas diferenças na saída. Portanto, é importante validar suas automações após a atualização.

    Muitas propriedades do componente de texto OCR são comuns com outros componentes de IU de ações. Para configurar essas propriedades, consulte Propriedades dos componentes de Ações (IU).

    As propriedades exclusivas do componente de texto OCR são fornecidas.
    Tabela 1. Propriedades do componente de texto OCR
    Propriedade Texto
    Origem de imagem Origem da qual o componente obtém a imagem.

    Procedimento

    1. No painel Caixa de ferramentas, navegue até Ações (IU) > Texto de OCR.
    2. Arraste o componente Texto OCR para a superfície Design.
    3. Opcional: Para definir as configurações, clique no ícone de configurações do componente ( Ícone de configurações do componente.).
      O componente tem configurações padrão que você pode revisar e usar.
    4. Opcional: Defina as configurações conforme descrito na tabela a seguir.
      Tabela 2. Configurações de OCR
      Campo Descrição
      Mecanismo Nome do mecanismo usado para extrair os campos de OCR.
      Idioma Mecanismo Teseract que pode oferecer suporte a vários idiomas. O usuário pode selecionar qualquer idioma listado aqui.
      Tolerância de altura da linha Altura da linha da fonte.
      ChangeDPI Muda os pontos por polegada (DPI) da imagem conforme mencionado na propriedade DPI.
      DPI Valor DE DPI.
      Extrair palavras Texto extraído em formato Word. Caso contrário, será texto sem formatação.
      Inverter Cor da imagem invertida. Por exemplo, inverte o preto para o branco.
      Idioma Idioma usado para extrair.
      Imagem de escala Escala a imagem pelo número fornecido.
      Limite Imagem convertida da imagem em escala de cinza ou ruído removido de acordo com o valor limite.
      Valor de Limite Valor do limite.
      Tempo limite Tempo após o qual a operação do componente expira.
    5. Para fechar a janela Configurações de OCR, clique em OK .
    6. Para configurar a entrada, consulte Configure as propriedades da porta.
    7. Para configurar a saída, consulte Configure as propriedades da porta de saída.
    8. Opcional: Conecte as portas conforme descrito na tabela a seguir.
      Tipo de porta Nome da porta Tipo de dados Finalidade Anotações
      Dados em Caminho do arquivo/imagem Bitmap/Cadeia de caracteres Usa a imagem ou o caminho para a imagem. A entrada depende da opção selecionada em Origem da imagem Em Propriedades.
      • Porta : O tipo de dados é Bitmap.
      • Caminho do arquivo : O tipo de dados é Cadeia de caracteres.
      Saída de dados Texto Cadeia de caracteres Retorna o texto extraído da imagem.
      Saída de dados Confiança Simples Retorna a figura de precisão do texto extraído.
    9. Para testar o componente, clique com o botão direito do mouse na barra de componentes e clique em Executar a partir daqui .

    Extraia texto de imagens e exiba com o componente Mostrar

    Extraia texto da imagem e exiba com o componente Mostrar.

    O componente de texto OCR usa um caminho para uma imagem. A imagem é composta pelo texto "ServiceNow". O componente extrai o texto da imagem e passa a cadeia de caracteres para o componente Mostrar (para usar o componente Mostrar, consulte Use o componente Mostrar). O componente Mostrar leva o texto pela porta Dados da mensagem na porta e exibe o texto em uma janela.