Use o componente Texto OCR

Zurich Data and Automation

Release

zurich

ft:locale

pt-BR

ft:publication_title

Zurich Data and Automation

ft:clusterId

crint

bundleId

crint

workflow

Creator

Use o componente Texto OCR

Versão de lançamento: Zurich

Atualizado 31 de jul. de 2025

2 min. de leitura

Extraia o texto de uma imagem usando o componente de texto OCR (reconhecimento óptico de caracteres) em Design studio de RPA para desktop.

Antes de Iniciar

Função necessária: nenhuma

Por Que e Quando Desempenhar Esta Tarefa

Importante:

Começando com Yokohama versão, o. Design studio de RPA para desktop Utiliza a versão mais recente do mecanismo de OCR Tesseract. Esta atualização melhora o pré-processamento de imagem e as otimizações de desempenho. Ao atualizar automações mais antigas que incluem o componente de texto OCR, você pode notar pequenas diferenças na saída. Portanto, é importante validar suas automações após a atualização.

Muitas propriedades do componente de texto OCR são comuns com outros componentes de IU de ações. Para configurar essas propriedades, consulte Propriedades dos componentes de Ações (IU).

As propriedades exclusivas do componente de texto OCR são fornecidas.

Tabela 1. Propriedades do componente de texto OCR
Propriedade	Texto
Origem de imagem	Origem da qual o componente obtém a imagem.

Procedimento

No painel Caixa de ferramentas, navegue até Ações (IU) > Texto de OCR.
Arraste o componente Texto OCR para a superfície Design.
Opcional: Para definir as configurações, clique no ícone de configurações do componente ( ).
O componente tem configurações padrão que você pode revisar e usar.

Opcional: Defina as configurações conforme descrito na tabela a seguir.

Tabela 2. Configurações de OCR
Campo	Descrição
Mecanismo	Nome do mecanismo usado para extrair os campos de OCR.
Idioma	Mecanismo Teseract que pode oferecer suporte a vários idiomas. O usuário pode selecionar qualquer idioma listado aqui.
Tolerância de altura da linha	Altura da linha da fonte.
ChangeDPI	Muda os pontos por polegada (DPI) da imagem conforme mencionado na propriedade DPI.
DPI	Valor DE DPI.
Extrair palavras	Texto extraído em formato Word. Caso contrário, será texto sem formatação.
Inverter	Cor da imagem invertida. Por exemplo, inverte o preto para o branco.
Idioma	Idioma usado para extrair.
Imagem de escala	Escala a imagem pelo número fornecido.
Limite	Imagem convertida da imagem em escala de cinza ou ruído removido de acordo com o valor limite.
Valor de Limite	Valor do limite.
Tempo limite	Tempo após o qual a operação do componente expira.

Para fechar a janela Configurações de OCR, clique em OK .
Para configurar a entrada, consulte Configure as propriedades da porta.
Para configurar a saída, consulte Configure as propriedades da porta de saída.

Opcional: Conecte as portas conforme descrito na tabela a seguir.


Tipo de porta	Nome da porta	Tipo de dados	Finalidade	Anotações
Dados em	Caminho do arquivo/imagem	Bitmap/Cadeia de caracteres	Usa a imagem ou o caminho para a imagem.	A entrada depende da opção selecionada em Origem da imagem Em Propriedades. Porta : O tipo de dados é Bitmap. Caminho do arquivo : O tipo de dados é Cadeia de caracteres.
Saída de dados	Texto	Cadeia de caracteres	Retorna o texto extraído da imagem.
Saída de dados	Confiança	Simples	Retorna a figura de precisão do texto extraído.

Para testar o componente, clique com o botão direito do mouse na barra de componentes e clique em Executar a partir daqui .

Extraia texto de imagens e exiba com o componente Mostrar

Extraia texto da imagem e exiba com o componente Mostrar.

O componente de texto OCR usa um caminho para uma imagem. A imagem é composta pelo texto "ServiceNow". O componente extrai o texto da imagem e passa a cadeia de caracteres para o componente Mostrar (para usar o componente Mostrar, consulte Use o componente Mostrar). O componente Mostrar leva o texto pela porta Dados da mensagem na porta e exibe o texto em uma janela.