Verwenden Sie die OCR-Textkomponente

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 2 Minuten Lesedauer
  • Extrahieren Sie den Text aus einem Bild mithilfe der Textkomponente OCR (optische Zeichenerkennung) in RPA Desktop Design Studio.

    Vorbereitungen

    Erforderliche Rolle: keine

    Warum und wann dieser Vorgang ausgeführt wird

    Wichtig:

    Beginnend mit Yokohama Release, die RPA Desktop Design Studio Verwendet die neueste Version der Tesseract OCR-Engine. Dieses Update verbessert die Bildvorverarbeitung und die Leistungsoptimierung. Beim Aktualisieren älterer Automatisierungen, die die OCR-Textkomponente enthalten, können leichte Unterschiede in der Ausgabe auftreten. Daher ist es wichtig, Ihre Automatisierungen nach dem Update zu validieren.

    Viele Eigenschaften der OCR-Textkomponente sind mit anderen Aktionen-UI-Komponenten gemeinsam. Informationen zum Konfigurieren dieser Eigenschaften finden Sie unter Eigenschaften von Aktionskomponenten (UI).

    Die für die OCR-Textkomponente eindeutigen Eigenschaften sind angegeben.
    Tabelle : 1. Eigenschaften der OCR-Textkomponente
    Eigenschaft Text
    Bildquelle Quelle, aus der die Komponente das Image übernimmt.

    Prozedur

    1. Navigieren Sie im Toolbox-Bereich zu Aktionen (UI) > OCR-Textan.
    2. Ziehen Sie die OCR-Textkomponente auf die Design-Oberfläche.
    3. Wahlweise: Klicken Sie zum Konfigurieren der Einstellungen auf das Symbol für Komponenteneinstellungen ( Symbol für Komponenteneinstellungen.).
      Die Komponente verfügt über Standardeinstellungen, die Sie überprüfen und verwenden können.
    4. Wahlweise: Konfigurieren Sie die Einstellungen wie in der folgenden Tabelle beschrieben.
      Tabelle : 2. OCR-Einstellungen
      Feld Beschreibung
      Engine Engine-Name, der zum Extrahieren der OCR-Felder verwendet wird.
      Sprache Teseract-Engine, die mehrere Sprachen unterstützen kann. Der Anwender kann eine beliebige Sprache auswählen, die hier aufgeführt ist.
      Positionshöhentoleranz Höhe der Schriftzeile.
      ChangeDPI Ändert die Punkte pro Zoll (Dots per Inch, DPI) des Bildes, wie in der DPI-Eigenschaft erwähnt.
      DPI DPI-Wert.
      Extrahieren Sie Wörter Text, der in einem Word-Format extrahiert wird. Andernfalls ist es nur-Text.
      Umkehren Bildfarbe, die umgekehrt wird. Beispielsweise wird Schwarz in weiß umgekehrt.
      Sprache Sprache, die zum Extrahieren verwendet wird.
      Bild Skalieren Skaliert das Bild nach der angegebenen Zahl.
      Schwellenwert Bild, das aus einem Graustufenbild konvertiert wird, oder Rauschen, das gemäß dem Schwellenwert entfernt wird.
      Schwellenwert Schwellenwert.
      Zeitüberschreitung Zeit, nach der der Komponentenvorgang abläuft.
    5. Klicken Sie auf, um das Fenster „OCR-Einstellungen“ zu schließen OK .
    6. Informationen zum Konfigurieren der Eingabe finden Sie unter Konfigurieren Sie Porteigenschaften.
    7. Informationen zum Konfigurieren der Ausgabe finden Sie unter Konfigurieren Sie Ausgabeporteigenschaften.
    8. Wahlweise: Verbinden Sie die Ports wie in der folgenden Tabelle beschrieben.
      Porttyp Portname Datentyp Zweck Notizen
      Daten In Bild-/Dateipfad Bitmap/Zeichenfolge Übernimmt das Bild oder den Pfad zum Bild. Die Eingabe hängt von der in ausgewählten Option ab Bildquelle Option in den Eigenschaften.
      • Port : Der Datentyp ist Bitmap.
      • Dateipfad : Der Datentyp ist Zeichenfolge.
      Daten Aus Text Zeichenfolge Gibt den extrahierten Text aus dem Bild zurück.
      Daten Aus Vertrauen Ledig Gibt die extrahierte Textgenauigkeit zurück.
    9. Um die Komponente zu testen, klicken Sie mit der rechten Maustaste auf die Komponentenleiste, und klicken Sie dann auf Von Hier Aus Ausführen .

    Extrahieren Sie Text aus Bildern, und zeigen Sie ihn mit der Komponente „Anzeigen“ an

    Extrahieren Sie Text aus dem Bild, und zeigen Sie ihn mit der Komponente „Anzeigen“ an.

    Die OCR-Textkomponente nimmt einen Pfad zu einem Bild. Das Bild enthält den Text „servicenow“. Die Komponente extrahiert den Text aus dem Bild und übergibt die Zeichenfolge an die Komponente „Anzeigen“ (Informationen zur Verwendung der Komponente „Anzeigen“ finden Sie unter Verwenden Sie die Komponente Anzeigen). Die Komponente „Anzeigen“ führt den Text über den Nachrichtendaten in-Port und zeigt den Text dann in einem Fenster an.