Verwenden Sie die OCR-Textkomponente

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 2 Minuten Lesedauer
  • Extrahieren Sie den Text aus einem Bild, indem Sie die OCR-Textkomponente in verwenden RPA Desktop Design Studio.

    Vorbereitungen

    Erforderliche Rolle: keine

    Warum und wann dieser Vorgang ausgeführt wird

    Viele Eigenschaften der OCR-Textkomponente sind mit anderen Aktionen-UI-Komponenten gemeinsam. Informationen zum Konfigurieren dieser Eigenschaften finden Sie unter Eigenschaften von Aktionskomponenten (UI).

    Die für die OCR-Textkomponente eindeutigen Eigenschaften sind angegeben.
    Tabelle : 1. Eigenschaften der OCR-Textkomponente
    Eigenschaft Text
    Bildquelle Quelle, aus der die Komponente das Bild übernimmt.

    Prozedur

    1. Navigieren Sie im Toolbox-Bereich zu Aktionen (UI) > OCR-Textan.
    2. Ziehen Sie die OCR-Textkomponente auf die Designoberfläche.
    3. Wahlweise: Klicken Sie zum Konfigurieren der Einstellungen auf das Symbol für Komponenteneinstellungen ( Symbol für Komponenteneinstellungen.).
      Die Komponente verfügt über Standardeinstellungen, die Sie überprüfen und verwenden können.
    4. Wahlweise: Konfigurieren Sie die Einstellungen wie in der folgenden Tabelle beschrieben.
      Tabelle : 2. OCR-Einstellungen
      Feld Beschreibung
      Engine Engine-Name, der zum Extrahieren der OCR-Felder verwendet wird.
      Sprache Teseract-Engine, die mehrere Sprachen unterstützen kann. Der Anwender kann eine beliebige Sprache auswählen, die hier aufgeführt ist.
      Positionshöhentoleranz Höhe der Schriftzeile.
      ChangeDPI Ändert die Punkte pro Zoll (DPI) des Bildes, wie in der DPI-Eigenschaft erwähnt.
      DPI DPI-Wert.
      Wörter Extrahieren Text, der im Word-Format extrahiert wird. Andernfalls ist es nur-Text.
      Umkehren Invertierte Bildfarbe. Beispielsweise wird schwarz in weiß umgekehrt.
      Sprache Sprache, die zum Extrahieren verwendet wird.
      Bild Skalieren Skaliert das Bild um die angegebene Zahl.
      Schwellenwert Bild, das aus dem Graustufenbild konvertiert wird, oder Rauschen, das gemäß dem Schwellenwert entfernt wird.
      Schwellenwert Schwellenwert.
      Zeitüberschreitung Zeit, nach der der Komponentenvorgang abläuft.
    5. Klicken Sie auf, um das Fenster „OCR-Einstellungen“ zu schließen OK .
    6. Informationen zum Konfigurieren der Eingabe finden Sie unter Konfigurieren Sie Porteigenschaften.
    7. Informationen zum Konfigurieren der Ausgabe finden Sie unter Konfigurieren Sie Ausgabeporteigenschaften.
    8. Wahlweise: Verbinden Sie die Ports wie in der folgenden Tabelle beschrieben.
      Porttyp Portname Datentyp Zweck Obligatorisch? Hinweise
      Daten In Bild-/Dateipfad Bitmap/Zeichenfolge Übernimmt das Bild oder den Pfad zum Bild. Ja Die Eingabe hängt von der Option ab, die in ausgewählt wurde Bildquelle Option in den Eigenschaften.
      • Port : Der Datentyp ist Bitmap.
      • Dateipfad : Der Datentyp ist Zeichenfolge.
      Daten Aus Text Zeichenfolge Gibt den extrahierten Text aus dem Bild zurück. Nein Die Verbindung dieses Ports ist optional.
      Daten Aus Vertrauen Einzeln Gibt die extrahierte Textgenauigkeit zurück. Nein Die Verbindung dieses Ports ist optional.
    9. Um die Komponente zu testen, klicken Sie mit der rechten Maustaste auf die Komponentenleiste, und klicken Sie dann auf Von Hier Ausführen .

    Extrahieren Sie Text aus Bildern, und zeigen Sie ihn mit der Komponente „Anzeigen“ an

    Die OCR-Textkomponente nimmt einen Pfad zu einem Bild. Das Bild enthält den Text „servicenow“. Die Komponente extrahiert den Text aus dem Bild und übergibt die Zeichenfolge an die Komponente „Anzeigen“ (Informationen zur Verwendung der Komponente „Anzeigen“ finden Sie unter Verwenden Sie die Komponente „Anzeigen“). Die Komponente „Anzeigen“ führt den Text durch den Nachrichtendaten-Port und zeigt den Text dann in einem Fenster an.