Die KI-Funktion OCR (Optical Character Recognition) erkennt Text in Bildern und schreibt den erkannten Inhalt in eine Textspalte. Damit können Sie gescannte Dokumente, Fotos von Visitenkarten oder Rechnungsbilder automatisch in durchsuchbaren Text umwandeln.

  • Visitenkarten: Fotos von Visitenkarten automatisch als Text erfassen.
  • Rechnungen und Belege: Eingescannte Rechnungen in lesbaren Text umwandeln.
  • Lieferscheine: Text aus fotografierten Lieferscheinen auslesen.
  • Handschriftliche Notizen: Fotos von Notizzetteln digitalisieren.
  • Dokumente: Gescannte Verträge oder Formulare als Text verfügbar machen.

Erstellen Sie eine neue Automationsregel wie im Artikel KI-Automation einrichten beschrieben. Ein typischer Trigger ist Wenn eine Zeile hinzugefügt wird — so wird jedes neu hochgeladene Bild automatisch verarbeitet.

Alternativ können Sie Wenn eine Zeile geändert wird verwenden und die Bild-Spalte als überwachte Spalte definieren. In diesem Fall wird die OCR-Erkennung jedes Mal ausgelöst, wenn ein neues Bild in die Spalte eingefügt wird.

Klicken Sie auf Aktion hinzufügen und wählen Sie KI aufrufen.

Wählen Sie in den Aktionseinstellungen:

  • Tabelle: Die Tabelle, in der die KI arbeiten soll.
  • Funktion: OCR

Aktionseinstellungen mit ausgewählter Funktion OCR

Wählen Sie die Spalte, aus der die KI den Text erkennen soll. Als Input-Spalte können Sie eine Bild-Spalte oder eine Datei-Spalte verwenden. Bei einer Datei-Spalte können Sie zum Beispiel PDFs oder eingescannte Dokumente verarbeiten lassen.

Wählen Sie die Spalte, in die der erkannte Text geschrieben werden soll. Diese muss vom Typ Text oder Formatierter Text sein.

Klicken Sie auf Speichern und laden Sie ein Testbild mit gut lesbarem Text in die Bild-Spalte hoch. Nach wenigen Sekunden sollte der erkannte Text in der Ergebnisspalte erscheinen.

Ihr Vertriebsteam fotografiert auf Messen Visitenkarten und lädt die Fotos in eine SeaTable-Tabelle hoch. Die KI soll den Text auf der Visitenkarte automatisch erkennen, damit Sie die Kontaktdaten durchsuchen können.

Konfiguration:

  • Trigger: Wenn eine Zeile hinzugefügt wird
  • Funktion: OCR
  • Input-Spalte: Visitenkartenbild (Bild-Spalte)
  • Ergebnisspalte: Erkannter Text (Text-Spalte)

Sobald ein neuer Eintrag mit einem Visitenkartenbild erstellt wird, liest die KI den Text aus dem Bild und schreibt ihn in die Ergebnisspalte. Von dort können Sie die Daten weiter verarbeiten — zum Beispiel mit einer anschließenden Extract-Aktion, um Name, Firma und Telefonnummer gezielt herauszulesen.

  • Bildqualität zählt. Je schärfer und kontrastreicher das Bild, desto besser die Texterkennung. Unscharfe Fotos oder schlechte Beleuchtung können zu Fehlern führen.
  • Gedruckter Text funktioniert zuverlässiger als Handschrift. Maschinenschrift wird nahezu fehlerfrei erkannt. Bei Handschrift hängt die Qualität von der Lesbarkeit ab.
  • Halten Sie das Bild gerade. Stark verzerrte oder gedrehte Bilder können die Erkennung erschweren.
  • Verwenden Sie gängige Bildformate. JPG und PNG funktionieren zuverlässig.

Die OCR-Funktion liefert den gesamten erkannten Text als Fließtext. Wenn Sie gezielt einzelne Informationen herausholen möchten (z. B. Name, Adresse, Rechnungsnummer), können Sie in derselben Automation eine zweite Aktion mit der Funktion Extract hinzufügen. So wird der erkannte Text in einem zweiten Schritt strukturiert in einzelne Spalten aufgeteilt.