Ausgabe

Die Ausgabe von gescannten Schritten stellt den letzten Verarbeitungsschritt in der Verarbeitung von gescannten Dokumenten dar, wobei die Ausgabe ein Bedingungen geknüpft werden kann, die auf Erkennungen von Dokumenteninhalten (Text, Barcodes oder Formulartyp) oder auf Metadaten (zum Beispiel: wer hat gescannt, auf welchem Gerät wurde gescannt, etc.) zurückgreifen können.

Screenshot

Es können beliebig viele Ausgaben erstellt werden, wobei manche Ausgaben nur ausgeführt werden, wenn Bedingungen zutreffen. Oder, wenn gewünscht, können mehrere Ausgaben erstellt werden, um Kopien eines Dokumentes an unterschiedlichen Orten, sogar in unterschiedlichen Farbtiefen und Dateiformate, abzulegen.

Seitenstapel und Stapelverarbeitung

Wenn eine oder mehrere Seiten an die Ausgabeverarbeitung von Docuflair übergeben werden, beginnt die Verarbeitung mit dem ersten Eintrag in der Liste der Ausgaben. Durch die Prüfung von Bedingungen kann eine Ausgabe tatsächlich durchgeführt werden (zum Beispiel durch Speicherung eines Dokuments) oder, wenn die Bedingung nicht zutrifft, die weitere Verarbeitung dieses Eintrags übersprungen werden. In diesem Fall wechselt die Ausgabeverarbeitung zur nächsten Zeile und prüft, wenn vorhanden, erneut etwaige Bedingungen und eine eventuelle Ausgabe.

Folgende Grundlagen sind zu beachten:

Aus diesem Grund wird empfohlen, am Ende der Ausgabeliste einen Arbeitsschritt hinzuzufügen, der alle verbleibenden Seiten ohne jede Bedingung an einem Speicherort ablegt.

Ein Ändern der Reihenfolge von Einträgen ist jederzeit möglich: mit Drag & Drop durch Anklicken der Zahl in der Spalte Reihenfolge kann ein Eintrag an jede beliebige Stelle verschoben werden.

Funktionsweise

Docuflair 3 verarbeitet einlangende Scanaufträge mit einer oder mehreren Seiten als Stapel, der von oben nach unten nacheinander an jede Ausgabe zur Verarbeitung übergeben wird. Wenn eine Bedingung festgelegt wurde, wird jede Seite des Stapels durchlaufen und auf diese Bedingung überprüft. Im nächsten Arbeitsschritt werden alle Seiten mit einem "wahr"-Ergebnis gekennzeichnet und mit den folgenden Seiten zu Blöcken zusammengefasst, die gemeinsam an die Endverarbeitung (In Speicherort ablegen, E-Mail versenden, etc.) übergeben werden.

Beispiel

Ein Scanauftrag enthält 5 Seiten mit folgendem Inhalt:

  • Seite 1: Enthält neben Text einen Barcode mit dem Wert BC1234
  • Seite 2: Enthält nur Text
  • Seite 3: Enthält neben Text einen Barcode mit dem Wert BC9876
  • Seite 4: Kein Inhalt (leere Seite)
  • Seite 5: Enthält nur Text

Ein Anwender erstellt nun einen Scan-Workflow mit einer Erkennung für Barcodes und weist das Ergebnis der Variable myBarcode zu. In einer Ausgabe legt er fest, dass die Suche erfolgreich sein muss und gibt als zu prüfende Variable myBarcode an. Auch sollen etwaige Leerseiten entfernt werden und das Dokument als PDF-Datei abgelegt werden.

Docuflair verarbeitet nun den Auftrag wie folgt:

  1. Vorverarbeitung und Erkennung werden für jede Seite des Scanauftrags ausgeführt.
  2. Docuflair startet nun mit der ersten definierten Ausgabe und prüft etwaige Bedingungen jeder einzelnen Seite in diesem Stapel.
    Ergebnis in diesem Beispiel: die Bedingung Suche erfolgreich wird für Seite 1 und Seite 3 wahr. Für alle anderen Seiten wird diese Bedingung nicht erfüllt, weil kein Barcode auf diesen Seiten enthalten ist.
  3. Docuflair zerschneidet den Auftrag in zwei Teilstapel: Seiten 1+2 und Seiten 3+4+5.
  4. Docuflair entfernt die Leerseiten aus den Teilstapeln. Der eine Teilstapel enthält noch immer Seiten 1+2, der andere nur noch Seiten 3+5.
  5. Docuflair übergibt die zwei Stapel zur Speicherung an den PDF-Generator, der nacheinander zwei Ausgabedateien erzeugt.
  6. Nun wird überprüft, ob die verarbeiteten Seiten in (Haupt-)Stapel für spätere Ausgaben verbleiben soll. Falls nicht, werden die Seiten entfernt.
  7. Wenn noch Seiten im (Haupt-)Stapel übrig sind, prüft Docuflair, ob weitere Einträge in der Liste der Ausgaben vorhanden sind. Wenn ja, wird zur nächsten Ausgabe gewechselt und die Abarbeitung ab Punkt 2 wiederholt.

Neue Ausgabe erstellen

Eine neue Ausgabe kann durch Klick auf Ausgabe erstellen hinzugefügt werden.

Screensot

Im Feld Name muss eine Bezeichnung für die Ausgabe eingetragen werden. Es wird empfohlen, einen möglichst aussagekräftigen Namen zu vergeben (zum Beispiel "PDF-Ausgabe")

In der Auswahlliste Zustellungsart wird festgelegt, was mit den Seiten passieren soll beziehungsweise wohin diese zugestellt werden sollen. Folgende Optionen sind möglich:

Für die Generierung von Ordnernamen und Dateinamen stehen verschiedene Platzhalter zur Verfügung, die beim Speichern mit Inhalten befüllt werden. Durch Klick auf Platzhalter wird eine Liste mit verfügbaren Möglichkeiten angezeigt.

Platzhalter Beschreibung
{variablenname} Fügt den Wert einer Variablen ein, die im Zuge der Erkennung befüllt wurde
%g Generiert eine zufällige, 5-stellige Zeichenfolge
%b Fügt an dieser Stelle den Wert der Variable ein, gegen den eine Bedingung geprüft wurde
%e E-Mail-Adresse des Erstellers
%u Name des Erstellers
%o! Originaler Dateiname ohne Dateierweiterung
%o Originaler Dateiname
%r Verzeichnis aus rekursiver Suche
%T Erstellungszeitpunkt (Zeitpunkt des Scans)
%d Aktuelles Datum im Format Tag.Monat.Jahr (dd.MM.yyyy)
%t Aktuelle Uhrzeit
%hh Aktuelle Stunde
%mm Aktuelle Minute
%ss Aktuelle Sekunde
%DD Aktueller Tag
%MM Aktueller Monat
%YY Aktuelles Jahr (2-stellig)
%YYYY Aktuelles Jahr (4-stellig)
%W Wochentag auf Deutsch
%w Wochentag auf Englisch
%p Anzahl der Ausgabeseiten (pagecount)
%g Fortlaufende 5-stellige Nummer beginnend mit 00000 (prüft bestehende Dateinamen)
%S Fortlaufende 7-stellige Nummer beginnend mit 0000000 (globaler Zähler für Scan-Aufträge)
%6S Fortlaufende 6-stellige Nummer beginnend mit 000000 (globaler Zähler für Scan-Aufträge)
%5S Fortlaufende 5-stellige Nummer beginnend mit 00000 (globaler Zähler für Scan-Aufträge)
%4S Fortlaufende 5-stellige Nummer beginnend mit 0000 (globaler Zähler für Scan-Aufträge)
%3S Fortlaufende 5-stellige Nummer beginnend mit 000 (globaler Zähler für Scan-Aufträge)
%X Anzahl der Sekunden seit 1.1.1970

Mit der E-Mail-Benachrichtigung können Anwender per E-Mail benachrichtigt werden, wenn ein Dokument von dieser Ausgabe erstellt wurde.

Die Option Dokument manuell freigeben ist nur verfügbar, wenn die Option Scan-Freigabe lizenziert wurde. Wird diese Option aktiviert, wird das Dokument verarbeitet, aber angehalten, bis ein Bereichtigter Operator über den Menüeintrag Dokumente/Scan-Freigabe die Dokumente sichtet und freigibt. Wenn erforderlich stehen dem Operator auch Funktionen zur Nachbearbeitung des gescannten Dokumentes zur Verfügung.

Mit Leerseiten entfernen können Seiten eines Dokumentes ohne Aufdruck beim Speichern in dieser Ausgabe ausgeschlossen werden. Diese Funktion analysiert jedes Bild, um festzustellen, ob eine Seite Informationen beinhaltet, oder ob diese komplett leer ist. Die Erkennung von Informationen erfolgt im Wesentlichen durch Abzählen von Bildpunkten, die nicht weiß sind. Wird ein bestimmter Weißanteil in Prozenten überschritten, gilt eine Seite als leer und wird entfernt.

Bedingungen

Die Konfiguration von Bedingungen ist nicht zwingend erforderlich und nur in komplexeren Scan-Workflow-Typen verfügbar.

Wenn keine Bedingung festgelegt wurde oder wenn einfache Scan-Workflow-Typen zum Einsatz kommen, wird eine Ausgabe in jedem Fall durchgeführt und nach Abschluss der Verarbeitung zum nächsten Eintrag in der Verarbeitungsliste gewechselt.

Wurde für eine Ausgabe eine Bedingung festgelegt, wird vor der Erstellung der Ausgabe überprüft, ob eine Bedingung zutrifft. Wenn das der Fall ist, wird die Ausgabe fortgesetzt und das Dokument, abhängig von der gewählten Zustellart, zum Beispiel gespeichert oder per E-Mail versendet. Wenn die Bedingung nicht zutrifft, wird die Verarbeitung dieser Ausgabe abgebrochen und mit dem nächsten Eintrag fortgesetzt.

Screensot

Die Prüfung von Bedingungen erfolgt normalerweise gegen Variablen, die im Zuge der Erkennung befüllt wurden.

Es gibt verschiedene Arten von Bedingungen, die in Docuflair vordefiniert sind. Die meisten Bedingungen erfordern eine Angabe, gegen welche Variable die Prüfung erfolgen soll. Wie schon in der Erkennung beschrieben, können mehrere Suchen nach unterschiedlichen Inhalten in verschiedenen Bereichen einer Seite definiert werden. Die Ausgabeverarbeitung erfährt durch die Festlegung des Variablennamens, welche Variable von besonderem Interesse ist und zum Beispiel für das Zerlegen eines Auftrags in einzelne Dokumente herangezogen werden soll.

Etwaige Beispiele beziehen sich auf eine konfigurierte Erkennung, die nach einem beliebigen 1D-Barcode sucht und auf einer Seite den Barcode mit folgendem Inhalt gefunden hat: "ABC12345".

Bedingung Beschreibung
Suche erfolglos Diese Bedingung wird nur wahr, wenn auf einer Seite im Zuge der Erkennung die angegebene Variable nicht befüllt wurde, weil zum Beispiel kein Barcode gefunden werden konnte.
Suche erfolgreich Diese Bedingung wird wahr, wenn die angegebene Variable mit einem beliebigen Inhalt befüllt wurde, also zum Beispiel ein x-beliebiger Barcode mit irgendeinem Inhalt erkannt werden konnte.
Suchergebnis beginnt mit Wird wahr, wenn die in Inhalt angegebene Zeichenfolge mit den ersten Zeichen der zu prüfenden Variablen identisch ist. Zum Beispiel "ABC"
Suchergebnis endet mit Wird wahr, wenn die in Inhalt angegebene Zeichenfolge mit den letzten Zeichen der zu prüfenden Variablen identisch ist. Zum Beispiel "45"
Suchergebnis enthält Wird wahr, wenn die in Inhalt angegebene Zeichenfolge in der zu prüfenden Variable enthalten ist.
Suchergebnis ignorieren Unabhängig von allen Erkennungen wird diese Bedingung immer wahr und damit die Ausgabe immer durchgeführt.
Suchergebnis entspricht regulären Ausdruck Prüft, ob eine Regular Expression im Inhalt einer Variablen gefunden werden kann.
Suchergebnis entspricht genau Prüft, ob der Inhalt exakt einem Wert einer Variablen entspricht. Wird als in obigem Beispiel nur wahr, wenn auf den Wert "ABC12345" geprüft wird.

Für alle Prüfungen auf Textinhalte gilt, dass zwischen Groß- und Kleinschreibung unterschieden wird. Eine Prüfung mit der Bedingung Suchergebnis beginnt mit würde mit "AbC" für obiges Beispiel nicht wahr werden.

Optionen

Mit den Optionen können verschiedene Parameter der Verarbeitung gesteuert werden, um zum Beispiel festzulegen, wie ein Workflow abgearbeitet werden soll.

Screensot

Option Beschreibung
Seiten in nachfolgenden Ausgaben nicht noch einmal verarbeiten Wird diese Option aktiviert, werden die Seiten, die durch diese Ausgabe verarbeitet wurden, aus dem Stapel entfernt und nicht nochmals in späteren Ausgabeschritten verarbeitet. Setzt voraus, dass eine etwaige Bedingung das Ergebnis wahr liefert.
Jede Erkennung trennt Option zum Verarbeiten von identischen Erkennungen in hintereinander liegenden Seiten. Wenn nicht aktiviert, ignoriert Docuflair identische Erkennungen (z.B. Barcodes) auf hintereinander folgenden Seiten; d.h. solange identische Ergebnisse auf Seiten erkannt werden, werden alle Seiten zu einem Block zusammengefasst.
Jede Seite enthält Daten zur Erkennung Ist diese Option aktiviert, wird die Trennung in Teilaufträge nach jeder Seite erzwungen.
Seite mit erkannten Daten entfernen Entfernt die Seite, auf der die Erkennung (z.B. Barcode) vorgenommen wurde. Erforderlich, wenn Trennblätter ausgefiltert werden sollen, die nur die Information zur Trennung, sonst aber keine Daten beinhalten.
Rückseite von Trennblatt entfernen Entfernt die Rückseite der Seite, auf der die Erkennung (z.B. Barcode) vorgenommen wurde. Sinnvoll, wenn doppelseitig gescannt und mit Trennblättern gearbeitet wird, die auf der Rückseite leer sind.
Nur erste Erkennung in Dokument verwenden Normalerweise wird ein Stapel mit Seiten bei jeder Erkennung gesplittet. Durch Aktivieren dieser Option wird nach der ersten Erkennung nicht weiter nach Erkennungen auf Folgeseiten geprüft. Das heißt, sind zum Beispiel in einem fünf seitigen Scanauftrag auf Seite 1 und 3 ein Barcode aufgedruckt, so wird der Barcode auf Seite 3 ignoriert.

Schwärzung

Die Schwärzung (Redaction) kann verwendet werden, um sensible Informationen in gescannten Dokumenten unkenntlich zu machen. Um sensible Informationen zu erkennen, kommt eine Texterkennung (OCR) zum Einsatz. Als Datenquellen können Wörterbücher und Verzeichnisdienste eingesetzt werden. Die Schwärzung erfolgt auf Pixelebene. Dadurch wird sichergestellt, dass für jedes Ausgabedateiformat sensible Informationen ausgefiltert werden. Um die Schwärzung einsetzen zu können, ist eine entsprechende Lizenz erforderlich.

Screensot

Wird als Datenquelle ein Wörterbuch verwendet, kann dieses mit jedem Texteditor erstellt oder bearbeitet werden. Jedes Wort, das vor der Ausgabe geschwärzt werden soll, ist einer Zeile aufzunehmen. Eine Toleranz, falls Wörter nicht exakt dem Eintrag entsprechen (zum Beispiel Tippfehler, geringfügig andere Schreibweise oder Verwendung) kann festgelegt werden, indem am Ende der Zeile eines Wortes, nach einem Komma eine Zahl x angegeben werden kann. Wird ein Wort von der Texterkennung in den Bilddaten gefunden, wird dieses mit dem Wörterbuch vergleichen. Die Zahl x gibt nun an, ob man das gefundene Wort in x oder weniger Ersetzungen, Löschungen oder Ergänzungen zum Wort im Wörterbuch umformen könnte. Wird zum Beispiel im Wörterbuch der Eintrag Maus,1 hinzugefügt, würde auch Haus gefunden werden, weil der Abstand zwischen den Wörtern genau 1 ist. Werden zwei oder mehrere Wörter ein eine Zeile eingetragen, dann müssen die Wörter gemeinsamen in relativer Nähe auftreten, damit es zu einer Schwärzung kommt.

Beispielwörterbuch

Mona Muster
7000 Eisenstadt
Hauptstraße 9
Deutsch,2
Englisch,2
Französisch,2
Italienisch,2

Wird als Datenquelle ein Verzeichnisdienst eingesetzt, werden alle Identitäten ausgelesen (zum Beispiel die Liste der internen Mitarbeiter) sowie Ihre personenbezogenen Daten (Adresse, Telefonnummer, etc.). Als Verzeichnisdienst kann LDAP, Active Directory oder AD LDS zum Einsatz kommen. Das Auslesen der Identitäten kann auf einzelne OUs beschränkt werden, indem ein entsprechender ConnectionString in der Active Directory Verbindung eingetragen wird. Docuflair erstellt aus den extrahierten Informationen ein Wörterbuch und richtet selbstständig Fehlertoleranzen ein, um geringfügig falsche Schreibweisen oder häufige Abkürzungen auszufiltern.

Screensot

Metadaten

Die Seite Metadaten erlaubt das zeitgleiche Erstellen von Text und XML-Dateien, wenn ein gescanntes und verarbeitetes Dokument zugestellt wird (zum Beispiel an einen Speicherort übertragen wird).

Screensot

Wenn die Metadaten-Datei neben dem Scanauftrag gespeichert werden soll, muss Zustellung gleich wie Dokument ausgewählt werden. Ansonsten kann ein lokales Verzeichnis und Dateiname angegeben werden.

Der Inhalt der Metadaten-Datei ist frei konfigurierbar. Soll auf Daten aus einer Erkennung zurückgegriffen werden, können diese durch die Angabe des Variablennamens innerhalb geschwungener Klammern eingefügt werden. Das Einfügen von zum Beispiel {myBarcode} fügt den Inhalt der Variable myBarcode an dieser Stelle in die Datei ein.