Erstellung von Seitenrahmen: Unterschied zwischen den Versionen

Aus Helper
Zur Navigation springen Zur Suche springen
(3256 Neue Seite mit Beschreibung des Workflows)
 
KKeine Bearbeitungszusammenfassung
 
(5 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 2: Zeile 2:


Die Herstellung von digitalisierten Seiten, insbesondere Buchseiten.  
Die Herstellung von digitalisierten Seiten, insbesondere Buchseiten.  
Reduzierung der Seitenausgabe auf einzelne Seiten, welche einen sauberen Seitenrahmen, bzw. Seitenzuschnitt um den Text besitzen.
Reduzierung der Seitenausgabe auf einzelne Seiten, welche einen sauberen Seitenrahmen, bzw. Seitenzuschnitt um den Text besitzen.
Oder anderst gesagt, ohne störende, ungewünschte oder unnötige Randbereiche um den Textinhalt einer Seite erfasst werden.
Oder anderst gesagt, ohne störende, ungewünschte oder unnötige Randbereiche um den Textinhalt einer Seite erfasst werden.


Wenn die geforderte Ausgabe (bzw. Eingabe) nicht bereits bei der Digitalisierung (Scanprozess) erreicht werden kann, müssen die Seiten nachträglich mit dem passenden Seitenrahmen versehene und zugeschnitten werden.
Wenn die geforderte Ausgabe (bzw. Eingabe) nicht bereits bei der Digitalisierung (Scanprozess) erreicht werden kann, müssen die Seiten nachträglich mit dem passenden Seitenrahmen versehene und zugeschnitten werden.
Die folgenden Schritte unterstützen diesen Prozess.
Die folgenden Schritte unterstützen diesen Prozess.


Zeile 12: Zeile 14:
* [[Bilderstellung aus Rahmen]] - Erstellung der Seiten durch automatisierten Beschnitt der ermittelten Seitenrahmen
* [[Bilderstellung aus Rahmen]] - Erstellung der Seiten durch automatisierten Beschnitt der ermittelten Seitenrahmen


==Beschreibung==
==Beispiele==
 
===Buch mit Leerseite===
 
Exemplarische Konfiguration und erwartete Resultate für die Bearbeitung eines Buches welches auf dem Buchscanner digitalisiert wurde.
 
Es handelt sich dabei um Bücher, welche jeweils nur auf der rechten Seite mit Text versehen sind.
 
Die Seiten sind mit sauberen Seiterahmen zu versehen und mit einem Status "Leereseite: Ja/Nein" zu markieren.
 
 
Ausgangsmaterial: Doppelseitiges Buch mit grosszügigem Randbereich von der Scanfläche.
 
[[Datei: Buchtotale.png]]
 
 
'''Erster Schritt: [[Seitenrahmen finden]]'''
 
Konfigurierte Befehlsfolge:
 
# Region of interest
# Doppelseite teilen (erkennt Regions of Interest)
# Drehung finden aus Bild, oder, aus OCR
# Ränder finden (erkennt Regions of Interest)
# Leere Seiten finden
 
 
;Befehl - Region of interest
 
Mit diesem Schritt wird der tatsächliche Buchbereich, bzw. Arbeitsbereich für gewisse Folgebefehle ermittelt. Anhand von diesem Bereich können die Folgebefehle "Doppelseite teilen" und "Ränder finden" ggf. bessere Resultate liefern.
 
Im gezeigten Beispiel liegt das Buch recht gut mittig. Für die Fälle, wo die Mitte jedoch abweicht, und der "Doppelseite teilen" Befehl über die Bildhälfte ausgeführt wird, sind die gewonnenen Buchhälften dann ungenau.
 
 
Beispiel für eine ermittelte ROI (Parameter: Konfidenz=45, Referenzrand=oben Links, Typ=Dokument)
 
[[Datei: Buchroi.png]]
 
 
;Befehl - Doppelseite teilen
 
Das Bild wird entweder auf der Hälfte der Seite ODER über die Hälfte eines zuvor ermittelten ROI's geteilt. Die nicht verwendeten Seitenteile werden schwarz ausgefüllt.
 
Hauptsächlicher Anwendungsfall für das Teilen von Seiten, ist die nachfolgende Ermittlung von Schräglagen, üblicherweise bezogen auf die sich darauf befindenden Seitentexte.
 
Die Teilung führt im folgenden Kontrollieren Arbeitsschritt dazu, dass 2 Anzeigefenster dargestellt werden und die ursprügliche Seite zwei mal, jede entsprechend mit ihrem zugehörigen Seitenrahmen, geladen wird.
 
Da die Teilung zwei Seitenrahmen erzeugt, muss für jede Seite ein Namenssuffix angegeben werden. Dieses wird dem vorgegebenen Seitenrahmen Name angehängt.
Der Teilung kann ein Offset über den Parameter "Overlap" mitgegeben werden.
 
 
Beispiel für die geteilten Seiten, welche nur im Speicher gehalten werden (Parameter: Teilen=vertikal, Overlap=50)
 
[[Datei: linksteil1.png]] [[Datei: rechtsteil1.png]]
 
 
 
;Befehl - Drehung finden aus Bild / OCR
 
Ermittelt entweder über einen Erkennungsalgorithmus aus GDPicture oder über die erkannte Textlage über OCR den Drehwinkel zur Horizontalen. Dieser Winkel wird gespeichert und bei der endgültigen [[Bilderstellung aus Rahmen|Bilderstellung]] angewendet, bevor das Bild anhand des Seitenrahmen zugeschnitten wird.


;Befehl - Ränder finden


Ermittelt und speichert die finalen gesuchten Seitenrahmen. Wurde zuvor der Befehl ROI angewendet, dann wird nur innerhalb der ermittelten ROI Bereiche nach weiteren Rändern gesucht.
Die Konfidenz für die besten Resultate muss durch versuche ermittelt werden.




[[Kategorie:Workflowumschreibungen]]
[[Kategorie:Workflowbeschreibungen]]

Aktuelle Version vom 21. November 2023, 15:06 Uhr

Ausgangslage

Die Herstellung von digitalisierten Seiten, insbesondere Buchseiten.

Reduzierung der Seitenausgabe auf einzelne Seiten, welche einen sauberen Seitenrahmen, bzw. Seitenzuschnitt um den Text besitzen. Oder anderst gesagt, ohne störende, ungewünschte oder unnötige Randbereiche um den Textinhalt einer Seite erfasst werden.

Wenn die geforderte Ausgabe (bzw. Eingabe) nicht bereits bei der Digitalisierung (Scanprozess) erreicht werden kann, müssen die Seiten nachträglich mit dem passenden Seitenrahmen versehene und zugeschnitten werden.

Die folgenden Schritte unterstützen diesen Prozess.

Beispiele

Buch mit Leerseite

Exemplarische Konfiguration und erwartete Resultate für die Bearbeitung eines Buches welches auf dem Buchscanner digitalisiert wurde.

Es handelt sich dabei um Bücher, welche jeweils nur auf der rechten Seite mit Text versehen sind.

Die Seiten sind mit sauberen Seiterahmen zu versehen und mit einem Status "Leereseite: Ja/Nein" zu markieren.


Ausgangsmaterial: Doppelseitiges Buch mit grosszügigem Randbereich von der Scanfläche.


Erster Schritt: Seitenrahmen finden

Konfigurierte Befehlsfolge:

  1. Region of interest
  2. Doppelseite teilen (erkennt Regions of Interest)
  3. Drehung finden aus Bild, oder, aus OCR
  4. Ränder finden (erkennt Regions of Interest)
  5. Leere Seiten finden


Befehl - Region of interest

Mit diesem Schritt wird der tatsächliche Buchbereich, bzw. Arbeitsbereich für gewisse Folgebefehle ermittelt. Anhand von diesem Bereich können die Folgebefehle "Doppelseite teilen" und "Ränder finden" ggf. bessere Resultate liefern.

Im gezeigten Beispiel liegt das Buch recht gut mittig. Für die Fälle, wo die Mitte jedoch abweicht, und der "Doppelseite teilen" Befehl über die Bildhälfte ausgeführt wird, sind die gewonnenen Buchhälften dann ungenau.


Beispiel für eine ermittelte ROI (Parameter: Konfidenz=45, Referenzrand=oben Links, Typ=Dokument)


Befehl - Doppelseite teilen

Das Bild wird entweder auf der Hälfte der Seite ODER über die Hälfte eines zuvor ermittelten ROI's geteilt. Die nicht verwendeten Seitenteile werden schwarz ausgefüllt.

Hauptsächlicher Anwendungsfall für das Teilen von Seiten, ist die nachfolgende Ermittlung von Schräglagen, üblicherweise bezogen auf die sich darauf befindenden Seitentexte.

Die Teilung führt im folgenden Kontrollieren Arbeitsschritt dazu, dass 2 Anzeigefenster dargestellt werden und die ursprügliche Seite zwei mal, jede entsprechend mit ihrem zugehörigen Seitenrahmen, geladen wird.

Da die Teilung zwei Seitenrahmen erzeugt, muss für jede Seite ein Namenssuffix angegeben werden. Dieses wird dem vorgegebenen Seitenrahmen Name angehängt. Der Teilung kann ein Offset über den Parameter "Overlap" mitgegeben werden.


Beispiel für die geteilten Seiten, welche nur im Speicher gehalten werden (Parameter: Teilen=vertikal, Overlap=50)


Befehl - Drehung finden aus Bild / OCR

Ermittelt entweder über einen Erkennungsalgorithmus aus GDPicture oder über die erkannte Textlage über OCR den Drehwinkel zur Horizontalen. Dieser Winkel wird gespeichert und bei der endgültigen Bilderstellung angewendet, bevor das Bild anhand des Seitenrahmen zugeschnitten wird.


Befehl - Ränder finden

Ermittelt und speichert die finalen gesuchten Seitenrahmen. Wurde zuvor der Befehl ROI angewendet, dann wird nur innerhalb der ermittelten ROI Bereiche nach weiteren Rändern gesucht. Die Konfidenz für die besten Resultate muss durch versuche ermittelt werden.