Azure Document Intelligence: Unterschied zwischen den Versionen

Version vom 14. Oktober 2024, 11:03 Uhr

Beschreibung

Document Intelligence ist ein AI basierter cognigitive service von Microsoft Azure.

Der Dienst besteht zumindest aus einem Document intelligence Objekt und einem zugehörigen Speicherkonto. Wenn ein neues Projekt in Document intelligence Studio (kurz: DIS) angelegt wird, muss dafür ein Speicherkonto genannt werden. Das Speicherkonto wird benötigt, um die Trainingsdateien für die AI Modelle zur Verfügung zu stellen. Die Feldkonfiguration für die extraktion und das Training eines zugehörigen Models werden im WebUI des DIS gehandhabt. Die Handhabung der Daten sehen wir uns im Kapitel Speicherlaufwerke genauer an.

DIS bietet verschiedene vorkonfigurierte Modelle, diese sind für uns an dieser Stelle erstmal nicht relevant. Um eigene Modelle zu erstellen und zu trainieren, verwenden wir die "Custom extraction", bzw. die "custom classification" falls die Dokumente erst separiert werden müssen.

Azure Ressourcen

Auf der Portalseite von Azure finden sich die Ressourcen welche der Ressourcengruppe BSB_AI-Services zugehörig sind. Aktuell ist dort ein Document intelligence Dienst und ein Speicherkonto zu finden.

Verschiedene Projekte können problemlos auf den selben Ressource ausgeführt werden. Das DIS WebUI ist eine davon losgelöste Plattform, welche darunter laufenden Projekte an ein Benutzerkonto bindet. Die Projekte selbst werden jedoch beim erstellen dauerhaft mit den hier gezeigten Ressourcen verknüpft.

Cognitive Service - Document Intelligence

Die Resource des vorläufig ersten Document intelligence Objektes heisst "BSBDocInt". Es gibt dort keine weiteren Einstellungen, welche durch den Benutzer vorgenommen werden sollten.

Die Detailseite der Resource ermöglicht die Anzeige der Zugriffsschlüssel und des Endpunktes für die Konfiguration des Helper Arbeitsschrittes.

Die Endpunkte setzen sich grunsätzlich aus dem Namen der Resource und der Endung cognitiveservices.azure.com zusammen. E.g.: https://bsbdocint.cognitiveservices.azure.com

Speicherlaufwerke

Das Speicherkonto "databsb" ist als günstiger Blob Storage mit Key access ausgelegt. Es wird generell nur für die Ablage der Trainigsdaten verwendet, welche über das WebUI des DIS hochgeladen werden.

Die Verwaltung kann aktuell nur über das Azure Portal ausgeführt werden. Hier können Projekt, bzw. Modelspezifische Ordner angelegt und bearbeitet werden.

Der Zugriff auf das Laufwerk wird über den Storage Browser geregelt. Dazu wird die Storage Resource im Portal durch klicke auf das Icon geöffnet. Im darauf erscheinenden UI im linken Menubereich die Option "Storage Browser" auswählen. Danach um Untermenü rechts davon die Option "Blob containers" auswählen. Dies ist der Hauptcontainer des Speicherkontos.

Darin befindet sich ein Container mit dem Namen "trainingdata". Dies ist so zu sagen das Laufwerk, in dem wir die Trainingsdaten ablegen.

Datenhaltung

Es empfiehlt sich je Projekt einen eigenen Ordner im container "trainingdata" anzulegen. In dem jeweiligen Projektordner werden dann nach Bedarf weitere Unterordner für jedes zu Trainierende Model angelegt.

Die Trainingsdaten können bereits hier in die entsprechenden Ordner hochgeladen, oder später bei der Trainingskonfiguration im DIS UI.

Je nach Konfigurationsfortschritt eines Projektes über das DIS WebUI, werden neben den Dokumenten weitere Dateien angelegt. Dies sind Dateien für das OCR und die eingefügten Labels.

Die vollstängige Labelbeschreibung wird in der Datei fields.json abgelegt. Diese Datei kann einfach in andere Projektunterordner kopiert werden, falls die Felder dort identisch heissen werden.

Für die OCR Daten, welche bei der "Run layout" Funktion im DIS generiert werden, entsteht eine dem Dateinamen des zugehörigen Dokumentes identische Datei mit der zusätzlichen Endung .ocr.json.

Für die Labelzuordnung wird nochmals eine Datei mit dem gleichen Dateinamen wie das Dokument mit der endung .labels.json erstellt.

Bsp. für eine Datei mit dem Namen "MeinDokument.pdf":

MeinDokument.pdf
MeinDokument.pdf.ocr.json
MeinDokument.pdf.labels.json
fields.json

Azure Document Intelligence: Unterschied zwischen den Versionen

Version vom 14. Oktober 2024, 11:03 Uhr

Inhaltsverzeichnis

Beschreibung

Azure Ressourcen

Cognitive Service - Document Intelligence

Speicherlaufwerke

Datenhaltung

Document Intelligence Studio

Navigationsmenü

@@ Zeile 27: / Zeile 27: @@
 ===Speicherlaufwerke===
-Das Speicherkonto "databsb" ist ein
+Das Speicherkonto "databsb" ist als günstiger Blob Storage mit Key access ausgelegt. Es wird generell nur für die Ablage der Trainigsdaten verwendet, welche über das WebUI des DIS hochgeladen werden.
+Die Verwaltung kann aktuell nur über das Azure Portal ausgeführt werden. Hier können Projekt, bzw. Modelspezifische Ordner angelegt und bearbeitet werden.
+Der Zugriff auf das Laufwerk wird über den Storage Browser geregelt. Dazu wird die Storage Resource im Portal durch klicke auf das Icon geöffnet. Im darauf erscheinenden UI im linken Menubereich die Option "Storage Browser" auswählen. Danach um Untermenü rechts davon die Option "Blob containers" auswählen. Dies ist der Hauptcontainer des Speicherkontos.
+Darin befindet sich ein Container mit dem Namen "trainingdata". Dies ist so zu sagen das Laufwerk, in dem wir die Trainingsdaten ablegen.
 ====Datenhaltung====
-- Dateiablage und organisation
+Es empfiehlt sich je Projekt einen eigenen Ordner im container "trainingdata" anzulegen. In dem jeweiligen Projektordner werden dann nach Bedarf weitere Unterordner für jedes zu Trainierende Model angelegt.
+Die Trainingsdaten können bereits hier in die entsprechenden Ordner hochgeladen, oder später bei der Trainingskonfiguration im DIS UI.
+Je nach Konfigurationsfortschritt eines Projektes über das DIS WebUI, werden neben den Dokumenten weitere Dateien angelegt. Dies sind Dateien für das OCR und die eingefügten Labels.
+Die vollstängige Labelbeschreibung wird in der Datei '''fields.json''' abgelegt. Diese Datei kann einfach in andere Projektunterordner kopiert werden, falls die Felder dort identisch heissen werden.
+Für die OCR Daten, welche bei der "Run layout" Funktion im DIS generiert werden, entsteht eine dem Dateinamen des zugehörigen Dokumentes identische Datei mit der zusätzlichen Endung '''.ocr.json'''.
+Für die Labelzuordnung wird nochmals eine Datei mit dem gleichen Dateinamen wie das Dokument mit der endung '''.labels.json''' erstellt.
-- zugehörige dateien
+Bsp. für eine Datei mit dem Namen "MeinDokument.pdf":
+ MeinDokument.pdf
+ MeinDokument.pdf.ocr.json
+ MeinDokument.pdf.labels.json
+ fields.json
 ==[https://documentintelligence.ai.azure.com/studio Document Intelligence Studio]==

Azure Document Intelligence: Unterschied zwischen den Versionen

Version vom 14. Oktober 2024, 11:03 Uhr

Beschreibung

Azure Ressourcen

Cognitive Service - Document Intelligence

Speicherlaufwerke

Datenhaltung

Document Intelligence Studio

Navigationsmenü

Suche