KI Bearbeitung: Unterschied zwischen den Versionen

Version vom 5. Mai 2026, 10:28 Uhr

Mantiseinträge

Systemtyp

OJOHZDOKIBearbeitung

Beschreibung

Ermöglicht die Auswertung von Text und Bilddateien über verschiedene KI Modelle und Endpunkte. Unterstützt werden PDF Dateien, sowie JPEG und PNG Bilddateien.

Es können verschiedene Anbieter, deren Endpunkte und API Schnittstellen angesprochen werden. Web-API, Hosted oder bereitgestellt in lokaler Infrastruktur. Als API wird die OpenAI API in der neuesten Version empfohlen.

Der Serverjob macht genau einen Aufruf mit einer Anfrage.

Es gibt in der Konfiguration einen Sytstem-Prompt und einen User-Prompt, wobei der User-Prompt dem Chatprompt bei Chatbasierten LLM Applikationen entspricht. Dieser ist hier in der Regel eher zweitrangig.

Der System-Prompt definiert die KI strikt als funktionales Werkzeug: Er legt ihr Verhalten, ihre Aufgaben, Regeln und Einschränkungen fest und begrenzt den Interpretationsspielraum klar. Der User-Prompt übernimmt darauf aufbauend ausschliesslich die konkrete Anfrage zur Auswertung des jeweiligen Dokuments.

Für das Speichern der Ausgabe aus den Abfragen in Metadatenfeldern, ist die Angabe eines fixen Schemas notwendig. Dabei muss der Name des Schemaelements mit dem Metadatumsnamen Feld übereinstimmen, in welches das Resultat abgefüllt werden soll.

Konfiguration

API

In diesem Abschnitt wird die Verbindung zum KI-Anbieter eingerichtet.

Feld	Beschreibung
KI Anbieter	Bezeichnung des API-Anbieters, z. B. `Azure OpenAI` oder `OpenAI`. Dient zur Identifikation und Auswahl der richtigen Verbindungslogik.
API Endpunkt	Spezifischer API-Pfad, der angesprochen wird. Empfohlen wird `/responses` (neueste Version). Alternativ `/chat/completions` für ältere oder kompatible Anbieter.
URL	Stamm-URL des API-Endpunkts, z. B. `https://api.openai.com/v1` oder die URL einer Azure-Instanz.
API-Key	Geheimer Schlüssel zur Authentifizierung gegenüber dem Anbieter. Wird direkt beim Anbieter bezogen und muss vertraulich behandelt werden.
KI Modell	Name des zu verwendenden KI-Modells, z. B. `gpt-4o`, `gpt-4o-mini` oder ein Azure-Deployment-Name.

Hinweis: Für Azure OpenAI ist die Basis-URL anbieterabhängig und enthält in der Regel den Azure-Ressourcennamen. Endpunkt und Modell müssen mit dem jeweiligen Deployment in Azure übereinstimmen.

Extraktionanweisungen

Hier werden die Anweisungen definiert, die der KI mitgeteilt werden, was sie aus dem Dokument extrahieren soll.

System-Prompt

Der System-Prompt ist die wichtigste Konfiguration. Er definiert das Verhalten der KI vollständig und legt fest:

welche Art von Dokument analysiert wird,
welche Informationen extrahiert werden sollen,
in welchem Format die Antwort zurückgegeben werden muss,
welche Regeln und Einschränkungen gelten (z. B. keine Werte erfinden, nur extrahieren was explizit vorhanden ist).

Der System-Prompt wird als Rolle developer oder system an die API übergeben. Es empfiehlt sich, den hier gezeigten Prompt als Basis zu verwenden, entsprechend anzupassen und im Abschnitt ## Extraktionsanweisungen die dokumenttypspezifischen Anweisungen einzutragen.

Beispiel:

Du bist eine Engine zur Analyse von Dokumenten. Deine Aufgabe ist es, Informationen aus dem bereitgestellten Dokument zu extrahieren und als JSON zurückzugeben, das exakt dem im Request definierten Schema entspricht.

## Regeln
- Extrahiere nur Informationen, die im Dokument explizit vorhanden sind.
- Triff keine Annahmen und leite keine Werte ab.
- Wenn ein Feld nicht gefunden werden kann, setze es auf null.
- Gib ausschließlich die im Schema definierten Felder zurück.
- Gib keine Erklärungen, Kommentare oder zusätzlichen Text aus.
- Betrachte mehrseitige Dokumente als eine Einheit.

## Confidence
Wenn im Schema ein entsprechendes Feld vorhanden ist:
- HIGH: Wert ist eindeutig und klar lesbar
- MEDIUM: Wert ist vorhanden, aber nicht eindeutig oder leicht interpretativ
- LOW: Wert ist unsicher oder nur teilweise vorhanden
- NONE: Kein Wert gefunden → zugehöriges Feld ist null

## Fehlerfall
Falls das Dokument nicht verarbeitet werden kann oder keinen Text oder erkennbaren Inhalt enthält, gib stattdessen einer der folgenden zum Fehler passenden Werte in das feld fehlerbeschreibung im json schema aus.

Mögliche Codes:
- NO_DOCUMENT
- UNREADABLE
- WRONG_FORMAT
- NO_CONTENT
- OUT_OF_SCOPE

## Extraktionsanweisungen
Siehe genaue Anweisung in der Benutzereingabe
Extrahiere aus Rechnungen:
- Vorname und Nachname der angeschriebenen Person (meist oben links in der Anschrift)
- Ort aus der Anschrift
- Rechnungstotal
- flugnummer

## Ausgabe
Gib genau ein gültiges JSON-Objekt zurück, das dem Schema entspricht, oder ein Fehlerobjekt.

User-Prompt

Der User-Prompt enthält die konkrete, dokumentbezogene Anfrage und wird direkt nach dem System-Prompt an die KI übergeben. In der Regel genügt ein kurzer Befehl wie:

Analysiere das Dokument und extrahiere die Informationen.

Für einfache Extraktionsaufgaben kann dieses Feld kurz gehalten werden, da die eigentlichen Anweisungen bereits vollständig im System-Prompt enthalten sind.

KI Bearbeitung: Unterschied zwischen den Versionen

Version vom 5. Mai 2026, 10:28 Uhr

Inhaltsverzeichnis

Beschreibung

Konfiguration

API

Extraktionanweisungen

System-Prompt

User-Prompt

Feldzuordnungen

Modelparameter

Testfenster

Navigationsmenü

@@ Zeile 48: / Zeile 48: @@
 === Extraktionanweisungen ===
+Hier werden die Anweisungen definiert, die der KI mitgeteilt werden, was sie aus dem Dokument extrahieren soll.
 [[Datei:Extraktionsprompt.png]]
+==== System-Prompt ====
+Der System-Prompt ist die wichtigste Konfiguration. Er definiert das Verhalten der KI vollständig und legt fest:
+* welche Art von Dokument analysiert wird,
+* welche Informationen extrahiert werden sollen,
+* in welchem Format die Antwort zurückgegeben werden muss,
+* welche Regeln und Einschränkungen gelten (z.&nbsp;B. keine Werte erfinden, nur extrahieren was explizit vorhanden ist).
+Der System-Prompt wird als Rolle <code>developer</code> oder <code>system</code> an die API übergeben. Es empfiehlt sich, den hier gezeigten Prompt als Basis zu verwenden, entsprechend anzupassen und im Abschnitt <code>## Extraktionsanweisungen</code> die dokumenttypspezifischen Anweisungen einzutragen.
+'''Beispiel:'''
+<pre>
+Du bist eine Engine zur Analyse von Dokumenten. Deine Aufgabe ist es, Informationen aus dem bereitgestellten Dokument zu extrahieren und als JSON zurückzugeben, das exakt dem im Request definierten Schema entspricht.
+## Regeln
+- Extrahiere nur Informationen, die im Dokument explizit vorhanden sind.
+- Triff keine Annahmen und leite keine Werte ab.
+- Wenn ein Feld nicht gefunden werden kann, setze es auf null.
+- Gib ausschließlich die im Schema definierten Felder zurück.
+- Gib keine Erklärungen, Kommentare oder zusätzlichen Text aus.
+- Betrachte mehrseitige Dokumente als eine Einheit.
+## Confidence
+Wenn im Schema ein entsprechendes Feld vorhanden ist:
+- HIGH: Wert ist eindeutig und klar lesbar
+- MEDIUM: Wert ist vorhanden, aber nicht eindeutig oder leicht interpretativ
+- LOW: Wert ist unsicher oder nur teilweise vorhanden
+- NONE: Kein Wert gefunden → zugehöriges Feld ist null
+## Fehlerfall
+Falls das Dokument nicht verarbeitet werden kann oder keinen Text oder erkennbaren Inhalt enthält, gib stattdessen einer der folgenden zum Fehler passenden Werte in das feld fehlerbeschreibung im json schema aus.
+Mögliche Codes:
+- NO_DOCUMENT
+- UNREADABLE
+- WRONG_FORMAT
+- NO_CONTENT
+- OUT_OF_SCOPE
+## Extraktionsanweisungen
+Siehe genaue Anweisung in der Benutzereingabe
+Extrahiere aus Rechnungen:
+- Vorname und Nachname der angeschriebenen Person (meist oben links in der Anschrift)
+- Ort aus der Anschrift
+- Rechnungstotal
+- flugnummer
+## Ausgabe
+Gib genau ein gültiges JSON-Objekt zurück, das dem Schema entspricht, oder ein Fehlerobjekt.
+</pre>
+==== User-Prompt ====
+Der User-Prompt enthält die konkrete, dokumentbezogene Anfrage und wird direkt nach dem System-Prompt an die KI übergeben. In der Regel genügt ein kurzer Befehl wie:
+ Analysiere das Dokument und extrahiere die Informationen.
+Für einfache Extraktionsaufgaben kann dieses Feld kurz gehalten werden, da die eigentlichen Anweisungen bereits vollständig im System-Prompt enthalten sind.
 === Feldzuordnungen ===

KI Bearbeitung: Unterschied zwischen den Versionen

Version vom 5. Mai 2026, 10:28 Uhr

Beschreibung

Konfiguration

API

Extraktionanweisungen

System-Prompt

User-Prompt

Feldzuordnungen

Modelparameter

Testfenster

Navigationsmenü

Suche