Datenextraktion mit yuuvis® RAD extraction-service
yuuvis® RAD extraction-service ist ein Microservice, mit dessen Funktionen Daten aus unterschiedlichen Dateiformaten extrahiert werden können:
- EXIF-Daten aus Audio-, Video- und Bilddateien,
- XMP-Daten aus Office- und PDF-Dokumenten,
- E-Rechnungen,
- ZUGFeRD (Versionen 1 und 2.3),
- Factur-X (Version 1.0),
-
XRechnung (Version 3.0.1) mit der Syntax UN/CEFACT und Cross Industry Invoice und Universal Business Language 2.1.
- Standardeigenschaften aus E-Mails im MSG- oder EML-Format.
Der Dienst wird beim Speichern von neu erstellten oder geänderten Dokumenten in yuuvis® RAD client aufgerufen. Die extrahierten Daten werden bei entsprechender Konfiguration des Mappings als Metadaten gespeichert.
Die Extraktion muss mit Beispieldaten getestet werden. Das Mapping kann zu Fehlern, führen, insbesondere zu Fehlern durch nicht passende Datentypen und Formate.
Sie können die Extraktion des Microservices testen:
-
Administrationsseite der Microservices per URL http://<service-admin-IP>:<port> öffnen.
Standard-Port: 7273
yuuvis® RAD extraction-service wird unter dem Namen EXTRACTION aufgeführt.
- Auf EXTRACTION klicken und erneut durch eine Klick den Extraction-Bereich öffnen.
-
Auf Insights > Details klicken.
Die Detailseite wird geöffnet.
- Auf den Link zur Swagger-UI klicken.
- Auf der Seite Extraction API aus der Liste in der Kopfzeile extraction-api auswählen.
- Auf POST /extraction/api/xmp klicken.
- Auf Try it out! klicken.
- Datei aus Dateisystem wählen.
- Mit einem Klick auf Execute Extraktion starten.
Die Daten werden unmittelbar extrahiert und das Ergebnis wird angezeigt.
Das Ergebnis hat folgende Struktur: "Alias": "Wert"
Für die Übernahme der von yuuvis® RAD extraction-service extrahierten Daten muss das Schema in yuuvis® RAD designer angepasst werden:
- Für jedes Metadatenfeld eines Objekttyps, in das extrahierte Daten übernommen werden sollen, müssen Sie in den Feldeigenschaften das gewünschten yuuvis® RAD-Alias aus den Tabellen Metadatenmapping angeben.
Wenn das Neuerstellungsformular ein Metadatenfeld enthält, in das nur eindeutige Werte eingegeben werden dürfen, wird ungeachtet des Imports mehrerer Dateien nur ein Dokument mit der ersten zu importierenden Datei in yuuvis® RAD erstellt. Deshalb dürfen Metadatenfelder von Objekttypen, die für die Datenextraktion vorgesehen sind, nicht die Eigenschaft Eindeutig erhalten.
Wenn extrahierte Daten die maximale Länge der Metadatenfelder überschreiten, werden sie abgeschnitten.
Die extrahierten Daten der Medien- und Dokumentdateien werden so verarbeitet, dass der Wert der ersten passenden Information in die Metadaten übernommen wird.
Die Schreibweise der yuuvis® RAD-Aliasse ist Namensraum.Name.
Beispiel:
extract.OS:Title
Für die Übernahme der von yuuvis® RAD extraction-service extrahierten Daten muss das Schema in yuuvis® RAD designer angepasst werden. Dies erfolgt hier beispielhaft anhand eines Dokumenttyps für E-Mails.
yuuvis® RAD extraction-service stellt die Zuweisungen von Standardeigenschaften aus E-Mail-Dateien auf yuuvis® RAD-Aliasse bereit (siehe Metadatenmapping).
Schema anpassen:
- In yuuvis® RAD designer den Dokumenttyp E-Mail öffnen und in den Bereich Felder wechseln.
- Das Feld From wählen, ein Alias hinzufügen und folgende Angaben machen:
- In der Eigenschaft Name den Text OS:MailFrom eintragen.
- In der Eigenschaft Namensraum den Text extract eintragen.
- Bei Bedarf das Feld schreibgeschützt setzen.
- Mit allen weiteren Feldern des Dokumenttyps ebenso verfahren.
- Schema speichern und aktivieren.
Damit ist die Konfiguration abgeschlossen.
Sie können nun in ein E-Mail-Programm wechseln und eine E-Mail in yuuvis® RAD übernehmen. Prüfen Sie in yuuvis® RAD client, ob die Metadatenfelder der übernommenen E-Mail korrekt ausgefüllt sind.
Plugins
yuuvis® RAD extraction-service kann durch Plugins ergänzt werden, über die das Extrahieren von Daten aus konfigurierten Dateiformaten ermöglicht wird.
Die Dokumentation finden Sie im Entwickler-Bereich.