Datenextraktion mit yuuvis® RAD extraction-service

yuuvis® RAD 8.x »

yuuvis® RAD extraction-service ist ein Microservice, mit dessen Hilfe EXIF-Daten aus Audio-, Video- und Bilddateien, XMP-Daten aus Office- und PDF-Dokumenten, ZUGFeRD-Daten sowie Standardeigenschaften aus E-Mails im MSG- oder EML-Format extrahiert werden können.

Der Dienst wird beim Speichern von neu erstellten oder geänderten Dokumenten in yuuvis® RAD client aufgerufen. Die extrahierten Daten werden bei entsprechender Konfiguration des Mappings als Metadaten gespeichert.

Die Extraktion muss mit Beispieldaten getestet werden. Extrahierte Daten, die mit 'OS:' gekennzeichnet sind, können gemappt werden. Das Mapping anderer Daten kann zu Fehlern, führen, insbesondere zu Fehlern durch nicht passende Datentypen und Formate.

Konfiguration von yuuvis® RAD extraction-service

Für das Extrahieren können Dateiendungen und maximale Dateigrößen angegeben werden, für die keine Extraktion von Daten erfolgt. Die Konfiguration erfolgt über die Konfigurationsdatei extraction-prod.yml aus dem Verzeichnis \config von yuuvis® RAD service-manager.

Beispiel:

skipexif:
  extensions: "xml,xsd"
  threshold: 10MB

Parameter:

extensions

Dateiendungen der Dateien, die ab der angegebenen Größe nicht extrahiert werden sollen.

Der Platzhalter '*'steht für alle Dateiendungen.

threshold

Nur Dateien, die Kleiner sind als angegeben, werden extrahiert.

Angabe in MB oder KB.

Ohne diesen Parameter werden keine Dateien mit angegebenen Dateiendungen extrahiert.

Aliasse für Dateieigenschaften

Unabhängig vom yuuvis® RAD extraction-service und dessen Konfiguration können folgende Dateieigenschaften direkt übernommen werden:

  • dms.Path: Dateiname mit Pfad

  • dms.FileSize: Dateigröße

  • dms.Digest: Digest der Dateigröße

  • dms.DigestAlgorithm: Algorithmus, mit dem der Digest erstellt wurde

  • dms.MimeType: MimeType der Datei

  • dms.Extension: Dateiendung