Texterkennung und PDF/A-Erzeugung mit dem Microservice 'ocrservice'

yuuvis® RAD 7.x »

Der Service 'ocrservice' erzeugt in Zusammenarbeit mit der Texterkennungssoftware ABBYY FineReader aus Bilddokumenten Textdokumente, die für die Volltextindexierung verwendet werden. Zusätzlich können mit ihm PDF-Dateien mit Hidden Text, verschiedene PDF/A-Formate und stark komprimierte PDFs erzeugt werden.

Konfiguration

Der Service 'ocrservice' arbeitet mit folgenden Standardeinstellungen:

PDF-Profil: Format PDF/A1b
PDF-Profil: Verfahren Balanced
Text-Profil Vorgegeben: TextExport.ini
Dateiübertragung zu yuuvis® RAD rendition-plus Stream
Anzahl der Kerne für ABBYY FineReader 1

Über die Konfigurationsdatei ocr-prod.yml aus dem Verzeichnis \servicemanager\config\ können diese Einstellungen geändert werden.

Beispiel einer Konfiguration in der Datei ocr-prod.yml:

finereader:
	profile:
		pdfa: PDFA1bBalanced.ini
		text: TextExport.ini
rest:
	transferPolicy: stream
finereader.engine.numberOfCores: 1

Das Beispiel entspricht den Standardeinstellungen.

Angegeben werden müssen nur die Einstellungen, die von den Standardeinstellungen abweichen.