Sicherungsleitfaden

enaio® 10.10 »

Ständige Sicherung der Verlaufsdaten

Die Sicherung der Verlaufsdaten gewährleistet die korrekte Funktion des Systems und soll nach einem Ausfall die kompletten Daten wieder bereitstellen. Dazu muss gesichert werden:

  • der Datenbereich WORK

  • die Datenbank des Systems

  • Volltextindex

  • die Konfigurationsdateien, die nicht in der Datenbank stehen

  • die Registrierungsdaten des Servers und weiterer Komponenten

Mit diesen Daten kann enaio® nach einer Neuinstallation wieder auf den Stand vor dem Ausfall gebracht werden.

Für eine schnelle Wiederaufnahme der Volltextsuche ohne Neuindizierung (und Verbrauch von OCR-Lizenzen) muss ebenfalls gesichert werden:

  • Volltextdatenbank

  • Dokumentvorschau \cache\, laufende Sicherung des Backup-Verzeichnisses, einmalige Sicherung des fts-archive-Verzeichnisses.

Sicherung der Installation nach Neueinrichtung oder Update

Für eine schnelle Wiederherstellung und für die Wiedereinrichtung von zusätzlichen Komponenten nach einem Ausfall empfiehlt sich nach der Einrichtung oder nach Updates des File-Servers eine Sicherung mit folgenden Komponenten:

  • Client-Verzeichnisse mit spezifischen Konfigurationsdateien:

    • Client32/64

    • Admin

    • Capture

  • Konfigurationen der Kerndienste

  • Konfiguration der Microservices

  • Konfigurationsdateien im Serverbereich

    • alle .cfg- und .ini-Dateien

    • etc- Verzeichnis des Datenverzeichnisses

Eine Sicherung lokaler Client-Einrichtungen ist nur dann erforderlich, wenn lokale Capture-Einrichtungen vorhanden sind.

File-Server

Auf dem File-Server liegen die Programmdateien der enaio® Client-Anwendungen. Diese finden sich üblicherweise in folgenden Verzeichnissen:

...\<OSECM-Anwendung>\clients\...

Der genaue Verzeichnispfad ist installationsabhängig. In den Verzeichnissen finden sich neben den Programmdateien auch einige Konfigurationsdateien für Zusatzmodule. Es muss deshalb im Einzelfall geprüft werden, ob die Verzeichnisse zu sichern sind. Falls ja, ist eine Sicherung nach Installation, Update bzw. Änderung der Konfiguration ausreichend. Ein Vorhalten der Client-Verzeichnisse in einem Backup beschleunigt das Wiederherstellen, da nicht erst installiert werden muss.

enaio® server

Für eine zur Wiederherstellung des Gesamtsystems ausreichende Sicherung sind auf enaio® server verschiedene Verzeichnisse des Dateisystems sowie Pfade der Registrierungsdatenbank zu sichern. Zunächst sollen die Verzeichnisse des Dateisystems erläutert werden:

  • WORK

    …\<install>\server\Work\

  • CACHE

    …\<install>\server\Cache\

  • ARCHIVE

    …\<install>\server\ARCHIVE\

  • BACKUP

    …\<install>\server\Backup\

  • NOTE

    …\<install>\server\Note\

  • ETC-Verzeichnis

    …\<install>\server\etc\ bzw.

    …<datenverzeichnis\etc\>

WORK-Verzeichnis

…\<install>\server\Work

Wie im ersten Abschnitt erläutert wurde, werden alle Dokumente, die in enaio® erfasst werden, zunächst im WORK-Bereich von enaio® server abgelegt. Erst mit der Archivierung werden die Dokumente aus dem WORK-Bereich entfernt. Der WORK-Bereich ist somit zwingend erforderlich für eine Rekonstruktion des gesamten Systems und ist mindestens täglich zu sichern.

In einer Standardinstallation befindet sich das WORK-Verzeichnis unterhalb des Server-Verzeichnisses. Es kann auch auf andere Orte ausgelagert werden. Der korrekte Standort wird in der Path-Tabelle festgelegt.

CACHE-Verzeichnis

…\<install>\server\Cache

Dieses Unterverzeichnis von enaio® server dient als Output-Cache des Systems. Es gibt zwei Optionen, bei denen es gefüllt wird:

  • Im Mehrserversystem bei Abruf von Dokumenten aus einer anderen Servergruppe.
  • Bei Archivierung:
    • beim Archivierungslauf selbst
    • beim Abruf von Dokumenten von einem Archivmedium.

Bei Anforderung wird das Dokument durch enaio® server vom Archivmedium zunächst in das CACHE-Verzeichnis kopiert, bevor es zum Client übertragen wird. Die Dokumente im CACHE-Verzeichnis befinden sich bereits auf den revisionssicheren Archivmedien. Daher muss das CACHE-Verzeichnis nicht gesichert werden. Es sollte jedoch regelmäßig bereinigt werden, um Speicherplatz freizuschaffen. Standardmäßig ist dazu ein periodischer Server-Job aktiviert. Um das CACHE-Verzeichnis zu bereinigen, können Sie auch die automatische Aktion 'Cachebereinigung' durchführen.

In einer Standardinstallation befindet sich das CACHE-Verzeichnis unterhalb des Server-Verzeichnisses. Es kann auch auf andere Orte ausgelagert werden. Der korrekte Standort wird ebenfalls über die Pfadangabe des WORK-Verzeichnisses festgelegt.

ARCHIVE-Verzeichnis

…\<install>\server\ARCHIVE

Das ARCHIVE-Verzeichnis wird für die Zusammenstellung der Indexdaten bei der Archivierung verwendet. Die Informationen der Objektdefinition und der Indexdaten werden hier gesammelt und nach Abschluss der Archivierung auf das Archivmedium in das Unterverzeichnis \SYS\ geschrieben.

enaio® server legt bei der Archivierung im Verzeichnis ARCHIVE für jedes Medium, auf das archiviert wird, ein entsprechendes Unterverzeichnis an. Hier befinden sich im Unterverzeichnis SYS immer die Indexdaten nebst Objektdefinition des letzten Archivierungslaufs. Die Daten werden pro Lauf durchnummeriert. Diese Information wird in der Datei RECOVER.INI ebenfalls in diesem Verzeichnis abgelegt. Bei virtuellen Servern wird nur ein Verzeichnis mit dem Namen des virtuellen Servers verwendet.

Die Daten des ARCHIVE-Verzeichnisses können für eine Wiederherstellung der Datenbank des enaio®-Systems verwendet werden. Da für einen virtuellen Archivserver keine Speicherung auf dem Speichersystem erfolgt, muss für diesen Fall festgelegt werden, ob eine langfristige Sicherung dieser Wiederherstellungsdaten für den Betrieb notwendig ist. Alternativ ist eine Sicherung der Archivierung (neben der erweiterten Archivierung) zu Dokumentationszwecken möglich.

Das ARCHIVE-Verzeichnis kann aufgeräumt werden. Aus Konsistenzgründen sollten alle Medien erhalten bleiben, die noch nicht voll sind bzw. die in enaio® enterprise-manager als 'frei' gekennzeichnet sind.

Dateien mit der Endung .404 im Archive-Verzeichnis stammen von einer bestätigten Archivierung und werden nicht mehr verwendet. .404-Dateien müssen nicht gesichert werden.

BACKUP-Verzeichnis

…\<install>\server\Backup\

Das BACKUP dient als optionales drittes Sicherungsmedium bei der Archivierung. Bei Aktivierung der Backup-Option legt enaio® server bei der Archivierung für jedes Medium, auf das archiviert wird, ein entsprechendes Unterverzeichnis an. Bei virtuellen Archivservern steht an Stelle des Medium-Namens der Name des virtuellen Servers.

Backup-Option

Die Notwendigkeit zur Sicherung dieses Verzeichnisses ergibt sich aus Ihrer Archivierungsstrategie. OPTIMAL SYSTEMS empfiehlt, die Backup-Option grundsätzlich zu aktivieren. Aktivieren Sie die Backup-Option unbedingt, wenn Sie nicht mit Spiegelmedien arbeiten oder der virtuelle Archivserver keine Duplizierung ermöglicht. Aktivieren die Backup-Option möglichst auch dann, wenn Sie zeitgleich auf ein Haupt-und ein Spiegelmedium archivieren und keine physikalische und räumliche Trennung zwischen Haupt-und Spiegelmedium gegeben ist.

Das BACKUP-Verzeichnis kann aufgeräumt werden. Erhalten Sie aber nach Möglichkeit alle Medien, die noch nicht voll sind bzw. die in enaio® enterprise-manager als 'frei' gekennzeichnet sind.

NOTE-Verzeichnis

…\<install>\server\Note\

In Programminstallationen vor Version 4.00 wurden Notizen zu Dokumenten im NOTE-Verzeichnis im Dateisystem abgelegt. In den Versionen ab 4.00 können Notizen entweder in der Datenbank oder im Dateisystem abgelegt werden. Eine Übernahme der im Dateisystem abgelegten Notizen in die Datenbank ist nur bedingt möglich. Wenden Sie sich bei Fragen zur Übernahme von Notizen aus dem Dateisystem an das Professional Services-Team von OPTIMAL SYSTEMS. Aktivieren Sie bei Installationen ab Version 4.00 unbedingt die Ablage in der Datenbank.

Eine Sicherung des NOTE-Verzeichnisses ist bei Aktivierung der Ablage in der Datenbank nicht erforderlich, da diese mit der Datenbanksicherung erfolgt.

Wenn die Ablage im Dateisystem eingestellt ist, muss das Verzeichnis gesichert werden.

ETC-Verzeichnis

…\<install>\server\etc\ bzw.

…<datenverzeichnis\etc\>

Das ETC-Verzeichnis enthält alle Konfigurationsdateien und Dokumentvorlagen, die nicht in der Datenbank gesichert werden. So werden in diesem Verzeichnis alle Versionen der Konfigurationsdateien gespeichert. Die Konfigurationsversionen werden über enaio® administrator verwaltet.

Im Unterverzeichnis Templates werden die Vorlagen für alle im System konfigurierten W-Vorlagen abgelegt.

Das Unterverzeichnis User enthält für jeden im System konfigurierten Benutzer ein Unterverzeichnis mit benutzerspezifischen Konfigurationen.

Das Verzeichnis etc ist somit zwingend erforderlich für eine Rekonstruktion des gesamten Systems und ist täglich zu sichern. Das Verzeichnis sollte mit Hilfe der automatischen Aktion 'Bereinigung der Konfigurations- und Protokolldateien' regelmäßig bereinigt werden, um Speicherplatz freizuschaffen. Achten Sie bei der Bereinigung darauf, eine für Ihre Umgebung angemessene Anzahl an Konfigurationen und Logdateien aus einem sinnvollen Zeitraum beizubehalten.

Registrierungsdatenbank

Die Registrierungseinträge von enaio® server gehören ebenfalls ins Sicherungskonzept. Es empfiehlt sich, die Registrierungseinträge nach erfolgter Installation und bei Änderungen an Konfigurationen von enaio® server zu sichern. Grundsätzlich können die hier enthaltenen Daten bei der Rekonstruktion des Systems durch Konfigurationstätigkeiten wiederhergestellt werden. Eine Sicherung der Registrierungseinträge erspart jedoch im Notfall viel Zeit bei der Wiederherstellung.

enaio® speichert die Konfigurationsdaten in folgenden Zweigen:

HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\OPTIMAL SYSTEMS
HKEY_LOCAL_MACHINE\SOFTWARE\OPTIMAL SYSTEMS

Eine Sicherung kann mit Hilfe des Registrierungs-Editors erfolgen. Markieren Sie hierzu einen oben genannten Zweig und wählen Sie aus dem Menü Datei den Eintrag Exportieren. Die erstellte Datei <name>.reg kann jetzt gesichert werden und im Notfall per Doppelklick im Explorer wieder in die Registrierungsdatenbank importiert werden.

Datenbank

Die Datenbank sollte immer zugleich mit dem WORK-Bereich des Anwendungs-Servers gesichert werden, da sonst Inkonsistenzen zwischen Indexdaten und physischen Dokumenten entstehen können.

Für die Sicherung der Datenbank stehen verschiedene Mittel und Wege zur Auswahl. Die Sicherung kann mit datenbankeigenen Werkzeugen oder durch Sicherungsagenten Ihrer Backup-Software erfolgen.

enaio® editor ist ein sehr mächtiges Werkzeug, das ausschließlich von qualifiziertem Fachpersonal bedient werden darf. Die Löschung der kompletten Datenbank ist hier leicht möglich. Damit ist der Zugang zu diesem Werkzeug auf Zugriffsebene im Anwendungsbereich zu schützen. Eine Datenbankanpassung sollte nur vom qualifizierten Fachpersonal durchgeführt werden, nachdem geprüft wurde, dass eine aktuelle (funktionierende) Datenbanksicherung vorliegt.

Nachfolgend soll beispielhaft die Einrichtung einer Onlinesicherung beim Microsoft SQL-Server beschrieben werden. Für andere Datenbanken bzw. Sicherungsagenten von Backup-Lösungen informieren Sie sich in der Dokumentation der Hersteller. Speziell bei Microsoft SQL-Datenbanken sollte darauf geachtet werden, dass die Transaktionsprotokolle regelmäßig gesichert und abgeschnitten werden um Speicherplatz freizuschaffen. Bei Plattenplatzmangel kann es zu Fehlern bei der Sicherung kommen. Eine Wiederherstellung der Datenbank ist damit nicht mehr gewährleistet. Bewahren Sie gesicherte Dateien für eine für Ihre Umgebung angemessene Zeitspanne auf.

Sicherung für den MS SQL Server

Sicherungen werden in Form von Wartungsplänen im Microsoft SQL Server konfiguriert. Je nach Microsoft SQL-Server-Version kann die Einstellung und Aktivierung unterschiedlich sein. Eine detaillierte Erklärung der einzelnen Optionen können Sie der Dokumentation des installierten Microsoft SQL-Servers entnehmen.

Zu jedem Wartungsplan kann ein Zeitplan konfiguriert werden, durch den Sie den Zeitpunkt und die Frequenz der Sicherung steuern können. Hier ein Beispiel aus dem Microsoft SQL-Management Studio unter Verwaltung >Wartungspläne:

Archivmedien

Auch Archivmedien wie Dateiverzeichnisse, WORMs, DVDs und CDs sollten für den Fall mechanischer Fehler oder Diebstahl gesichert werden.

Dazu bieten sich mehrere Varianten an:

  • Duplizierung der Medien über Funktionen des Speichersystems (wenn vorhanden)
  • Spiegelung der Medien im Anwendungs-Server auf einen anderen Speicherpfad, der vorzugsweise auf einem anderen physikalischen Geräten liegt.
  • Kopieren des Archivmediums im Windows-Explorer

OPTIMAL SYSTEMS rät dringend dazu, Spiegel-oder Backup-Medien bei der Archivierung zu erzeugen. In jedem Falle muss gesichert sein, dass ein wiederherstellbares Duplikat der Medien auf einem anderen Gerät oder Ort existieren. Bewahren Sie die Medien für eine für Ihre Umgebung angemessene Zeitspanne auf.

Virtuelle / externe Archivserver

Im Fall von virtuellen / externen Archivservern existieren keine Medien. Es werden lediglich Referenzen auf das Dokument im Fremdsystem gespeichert. Die Sicherung sollte daher im Standort über die Replikationsmechanismen des jeweiligen Speichersystems erfolgen. Im Falle von redundanten Systemen kann die Spiegelung auch über einen mögliche Multi-Konfiguration erfolgen (iTernity Multihead, Centera Multi Storage). Sollte es hierzu keine Möglichkeiten geben, sind Backups und deren Sicherung notwendig.

Weitere Komponenten

OPTIMAL SYSTEMS stellt eine Reihe von Zusatzkomponenten und Diensten zur Verfügung. Von diesen müssen mindestens die Konfigurationen gesichert werden. Bei bestimmten Komponenten ist es ratsam, die gespeicherten Daten zu sichern.

Für alle Fremdkomponenten, wie z. B. Elasticsearch und ABBYY FineReader gilt: informieren Sie sich über die Dokumentation der Hersteller über die Sicherungsstrategien.

Sicherungsstrategie

Für den konsistenten Zustand des enaio®-Systems ist eine Sicherung der Daten in den Diensten nicht zwingend notwendig. Alle Daten sind jederzeit wiederherstellbar. Es kann jedoch zeit- und ggf. auch (im Falle von z. B. FineReader-Lizenzen) kostenaufwändig sein, Daten vollständig zu reproduzieren. Es kann also sinnvoll sein, bereits erzeugte Text-oder Vorschaudaten für eine schnelle Wiederherstellung zu sichern. Allerdings muss beachtet werden, dass es sich unter Umständen um größere Datenmengen handeln kann.

Komponente

Zu sichernde Daten

Volltext

Volltextindex: der Pfad zum Volltextindex wird bei der Installation angegeben und ist in der Konfigurationsdatei elasticsearch.yml aus dem Verzeichnis …\services\OS_ServiceManager\elasticsearch\config\ eingetragen.

Backups sollten Anhand der Dokumentation von Elasticsearch durchgeführt werden.

Ab Version 7.10 befinden sich die zu sichernden Texte zum Befüllen des Volltextindex im Data\Backup\-Verzeichnis von enaio® documentviewer.

enaio® documentviewer

Die Konfiguration im Verzeichnis …\Services\OS_DocumentViewer\webapps\renditionplus\WEB-INF\classes\config\

(Bis Version 8.0 liegt die Konfiguration im Verzeichnis …\Services\OS_DocumentViewer\webapps\osrenditioncache\WEB-INF\classes\config\).

Das CACHE-Verzeichnis muss nicht gesichert werden, es baut sich automatisch wieder auf.

Ausnahme bildet dort das Cache\Backup-Verzeichnis mit den Textdateien für die Volltextindizierung (laufende Sicherung) und das fts-archive-Verzeichnis (einmalige Sicherung).

Microservices

Sicherung des Verzeichnisses…\services\service-manager\config\ mit den Konfigurationen.

enaio® gateway

Die Konfiguration im Verzeichnis …\services\OS_Gateway\apps\os_gateway\config\

enaio® appconnector

Die Konfiguration im Verzeichnis …\Services\OS_AppConnector\configuration\

enaio® exchange

Die Konfigurationsdateien im OSEXCHANGE-Server-und-Admin-Verzeichnis sowie alle weiteren Konfigurationsdateien

enaio® communicator      

Hier sollte mindestens das CFG-Verzeichnis gesichert werden.

Sofern die Importdaten auch gesichert werden sollen, dann noch das konfigurierte DAT-bzw. Journal-Verzeichnis