Der Backup-Service der ZEDAT

Das Speichern von Informationen auf maschinenlesbaren Datenträgern erzeugt naturgemäß die Frage nach seiner Zuverlässigkeit.

Verluste von Information sind häufig mit erheblichen zeitlichen, wirtschaftlichen und auch reputativen Verlusten verbunden, da der Aufwand zum Wiederherstellen einer verlorenen Information oft weit höher liegt als der Aufwand zu ihrem ursprünglichen Entstehen. Beispielsweise Fotos der ESA-Marssonde.

Deshalb haben Methoden zur Vorbeugung gegen Datenverluste in der Informationsverarbeitung eine wichtige Funktion.

Ursachen für Datenverluste können sowohl im Ausfall von Speichertechnik als auch in menschlichem Fehlverhalten liegen.

Da Informationen auf Datenverarbeitungsanlagen in Form von Dateien (engl: Files) gespeichert werden, stellt Informationsverlust entweder eine unbeabsichtigte oder technisch bedingte Veränderung eines Files oder den Verlust eines Files (oder einer Menge von Files) dar.

Zur Vorbeugung gegen technisch bedingte Verluste gibt es eine Vielzahl von Methoden, z.B. das redundante Speichern auf sog. RAID-Plattensystemen. Gegen menschliches Fehlverhalten schützt i.a. nur das Aufbewahren von Dateikopien über einen längeren Zeitraum.

Da das Aufbewahren von Kopien auf Wechselmedien wie Magnetbändern kostengünstiger und sogar zuverlässiger ist als das Speichern der Originaldaten auf Festplatten, wird die gleiche Technologie auch verwendet, um Daten längerfristig für eine spätere Verarbeitung zu lagern (zu archivieren).

Die ZEDAT bietet zur Datensicherung und Archivierung einen Backup- und Archiv-Service an. Diesen Dienst können zur Zeit Rechner mit allen gängigen Betriebssystemen in Anspruch nehmen.

Der Backup-Dienst wird von der ZEDAT nicht für Einzelbenutzer oder einzelne Administratoren sondern für die Einrichtungen der Freien Universität insgesamt angeboten. Dazu benennen die Fachbereiche jeweils einen Partner für die ZEDAT, der durch die ZEDAT qualifiziert wird und die Rechner-Administratoren und Benutzer im Fachbereich betreut. Interessenten wenden sich bitte an den IT-Verantwortlichen ihres Fachbereiches.

Der Backup- und Archiv-Service wird technisch durch einen Linux-Rechner in der ZEDAT erbracht (Backup-Server), auf dem die Backup-Serversoftware läuft. Die Handhabung der Clientsoftware ergibt sich aus den Handbüchern und manpages und unseren FAQs. Für die Installation lassen wir Ihnen per URL die Software und eine Installationsanleitung zukommen.

Der Backup- und Archiv-Service an der Freien Universität wird mit Hilfe des Produktes NetBackup der Firma Symantec (EX-Veritas, EX-Open Vision) erbracht.

NetBackup unterscheidet zwischen dem Backup-Server und den Backup-Clienten (Rechner, die diesen Dienst in Anspruch nehmen).

Die kleinste unteilbare Einheit eines Backups ist die Datei, d.h. es werden immer vollständige Dateien (Files) auf dem Server aufbewahrt. Das Ändern einer Datei führt beim inkrementellen Backup (s. u.) zu ihrem vollständigen Kopieren auf den Server.

Der Backup- und Archiv-Service beinhaltet:

  • das automatische (servergesteuerte) Anfertigen von Full Backups von Filesystemen, Dateibäumen oder Listen von Filesystemen und Dateibäumen entsprechend einem zentral festgelegten Zeitplan. In Absprache mit dem Administrator der Clientenrechner legen die Administratoren des Servers diesen Zeitplan so fest, daß sowohl der Leistungsfähigkeit der Servers und des Rechnernetzes als auch den Nutzungsbedingungen des Clienten möglichst Rechnung getragen wird.

  • das automatische (servergesteuerte) Anfertigen von inkrementellen Backups obiger Filesysteme oder Dateibäume entsprechend einem zentral festgelegten Zeitplan. Ein inkrementelles Backup bezieht sich immer auf das zuletzt angelegte inkrementelle Backup oder auf das letzte Full Backup, falls es jünger ist als das letzte inkrementelle Backup.

  • das vom Benutzer eines Clients angeforderte Backup eines Dateibaumes (sog. User Backup). Das Anlegen eines derartigen Backups wird durch den Server gesteuert und erfolgt zu einem Zeitpunkt, an dem die Last des Servers dieses erlaubt. Der Benutzer muß Lesezugriff auf die betreffenden Dateien haben. Der Benutzer kann sich über den Fortgang bzw. die Fertigstellung des Backups informieren.

  • das vom Benutzer eines Clients angeforderte Archivieren eines Dateibaumes (sog. User Archiv). Es unterscheidet sich vom nutzergeforderten Backup dadurch, daß die Originaldateien nach dem Kopieren auf den Server auf dem Clienten gelöscht werden! Dazu muß der Benutzer Lese- und Schreibzugriff auf die betreffenden Dateien und Verzeichnisse haben.

  • Information eines Benutzers über existierende Backups oder Archive. Dazu muß der Benutzer auf die betreffenden Verzeichnisse zum Zeitpunkt des Anlegens des Backup Lesezugriff gehabt haben.

  • Retrievel (Wiederherstellen auf dem Clienten-Rechner) von Dateien und Dateibäumen. (Backups von Filesystemen stellen in diesem Zusammenhang auch Dateibäume dar.). Das Retrievel erfolgt i.a. nur auf den Client-Rechner, von dem das Backup (Archiv) angefertigt wurde. Wahlweise kann es an die ursprüngliche Stelle oder einen alternativen Suchpfad zurückgestellt werden. Dabei werden bezüglich der Zugriffsrechte die UNIX-Konventionen eingehalten, z.B. kann ein Benutzer Dateien zurückspielen lassen, wenn ihm diese zum Zeitpunkt des Backups nicht gehört haben. Das muß dann aber an eine alternative Stelle erfolgen und die so wiederhergestellten Dateien gehören dann dem anfordernden Benutzer.

Um den Backup- und Archivservice nutzen zu können, müssen folgende Voraussetzungen erfüllt sein:

  • Auf dem Client muß die Client Software installiert sein. Das geschieht i.a. in "/usr/openv/netbackup`` . Die Programmdateien stehen dann in "/usr/openv/netbackup/bin``. Ferner ist eine Ergänzung in der Konfiguration des Internet-daemon erforderlich.

  • Auf dem Server muß mindestens eine sog. Backup-Policy existieren, in die der Client mit den zu sichernden Filebäumen und dem Zeitplan für automatische Backups sowie Zeitfenster für Nutzer-Aufträge (Anlegen von Backups oder Archiven) eingetragen sind. Informationsdienste und Retrievel kann zu jedem beliebigen Zeitpunkt angefordert werden.

Der Backup-Server verwaltet sowohl die angelegten Backup-Dateien als auch eine Datenbank mit den Metadaten (Beschreibungsdaten zum Wiederfinden von Dateien in den Backups). Die Backup-Dateien auf dem Server haben ein tar-ähnliches Format, so dass auch bei Totalverlust der Backup-Software auf die Daten zugegriffen werden kann. Die Metadaten Ihrer Backups auf dem Backup-Server sind in einem binären-Format abgelegt, können aber in ein ASCII-Format gedumpt werden. NetBackup stellt auf Ihrem Backup-Client entsprechende Software zur Verfügung, neben den GUIs (jbpSA, bp, nbwin.exe) sind das auch CLI-Utilities, z.B. bpclimagelist und bplist. Um das Speichern der Backups wirtschaftlicher zu gestalten, werden die entsprechenden Dateien physikalisch ausgelagert, sind aber mir kurzer Latenz jederzeit zugreifbar:

Die Backup-Dateien werden (abhängig von Größe und Alter) aus dem Plattenspeicher auf Magnetbandkassetten ausgelagert. Die Verwaltung der Magnetbandkassetten geschieht technisch mit einem Roboter und einer sog. Migrationssoftware, so daß jederzeit ohne Bedienereingriff ein Backup online bereitgestellt werden kann. Der Benutzer stellt lediglich anhand der Wartezeit (in der Regel 1 bis 3 Minuten) auf ein Retrievel fest, ob die Backup-Dateien migriert waren.

Zur Zeit werden für das Auslagern Ultrium2 und Ultrium4-Magnetbandkassetten und ein Roboter der Firma Quantum (Ex-ADIC) verwendet. Als Migrationssoftware fungiert DMF der Firma SGI.

Die Metadaten werden ständig online gehalten, allerdings werden sie nach Erreichen eines gewissen Alters komprimiert. Kurze Wartezeiten auf einen Informationsdienst können sowohl auf dem Umfang der zu durchZEDAT/suchenden Metadaten als auch auf Dekompression zurückzuführen sein.

NetBackup-Werkzeuge für den Benutzer

Dem Benutzer stehen sowohl kommandozeilenorientierte Werkzeuge als auch eine X-basierte Oberfläche zur Nutzung des Dienstes zur Verfügung, die alle unter dem Pfad /usr/openv/netbackup/bin/ abgelegt sind.

Diese Werkzeuge sind:

bp - ein menübasiertes Interface

bpbackup - erzeugt User-Backups und übergibt diese dem Server

bplist - listet auf dem Backup Server gespeicherte Dateien

bpclimagelist - listet chronologisch die Backup-Historie auf

bprestore - Veranlasst das Retrievel von Dateien oder Dateibäumen

Das java-basierte Benutzer-GUI heißt jbpSA. Hier wird der Benutzer mit Pull Down Menüs zur Lösung seiner Aufgabe geführt. jbpSA nimmt Aufträge zum Nutzer-Backup, Nutzer-Archiv und zum Retrievel entgegen und leitet diese zur Ausführung an den Server weiter. Es informiert über existierende Backups für Dateien und über den Fortgang angeforderter Server-Dienste (Backup, Archiv, Retrievel). Das GUI für MS-Windows Rechner heißt nbwin.exe und ist über das Startmenü erreichbar (Startmenü - Programme - VERITAS - NetBackup - Backup, Archive & Restore).

Fragen an den Backup-Service richten Sie bitte an:
fab-service@zedat.fu-berlin.de