Der Backup-Service der ZEDAT

Das Speichern von Informationen auf maschinenlesbaren Datenträgern erzeugt naturgemäß die Frage nach der Zuverlässigkeit.

Verluste von Information sind häufig mit erheblichen zeitlichen, wirtschaftlichen und auch reputativen Verlusten verbunden, da der Aufwand zum Wiederherstellen einer verlorenen Information oft weit höher liegt als der Aufwand zu ihrem ursprünglichen Entstehen. Beispielsweise Fotos der ESA-Marssonde.

Deshalb haben Methoden zur Vorbeugung gegen Datenverluste in der Informationsverarbeitung eine wichtige Funktion. Ursachen für Datenverluste können sowohl im Ausfall von Speichertechnik als auch in menschlichem Fehlverhalten liegen.

Da Informationen auf Datenverarbeitungsanlagen in Form von Dateien (engl.: Files) gespeichert werden, stellt Informationsverlust entweder eine unbeabsichtigte oder technisch bedingte Veränderung eines Files oder den Verlust eines Files (oder einer Menge von Files) dar.

Zur Vorbeugung gegen technisch bedingte Verluste gibt es eine Vielzahl von Methoden, z.B. das redundante Speichern auf sog. RAID-Plattensystemen. Gegen menschliches Fehlverhalten schützt i.a. nur das Aufbewahren von Dateikopien über einen längeren Zeitraum.

Da das Aufbewahren von Kopien auf Wechselmedien wie Magnetbändern kostengünstiger und sogar zuverlässiger ist als das Speichern der Originaldaten auf Festplatten, wird die gleiche Technologie auch verwendet, um Daten längerfristig für eine spätere Verarbeitung zu lagern (zu archivieren).

Die ZEDAT bietet zur Datensicherung und Archivierung einen Backup- und Archiv-Service an. Diesen Dienst können zurzeit die Adminisstrierenden von Rechnern mit allen gängigen Betriebssystemen in Anspruch nehmen.

Der Backup-Dienst wird von der ZEDAT nicht für Einzelpersonen, sondern für die Einrichtungen der Freien Universität insgesamt angeboten. Dazu benennen die Fachbereiche jeweils eine Person, die dann durch die ZEDAT qualifiziert wird und anschließend die Betreuung im jeweiligen Bereich übernimmt. Interessierte wenden sich bitte an die IT-Beauftragten ihres Fachbereiches.

Der Backup- und Archiv-Service wird technisch durch einen Linux-Rechner in der ZEDAT erbracht (Backup-Server), auf dem die Backup-Serversoftware läuft. Die Handhabung der Clientsoftware ergibt sich aus den Handbüchern und Manpages und unseren FAQs. Für die Installation lassen wir Ihnen per Download-Link die Software und eine Installationsanleitung zukommen.

Der Backup- und Archiv-Service an der Freien Universität wird mithilfe des Produktes NetBackup der Firma Veritas erbracht. NetBackup unterscheidet zwischen dem Backup-Server und den Backup-Clients (Rechner, die diesen Dienst in Anspruch nehmen).

Die kleinste unteilbare Einheit eines Backups ist die Datei, d.h. es werden immer vollständige Dateien (Files) auf dem Server aufbewahrt. Das Ändern einer Datei führt auch beim inkrementellen Backup (s. u.) zu ihrem vollständigen Kopieren auf den Server.

Der Backup- und Archiv-Service beinhaltet:

  • das automatische (servergesteuerte) Anfertigen von Full Backups von Filesystemen, Dateibäumen bzw. einer Liste von Filesystemen und Dateibäumen entsprechend einem zentral festgelegten Zeitplan. In Absprache mit den Administrierenden der Clientrechner legt die ZEDAT diesen Zeitplan so fest, dass möglichst sowohl der Leistungsfähigkeit von Server und Rechnernetzes als auch den Nutzungsbedingungen des Clients Rechnung getragen wird.

  • das automatische (servergesteuerte) Anfertigen von inkrementellen Backups obiger Filesysteme oder Dateibäume entsprechend einem zentral festgelegten Zeitplan. Ein inkrementelles Backup bezieht sich immer auf das zuletzt angelegte Backup.

  • das aktiv veranlasste Backup eines Dateibaumes (sog. User Backup). Das Anlegen eines derartigen Backups wird durch den Server gesteuert und erfolgt zu einem Zeitpunkt, an dem die Last des Servers dieses erlaubt. Es können nur Daten gesichert werden, für die (lesende) Zugriffsberechtigungen vorliegen. Über den Fortgang bzw. die Fertigstellung des Backups kann man sich ggf. vom System informieren lassen.

  • das aktiv veranlasste Archivieren eines Dateibaumes (sog. User Archiv). Es unterscheidet sich vom User Backup dadurch, dass die Originaldateien nach dem Kopieren auf den Server auf dem Client gelöscht werden! Es können nur Daten archiviert werden, für die (lesende und schreibende) Zugriffsberechtigungen vorliegen.

  • Information eines Benutzenden über existierende Backups oder Archive. Dazu muss zum Zeitpunkt des Anlegens des Backup die Berechtigung zum Lesezugriff auf die betreffenden Verzeichnisse bestanden haben.

  • Retrieval (Wiederherstellen auf dem Client-Rechner) von Dateien und Dateibäumen. (Backups von Filesystemen stellen in diesem Zusammenhang auch Dateibäume dar.). Das Retrieval erfolgt i.A. nur auf genau den Client-Rechner, von dem das Backup (Archiv) angefertigt wurde. Wahlweise kann es an die ursprüngliche Stelle oder einen alternativen Suchpfad zurückgestellt werden. Dabei werden bezüglich der Zugriffsrechte die UNIX-Konventionen eingehalten, z.B. kann man Dateien auch zurückspielen lassen, wenn einem diese zum Zeitpunkt des Backups nicht gehört haben. Das muss dann aber an eine alternative Stelle erfolgen und die so wiederhergestellten Dateien gehören dann dem anfordernden Account.

Um den Backup- und Archivservice nutzen zu können, müssen folgende Voraussetzungen erfüllt sein:

  • Auf dem Client muss die Client-Software installiert sein. Das geschieht i.a. in "/usr/openv/netbackup" bzw. in "C:\Program Files\VERITAS\Netbackup\". Die Programmdateien befinden dann in ".../netbackup/bin/". Ferner ist eine Ergänzung in der Konfiguration des Internet-Daemon erforderlich.

  • Auf dem Server muss mindestens eine sog. Backup-Policy existieren, in die der Client mit den zu sichernden Filebäumen und dem Zeitplan für automatische Backups sowie Zeitfenster für interaktive Aufträge (Anlegen von Backups oder Archiven) eingetragen sind. Informationsdienste und Retrieval können zu jedem beliebigen Zeitpunkt angefordert werden.

Der Backup-Server verwaltet sowohl die angelegten Backup-Dateien als auch eine Datenbank mit den Metadaten (Beschreibungsdaten zum Wiederfinden von Dateien in den Backups). Die Backup-Dateien auf dem Server haben ein tar-ähnliches Format, sodass auch bei Totalverlust der Backup-Software auf die Daten zugegriffen werden kann. Die Metadaten Ihrer Backups auf dem Backup-Server sind in einem binären-Format abgelegt, können aber in ein ASCII-Format ausgegeben werden. NetBackup stellt auf Ihrem Backup-Client entsprechende Software zur Verfügung, neben den GUIs (jbpSA, bp, nbwin.exe) sind das auch CLI-Utilities, z.B. bpclimagelist und bplist. Um das Speichern der Backups wirtschaftlicher zu gestalten, werden die entsprechenden Dateien physikalisch ausgelagert, sind aber mir kurzer Latenz jederzeit zugreifbar:

Die Backup-Dateien werden (abhängig von Größe und Alter) aus dem Plattenspeicher auf Magnetbandkassetten ausgelagert. Die Verwaltung der Magnetbandkassetten geschieht technisch mit einem Roboter und einer sog. Migrationssoftware, sodass jederzeit ohne Bedienereingriff ein Backup online bereitgestellt werden kann. Der Benutzer stellt lediglich anhand der Wartezeit (in der Regel 1 bis 3 Minuten) auf ein Retrieval fest, ob die Backup-Dateien migriert waren.

Zurzeit werden für das Auslagern Ultrium-Magnetbandkassetten verschiedener Generationen und ein Roboter (Tape-Library) der Firma Quantum verwendet. Als Migrationssoftware fungiert DMF der Firma HPE.

Die Metadaten werden ständig online gehalten, allerdings werden sie nach Erreichen eines gewissen Alters komprimiert. Kurze Wartezeiten auf einen Informationsdienst können sowohl auf dem Umfang der zu durchsuchenden Metadaten als auch auf Dekompression zurückzuführen sein.

NetBackup-Werkzeuge für Benutzende

Es stehen sowohl kommandozeilenorientierte Werkzeuge als auch eine X-basierte grafische Oberfläche zur Nutzung des Dienstes zur Verfügung, die alle unter dem Pfad /usr/openv/netbackup/bin/ abgelegt sind.

Diese Werkzeuge sind:

  • bp - ein menübasiertes Interface
  • bpbackup - erzeugt User-Backups und übergibt diese dem Server
  • bplist - listet auf dem Backup Server gespeicherte Dateien
  • bpclimagelist - listet chronologisch die Backup-Historie auf
  • bprestore - veranlasst das Retrieval von Dateien oder Dateibäumen

Das java-basierte GUI heißt jbpSA. Hier wird man mit Pull-down-Menüs zur Lösung seiner Aufgabe geführt. jbpSA nimmt Aufträge zum User-Backup, User-Archiv sowie zum Retrieval entgegen und leitet diese zur Ausführung an den Server weiter. Es informiert über existierende Backups für Dateien und über den Fortgang angeforderter Server-Dienste (Backup, Archiv, Retrieval). Das GUI für MS-Windows Rechner heißt nbwin.exe und ist über das Startmenü erreichbar (Startmenü - Programme - VERITAS - NetBackup - Backup, Archive & Restore).

Fragen an den Backup-Service richten Sie bitte an:
fab-service@zedat.fu-berlin.de