Suche

Von Gigabyte zu Terabyte

Thomas Birke, Rechenzentrum

Ein statistischer Überblick über die Datensicherung an der Universität Augsburg

erschienen Juni 2003 in: Augsburg
Verlag: Selbstverlag
ISSN 1435-1684


Seit Ende 1998 werden vom Rechenzentrum täglich die Daten aller Teilnehmer am campusweiten Benutzerund Datenmanagement gesichert. Neben den Naturwissenschaften (seit 1998 dabei) haben sich mit dem Jahreswechsel 2001/02 auch die Juristische Fakultät und die Wirtschaftswissenschaftliche Fakultät diesem bewährten System angeschlossen. Es ist also höchste Zeit, einen Zwischenbericht über die bisherige Entwicklung abzugeben und einen Ausblick in die Zukunft zu wagen.

Die heutigen Rechnersysteme sind häufig mit Festplatten von 80 GB und mehr ausgestattet, die Sicherung der sich darauf ansammelnden Datenmengen stellt die Inhaber der Geräte aber vor größere Probleme. Nicht zuletzt deshalb hat an der Universität Augsburg in den letzten Jahren in Sachen „Datenhaltung“ eine sanfte Rückbesinnung auf zentral organisierte, zuverlässige Dienstleistungen stattgefunden.

Die vom Rechenzentrum bereitgestellte Infrastruktur, das so genannte campusweite Benutzer- und Datenmanagement, versorgt alle Anwender mit einer einheitlichen Benutzerkennung samt dazugehörigem Passwort. Die Nutzer erhalten darüber hinaus von allen Systemen aus Zugriff auf die eigenen Daten im Homelaufwerk bzw. Homeverzeichnis oder in Projektverzeichnissen. Die Sicherung dieser server-gespeicherten Daten erfolgt im täglichen Rythmus durch das Rechenzentrum. Sie sorgt dafür, dass sich der Schaden im Fall des versehentlichen Datenverlusts durch Virenbefall, versehentliches Löschen oder andere „Unfälle“ in engen Grenzen hält und unnötige Daten, wie z.B. Betriebssystemsdaten, nicht ständig mitgesichert werden müssen.

Daten-GAU vermeiden

Beginnend mit dem Jahreswechsel 1998/99, d.h. seit etwa fünf Jahren, werden auf diese Weise die Dateien aller Teilnehmer gesichert. Nach der Sicherung sollen die gesicherten Daten dann, so sieht es unser Konzept eigentlich vor, über einen Zeitraum von einem Jahr hinweg abrufbar sein. Alle Sicherungen, die älter als ein Jahr sind, werden automatisch gelöscht. Leider musste aufgrund aktueller Engpässe (siehe unten) der Zeithorizont vor kurzem übergangsweise auf ein halbes Jahr reduziert werden.

In der Vergangenheit konnte das realisierte Konzept bereits mehrfach seine Zuverlässigkeit unter Beweis stellen, z.B. beim unglücklichen Ausfall eines kompletten RAID-Systems im Bereich der Physik. Innerhalb weniger Stunden waren die Nutzerdaten auf einem Ausweichsystem wieder hergestellt und die betroffenen Lehrstühle konnten mit dem Stand der letzten Sicherung, d.h. dem Stand vom Vortag, weiter arbeiten.

Neben den Anwenderdaten werden zusätzlich die wichtigsten zentralen Server- Systeme des Rechenzentrums gesichert. Ein Beispiel sind die vom Rechenzentrum für die verschiedenen Bereiche betriebenen Web-Server. Im Katastrophenfall ermöglicht dies ein schnelles Wiederaufsetzen ausgefallener Systeme und somit eine rasche Wiederherstellung der bestehenden Infrastruktur. Im weiteren Verlauf dieses Beitrags werde ich Ihnen einen Eindruck über die an der Universität Augsburg zu verarbeitenden Datenmengen vermitteln.

Rasantes Wachstum

Das in den Jahren 1996/97 geplante und 1998 beschaffte Backup-System hatte eine Grundkapazität von wenigen hundert Gigabytes (genau: 400 GB). Durch Datenkomprimierung auf den Bändern und manuelles Auslagern von Bändern wurde die effektive Kapazität von uns übergangsweise auf etwa ein Terabyte (TB) aufgestockt. (Zur Auffrischung: 1024 Gigabyte ergeben ein Terabyte.) Durch die oben beschriebenen Versorgungsaufgaben des Rechenzentrums platzte dieses System allerdings schnell aus allen Nähten. Ein aus eigenen Mitteln beschaffter Bandroboter schraubte die verfügbare Kapazität Anfang 2000 auf 3,6 TB. Durch Komprimierung der Daten beträgt das gesamte Fassungsvermögen für Backup-Daten derzeit gut 5,6 TB.

Ein Blick auf unsere aktuellen Statistiken zeigt, dass vom Rechenzentrum inzwischen die Daten von knapp 18.000 Anwendern gesichert werden müssen. Außerdem verraten die Belegungsdaten des Bandroboters schon wieder eine Auslastung von über 90% – und das obwohl der Zeithorizont für die Aufbewahrung zurückliegender Sicherungen schrittweise auf ein halbes Jahr verkürzt wurde. Eine geplante HBFG-Beschaffung soll in Kürze dieses Problem aus der Welt schaffen.

volumen
Abb. 1: Starker Anstieg der Datenmenge im Backup- System des Rechenzentrums.

Abbildung 1 verdeutlicht das Wachstum der regelmäßigen Datensicherungen um etwa den Faktor 2 pro Jahr. Diese Beobachtung, also die jährliche Verdoppelung der zu sichernden Daten, ist übrigens keine Augsburger Besonderheit, sondern steht im Einklang mit den Erfahrungen anderer deutscher Hochschulrechenzentren. Die Stagnation des Wachstums ab dem vierten Quartal 2002 ist auf den rückläufigen Zeithorizont bei der Aufbewahrung der gesicherten Daten zurückzuführen – das Fassungsvermögen des Bandroboters ist zur Zeit leider vollständig ausgeschöpft.

Nichts als Zahlen

Im letzten Jahr wurden vom Rechenzentrum pro Tag im Durchschnitt 25 GB an Nutzerdaten gesichert:

taeglichesicherung

Der durch diesen ständigen Zufluß verursachte Füllstand des Bandroboters beträgt derzeit in etwa 4,9 TB, der Rest wird von den Sicherungen wichtiger zentraler Server belegt:

fuellstand

Obwohl die Wirtschaftswissenschaften erst seit etwas über einem Jahr komplett in das campusweite Benutzer- und Datenmanagement integriert sind, beanspruchen sie mit 42% der Datenmenge inzwischen bereits den Löwenanteil bei der Datensicherung. Das Konzept ist an den Lehrstühlen offensichtlich gut angenommen worden. Auf Rang zwei folgt die Physik mit einem Anteil von 27% am gesamten Backup-Volumen. Die Studierenden (deren Daten derzeit nur 2x pro Woche gesichert werden) belegen knapp hinter der Informatik Platz vier der aktuellen „Speicher-Rangliste“.

Blick in die Zukunft Die seit Aufnahme des regulären Betriebs zum Jahreswechsel 1998/99 gesammelten Erfahrungen zeigen, dass an der Universität Augsburg für ein komplettes Ein- Jahres-Backup der Anwenderdaten derzeit ein Bedarf von rund 8,1 TB vorhanden ist. Für Sicherungen wichtiger Server und Systeme würden aktuell weitere rund 2 TB an Speicherplatz anfallen. Insgesamt müsste in einem ausreichend dimensionierten Backupsystem – den aktuellen Anforderungen entsprechend – Platz für momentan etwas mehr als 10 TB vorhanden sein. (Zur Veranschaulichung: Geht man davon aus, dass eine beschriebene Text-Seite 5 KB Daten enthält, ein Buch durchschnittlich ca. 500 Seiten umfasst, so ergeben 10 TB Daten einen Buchbestand von ca. vier Millionen Bänden. Dies entspricht in etwa dem doppelten Buchbestand der Universitäts- Bibliothek aus dem Jahr 2001!)

Da diese gut 10 TB die Speicherkapazität des vorhandenen Systems (ca. 5,6 TB) deutlich übersteigt, muss über einen HBFG-Antrag zur Erweiterung der Sicherungsumgebung schnellstmöglich Abhilfe geschaffen werden. Das neue Sicherungssystem soll ein Fassungsvermögen von (zunächst) 30 TB haben. Der neue Bandroboter soll jedoch leicht erweiterbar sein, um schnell auf die wachsenden Ansprüche reagieren zu können. Damit können wir Ihnen dann auch in Zukunft versprechen, dass Ihre Daten bei uns in guten Händen sind. Verlassen Sie sich darauf!


Downloads: