Suche

Parallelrechner IBM RS/6000 SP

Markus Zahn, Rechenzentrum

Parallele Rechenleistungs-Ressource für die Wissenschaftler der Universität

erschienen Februar 1998 in: Augsburg
Verlag: Selbstverlag
ISSN 1435-1684


Nach der Genehmigung durch das Bayerische Staatsministerium für Unterricht, Kultus, Wissenschaft und Kunst am 16. Juli 1997 konnte vom Rechenzentrum der Universität Augsburg ein Parallelrechner vom Typ IBM RS/6000 SP beschafft werden. Der Rechner wurde inzwischen an die Universität ausgeliefert und vom Rechenzentrum in Zusammenarbeit mit IBM im Maschinensaal des Rechenzentrums in Betrieb genommen. Dieser Artikel vermittelt einen Überblick über die technische Ausstattung, die Softwarekonfiguration und die Zugangsmöglichkeiten zu dieser parallelen Rechenleistungs-Ressource. Ein entsprechender Kurs des Rechenzentrums wird vor Beginn des Sommersemesters in die Betriebskonzepte und die Programmierung der IBM SP einführen (siehe Lehrveranstaltungen).

Technische Details

Der auf wesentliches Betreiben der Physik, der Informatik und der Mathematik für die Universität beschaffte Rechner umfaßt in der jetzigen Ausbaustufe 14 Prozessoren, von denen jeder für sich eine Hochleistungs-Workstation darstellt. Die Maschine könnte - die entsprechenden finanziellen Mittel vorausgesetzt - auf bis zu 256 Knoten erweitert werden. Die 14 Knoten unseres Parallelrechners gehören zu den erst seit Ende 1997 verfügbaren "160MHz Thin Nodes", welche einen mit 160MHz getakteten "POWER2 Super Chip" Prozessor mit "128KB data/32KB instruction L1-Cache" besitzen. Ein einziger Knoten dürfte damit je nach Anwendungsgebiet die zwei- bis dreifache Rechenkapazität der stärksten bisher an der Universität verfügbaren Workstations besitzen. Das Gesamtsystem besitzt insgesamt eine Spitzenleistung von neun Gigaflops, das sind neun Milliarden Fließkomma-Operationen pro Sekunde. Jeder Knoten verfügt über eine eigene 4,5GB Festplatte und 256MB Hauptspeicher, der Zugangsknoten ist abweichend davon mit 512MB Hauptspeicher, einer ATM-Schnittstelle und einem zusätzlichen 18GB SSA-Platten-Array ausgestattet. Die einzelnen Knoten kommunizieren miteinander über den sogenannten "SP Switch", ein extrem leistungsfähiges Verbindungsnetzwerk, das eine bidirektionale Datentransferrate von bis zu 110MB/s zwischen je zwei Knoten erlaubt.

Software

Die gesamte Anlage wird vollständig integriert unter IBMs Unix-Variante (AIX V4.2.1) und dem Distributed Computing Environment (DCE) betrieben. Zur Steuerung des Batch-Betriebs wird der IBM LoadLeveler eingesetzt. Die mitgelieferten "Parallel System Support Programs" (PSSP V2.3) ermöglichen das reibungslose Zusammenspiel der einzelnen Knoten sowie eine effiziente Administration des Gesamtsystems. Für Anwendungs-Entwickler steht vor allem das Parallel Environment, ebenfalls in der neuen Version 2.3, zur Verfügung.

Das Distributed Computing Environment der Open Software Foundation (OSF) ist ein Netzwerk-Betriebssystem, das auf den einzelnen Knoten des Parallelrechners für eine einheitliche Benutzerverwaltung sowie ein einheitliches, netzwerktransparentes Dateisystem sorgt. Ferner können auf Basis von DCE verteilte Anwendungen, das sind Anwendungen, die auf mehreren Knoten eines Rechnernetzes ablaufen, entwickelt werden. Das in DCE integrierte Distributed File System (DFS) stellt sich dem Nutzer als ein globales Filesystem dar und bietet gegenüber z.B. NFS-Filesystemen enorme Vorteile bei Administration, Sicherheit, Verfügbarkeit und Performance. Der Anwender hat von allen in DCE integrierten Rechnern die gleiche Sicht auf das Dateisystem, d.h. er muß sich u.a. nicht mehr darum kümmern, wo seine Daten physikalisch abgespeichert sind oder ob z.B. sein Home-Verzeichnis auf dem Rechner, den er im Moment nutzt, "gemounted" ist oder nicht. Der Benutzer kann sich vielmehr darauf verlassen, daß seine Daten auf allen Rechnern innerhalb der DCE-Zelle in der gleichen Art und Weise verfügbar sind!

Mit dem IBM LoadLeveler (LL) wird der Batch-Betrieb der Maschine gesteuert, d.h. die auszuführenden Programme werden in eine Warteschlange eingereiht und gestartet, sobald die angeforderten Ressourcen verfügbar sind. Die Vorteile für die Anwender liegen auf der Hand: Sie müssen sich nicht mehr vor Ort um den Start ihrer Anwendungen kümmern, der LoadLeveler übernimmt die Zuteilung der benötigten Ressourcen eigenverantwortlich. Siehe dazu auch den Beitrag "Rechnernetzwerk - Netzwerkrechner" in connect 1/1997.

Für die Programmierung steht im wesentlichen das Parallel Environment (PE) zur Verfügung. Diese Programmierumgebung enthält Hilfsmittel zur Entwicklung, zum Testen und Analysieren sowie zur Ausführung paralleler bzw. verteilter Programme. Highlights sind sicher die thread-verträgliche Implementierung des "Message Passing Interface" (MPI) und das "Low-level Application Programming Interface" (LAPI).

Ergänzt wird das Angebot für Programmierer durch die entsprechenden Compiler: C, C++, Fortran sowie High Performance Fortran (HPF). Für die "Scientific-Computing" Anwender steht mit der "Parallel Engineering and Scientific Subroutine Library" (PESSL) zusätzlich ein Satz von schnellen mathematischen Funktionen zur Verfügung.