Studentenrabatt

Bestellung & Service
041 318 40 00

Biozentrum Universität Basel - «Beowulf» Cluster und GPFS

Biozentrum Basel Header

Das Biozentrum in Kürze

DIE DYNAMIK DES LEBENS

Seit rund 30 Jahren betreibt das Biozentrum Grundlagenforschung auf dem Gebiet der modernen Biologie und hat sich mit wissenschaftlichen Publikationen und Auszeichnungen sowie seinem neuartigen interdisziplinären Konzept weltweit einen Namen gemacht. Das Departement der Universität Basel befasst sich mit Zell- und Strukturbiologie, molekularer Mikrobiologie, Biochemie, Biophysik, Pharmakologie und Neurobiologie. Zu den neuen Disziplinen gehört unter anderem die Bioinformatik. 35 Forschungsgruppen mit Mitarbeitern aus über 30 Nationen untersuchen biologische Vorgänge auf molekularer Ebene und erforschen dabei auch Krankheiten, die durch Bakterien und Viren ausgelöst werden oder genetisch bedingt sind. Insgesamt sind am Biozentrum rund 430 Personen beschäftigt oder in Ausbildung. www.biozentrum.unibas.ch

ImBiozentrum der Universität Basel führen die Bioinformatiker am Computer täglich Zehntausende von Simulationen durch und erzeugen Millionen von Daten. IBM bietet eine flexible IT-Lösung.

InhibitorWenn das Dengue-Virus menschliche Körperzellen befällt, setzt es alles daran, sich dort möglichst schnell auszubreiten. Diesem Vermehrungsprozess will nun das Biozentrum in Basel einen «Riegel vorschieben». Ziel eines internationalen Kooperationsprojekts ist es, einen passenden Wirkstoff zu entwickeln.
Der Auslöser des sogenannten «Knochenbrecher-Fiebers» ist weltweit auf dem Vormarsch. 50 bis 100 Millionen Menschen, vor allem in einkommensschwachen Ländern, erkranken jedes Jahr an dieser Krankheit. Deshalb sind effiziente und kostengünstige Konzepte in der Forschung gefragt. Um Zeit und Aufwand im Labor zu sparen, treten die Bioinformatiker auf den Plan: Sie modellieren zunächst die dreidimensionale Struktur von Proteinen des Dengue-Virus am Computer und versuchen so, anhand von Simulationen dessen Funktion zu verstehen.

DAS VIRUS AUSTRICKSEN

Das Virus, das von Insekten übertragen wird, ist clever: Es wird vom menschlichen Körper nicht schnell genug als Fremdkörper erkannt und kann sich unbemerkt in den Zellen des Organismus einnisten. Mit eigenen Werkzeugen versucht der Erreger dort seine Erbsubstanz zu vervielfältigen, um sich zu vermehren. Hier greift auch das Biozentrum in die Trickkiste: Gezielt suchen die Bioinformatiker nach speziellen chemischen Molekülen. Die sogenannten Inhibitoren heften sich wie Klebstoff genau dort an die Werkzeuge des Virus, wo diese sonst ihre Funktion verrichten. Damit soll die Reproduktion des Virus blockiert werden.
Die Identifikation eines passenden Inhibitors ist quasi die Vorstufe zur Entwicklung eines Medikaments. Doch der Selektions- und Evaluationsprozess ist wie die Suche nach der Nadel im Heuhaufen. Die Computer-Simulation möglicher Wechselwirkungen mit dem Virus-Protein ist entsprechend aufwendig und kann von wenigen Sekunden bis zu mehreren Stunden pro Molekül dauern. Die Bioinformatiker greifen dabei auf eine öffentliche Datenbank mit mehreren Millionen bereits bekannter Moleküle zurück. Bisher wurden 300 Kandidaten am Computer ausgewählt und anschliessend im Labor getestet. Die Strategie geht auf: Bereits wurden mehrere neue Inhibitoren entdeckt, die jetzt weiter untersucht werden.
"Wir verstehen uns als Wissenschaftler, die den Computer genauso als Instrument für die biologische Forschung einsetzen wie
die Mikrobiologen das Mikroskop", erklärt Torsten Schwede, Leiter einer von insgesamt vier Bioinformatik-Forschungsgruppen am Biozentrum und Mitglied im Vorstand des Schweizerischen Instituts für Bioinformatik.

STRUKTUREN AM COMPUTER SIMULIEREN

Um herauszufinden, wie ein Protein funktioniert und interagiert, müssen es die Biologen verändern, indem sie beispielsweise gewisse Funktionen gezielt ausschalten, ohne das Protein dabei zu zerstören oder zu beeinträchtigen. Eine knifflige Aufgabe, an der die Bioinformatiker mitarbeiten, indem sie Proteinstrukturen, die experimentell noch nicht aufgeklärt wurden, vorhersagen und am Computer modellieren. Schwede: " Über den SWISS-MODEL-Server erhalten wir von Forschern weltweit täglich rund 1 500 Anfragen zur Berechnung von Proteinmodellen." Die Gene enthalten in ihrer Erbsubstanz, der DNA, den Bauplan für Proteine. Sequenz für Sequenz gehen hier die Bioinformatiker auch Erbkrankheiten auf den Grund. "Allein die Tatsache, dass in einer Zelle Tausende von Genen aktiv sind, die wiederum Tausende von Proteinen produzieren, die sich gegenseitig beeinflussen, lässt die Komplexität und Fülle der Forschungsmöglichkeiten nur erahnen", betont Schwede.

DATEN WACHSEN EXPONENTIELL AN

Täglich generieren die Bioinformatiker im Rahmen ihrer Forschung grosse Datenmengen. Bereits heute sind die Grenzen der verfügbaren Speicherressourcen erreicht. Dennoch verdoppelt sich die Zahl der abzulegenden Daten alle 18 Monate. Damit nicht genug: Mit dem technologischen Fortschritt wachsen auch jene Daten exponentiell an, welche die Kollegen aus der experimentellen Biologie produzieren: "Früher wurde jede Veränderung an Zellen unter dem Mikroskop beobachtet, einzeln fotografiert und im Laborjournal festgehalten", erzählt Michael Podvinec, Leiter Research IT. Eine arbeitsintensive Handarbeit, die heute von Robotern, computergesteuerten Mikroskopen und digi­talen Kameras in Sekundenschnelle übernommen wird. Die Automatisierung ermöglicht es schliesslich, Tausende von Experimenten in Folge durchzuführen, und löst damit eine regelrechte Datenflut aus.
Während die Bioinformatik neue Algorithmen zur Auswertung dieser Daten entwickelt, ist die grosse Herausforderung für die Systemadministration, die entstehende Datenflut zu kanalisieren. Dazu gehört, unterschiedliche Datentypen effizient zu handhaben: So werden einerseits viele kleine Dateien in kurzer Zeit produziert, andererseits erzeugen Simulationen einen langen Output-Stream. Erschwerend kommt hinzu, dass über 200 verschiedene - zum Teil selbst entwickelte - Anwendungen, Datenbanken und Tools eingesetzt werden. Und wenn noch mehrere Versuche gleichzeitig starteten, stiessen die Rechner schnell einmal an ihre Grenzen. Fazit: Die bisherige Hardware verfügte nicht mehr über die nötige Rechnerleistung und Speicherkapazität, um die wachsende Forschungsdynamik zu bewältigen.

PASSEND FÜR HETEROGENES UMFELD


Beowulf Cluster"Gesucht war darum eine leistungsstarke, flexible und stabile Arbeitsumgebung, welche die unterschiedlichen Anforderungen in einem sich stets ändernden Forschungsumfeld erfüllt", so Rainer Pöhlmann, Systemadministrator. Für diese Bedürfnisse bot IBM mit dem Linux-basierten High-Performance «Beowulf» Cluster und GPFS, General Par­allel File System, dem IBM Hochleistungs­Cluster-Dateisystem, eine passende Lösung.
Das Ergebnis: Performance und Stabilität werden durch die erweiterte Infrastruktur deutlich erhöht. Der neue Cluster besteht aus zwölf File-Servern IBM System x mit 96 Cluster Nodes. 500 Prozessorkerne - in der nächsten Ausbaustufe 1 000 - mit Linux beschleunigen die aufwendigen Simulationen deutlich. Damit stellt GPFS sicher, dass selbst bei extrem hohem Parallel-Zugriff auf Daten die nötige Performance vorhanden ist. Die gesamte Storage-Infrastruktur wird mit einer Tape Library verstärkt. Auch die Datenkonsistenz ist gewährleistet: Im Katastrophenfall sorgt das integrierte Backup-System mittels Tivoli Management von IBM dafür, dass Versuche nicht wiederholt werden müssen.
Angesichts der wachsenden Datenmenge und des knapper werdenden Speicherplatzes will die Bioinformatik ihre Daten künftig verstärkt gemäss ihrer Bedeutung entlang ihres Lebenszyklus bewirtschaften. Dabei wird laut Konstantin Arnold, Systemadministrator, unterschieden zwischen solchen Daten, auf die schnell zugegriffen werden muss, und solchen, die langfristig abgelegt und nur noch sporadisch verwendet werden.

GRENZEN ERFORSCHT

Seit 2003 begleiten IBM und ihre Partnerin «Pathworks GmbH» das Biozentrum in seiner Entwicklung und kennen dessen Bedürfnisse. Basierend auf den wechselnden Anforderungen wurden gemeinsam Lösungen erarbeitet. IBM und Pathworks sind auf dem Gebiet der Life Science erfahren und stellten für das Biozentrum ein fünfköpfiges Expertenteam zusammen. Dieses kümmert sich unter anderem um die Hardware- und Software-Belange. "Besonders schätzen wir die grosse Flexibilität unserer Partner und ihre Bereitschaft, mit uns Neuland zu betreten und auch in Grenzbereiche vorzustossen", so Schwede.

PATHWORKS GMBH
Gegründet im Jahr 2001, ist Pathworks GmbH Business Partner von IBM. Als Anbieter unternehmensweiter IT-Systeme deckt Pathworks eine umfassende Palette an Dienstleistungen, Hard- und Software ab. Mit der Expertise im Bereich High Performance Computing und Datamanagement unterstützt Pathworks Kunden in den Sektoren Finanz- und Versicherungswesen, Pharma, Bildung und Forschung. www.pathworks.ch