Eine Cloud-Lösung für Bioinformatiker wird über das Universitätsrechenzentrum in Tübingen bereitgestellt. Sie umfasst eine Recheninfrastruktur, verschiedene Workflow-Lösungen zum Aufbau von Pipelines und Tools mit besonderem Schwerpunkt auf der Analyse von Hochdurchsatzdaten (Genomik, Proteomik, Metabolomik usw.). Die bereitgestellte Cloud-Umgebung umfasst die folgenden Dienste:
- Infrastruktur als Service (IaaS): Auf die Cloud-Infrastruktur kann über verschiedene Virtualisierungstechnologien wie virtuelle Maschinen, Docker-Container oder Singularity-Container zugegriffen werden. Der Benutzer kann über die UNICORE Middleware Rechenressourcen nutzen, um ressourcenintensive Datenanalyse- und Simulationsalgorithmen auszuführen. Darüber hinaus können Benutzer Webdienste in ihrer Virtualisierungsumgebung einrichten und die verfügbaren Ressourcen für ihre Anwendungen nutzen.
- Platform as a Service (PaaS): Wir bieten direkten Zugang zu etablierten Pipelines für die Hochdurchsatzdatenanalyse sowie zu Workflow-Umgebungen (Galaxy, KNIME, UNICORE), um diese Workflows in einer Cloud-Umgebung auszuführen. Ein besonderer Schwerpunkt des Tübinger Standorts sind Workflows für die Analyse von massenspektrometrischen Daten und die Multi-omics-Datenanalyse. Der Benutzer wird in der Lage sein, die vorhandenen Frameworks und Workflows zu nutzen und sie selbst weiter anzupassen, um vollständige und reproduzierbare Datenanalyse-Workflows zu erhalten.
- Software-as-a-Service (SaaS): Wir bieten eine breite Palette von Standard-Bioinformatik, die ohne weitere Entwicklung angewendet werden kann. Die vorinstallierte Software wird als virtuelle Maschinen-Images, Docker-Container, Singularity-Container, UNICORE oder Galaxy-Workflows bereitgestellt. Die zahlreichen Tools, die im Rahmen des Zentrums für Integrative Bioinformatik cibi entwickelt wurden, sind am Standort Tübingen vollständig verfügbar und werden dort unterstützt. Sie umfassen Tools für Hochdurchsatzdaten (Genomik, Metagenomik, Proteomik, Metaproteomik, Transkriptomik, Metabolomik - SeqAn, OpenMS, MetFrag) sowie für die Bildanalyse (FIJI). Die Tübinger Cloud-Site konzentriert sich unter anderem auf die Reproduzierbarkeit von Forschungsdaten und ihre virtuellen Forschungsumgebungen, da Tübingen Projektpartner des CiTAR-Projekts ist.
- Data as a Service (DaaS): Der Zugang zu Datenpools mit wichtigen großen Datensätzen ist eine äußerst wertvolle Ressource für Bioinformatik-Nutzer aller Erfahrungsstufen. Diese Datenpools dienen der Entwicklung, dem Testen und dem Benchmarking von bioinformatischen Methoden und der Cloud-Umgebung. Je nach Bedarf erhalten de.NBI-Cloud-Nutzer autorisierten Zugriff auf große Datensätze, wie z.B. öffentliche Referenzdatensätze. Der Standort Tübingen konzentriert sich auf Daten für Proteomics, Metabolomics und Multi-omics-Daten (z.B. PRIDE, CPTAC, TCGA, ICGC). Darüber hinaus sind wir in der Lage, mehrere Speicherlösungen für vielfältige Anwendungszwecke anzubieten. Wenn Sie sensible Patientendaten speichern oder bestimmte Daten eines Datensatzes für verschiedene Personen mit unterschiedlichen Berechtigungen freigeben möchten, können wir Ihnen eine Lösung dafür anbieten. Ein anderer Anwendungszweck könnte darin bestehen, Anwendungen auf schnellem SSD-Speicher auszuführen und die Daten anschließend auf Festplattenlaufwerke zu verschieben (Tiering), auch das ist möglich.
Ein Hauptziel der de.NBI-Cloud in Tübingen ist die Bereitstellung von Software, die verschiedene wissenschaftliche Forschungsbereiche abdeckt, wie z.B. Massenspektrometrie-Analysen, NGS-Analyse-Pipelines, aber auch molekulares Docking über Ball, das in Galaxy-Workflows integriert ist (ballaxy).
Die de.NBI Cloud-Infrastruktur in Tübingen umfasst mehr als 1650 Rechenkerne, 15 TByte RAM, 250 TByte SSD-Speicher und 13 PByte Speicherkapazität.