Jupyterhub
Testbetrieb


Jupyterhub – wichtigste Fakten
Jupyter Notebooks (jupyter.org) haben sich in vielen wissenschaftlichen Disziplinen etabliert. Einerseits ermöglichen Notebooks einen einfachen Einstieg in die KI-basierte datengetriebene Forschung, andererseits können sie die Reproduzierbarkeit von Forschungsergebnissen erleichtern, indem sie Code, Dokumentation und Ergebnisse in einem ausführbaren Dokument zusammenfassen. Forschungsworkflows werden dadurch transparent, was wiederum zur guten wissenschaftlichen Praxis beiträgt.
Im Rahmen des AI-SKILLS Projektes werden Jupyter Notebooks über einen cloudbasierten sogenannten Jupyterhub serverseitig bereitgestellt. Dieser ermöglicht eine persistente Datenspeicherung und stellt gleichzeitig die notwendige (GPU-)Rechenleistung zur Verfügung. Studierende mit unterschiedlichsten Voraussetzungen und Endgeräten können so ohne zeit- und ressourcenaufwändige lokale Installationen an der Lehre teilnehmen. Die Lehrenden wiederum können sich ganz auf die Vermittlung der verschiedenen Methoden, deren Anwendung und Reflexion konzentrieren. Lern-, Daten- und Rechenressourcen können effizient und flexibel geteilt und genutzt werden.
Anwendungsszenarien
- Die Jupyter Notebooks über den Jupyterhub sind vor allem für didaktische Szenarien ausgelegt.
- Sechs verschiedene Jupyterlab-Umgebungen stehen derzeit zur Auswahl (Python, R, Spark, Tensorflow, Transformers und eine Umgebung für die RLernplattform).
- Eigene Docker Images via Github, Dockerhub oder das Gitlab des CMS können prinzipiell eingebunden werden.
Einschränkungen
- Ein HU-Account wird gegenwärtig vorausgesetzt für die LDAP-Authentifizierung.
- Die Jupyterhub-Instanz ist aktuell nur aus dem HU-Netz oder via VPN erreichbar.
- Es sind aktuell nur Übungsszenarien mit bis zu 70 gleichzeitigen Nutzer/innen möglich, die Kapazitäten werden jedoch ausgebaut.
- Für die jeweils gestartete Jupyterlab-Umgebung stehen 4 CPUs, 16 GB RAM & 8 GB Speicherplatz zur Verfügung.
- Server mit GPU-Unterstützung sind in Vorbereitung, stehen derzeit aber noch nicht zur Verfügung.
Software-Konfiguration
Jupyterhub läuft auf einem Kubernetes Cluster innerhalb der HU-Cloud des CMS, auf der Basis von Openstack. Die Anwendung selbst basiert auf dem Zero 2 JupyterHub Project.
Website des Dienstes
- https://jupyterhub.cms.hu-berlin.de (HU-Netz oder VPN erforderlich)
Support
jupyterhub-support@hu-berlin.de
E-Mails an die Adresse jupyterhub-support@hu-berlin.de werden mit einem elektronischen Ticketsystem bearbeitet. Bitte beachten Sie den datenschutzrechtlichen Hinweis: https://otrs.hu-berlin.de/hinweis.html