Humboldt-Universität zu Berlin - Digitales Lehren und Lernen

Jupyterhub

Pilotbetrieb

Jupyterhub – wichtigste Fakten

Jupyter Notebooks (jupyter.org) haben sich in vielen wissenschaftlichen Disziplinen etabliert. Einerseits ermöglichen Notebooks einen einfachen Einstieg in die KI-basierte datengetriebene Forschung, andererseits können sie die Reproduzierbarkeit von Forschungsergebnissen erleichtern, indem sie Code, Dokumentation und Ergebnisse in einem ausführbaren Dokument zusammenfassen. Forschungsworkflows werden dadurch transparent, was wiederum zur guten wissenschaftlichen Praxis beiträgt.

Im Rahmen des AI-SKILLS Projektes werden Jupyter Notebooks über einen cloudbasierten sogenannten Jupyterhub serverseitig bereitgestellt. Dieser ermöglicht eine persistente Datenspeicherung und stellt gleichzeitig die notwendige (GPU-)Rechenleistung zur Verfügung. Studierende mit unterschiedlichsten Voraussetzungen und Endgeräten können so ohne zeit- und ressourcenaufwändige lokale Installationen an der Lehre teilnehmen. Die Lehrenden wiederum können sich ganz auf die Vermittlung der verschiedenen Methoden, deren Anwendung und Reflexion konzentrieren. Lern-, Daten- und Rechenressourcen können effizient und flexibel geteilt und genutzt werden.

Anwendungsszenarien

  • Die Jupyter Notebooks über den Jupyterhub sind vor allem für didaktische Szenarien ausgelegt.
  • Verschiedene Jupyterlab-Umgebungen, sog. Profile stehen derzeit zur Auswahl (u.a. Python, Spark, R, Tensorflow, eine Umgebung für Natural Language Processing und eine Umgebung mit Cuda-Unterstützung).
  • Eigene Docker Images können prinzipiell via Gitlab des CMS eingebunden werden. Zum Einbinden in die sog. Profilliste benötigen wir die URL zur Container Registry und wenn möglich einen sog. eineindeutigen tag. Für die Erstellung eines eigenen angepassten Images bspw. für Ihre Lehrveranstaltung können Sie sich gern an uns wenden (siehe Service-E-Mail-Adresse unten).
  • Über ein sog. Externes Tool (LTI) ist es seit dem Sommersemester 2025 auch möglich innerhalb eines Moodle-Kurses einen direkten Zugang zum Jupyterhub einzurichten. Somit können auch Studierende, die einen Account im HU-Moodle haben aber keinen HU-Account mit dem Jupyterhub der HU Berlin arbeiten.
  • Darüber hinaus gibt es ein Jupyterlab-Image, dass eine Erweiterung enthält mit der es möglich ist die LLMs des CMS bspw. mittels Chat zu nutzen.

aktuelle Planungen

  • Geplant ist eine verbesserte Integration mit Moodle (bspw. für Aufgabeneinreichungen) sowie
  • eine Anbindung an die HU-Box via webdav.

aktuelle Einschränkungen

  • Für die Anmeldung an der Jupyterhub-Startseite wird für die LDAP-Authentifizierung ein HU-Account vorausgesetzt.
  • Es sind aktuell Übungsszenarien mit bis zu 120 gleichzeitigen Nutzer/innen möglich.
  • Für die jeweils gestartete JupyterLab-Umgebung stehen max. 8 CPUs, 32 GB RAM & 10 GB Speicherplatz zur Verfügung.
  • Derzeit stehen acht Server (VMs) mit CPU- und zwölf Server (VMs) mit GPU-Unterstützung (mit Nvidia A100 Grafikkarten) zur Verfügung.
  • Die anfallenden Daten (Home-Verzeichnis sowie die Account-Daten) werden nach einem Jahr der Nichtnutzung des Dienstes gelöscht.

Software-Konfiguration

Jupyterhub läuft auf einem Kubernetes Cluster innerhalb der HU-Cloud des CMS, auf der Basis von Openstack. Die Anwendung selbst basiert auf dem Zero 2 JupyterHub Projekt.

Website des Dienstes

Support-E-Mail-Adresse

jupyterhub-support@hu-berlin.de

E-Mails an die Adresse jupyterhub-support@hu-berlin.de werden mit einem elektronischen Ticketsystem bearbeitet. Bitte beachten Sie den datenschutzrechtlichen Hinweis: https://otrs.hu-berlin.de/hinweis.html