Humboldt-Universität zu Berlin - Digitales Lehren und Lernen

Jupyterhub

Testbetrieb
hublogo.svghdl3-logo.png

Jupyterhub – wichtigste Fakten

Jupyter Notebooks (jupyter.org) haben sich in vielen wissenschaftlichen Disziplinen etabliert. Einerseits ermöglichen Notebooks einen einfachen Einstieg in die KI-basierte datengetriebene Forschung, andererseits können sie die Reproduzierbarkeit von Forschungsergebnissen erleichtern, indem sie Code, Dokumentation und Ergebnisse in einem ausführbaren Dokument zusammenfassen. Forschungsworkflows werden dadurch transparent, was wiederum zur guten wissenschaftlichen Praxis beiträgt.

Im Rahmen des AI-SKILLS Projektes werden Jupyter Notebooks über einen cloudbasierten sogenannten Jupyterhub serverseitig bereitgestellt. Dieser ermöglicht eine persistente Datenspeicherung und stellt gleichzeitig die notwendige (GPU-)Rechenleistung zur Verfügung. Studierende mit unterschiedlichsten Voraussetzungen und Endgeräten können so ohne zeit- und ressourcenaufwändige lokale Installationen an der Lehre teilnehmen. Die Lehrenden wiederum können sich ganz auf die Vermittlung der verschiedenen Methoden, deren Anwendung und Reflexion konzentrieren. Lern-, Daten- und Rechenressourcen können effizient und flexibel geteilt und genutzt werden.

Anwendungsszenarien

  • Die Jupyter Notebooks über den Jupyterhub sind vor allem für didaktische Szenarien ausgelegt.
  • Sechs verschiedene Jupyterlab-Umgebungen stehen derzeit zur Auswahl (Python, Spark, R, Tensorflow und eine erweiterte R-Umgebung sowie eine Umgebung für Natural Language Processing).
  • Eigene Docker Images via Github, Dockerhub oder das Gitlab des CMS können prinzipiell eingebunden werden. Bei der Erstellung eines eigenen angepassten Images können Sie sich gern an uns wenden (siehe Service-E-Mail-Adresse unten).

Einschränkungen

  • Ein HU-Account wird gegenwärtig vorausgesetzt für die LDAP-Authentifizierung.
  • Die Jupyterhub-Instanz ist aktuell nur aus dem HU-Netz oder via VPN erreichbar.
  • Es sind aktuell nur Übungsszenarien mit bis zu 80 gleichzeitigen Nutzer/innen möglich, die Kapazitäten werden jedoch kontinuierlich ausgebaut.
  • Für die jeweils gestartete Jupyterlab-Umgebung stehen max. 4 CPUs, 24 GB RAM & 10 GB Speicherplatz zur Verfügung.
  • Derzeit stehen nur fünf Server mit GPU-Unterstützung zur Verfügung, weitere fünf Server sind geplant bzw. in Vorbereitung.
  • Die anfallenden Daten werden nach dem Ende des jeweiligen Semesters wieder gelöscht

Software-Konfiguration

Jupyterhub läuft auf einem Kubernetes Cluster innerhalb der HU-Cloud des CMS, auf der Basis von Openstack. Die Anwendung selbst basiert auf dem Zero 2 JupyterHub Project.

Website des Dienstes

Support

jupyterhub-support@hu-berlin.de

E-Mails an die Adresse jupyterhub-support@hu-berlin.de werden mit einem elektronischen Ticketsystem bearbeitet. Bitte beachten Sie den datenschutzrechtlichen Hinweis: https://otrs.hu-berlin.de/hinweis.html