Praktischer Einsatz von privaten (OpenStack) und öffentlichen Clouds (Amazon EC2)
Lastabhängige Skalierung von Diensten in einer hybriden Cloud
Implementierung eines verteilten Dateisystems (ähnlich zu HDFS)
Verwendung von Container-Betriebssystemvirtualisierung (Docker)
Skalierbare Datenverarbeitung mittels MapReduce
Realisierung eines fehlertoleranten Koordinierungsdiensts (ähnlich zu ZooKeeper)
Im Rahmen der Übung werden Amazon Web Services (AWS) genutzt. Hierfür stellt der Lehrstuhl ein entsprechendes Freikontingent bei AWS zur Verfügung.
Übungsbetrieb
Zur jeder Übungsaufgabe werden zu Beginn des Bearbeitungszeitraums Videos und die dazugehörigen Foliensätze veröffentlicht, in denen die Aufgabe vorgestellt sowie relevante Hintergründe näher beleuchtet werden. Die Bearbeitung der Übungsaufgaben erfolgt in 3er-Gruppen und überwiegend in der Programmiersprache Java. Für die erfolgreiche Abgabe einer Aufgabe ist es erforderlich, die eigene Implementierung einem Übungsleiter zu präsentieren.
Nr.
Titel
Ausgabe
Abgabe
0
Grundlagen
-
-
1
Web-Services
24.10.2022
10.11.2022
2
Hybride Clouds
07.11.2022
24.11.2022
3
Verteilte Dateisysteme
21.11.2022
08.12.2022
4
MapReduce
05.12.2022
22.12.2022
5
Papierdiskussion
19.12.2022
19.01.2023
6
ZooKeeper
16.01.2023
02.02.2023
Für die digitalen Rechnerübungen wird die Online-Warteschlange Adora Belle verwendet, die hier erreicht werden kann.
Für die Übungsaufgaben werden Vorgaben und Hilfen im Verzeichnis /proj/i4mw/pub (erreichbar über den Informatik-CIP) bereitgestellt.
Es ist empfehlenswert, die jeweilige Aufgabenstellung vor der Bearbeitung einer Aufgabe vollständig zu lesen, um von Beginn an einen Überblick über das zu erstellende System zu haben.
Hinweis: Die meisten der hier verlinkten Videos stammen aus dem Wintersemester 2020/21 und können daher vom aktuellen Foliensatz geringfügig abweichen.
Hinweise
Das Aufgabenblatt 0 ist kein verpflichtender Teil des Übungsbetriebs, die Bearbeitung wird aber als Vorbereitung auf die Veranstaltung empfohlen.
Aufgabe 0 ist im Gegensatz zu den späteren Übungsaufgaben als Einzelaufgabe konzipiert.
Diese Aufgabe ist deutlich umfangreicher als die Webservices-Aufgabe.
Es wird empfohlen den Client zur Lasterzeugung im CIP-Pool zu betreiben.
Es gibt Probleme mit dem Tweet-Dienst? Meistens hilft ein Blick in die Protokolldateien beziehungsweise eine Kontrolle der Firewall-Konfiguration der VMs.
Falls es unter Windows Probleme mit der CPU Messung gibt, siehe Folie 2:2:18.
Das Dateisystem sollte auch mit einem ausgefallenem Datanode noch funktionieren (nur 7,5 ECTS).
Sind auch große Dateien nach dem Download identisch zur Originaldatei?
Es wird stark empfohlen, Docker in der bereitgestellten VM in der Cloud zu verwenden. Besonders bei der Verwendung von Docker aus Wohnheimsnetzen kann es zu Problemen mit der Standardkonfiguration kommen. Das RRZE stellt allerdings eine Anleitung zur Konfiguration von Docker bereit.
Materialien
Thema
Video
Foliensatz
Aufgabenblatt
Aufgabe 3: Verteilte Dateisysteme und Container-Betriebssystemvirtualisierung (Kumulierter Foliensatz)