inf105 - Fault Tolerance in Distributed Systems (Complete module description)

inf105 - Fault Tolerance in Distributed Systems (Complete module description)

Original version English PDF Download
Module label Fault Tolerance in Distributed Systems
Modulkürzel inf105
Credit points 6.0 KP
Workload 180 h
Institute directory Department of Computing Science
Verwendbarkeit des Moduls
Zuständige Personen
  • Sonnenschein, Michael (module responsibility)
  • Theel, Oliver (Prüfungsberechtigt)
Prerequisites
Skills to be acquired in this module
Vermittelt werden Kenntnisse im Bereich der fehlertoleranten verteilten Systeme mit dem Ziel, ein Verständnis über deren Begrifflichkeiten, Aufbau, Funktionsweise, Konzeption, Kernproblematik und die wesentlichen Lösungskonzepte zu erreichen. Die Studierenden sollen anschliessend 1) einschaetzen koennen, was fehlertolerantes verteiltes System ist und leistet, 2) wissen, wo die Probleme bei der Realisierung solcher Systeme liegen, 3) gaengige Realisierungen von fehlertoleranten verteilten Systemen kennen und bewerten koennen und 4) in der Lage sein, die Realisierungskonzepte auf andere Kontexte zu uebertragen oder fortzuentwickeln.
Module contents
Das Modul vermittelt folgende Inhalte:
1) Defekte, Fehler, Versagen
2) Fehlerarten, Fehlertoleranz
3) Stabiler Speicher
4) Atomare Commit-Protokolle
5) Klassifikation von Replikationskontrollstrategien
  • pessimistisch vs. optimistisch
  • semantisch vs. syntaktisch
  • statisch vs. dynamisch
6) Konsistenzbegriffe
7) Guetekriterien
8) Untersuchung von Replikationskontrollstrategien
9) Konstruktion von Replikationskontrollstrategien
10) Vereinheitlichende Rahmenwerke
11) Replikation in der Praxis

Die in diesem Modul erworbenen Kenntnisse und Faehigkeiten erlauben es dem Studierenden
u.a., die besonderen Probleme bei der Realisierung von fehlertoleranten verteilten Systemen, insbesondere basierend auf Replikation im allgemeinen zu erkennen, in ihrem Schwierigkeit einschaetzen und Loesungen realisieren und bewerten zu koennen.
Literaturempfehlungen
P. Jalote (1994): Fault Tolerance in Distributed Systems. Prentice-Hall.
A. Helal et. Al (1996): Replication Techniques in Distributed Systems. Kluwer Academics
A. Schiper et. Al (2010): Replication: Theory and Practice
Links
Language of instruction German
Duration (semesters) 1 Semester
Module frequency im 2-Jahres-Zyklus
Module capacity unlimited
Lehrveranstaltungsform Comment SWS Frequency Workload of compulsory attendance
Lecture 2 28
Seminar
Präsenzzeit Modul insgesamt 28 h
Examination Prüfungszeiten Type of examination
Final exam of module
1. Termin: letzte Vorlesungswoche
1. Wiederholungspruefung vor Beginn des naechsten Semesters
M