Verteilte Systeme
Verteilte Systeme zeichnen sich dadurch aus, dass sie aus mehreren, weitestgehend eigenständigen und über ein Netzwerk miteinander verbundenen Komponenten bestehen, die einen gemeinsamen Dienst anbieten. Abhängig von der konkreten Ausprägung kann es sich hierbei beispielsweise um die auf wenige Rechner begrenzte redundante Speicherung kleiner Dateien handeln, oder aber auch um die massiv parallele Verarbeitung großer Datenmengen im Rahmen weltumspannender Cloud-Anwendungen. Während sich durch die Verteiltheit eines Systems einerseits neue Möglichkeiten eröffnen, wie etwa eine Verbesserung der Fehlertoleranzeigenschaften durch Replikation von Daten oder Berechnungen, ergeben sich andererseits zusätzliche Herausforderungen, wie zum Beispiel die effiziente Bereitstellung von Diensten bei einer Verteilung auf mehrere geografische Standorte. Ziel der Forschungsaktivitäten des Lehrstuhls ist die Entwicklung von Konzepten und Techniken, die es Systemen erlauben, die sich durch Verteilung bietenden Chancen zu nutzen und dabei die zur Verfügung stehenden Ressourcen so effizient wie möglich einzusetzen.
Projekte:
Das Konzept von Distributed Ledger Systemen (Blockchain) ist eine grundlegend neue Basistechnologie, welche in der öffentlichen Wahrnehmung derzeit verstärkt im Fokus steht und welche erhöhtes Potential zur Lösung von Problemstellungen in einer Vielzahl von Anwendungsbereichen verspricht.
Daneben wandelt sich die Luftverkehrslandschaft absehbar mit einer massiven Zunahme an Luftverkehrsteilnehmern und weiteren Luftverkehrsarten wie autonomen Kleinstsystemen. Des Weiteren besteht ein…
Distributed Ledger Technologies (DLTs), oft auch als Blockchains bezeichnet, ermöglichen die Realisierung zuverlässiger und angriffsresilienter Dienste ohne zentrale Infrastruktur. Die verbreiteten "Proof-of-Work"-Mechanismen für DLTs leiden jedoch unter hohen Latenzen von Operationen und enormen Energiekosten. Byzantinisch fehlertolerante (BFT) Einigungsalgorithmen stellen eine potentiell bessere Alternative zu Proof-of-Work dar. Jedoch bringen aktuelle BFT-Protokolle auch Herausforderungen mit sich, die ihre praktische Verwendung in Produktivsystemen noch einschränken. Dieses Forschungsvorhaben adressiert diese Herausforderungen, indem es (1) die Skalierbarkeit von BFT-Protokollen verbessert, ohne ihre Resilienz einzuschränken, (2) durch Modellierung die zu erwartende Performanz und das zeitliche Verhalten der Protokolle auch unter Angriffen und in Abhängigkeit der Rahmenparameter des Protokolls vorhersehbarer macht, sowie (3) den Entwurfsprozesses von validen, automatisiert prüfbaren BFT-Systemen von Spezifikation bis hin zum Einsatz in einer Blockchain-Infrastruktur unterstützt. Beim Thema Skalierbarkeit geht es darum, praxistaugliche Lösungen zu finden, die auch Herausforderungen wie Wiederanlauf nach größeren Ausfällen oder Upgrades sowie Rekonfigurationen zur Laufzeit berücksichtigen. Auch möchten wir eine resiliente Kommunikationsschicht konzipieren, die die Wahl einer geeigneten Kommunikationstopologie vom eigentlichen BFT-Einigungsalgorithmus entkoppelt und somit dessen Komplexität reduziert. Dies soll durch die Verwendung von vertrauenswürdigen Hardwarekomponenten unterstützt werden. Anknüpfend wollen wir an der Kombination dieser Konzepte mit kryptographischen Primitiven forschen, um die Skalierbarkeit weiter zu verbessern. Mit Hilfe von systematischen Modellierungstechniken möchten wir die Effizienz von skalierbaren, komplexen BFT-Protokollen (beispielsweise hinsichtlich Durchsatz und Latenz von Operationen) schon vor einem Deployment analysieren können, wenn man die Systemgröße, Rechenleistung von Knoten und grundlegende Eigenschaften der Kommunikationsverbindungen kennt. Auch möchten wir an robusten Gegenmaßnahmen forschen, die in groß-skalierbaren Blockchain-Systemen helfen, gezielte Angriffe abzuwehren. Das dritte Ziel ist es, die systematische und valide Umsetzung in ein praktisches System zu unterstützen, gegliedert in einem konstruktiven, modularen Ansatz, bei dem ein validierbares BFT-Protokoll aus kleineren, validierbaren Bausteinen komponiert wird, die Inkorporation automatisierter Testverfahren auf Grundlage eines heuristischen Algorithmus, der den komplexen Suchraum von Fehlverhalten in BFT-Systemen beherrschbarer macht und ein Werkzeug für automatisiertes Deployment mit einhergehendem Benchmarking und Stress-Testing in einem groß-skalierten DLT-System.
Netzwerkbasierte Dienste wie replizierte Datenbanken, verteilte Dateisysteme oder Blockchains sind grundlegende Bausteine heutiger IT-Infrastrukturen und müssen daher in der Lage sein, ein breites Spektrum an Problemszenarien zu bewältigen, das von Hardware-Ausfällen über Software-Fehlverhalten bis hin zu Angriffen reicht. Zwar existieren bereits diverse fehler- und einbruchstolerante Protokolle zur Replikation von Zustandsmaschinen, allerdings ist es alles andere als trivial diese auf Basis ihr…
Die Verarbeitung großer Datenmengen auf verteilten Ausführungsplattformen wie MapReduce oder Heron trägt signifikant zum Energieverbrauch heutiger Datenzentren bei. Das E³-Projekt erforscht wie sich der Stromverbrauch solcher Ausführungsumgebungen senken lässt ohne dabei Performanzeinbußen in Kauf nehmen zu müssen. Hierzu entwickelt das Projekt Ansätze, die darauf abzielen, Ausführungs- und Datenverabeitungsplattformen energiegewahr zu gestalten, und es ihnen zu ermöglichen, Wissen über Anwendungen…
Koordinierungsdienste wie ZooKeeper stellen zentrale Bausteine heutiger Datenzentrumsinfrastrukturen dar, da sie Prozessen verteilter Anwendungen Mechanismen zur Verfügung stellen, um Nachrichten auszutauschen, Anführerwahlen durchzuführen, Rechner- oder Prozessausfälle zu erkennen, oder Konfigurationsdaten auf zuverlässige Art und Weise zu speichern. Aufgrund ihrer hervorgehobenen Rolle als Stabilitätsanker für Client-Anwendungen müssen Koordinierungsdienste hohe Anforderungen hinsichtlich Widerst…
Durch Einführung von Redundanz ist es möglich verteilte Systeme zu bauen, die nicht nur Ausfälle einzelner Komponenten tolerieren können, sondern beliebiges Fehlverhalten. Leider ist diese Robustheit beim Rückgriff auf existierende Ansätze nur auf Kosten eines stark erhöhten Ressourcenverbrauchs zu erreichen, so dass der erforderliche Mehraufwand den eigentlichen Nutzen oftmals übersteigt. Der Fokus des Projekts „Resource-Efficient Fault and Intrusion Tolerance (REFIT)“ liegt darauf Protokolle und Systeme zu entwickeln, die Fehlertoleranz und Ressourceneffizienz miteinander in Einklang bringen. Zentrale Herangehensweise ist hierbei, die Redundanz während des Normalbetriebs eines System auf das Nötigste zu beschränken und zur Tolerierung von Fehlern erforderliche Ressourcen nur im Rahmen der Fehlerbehandlung zu belegen.
Kontaktpersonen:
Beteiligte Wissenschaftler:
Publikationen:
2024
Probabilistic Byzantine Fault Tolerance
43rd Symposium on Principles of Distributed Computing (PODC 2024) (Nantes, 17. Juni 2024 - 21. Juni 2024)
In: Proceedings of the 43rd Symposium on Principles of Distributed Computing (PODC 2024) 2024 , , , , :
Memory-Efficient Byzantine Fault-Tolerant Replication for Highly Resource-Constrained Systems
1st Workshop on Resilient Operations – Byzantine Fault Tolerance and State-Machine Replication (ROBUST '24) (Erlangen, 13. März 2024 - 14. März 2024)
Open Access: https://robust2024.github.io/robust24/assets/abstracts/memory-efficient-bft.pdf , :
TinyBFT: Byzantine Fault-Tolerant Replication for Highly Resource-Constrained Embedded Systems
30th IEEE Real-Time and Embedded Technology and Applications Symposium (RTAS 2024) (Hong Kong, China, 13. Mai 2024 - 16. Mai 2024)
In: Proceedings of the 30th IEEE Real-Time and Embedded Technology and Applications Symposium (RTAS 2024) 2024
DOI: 10.1109/RTAS61025.2024.00026
URL: https://sys.cs.fau.de/publications/2024/boehm_24_rtas.pdf , , :
Geo-Replicated Byzantine Fault-Tolerant State-Machine Replication with Low Latency (Dissertation, 2024)
DOI: 10.25593/open-fau-545 :
Spider: A BFT Architecture for Geo-Replicated Cloud Services
(2024)
DOI: 10.48550/arXiv.2407.07899
(online publication) , :
Tough on the Outside, Reliable on the Inside: Utilizing System Composition for Improved Resilience
1st Workshop on Resilient Operations – Byzantine Fault Tolerance and State-Machine Replication (ROBUST '24) (Erlangen, 13. März 2024 - 14. März 2024)
Open Access: https://robust2024.github.io/robust24/assets/abstracts/Utilizing_System_Composition_for_Improved_Resilience.pdf , :
Targeting Tail Latency in Replicated Systems with Proactive Rejection
25th Middleware Conference (Middleware '24) (Hong Kong, 2. Dezember 2024 - 6. Dezember 2024)
In: Proceedings of the 25th Middleware Conference (Middleware '24) 2024
DOI: 10.1145/3652892.3700775
URL: https://sys.cs.fau.de/publications/2024/lawniczak_24_middleware.pdf , :
2023
SoK: Scalability Techniques for BFT Consensus
IEEE International Conference on Blockchain and Cryptocurrency (Dubai, United Arab Emirates, 1. Mai 2023 - 5. Mai 2023)
In: Proceedings of the 5th IEEE International Conference on Blockchain and Cryptocurrency 2023
DOI: 10.48550/arXiv.2303.11045
URL: https://arxiv.org/pdf/2303.11045.pdf , , , , , , :
Vivisecting the Dissection: On the Role of Trusted Components in BFT Protocols
(2023)
DOI: 10.48550/arXiv.2312.05714
(online publication) , , , , , :
Micro Replication
53rd Annual IEEE/IFIP International Conference on Dependable Systems and Networks (DSN '23) (Porto, Portugal, 27. Juni 2023 - 30. Juni 2023)
In: Proceedings of the 53rd Annual IEEE/IFIP International Conference on Dependable Systems and Networks (DSN '23) 2023
DOI: 10.1109/DSN58367.2023.00024 , , :
Generic Checkpointing Support for Stream-based State-Machine Replication
Proceedings of the 10th Workshop on Principles and Practice of Consistency for Distributed Data (PaPoC '23) (Rome, 8. Mai 2023 - 8. Mai 2023)
DOI: 10.1145/3578358.3591329
URL: https://sys.cs.fau.de/publications/2023/lawniczak_23_papoc.pdf , , :
2022
SplitBFT: Improving Byzantine Fault Tolerance Safety Using Trusted Compartments
23rd ACM/IFIP International Middleware Conference, Middleware 2022 (Quebec, QC, 7. November 2022 - 11. November 2022)
In: Middleware 2022 - Proceedings of the 23rd ACM/IFIP International Middleware Conference 2022
DOI: 10.1145/3528535.3531516 , , , , , :
EventChain: A Blockchain Framework for Secure, Privacy-Preserving Event Verification
23rd ACM/IFIP International Middleware Conference (Quebec, QC, 7. November 2022 - 11. November 2022)
DOI: 10.1145/3528535.3565243
URL: https://dl.acm.org/doi/10.1145/3528535.3565243 , , , , , , , :
ZugChain: Blockchain-Based Juridical Data Recording in Railway Systems
Conference on Dependable Systems and Networks (Baltimore, Maryland, USA, 27. Juni 2022 - 30. Juni 2022)
In: Proceedings of the 52nd International Conference on Dependable Systems and Networks 2022
DOI: 10.1109/DSN53405.2022.00019
URL: https://www.ibr.cs.tu-bs.de/users/ruesch/papers/ruesch-dsn22.pdf , , , , , , , , , , , , , , :
2021
Byzantine Fault-Tolerant State-machine Replication from a Systems Perspective
In: ACM Computing Surveys 54 (2021), Art.Nr.: 24
ISSN: 0360-0300
DOI: 10.1145/3436728 :
Egalitarian Byzantine Fault Tolerance
2021 IEEE 26th Pacific Rim International Symposium on Dependable Computing (PRDC) (Perth, 1. Dezember 2021 - 3. Dezember 2021)
DOI: 10.1109/PRDC53464.2021.00019
URL: https://www4.cs.fau.de/Publications/2021/eischer_21_prdc.pdf , :
Stream-based State Machine Replication
In: Proceedings of the 17th European Dependable Computing Conference (EDCC '21) 2021
DOI: 10.1109/edcc53658.2021.00024
URL: https://arxiv.org/pdf/2106.13019 , :
2020
Resilient Cloud-based Replication with Low Latency
21st International Middleware Conference, Middleware 2020 (, 7. Dezember 2020 - 11. Dezember 2020)
In: Middleware 2020 - Proceedings of the 2020 21st International Middleware Conference 2020
DOI: 10.1145/3423211.3425689
URL: https://www4.cs.fau.de/Publications/2020/eischer_20_middleware.pdf , :
Low-Latency Geo-Replicated State Machines with Guaranteed Writes
7th Workshop on Principles and Practice of Consistency for Distributed Data, PaPoC 2020 (Heraklion, 27. April 2020 - 27. April 2020)
In: Proceedings of the 7th Workshop on Principles and Practice of Consistency for Distributed Data, PaPoC 2020 2020
DOI: 10.1145/3380787.3393686
URL: https://www4.cs.fau.de/Publications/2020/eischer_20_papoc.pdf , , :
2019
In Search of a Scalable Raft-based Replication Architecture
6th Workshop on Principles and Practice of Consistency for Distributed Data, PaPoC 2019 (Dresden, 25. März 2019)
In: Proceedings of the 6th Workshop on Principles and Practice of Consistency for Distributed Data, PaPoC 2019 2019
DOI: 10.1145/3301419.3323968 , :
Deterministic Fuzzy Checkpoints
International Symposium on Reliable Distributed Systems (SRDS '19) (Lyon, 1. Oktober 2019 - 4. Oktober 2019)
In: Proceedings of the 38th International Symposium on Reliable Distributed Systems (SRDS '19) 2019
DOI: 10.1109/SRDS47363.2019.00026
URL: https://www4.cs.fau.de/Publications/2019/eischer_19_srds.pdf , , :
2018
Strome: Energy-Aware Data-Stream Processing
Distributed Applications and Interoperable Systems (Madrid, 18. Juni 2018 - 21. Juni 2018)
In: Proceedings of the 18th International Conference on Distributed Applications and Interoperable Systems (DAIS '18) 2018
DOI: 10.1007/978-3-319-93767-0_4 , , , :
Latency-Aware Leader Selection for Geo-Replicated Byzantine Fault-Tolerant Systems
1st Workshop on Byzantine Consensus and Resilient Blockchains (BCRB '18) (Luxembourg City, 25. Juni 2018 - 28. Juni 2018)
In: Proceedings of the 48th International Conference on Dependable Systems and Networks Workshops (DSN-W '18) 2018
DOI: 10.1109/DSN-W.2018.00053
URL: https://www4.cs.fau.de/Publications/2018/eischer_18_bcrb.pdf , :
Scalable Byzantine Fault-tolerant State-Machine Replication on Heterogeneous Servers
In: Computing (2018), S. 1-22
ISSN: 0010-485X
DOI: 10.1007/s00607-018-0652-3
URL: https://www4.cs.fau.de/Publications/2018/eischer_18_computing.pdf , :
Troxy: Transparent Access to Byzantine Fault-Tolerant Systems
48th International Conference on Dependable Systems and Networks (DSN '18) (Luxembourg City, Luxembourg, 25. Juni 2018 - 28. Juni 2018)
In: Proceedings of the 48th International Conference on Dependable Systems and Networks (DSN '18) 2018
DOI: 10.1109/DSN.2018.00019
URL: https://www4.cs.fau.de/Publications/2018/li_18_dsn.pdf , , , , , :
2017
Hybster - A Highly Parallelizable Protocol for Hybrid Fault-Tolerant Service Replication
(2017)
DOI: 10.24355/dbbs.084-201703031341
(Techreport) , , :
Hybrids on Steroids: SGX-based High Performance BFT
EuroSys 2017 (Belgrade)
In: Proceedings of the 12th European Conference on Computer Systems (EuroSys '17) 2017
URL: https://www4.cs.fau.de/Publications/2017/behl_17_eurosys.pdf , , :
2016
Resource-efficient Byzantine Fault Tolerance
In: IEEE Transactions on Computers, Washington, DC, USA: IEEE Computer Society, 2016, S. 2807-2819 (IEEE Transactions on Computers, Bd.65(9))
DOI: 10.1109/TC.2015.2495213
URL: https://www4.cs.fau.de/Publications/2015/distler_15_ieeetc.pdf , , :
SAREK: Optimistic Parallel Ordering in Byzantine Fault Tolerance
EDCC 2016 (Gothenburg)
In: Proceedings of the 12th European Dependable Computing Conference (EDCC '16) 2016 , , , , :
2015
Consensus-Oriented Parallelization: How to Earn Your First Million
Middleware 2015 (Vancouver)
In: Proceedings of the 16th Middleware Conference (Middleware '15) 2015
DOI: 10.1145/2814576.2814800
URL: https://www4.cs.fau.de/Publications/2015/behl_15_mw.pdf , , :
Towards Energy-Proportional State-Machine Replication
14th Workshop on Adaptive and Reflective Middleware (Vancouver)
In: Proceedings of the 14th Workshop on Adaptive and Reflective Middleware (ARM '15) 2015
DOI: 10.1145/2834965.2834969
URL: https://www4.cs.fau.de/Publications/2015/eibel_15_arm.pdf , :
2014
Scalable BFT for Multi-Cores: Actor-based Decomposition and Consensus-oriented Parallelization
HotDep 2014 (Broomfield)
In: Proceedings of the 10th Workshop on Hot Topics in System Dependability (HotDep '14) 2014 , , :
2012
CheapBFT: Resource-efficient Byzantine Fault Tolerance
EuroSys 2012 (Bern, 10. April 2012 - 13. April 2012)
In: Proceedings of the EuroSys 2012 Conference (EuroSys '12) 2012
DOI: 10.1145/2168836.2168866
URL: http://www4.cs.fau.de/Publications/2012/kapitza_12_eurosys.pdf , , , , , , , :
2011
Increasing Performance in Byzantine Fault-Tolerant Systems with On-Demand Replica Consistency
EuroSys 2011 (Salzburg, 10. April 2011 - 13. April 2011)
In: Proceedings of the EuroSys 2011 Conference (EuroSys '11) 2011
DOI: 10.1145/1966445.1966455
URL: http://eurosys2011.cs.uni-salzburg.at/pdf/eurosys2011-distler.pdf , :
SPARE: Replicas on Hold
18th Network and Distributed System Security Symposium (NDSS '11) (San Diego)
In: Proceedings of the 18th Network and Distributed System Security Symposium (NDSS '11) 2011
URL: http://www.isoc.org/isoc/conferences/ndss/11/pdf/8_1.pdf , , , , :
2010
State Transfer for Hypervisor-Based Proactive Recovery of Heterogeneous Replicated Services
SICHERHEIT '10 (Berlin, 5. Oktober 2010 - 7. Oktober 2010)
In: Proceedings of the 5th "Sicherheit, Schutz und Zuverlässigkeit" Conference (SICHERHEIT '10) 2010
URL: http://www4.informatik.uni-erlangen.de/~distler/publications/distler10state.pdf , , :
2009
Functional Decomposition and Interactions in Hybrid Intrusion-tolerant Systems
In: Proceedings of the 3rd Workshop on Middleware-Application Interaction (MAI '09) 2009 , , :
2008
- Bessani Alysson, Reiser Hans P. , Sousa Paulo, Gashi Ilir, Stankovic Vladimir, Distler Tobias, Kapitza Rüdiger, Daidone Alessandro , Obelheiro Rafael:
FOREVER: Fault/intrusiOn REmoVal through Evolution & Recovery
ACM/IFIP/USENIX Middleware '08 (Leuven, Belgium)
In: Companion '08: Proceedings of the ACM/IFIP/USENIX Middleware '08 Conference Companion 2008
DOI: 10.1145/1462735.1462763
Efficient State Transfer for Hypervisor-Based Proactive Recovery
In: Proceedings of the 2nd Workshop on Recent Advances on Intrusion-Tolerant Systems (WRAITS '08) 2008 , , :