Topic: Verlässliche Anfrageverarbeitung mit Odysseus: Erweiterung des Zustandsmanagements

Topic: Verlässliche Anfrageverarbeitung mit Odysseus: Erweiterung des Zustandsmanagements

Personal details

Title Verlässliche Anfrageverarbeitung mit Odysseus: Erweiterung des Zustandsmanagements
Description

Die Verarbeitung von Daten findet oft basierend auf der Basis von Operatoren statt, die z.B. Daten filtern oder aggregieren. Während die Filterung (i.d.R.) eine Operation ist, die auf einem einzelnen Element entscheiden kann, ob es die Filterbedingung erfüllt oder nicht, benötigt die Aggregation (z.B. für die Durchschnittsberechnung) immer Informationen über mehrere Elemente. Damit also eine Operation wie die Aggregation durchgeführt werden kann, muss sie Daten zwischenspeichern. Diese zwischengespeicherten Daten werden als Zustand bezeichnet.

In dieser Arbeit geht es um Datenstromsysteme (DSS), bei denen die Daten nur flüchtig vorliegen und es nicht ohne weiteres möglich ist, im Fehlerfall einfach die Daten erneut einzulesen. Aus diesem Grund kommt dem Zustandsmanagement in DSS eine besondere Bedeutung zu. Neben der Flüchtigkeit muss noch eine potenzielle Unendlichkeit des Datenstroms berücksichtigt werden. Es ist also nicht möglich, einfach alle ankommenden Daten zwischenzuspeichern und im Fehlerfall erneut einzuspielen (Replay).

Viele DSS lösen das Problem, in dem sie dafür sorgen, dass der Zustand eines Operators nicht nur im Hauptspeicher zu finden ist, sondern Zwischenzustände (Snapshots) auch persistiert werden. Im Fehlerfall ist es dann möglich, von diesem Zwischenstand aus weiterzumachen und ein Replay nur für einen eingeschränkten Teil der Daten durchführen zu müssen.

In einer vorausgegangenen Masterarbeit wurden grundlegende Konzepte für die Zustandsverwaltung in Odysseus (https://odysseus.uni-oldenburg.de) geschaffen und beispielhaft die Korrektheit des Ansatzes anhand des Join-Operators umgesetzt.

Jetzt gibt es in einem DSS bzw. Odysseus eine ganze Reihe weitere Operatoren, wobei hier insbesondere die Aggregation eine wichtige Rolle spielt. In dieser Arbeit soll der obige Ansatz auf mindestens die Aggregation (und ggf. noch weitere Operatoren) übertragen werden.

Home institution Department of Computing Science
Associated institutions
Type of work practical / application-focused
Type of thesis Bachelor's or Master's degree
Author Dr. Marco Grawunder
Status available
Problem statement
Requirement
Created 17/12/24

Study data

Departments
  • Informationssysteme - Data Science
Degree programmes
Assigned courses
Contact person