Topic: Einsatzpotenziale von Federated Learning für Data Integration

Topic: Einsatzpotenziale von Federated Learning für Data Integration

Personal details

Title Einsatzpotenziale von Federated Learning für Data Integration
Description

Mit der zunehmenden Menge an verfügbaren Daten in verschiedenen Formaten und Quellen wird die Data Integration zu einer zentralen Herausforderung für Organisationen und Unternehmen. Der Data Integration Prozess besteht aus folgenden Schritten: (1) Schema Matching, (2.1) Data Preparation, (2.2) Blocking, (2.3) Record Pair Comparison, (2.4) Classification, (2.5) Evaluation und (3) Data Fusion. Für die Umsetzung von Data Integration werden zunehmend Machine Learning Modelle verwendet.

Federated Learning ist ein neues Paradigma im Bereich Machine Learning, bei dem ein Modell kollaborativ mit mehreren Teilnehmern trainiert wird, ohne dass die Trainingsdaten der Teilnehmer an einer zentralen Stelle gespeichert werden müssen.

Für die Entwicklung eines Prototyps werden Daten zur Verfügung gestellt. Mit dem entwickelten Ansatz soll ein Benchmark mit einem Startup durchgeführt werden.

Home institution Department of Computing Science
Associated institutions
Type of work practical / application-focused
Type of thesis Bachelor's or Master's degree
Author Jan-Philipp Awick
Status available
Problem statement

Das Ziel dieser Abschlussarbeit ist es, zu untersuchen, wie Federated Learning im Data Integration Prozess eingesetzt werden kann.

Requirement
  • Kenntnisse im Bereich Machine Learning sind von Vorteil
  • Eigeninitiative
  • Hohe Lernbereitschaft
  • Strukturierte Arbeitsweise
Created 22/09/23

Study data

Departments
  • Very Large Business Applications
Degree programmes
  • Bachelor's Programme Business Informatics
  • Master's Programme Computing Science
  • Bachelor's Programme Computing Science
  • Master's Programme Business Informatics
Assigned courses
Contact person