Topic: Einsatz von Federated Learning für dezentrales Training von Sprachmodellen im von Kontext Entity Matching

Topic: Einsatz von Federated Learning für dezentrales Training von Sprachmodellen im von Kontext Entity Matching

Personal details

Title Einsatz von Federated Learning für dezentrales Training von Sprachmodellen im von Kontext Entity Matching
Description

Mit der zunehmenden Menge an verfügbaren Daten in verschiedenen Formaten und Quellen wird die Data Integration zu einer zentralen Herausforderung für Organisationen und Unternehmen. Der Data Integration Prozess besteht aus 3 Schritten: (1) Schema Matching, (2) Entity Matching und (3) Data Fusion. Der zweite Schritt, Entity Matching identifiziert dabei übereinstimmende Datensätze zwischen verschiedenen Datenquellen. Für die Umsetzung dieses Schrittes werden aktuell zunehmend Language Models (z.B. BERT) eingesetzt.

Federated Learning ist ein neues Paradigma im Bereich Machine Learning, bei dem ein Modell kollaborativ mit mehreren Teilnehmern trainiert wird, ohne dass die Trainingsdaten der Teilnehmer an einer zentralen Stelle gespeichert werden müssen.

Die Idee dieser Abschlussarbeit ist es, den Einsatz von Federated Learning für das Training von Language Models im Kontext von Entity Matching zu untersuchen. Für die Entwicklung eines Prototyps werden Daten zur Verfügung gestellt.

Home institution Department of Computing Science
Associated institutions
Type of work practical / application-focused
Type of thesis Master's degree
Author Jan-Philipp Awick
Status available
Problem statement

Ziel der Arbeit ist es, das dezentrale Training von Sprachmodellen unter verschiedenen Konfigurationen (z.B. Anzahl der teilnehmenden Clients, Datenverteilung, usw.) zu untersuchen, um so Rückschlüsse auf den Einfluss von Parametern formulieren zu können. 

Requirement
  • Kenntnisse im Bereich Machine Learning und NLP
  • Eigeninitiative
  • Hohe Lernbereitschaft
  • Strukturierte Arbeitsweise
Created 22/01/25

Study data

Departments
  • Very Large Business Applications
Degree programmes
  • Bachelor's Programme Business Informatics
  • Master's Programme Computing Science
  • Bachelor's Programme Computing Science
  • Master's Programme Business Informatics
Assigned courses
Contact person