Personal details
Title | Einsatz von Federated Learning für dezentrales Training von Sprachmodellen im von Kontext Entity Matching |
Description | Mit der zunehmenden Menge an verfügbaren Daten in verschiedenen Formaten und Quellen wird die Data Integration zu einer zentralen Herausforderung für Organisationen und Unternehmen. Der Data Integration Prozess besteht aus 3 Schritten: (1) Schema Matching, (2) Entity Matching und (3) Data Fusion. Der zweite Schritt, Entity Matching identifiziert dabei übereinstimmende Datensätze zwischen verschiedenen Datenquellen. Für die Umsetzung dieses Schrittes werden aktuell zunehmend Language Models (z.B. BERT) eingesetzt. Federated Learning ist ein neues Paradigma im Bereich Machine Learning, bei dem ein Modell kollaborativ mit mehreren Teilnehmern trainiert wird, ohne dass die Trainingsdaten der Teilnehmer an einer zentralen Stelle gespeichert werden müssen. Die Idee dieser Abschlussarbeit ist es, den Einsatz von Federated Learning für das Training von Language Models im Kontext von Entity Matching zu untersuchen. Für die Entwicklung eines Prototyps werden Daten zur Verfügung gestellt. |
Home institution | Department of Computing Science |
Associated institutions |
|
Type of work | practical / application-focused |
Type of thesis | Master's degree |
Author | Jan-Philipp Awick |
Status | available |
Problem statement | Ziel der Arbeit ist es, das dezentrale Training von Sprachmodellen unter verschiedenen Konfigurationen (z.B. Anzahl der teilnehmenden Clients, Datenverteilung, usw.) zu untersuchen, um so Rückschlüsse auf den Einfluss von Parametern formulieren zu können. |
Requirement |
|
Created | 22/01/25 |