Personal details
Title | Entwicklung und Evaluierung eines deutschen Benchmark-Datensatzes für Retrieval-Augmented Generation (RAG) Systeme |
Description | HintergrundRetrieval-Augmented Generation (RAG) verbindet Informationsabruf mit generativen Sprachmodellen. Während für englischsprachige RAG-Systeme zahlreiche Benchmarks existieren, fehlen vergleichbare Ressourcen für den deutschen Sprachraum. Diese Masterarbeit soll diese Lücke schließen. ZielsetzungZiel dieser Arbeit ist die Erstellung und Validierung eines umfassenden deutschen Benchmark-Datensatzes zur Evaluierung von RAG-Systemen über verschiedene Fachdomänen hinweg. Grundlegende Begriffe
Datentypologie und MultimodalitätDer Benchmark soll verschiedene Datentypen umfassen, um der Vielfalt moderner KI-Systeme gerecht zu werden:
EvaluierungsmetrikenDer zu entwickelnde Benchmark könnte folgende Bewertungsdimensionen umfassen:
Potenzielle Aufgabenbereiche
Erwartete Ergebnisse
Anforderungen an Bewerber/innen
|
Home institution | Department of Computing Science |
Associated institutions |
|
Type of work | practical / application-focused |
Type of thesis | Master's degree |
Author | Jan-Hendrik Witte |
Status | available |
Problem statement | |
Requirement | |
Created | 25/02/25 |