Topic: Quantifizierung von Datenungleichgewichten in neuronalen Netzen für Regressionsaufgaben

Topic: Quantifizierung von Datenungleichgewichten in neuronalen Netzen für Regressionsaufgaben

Personal details

Title Quantifizierung von Datenungleichgewichten in neuronalen Netzen für Regressionsaufgaben
Description

Schwerpunkt: Data Science, Neuronale Netze

In der Welt von Machine Learning und Künstlicher Intelligenz ist Datenqualität oft entscheidender als die Wahl des Modells. Besonders spannend – und gleichzeitig herausfordernd – ist der Umgang mit unausgewogenen Datenverteilungen, also Data Imbalance. Während dieses Phänomen im Klassifikationskontext bereits gut erforscht ist, steckt die Analyse im Bereich Regression noch in den Kinderschuhen. Dabei zeigen erste Studien: Nicht nur die Verteilung der Daten selbst, sondern auch das verwendete Modellarchitektur beeinflusst, wie stark sich Imbalance auf die Modellgüte auswirkt.

In dieser Arbeit soll untersucht werden, wie sich Datenungleichgewichte im Kontext neuronaler Netze für Regressionsaufgaben quantifizieren lassen. Es kann auf vorhandene Forschungsarbeiten aufgebaut werden, die bereits erste Ansätze zur Bewertung solcher Ungleichgewichte liefern.

Home institution Department of Computing Science
Associated institutions
Type of work practical / application-focused
Type of thesis Bachelor's or Master's degree
Author Jelke Wibbeke, M. Sc.
Status available
Problem statement
  • Es soll sich in aktuelle wissenschaftliche Arbeiten zur Quantifizierung von Data Imbalance in Regressionsszenarien eingearbeitet werden.
  • Geeignete Metriken zur Beschreibung von Imbalance in Regressionsdaten sollen recherchiert, ausgewählt und angewendet werden.
  • Neuronale Netze sollen im Hinblick auf ihre Robustheit gegenüber verschiedenen Arten von Imbalance getestet werden.
  • Ein bestehendes Framework kann erweitert oder ein neues Konzept zur modellabhängigen Bewertung von Imbalance-Effekten entwickelt werden.
  • Die Ergebnisse sollen dokumentiert, analysiert und mit geeigneten Visualisierungen aufbereitet werden.
Requirement
  • Die Arbeit richtet sich an Studierende der Informatik die sich mit der datengetriebenen Modellierung beschäftigen wollen.
  • Ein mathematisches Grundverständnis sollte vorhanden sein.
  • Vorkenntnisse im Bereich Data Science, Neuronale Netze und Python-Programmierung sind wünschenswert, aber nicht zwingend erforderlich.
  • Bewerber*innen sollten bereit sein, sich motiviert und selbstständig in das neue Thema einzuarbeiten.
  • Die Ausarbeitung kann auf Deutsch oder Englisch erfolgen.
  • Die Arbeit kann sowohl im Homeoffice als auch in Präsenz erfolgen.
Created 22/05/25

Study data

Departments
  • Verteilte Regelung in vernetzten Systemen
Degree programmes
  • Master's Programme Computing Science
  • Bachelor's Programme Computing Science
Assigned courses
Contact person