Topic: Bias-Mitigation durch Ensemble Learning bei unausgewogenen Regressionsdaten

Topic: Bias-Mitigation durch Ensemble Learning bei unausgewogenen Regressionsdaten

Personal details

Title Bias-Mitigation durch Ensemble Learning bei unausgewogenen Regressionsdaten
Description

Themenschwerpunkt: Data Science, Maschinelles lernen

 

In der Welt der künstlichen Intelligenz und des maschinellen Lernens ist Datenqualität ein entscheidender Erfolgsfaktor. Besonders bei Regressionsproblemen kann eine unausgewogene Verteilung der Zielvariable (Imbalanced Regression) dazu führen, dass ML-Modelle systematische Fehler machen – sogenannte Modellverzerrungen (Bias). Klassische Methoden zur Mitigation wie Resampling oder Reweighting können diese Verzerrung zwar reduzieren, führen jedoch oft zu einer schlechteren Gesamtleistung des Modells.

Die spannende Frage ist daher: Können wir durch den Einsatz von Ensemble Learning – also die Kombination mehrerer Modelle – das Beste aus beiden Welten erreichen? Ziel dieser Masterarbeit ist es, genau diese Frage datengetrieben zu analysieren.

Home institution Department of Computing Science
Associated institutions
Type of work practical / application-focused
Type of thesis Bachelor's or Master's degree
Author Jelke Wibbeke, M. Sc.
Status available
Problem statement

Im Rahmen dieser Masterarbeit soll untersucht werden, ob und inwiefern Ensemble-Methoden (z. B. Bagging, Boosting, Stacking) dazu beitragen können, Modellverzerrungen durch Imbalanced Regression zu reduzieren – ohne die Modellqualität zu kompromittieren.

Die Aufgaben umfassen:

  • Literaturrecherche zu Modell-Bias, Imbalanced Regression und Ensemble Learning
  • Entwicklung eines Benchmark-Setups mit bestehenden Bias-Mitigation-Strategien (z. B. SMOGN, Reweighting)
  • Implementierung und Training von Ensemble-Ansätzen auf verschiedenen Regressionsdatensätzen
  • Systematische Analyse von Modellgüte und Verzerrung im Vergleich zu Einzelmodellen
  • Kritische Bewertung der Ergebnisse und Ableitung von Best Practices
Requirement
  • Die Arbeit richtet sich an Studierende der Informatik die sich mit der datengetriebenen Modellierung beschäftigen wollen.
  • Ein mathematisches Grundverständnis sollte vorhanden sein.
  • Vorkenntnisse im Bereich Data Science, Neuronale Netze und Python-Programmierung sind wünschenswert, aber nicht zwingend erforderlich.
  • Bewerber*innen sollten bereit sein, sich motiviert und selbstständig in das neue Thema einzuarbeiten.
  • Die Ausarbeitung kann auf Deutsch oder Englisch erfolgen.
  • Die Arbeit kann sowohl im Homeoffice als auch in Präsenz erfolgen.
Created 22/05/25

Study data

Departments
  • Verteilte Regelung in vernetzten Systemen
Degree programmes
  • Master's Programme Computing Science
  • Bachelor's Programme Computing Science
Assigned courses
Contact person