Topic: Evaluation verschiedener Methoden zur Schätzung der Bandbreite für kernelbasierte Relevanzfunktionen

Topic: Evaluation verschiedener Methoden zur Schätzung der Bandbreite für kernelbasierte Relevanzfunktionen

Personal details

Title Evaluation verschiedener Methoden zur Schätzung der Bandbreite für kernelbasierte Relevanzfunktionen
Description

Themenschwerpunkt: Data Science und Machine Learning

 

In vielen maschinellen Lernaufgaben, insbesondere im Regressionsbereich, stellt ein unausgewogenes Datenverhältnis (Data Imbalance) eine zentrale Herausforderung dar. Eine Möglichkeit, diesem Problem zu begegnen, besteht in der Nutzung von Relevanzfunktionen, die seltene, aber wichtige Werte im Zielraum stärker gewichten. Kernelbasierte Methoden, insbesondere auf Basis der Kernel Density Estimation (KDE), ermöglichen eine flexible Modellierung dieser Relevanzfunktionen. Ein kritischer Faktor dabei ist die Wahl der Bandbreite (Bandwidth), die maßgeblich die Glattheit und Genauigkeit der Dichteabschätzung bestimmt.

Home institution Department of Computing Science
Associated institutions
Type of work practical / application-focused
Type of thesis Bachelor's
Author Jelke Wibbeke, M. Sc.
Status available
Problem statement

Im Rahmen dieser Bachelorarbeit soll der Einfluss verschiedener Bandbreitenschätzverfahren auf die Qualität kernelbasierter Relevanzfunktionen untersucht werden. Konkret sollen klassische Methoden wie Silverman’s Rule of Thumb und die "Improved Sheather-Jones" (ISJ)-Methode sowie adaptive oder variable Bandbreitenansätze implementiert und verglichen werden. Die Bandbreitenschätzungen sollen anschließend im Kontext der Relevanzfunktionsberechnung für Regressionsprobleme mit unausgewogenen Zielverteilungen eingesetzt und bewertet werden. Hierzu sollen datengetriebene Modelle wie Random Forests oder Neuronale Netze implemeniert und analysiert werden.

Requirement
  • Die Arbeit richtet sich an Studierende der Informatik die sich mit der datengetriebenen Modellierung beschäftigen wollen.
  • Ein mathematisches Grundverständnis sollte vorhanden sein.
  • Vorkenntnisse im Bereich Data Science, Neuronale Netze und Python-Programmierung sind wünschenswert, aber nicht zwingend erforderlich.
  • Bewerber*innen sollten bereit sein, sich motiviert und selbstständig in das neue Thema einzuarbeiten.
  • Die Ausarbeitung kann auf Deutsch oder Englisch erfolgen.
  • Die Arbeit kann sowohl im Homeoffice als auch in Präsenz erfolgen.
Created 21/05/25

Study data

Departments
  • Verteilte Regelung in vernetzten Systemen
Degree programmes
  • Bachelor's Programme Computing Science
Assigned courses
Contact person