Topic: Entwicklung eines Benchmarking-Systems zur Evaluation von Large Language Models (LLM) für unternehmensspezifische Aufgaben

Topic: Entwicklung eines Benchmarking-Systems zur Evaluation von Large Language Models (LLM) für unternehmensspezifische Aufgaben

Personal details

Title Entwicklung eines Benchmarking-Systems zur Evaluation von Large Language Models (LLM) für unternehmensspezifische Aufgaben
Description

Die abat AG, eine international erfolgreiche SAP-Beratung im Bereich Automotive und Logistik, sucht einen Bacheloranden/Masteranden (m/w/d) für eine Abschlussarbeit im Bereich der KI-gestützten Systementwicklung.

Im Rahmen dieser Arbeit soll ein System zur Evaluation von Large Language Models (LLM) konzipiert und implementiert werden. Da viele Unternehmen sensible Daten verarbeiten und ihre Modelle lokal hosten müssen, stellt die Evaluation neuer Modelle eine besondere Herausforderung dar. Öffentliche Benchmarks bieten oft nicht ausreichend Überblick über die Eignung der Modelle für spezifische unternehmerische Prozesse bzw. reale Daten.

Ziel dieser Arbeit ist es, ein flexibles Benchmarking-System zu entwickeln, das verschiedene LLM einbinden und ihre Eignung anhand spezifischer Aufgaben aus dem Unternehmenskontext testen kann. Dies soll Unternehmen dabei unterstützen, fundierte Entscheidungen bezüglich des Einsatzes von LLM zu treffen.

Mit Hauptsitz in Bremen und zahlreichen namhaften Kunden aus dem Automotive- und Logistiksektor bietet abat dir die Chance, dein theoretisches Wissen in der Praxis anzuwenden und wertvolle Hands-on-Erfahrungen zu sammeln!

  • Arbeit an einem Thema mit hoher Praxisrelevanz und Einbettung in ein aktuelles Forschungsprojekt
  • Einblicke in die Praxis und in ein Unternehmen
  • qualifizierte Betreuung durch Uni-Ansprechpartner und Unternehmen
Home institution Department of Computing Science
Associated institutions
Type of work in businesses
Type of thesis Bachelor's or Master's degree
Author Steffen Meeuw, M. Sc.
Status available
Problem statement

Entwicklung eines KI-basierten Systems zum Vergleich bzw. Benchmarking von Large Language Modellen im Unternehmensumfeld:

  • Literaturrecherche / State of the Art
  • Auswahl von Ansätzen und Frameworks
  • Prototypische Implementierung
  • Evaluation des Systems
Requirement
  • Gute Kenntnisse in Python
  • Grundkenntnisse im Bereich KI sind wünschenswert
  • Hohes Engagement, Eigeninitiative und Kreativität
  • Teamfähigkeit und gute Kommunikationsfähigkeiten
Created 19/06/24

Study data

Departments
  • Very Large Business Applications
Degree programmes
  • Bachelor's Programme Business Informatics
  • Master's Programme Computing Science
  • Bachelor's Programme Computing Science
  • Master's Programme Business Informatics
Assigned courses
Contact person