Personal details
Title | Entwicklung eines Benchmarking-Systems zur Evaluation von Large Language Models (LLM) für unternehmensspezifische Aufgaben |
Description | Die abat AG, eine international erfolgreiche SAP-Beratung im Bereich Automotive und Logistik, sucht einen Bacheloranden/Masteranden (m/w/d) für eine Abschlussarbeit im Bereich der KI-gestützten Systementwicklung. Im Rahmen dieser Arbeit soll ein System zur Evaluation von Large Language Models (LLM) konzipiert und implementiert werden. Da viele Unternehmen sensible Daten verarbeiten und ihre Modelle lokal hosten müssen, stellt die Evaluation neuer Modelle eine besondere Herausforderung dar. Öffentliche Benchmarks bieten oft nicht ausreichend Überblick über die Eignung der Modelle für spezifische unternehmerische Prozesse bzw. reale Daten. Ziel dieser Arbeit ist es, ein flexibles Benchmarking-System zu entwickeln, das verschiedene LLM einbinden und ihre Eignung anhand spezifischer Aufgaben aus dem Unternehmenskontext testen kann. Dies soll Unternehmen dabei unterstützen, fundierte Entscheidungen bezüglich des Einsatzes von LLM zu treffen. Mit Hauptsitz in Bremen und zahlreichen namhaften Kunden aus dem Automotive- und Logistiksektor bietet abat dir die Chance, dein theoretisches Wissen in der Praxis anzuwenden und wertvolle Hands-on-Erfahrungen zu sammeln!
|
Home institution | Department of Computing Science |
Associated institutions |
|
Type of work | in businesses |
Type of thesis | Bachelor's or Master's degree |
Author | Steffen Meeuw, M. Sc. |
Status | available |
Problem statement | Entwicklung eines KI-basierten Systems zum Vergleich bzw. Benchmarking von Large Language Modellen im Unternehmensumfeld:
|
Requirement |
|
Created | 19/06/24 |