Stud.IP Uni Oldenburg
University of Oldenburg
04.12.2023 13:54:07
ThesisTopics

Personal details

Title Möglichkeiten zur Verarbeitung anonymisierter Daten entlang des Record-Linkage-Prozesses
Description

Die Datenschmiede.ai GmbH entwickelt eine KI-basierte Software für Record-Linkage, mit der die Datenintegration und Duplikats-Erkennung nahezu vollständig automatisiert werden. Dabei werden sog. Stammdaten fokussiert, wie Kunden- oder Zuliefererdaten, die auch häufig sensible Daten, wie personenbezogene Daten, enthalten. Record Linkage wird in die Bereiche Big Data, Datenintegration, Data Science sowie Data Engineering eingeordnet. Der Record-Linkage-Prozess besteht aus den Schritten (1) Schema Matching (2) Data Preparation, (3) Blocking, (4) Comparison, (5) Classification, (6) Evaluation. Beispielsweise werden für den Schritt (4) Comparison relevante Attribute, wie Kundennamen, über Textvergleiche miteinander verglichen. Ziel dieser Abschlussarbeit ist es zu erforschen, inwiefern diese Textvergleiche auch auf anonymisierten Daten durchgeführt werden können, welche Verschlüsselungsalgorithmen sich eignen und welche Auswirkungen diese auf die Ergebnisqualität haben werden im Vergleich zur Verarbeitung nicht-anonymisierter Daten.

 

Folgende Links als erste weiterführende Informationen zum Thema:

https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/1472-6947-9-41

Die Betreuung der Abschlussarbeit übernimmt Uni-seitig Jan-Philipp Awick. Seitens der Datenschmiede.ai betreuen Christoph Schröer und Dr. Felix Kruse die Abschlussarbeit.

Home institution Department of Computing Science
Type of work practical / application-focused
Type of thesis Bachelor's or Master's degree
Author Jan-Philipp Awick
Status available
Problem statement
Ziel dieser Abschlussarbeit ist es zu erforschen, inwiefern diese Textvergleiche auch auf anonymisierten Daten durchgeführt werden können, welche Verschlüsselungsalgorithmen existieren und welche Auswirkungen dies auf die Ergebnisqualität haben werden im Vergleich zur Verarbeitung nicht-anonymisierter Daten.
Requirement
  • Eigeninitiative
  • eine hohe Lernbereitschaft
  • Engagement, um gemeinsam mit dem KI-Startup Datenschmiede.ai ein innovatives Thema zu erarbeiten.
Created 19/09/23

Study data

Departments
  • Very Large Business Applications
Degree programmes
  • Bachelor's Programme Business Informatics
  • Master's Programme Computing Science
  • Bachelor's Programme Computing Science
  • Master's Programme Business Informatics
Assigned courses
Contact person