Personal details
Title | Möglichkeiten zur Verarbeitung anonymisierter Daten entlang des Record-Linkage-Prozesses |
Description | Die Datenschmiede.ai GmbH entwickelt eine KI-basierte Software für Record-Linkage, mit der die Datenintegration und Duplikats-Erkennung nahezu vollständig automatisiert werden. Dabei werden sog. Stammdaten fokussiert, wie Kunden- oder Zuliefererdaten, die auch häufig sensible Daten, wie personenbezogene Daten, enthalten. Record Linkage wird in die Bereiche Big Data, Datenintegration, Data Science sowie Data Engineering eingeordnet. Der Record-Linkage-Prozess besteht aus den Schritten (1) Schema Matching (2) Data Preparation, (3) Blocking, (4) Comparison, (5) Classification, (6) Evaluation. Beispielsweise werden für den Schritt (4) Comparison relevante Attribute, wie Kundennamen, über Textvergleiche miteinander verglichen. Ziel dieser Abschlussarbeit ist es zu erforschen, inwiefern diese Textvergleiche auch auf anonymisierten Daten durchgeführt werden können, welche Verschlüsselungsalgorithmen sich eignen und welche Auswirkungen diese auf die Ergebnisqualität haben werden im Vergleich zur Verarbeitung nicht-anonymisierter Daten.
Folgende Links als erste weiterführende Informationen zum Thema: https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/1472-6947-9-41 |
Home institution | Department of Computing Science |
Type of work | practical / application-focused |
Type of thesis | Bachelor's or Master's degree |
Author | Jan-Philipp Awick |
Status | available |
Problem statement | Ziel dieser Abschlussarbeit ist es zu erforschen, inwiefern diese Textvergleiche auch auf anonymisierten Daten durchgeführt werden können, welche Verschlüsselungsalgorithmen existieren und welche Auswirkungen dies auf die Ergebnisqualität haben werden im Vergleich zur Verarbeitung nicht-anonymisierter Daten. |
Requirement |
|
Created | 19/09/23 |