Thema: Möglichkeiten zur Verarbeitung anonymisierter Daten entlang des Record-Linkage-Prozesses

Thema: Möglichkeiten zur Verarbeitung anonymisierter Daten entlang des Record-Linkage-Prozesses

Grunddaten

Titel Möglichkeiten zur Verarbeitung anonymisierter Daten entlang des Record-Linkage-Prozesses
Beschreibung

Die Datenschmiede.ai GmbH entwickelt eine KI-basierte Software für Record-Linkage, mit der die Datenintegration und Duplikats-Erkennung nahezu vollständig automatisiert werden. Dabei werden sog. Stammdaten fokussiert, wie Kunden- oder Zuliefererdaten, die auch häufig sensible Daten, wie personenbezogene Daten, enthalten. Record Linkage wird in die Bereiche Big Data, Datenintegration, Data Science sowie Data Engineering eingeordnet. Der Record-Linkage-Prozess besteht aus den Schritten (1) Schema Matching (2) Data Preparation, (3) Blocking, (4) Comparison, (5) Classification, (6) Evaluation. Beispielsweise werden für den Schritt (4) Comparison relevante Attribute, wie Kundennamen, über Textvergleiche miteinander verglichen. Ziel dieser Abschlussarbeit ist es zu erforschen, inwiefern diese Textvergleiche auch auf anonymisierten Daten durchgeführt werden können, welche Verschlüsselungsalgorithmen sich eignen und welche Auswirkungen diese auf die Ergebnisqualität haben werden im Vergleich zur Verarbeitung nicht-anonymisierter Daten.

 

Folgende Links als erste weiterführende Informationen zum Thema:

https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/1472-6947-9-41

Die Betreuung der Abschlussarbeit übernimmt Uni-seitig Jan-Philipp Awick. Seitens der Datenschmiede.ai betreuen Christoph Schröer und Dr. Felix Kruse die Abschlussarbeit.

Heimateinrichtung Department für Informatik
Art der Arbeit praktisch / anwendungsbezogen
Abschlussarbeitstyp Bachelor oder Master
Autor Jan-Philipp Awick
Status verfügbar
Aufgabenstellung
Ziel dieser Abschlussarbeit ist es zu erforschen, inwiefern diese Textvergleiche auch auf anonymisierten Daten durchgeführt werden können, welche Verschlüsselungsalgorithmen existieren und welche Auswirkungen dies auf die Ergebnisqualität haben werden im Vergleich zur Verarbeitung nicht-anonymisierter Daten.
Voraussetzung
  • Eigeninitiative
  • eine hohe Lernbereitschaft
  • Engagement, um gemeinsam mit dem KI-Startup Datenschmiede.ai ein innovatives Thema zu erarbeiten.
Erstellt 19.09.2023

Studiendaten

Abteilungen
  • Very Large Business Applications
Studiengänge
  • Fach-Bachelor Wirtschaftsinformatik
  • Master Informatik
  • Fach-Bachelor Informatik
  • Master Wirtschaftsinformatik
Zugeordnete Veranstaltungen
Ansprechpartner