Show simple item record

2023-08-30Dissertation DOI: 10.18452/27106
Anonymization Techniques for Privacy-preserving Process Mining
dc.contributor.authorFahrenkrog-Petersen, Stephan A.
dc.date.accessioned2023-08-30T10:22:49Z
dc.date.available2023-08-30T10:22:49Z
dc.date.issued2023-08-30none
dc.identifier.urihttp://edoc.hu-berlin.de/18452/27863
dc.description.abstractProcess Mining ermöglicht die Analyse von Event Logs. Jede Aktivität ist durch ein Event in einem Trace recorded, welcher jeweils einer Prozessinstanz entspricht. Traces können sensible Daten, z.B. über Patienten enthalten. Diese Dissertation adressiert Datenschutzrisiken für Trace Daten und Process Mining. Durch eine empirische Studie zum Re-Identifikations Risiko in öffentlichen Event Logs wird die hohe Gefahr aufgezeigt, aber auch weitere Risiken sind von Bedeutung. Anonymisierung ist entscheidend um Risiken zu adressieren, aber schwierig weil gleichzeitig die Verhaltensaspekte des Event Logs erhalten werden sollen. Dies führt zu einem Privacy-Utility-Trade-Off. Dieser wird durch neue Algorithmen wie SaCoFa und SaPa angegangen, die Differential Privacy garantieren und gleichzeitig Utility erhalten. PRIPEL ergänzt die anonymiserten Control-flows um Kontextinformationen und ermöglich so die Veröffentlichung von vollständigen, geschützten Logs. Mit PRETSA wird eine Algorithmenfamilie vorgestellt, die k-anonymity garantiert. Dafür werden privacy-verletztende Traces miteinander vereint, mit dem Ziel ein möglichst syntaktisch ähnliches Log zu erzeugen. Durch Experimente kann eine bessere Utility-Erhaltung gegenüber existierenden Lösungen aufgezeigt werden.ger
dc.description.abstractProcess mining analyzes business processes using event logs. Each activity execution is recorded as an event in a trace, representing a process instance's behavior. Traces often hold sensitive info like patient data. This thesis addresses privacy concerns arising from trace data and process mining. A re-identification risk study on public event logs reveals high risk, but other threats exist. Anonymization is vital to address these issues, yet challenging due to preserving behavioral aspects for analysis, leading to a privacy-utility trade-off. New algorithms, SaCoFa and SaPa, are introduced for trace anonymization using noise for differential privacy while maintaining utility. PRIPEL supplements anonymized control flows with trace contextual info for complete protected logs. For k-anonymity, the PRETSA algorithm family merges privacy-violating traces based on a prefix representation of the event log, maintaining syntactic similarity. Empirical evaluations demonstrate utility improvements over existing techniques.eng
dc.language.isoengnone
dc.publisherHumboldt-Universität zu Berlin
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/
dc.subjectProcess Miningger
dc.subjectDatenschutzger
dc.subjectAnonymisierungger
dc.subjectResponsible Data Scienceger
dc.subjectProcess Miningeng
dc.subjectPrivacyeng
dc.subjectAnonymizationeng
dc.subjectResponsible Data Scienceeng
dc.subject.ddc004 Informatiknone
dc.subject.ddc005 Computerprogrammierung, Computerprogramme, Datennone
dc.titleAnonymization Techniques for Privacy-preserving Process Miningnone
dc.typedoctoralThesis
dc.identifier.urnurn:nbn:de:kobv:11-110-18452/27863-6
dc.identifier.doihttp://dx.doi.org/10.18452/27106
dc.date.accepted2023-06-30
dc.contributor.refereeWeidlich, Matthias
dc.contributor.refereevan der Aalst, Wil
dc.contributor.refereeSong, Minseok
local.edoc.pages176none
local.edoc.type-nameDissertation
bua.departmentMathematisch-Naturwissenschaftliche Fakultätnone

Show simple item record