[DSGVO-Schritt 7] Einführung von Datenmaskierungsstandards für die DSGVO
Laut Datenschutz-Grundverordnung (DSGVO) der Europäischen Union trat am 25. Mai 2018 in Kraft. Mit der Einführung der DSGVO werden Unternehmen stärker in die Verantwortung genommen, personenbezogene Daten wie etwa von Kunden, Mitarbeitern und potenziellen Neukunden zu schützen. Dazu gehört die Anonymisierung von Daten für einen kontrollierten Datenschutz.
In unserem kürzlich veranstalteten On-Demand-Webinar Practical Steps to GDPR Compliance haben wir einen umfassenden 16-stufigen Plan für die Umsetzung eines Data-Governance-Programms zur Förderung der DSGVO-Compliance vorgestellt.
Der siebte Schritt ist die Festlegung von Standards für die Datenmaskierung. Wenn Sie mehr über die ersten sechs Schritte erfahren möchten, werfen Sie einen Blick auf die Links in der Sidebar.
Was sagt die DSGVO über das Thema Datenmaskierung?
Die DSGVO unterscheidet zwischen personenbezogenen Daten, die direkt Aufschluss über die Identität einer Person geben können, und anderen Daten, die so verarbeitet oder gespeichert werden können, dass die Vertraulichkeit gewahrt wird.
Weniger Verpflichtungen für anonyme Daten
Erwägungsgrund 26 der DSGVO besagt, dass die Grundsätze des Datenschutzes für alle Informationen gelten sollten, „die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen“. Die Grundsätze gelten daher nicht für anonyme Informationen oder für personenbezogene Daten, durch die die betroffene Person nicht identifizierbar ist.
Artikel 11 der DSGVO befasst sich mit Verarbeitungsszenarien, bei denen keine Identifizierung erforderlich ist. Wenn für den Verantwortlichen (natürliche oder juristische Person, Behörde, Einrichtung oder andere Stelle, die über Zwecke und Mittel bei der Verarbeitung personenbezogener Daten entscheidet) keine Identifizierung der betroffenen Person erforderlich ist, werden die Verpflichtungen, denen der Verantwortliche unter der DSGVO unterliegt, deutlich reduziert.
Tatsächlich bestätigen Erwägungsgrund 26 und Artikel 11 der DSGVO die Existenz anonymer Informationen und befreien Organisationen von strengeren Sicherheitsverpflichtungen in Fällen, in denen personenbezogene Daten verborgen bleiben.
Maskierung personenbezogener Daten zu Sicherheitszwecken
Artikel 32 der DSGVO beschäftigt sich mit der Sicherheit der Verarbeitung. Bei empfindlichen personenbezogenen Daten empfiehlt die DSGVO die Implementierung geeigneter organisatorischer und technischer Maßnahmen (z. B. Anonymisierung, Pseudonymisierung), um ein dem Risiko angemessenes Sicherheitslevel zu gewährleisten.
Die Data-Governance-Verantwortlichen müssen Kontrollen einrichten, um sensible personenbezogene Daten auf angemessene Weise zu maskieren oder zu verschlüsseln. Die Datenmaskierungsstandards müssen sicherstellen, dass die Daten nicht rekonstruiert werden können, wenn mehrere Felder kombiniert werden.
Beispielsweise könnten Data-Scientists fordern, dass der Mitarbeitername vor einer Analyse maskiert werden soll. Allerdings könnten erfahrene und geschickte Data-Scientists die Identität eines Mitarbeiters ermitteln, indem sie sich einfach nur den Titel, die Vergütung und das Geschlecht anschauen (z. B. „HR-Leiterin mit einem Grundgehalt von 200.000 $“). In einem solchen Fall wäre es angemessener, auch den Jobtitel zu maskieren und eine Gehaltsspanne wie z. B. „über 100.000 $“ anzugeben.
Datenmaskierung mit Talend
Mithilfe von Talend Data Quality lassen sich Datenmaskierung und Data-Shuffling (Umsortierung der Daten) als zentrale Funktionen an jedem Punkt der Datenpipeline umsetzen (siehe Abbildung 1).
Data-Shuffling ist eine Art Datenmaskierung, bei der eine Spalte (oder ein komplexerer Datensatz wie eine Gruppe von Spalten oder eine Partition) zufällig gemischt wird, sodass die Identität verborgen bleibt, aber relevante Werte noch erhalten bleiben. Auf diese Weise wird der Datenschutz gewährleistet, während Analysen und Datentests immer noch auf Basis der ursprünglichen Datenwerte durchgeführt werden können.
Abbildung 1: Durch vorkonfigurierte oder benutzerdefinierte Funktionen lassen sich Datenmaskierung und Data-Shuffling auf Batch- und Echtzeit-Datenströme anwenden.
Mithilfe von Talend Data Preparation lässt sich die Datenmaskierung auch ad hoc umsetzen. So können die Nutzer in den Geschäftsbereichen sensible Daten vor der Weitergabe an Kollegen schützen. Nehmen wir zum Beispiel den Leiter einer Marketingkampagne, der seinen Partner über den Erfolg einer Kampagne informieren möchte. Er könnte die Daten, welche möglicherweise datenschutzrelevante Informationen auf eine nicht angemessene Weise preisgeben, anonymisieren und dann den Datensatz zur Analyse weitergeben (Abbildung 2).
Abbildung 2: Selfservice-Datenmaskierung für Business-Anwender in Talend Data Preparation.
Dies ist möglich, weil das Datenmaskierungstool den semantischen Kontext berücksichtigt und für typische personenbezogene Daten wie E-Mail-ID und Telefonnummer vorkonfiguriert ist. Im Fall einer E-Mail-ID könnte das Tool den ersten Teil – vor „@“ – verbergen, aber dafür den Domainnamen anzeigen.
Die nächsten Schritte zur Einhaltung der DSGVO
Früher war die Datenmaskierung eine spezialisierte Disziplin, die nur Nischenanwendungen vorbehalten war. Durch die DSGVO hat sich dies geändert: Alle möglichen Anwendungen können jetzt eine Funktion für die Datenmaskierung bieten. Das Feature muss benutzerfreundlich sein, sodass sowohl Entwickler als auch Business-Anwender ohne umfassende Datenmaskierungskenntnisse es ohne Weiteres einsetzen können. Genau nach diesen Anforderungen haben wir die Talend-Lösungen für die DSGVO konzipiert.
Die Schritte 1 bis 7 des umfassenden 16-stufigen Plans bilden die Grundlage zur Einhaltung der DSGVO-Vorgaben. Organisationen sollten nun ein klares Verständnis ihrer Daten haben und über eine Reihe präzise definierter Standards für die Erfassung, die Verarbeitung und den Schutz der Daten verfügen. Der nächste Schritt ist die Durchführung von Datenschutz-Folgenabschätzungen.
← Schritt 6 | Schritt 8 →
Weitere Artikel zu diesem Thema
- Vorbereitung auf die DSGVO
- [DSGVO-Schritt 14] Verwaltung des Informationslebenszyklus
- [DSGVO-Schritt 15] Abschluss von Verträgen zur Weitergabe von Daten
- [DSGVO-Schritt 16] Einrichtung von Kontrollen zur Einhaltung der Vorgaben
- [DSGVO-Schritt 13] Verwaltung des End-User-Computings
- [DSGVO-Schritt 11] Konsolidierung der Datenherkunft
- [DSGVO-Schritt 9] Durchführung einer Risikobewertung von Lieferanten
- [DSGVO-Schritt 12] Verwaltung von Analysemodellen
- [DSGVO-Schritt 10] Verbesserung der Datenqualität
- [DSGVO-Schritt 8] Durchführung von Datenschutz-Folgenabschätzungen
- [DSGVO-Schritt 3] Bestimmung von Dateninhabern
- [DSGVO-Schritt 6] Definition von Standards für die zulässige Nutzung für die DSGVO
- [DSGVO-Schritt 2] Die Bedeutung einer Datentaxonomie
- [DSGVO-Schritt 4] Identifizierung kritischer Datensätze und kritischer Datenelemente
- [DSGVO-Schritt 1] Entwicklung von Richtlinien, Standards und Kontrollen
- Datenschutz
- [DSGVO-Schritt 5] Festlegung von Standards für die Datenerfassung