[DSGVO-Schritt 10] Verbesserung der Datenqualität

Die Datenschutz-Grundverordnung (DSGVO) der Europäischen Union trat am 25. Mai 2018 in Kraft. Mit der Einführung der DSGVO müssen Unternehmen sicherstellen, dass die personenbezogenen Daten von Kunden, Mitarbeitern, potenziellen Kunden etc. vollständig und korrekt sind.

In unserem kürzlich veranstalteten On-Demand-Webinar Practical Steps to GDPR Compliance haben wir einen umfassenden 16-stufigen Plan für die Umsetzung eines Data-Governance-Programms vorgestellt, der die Einhaltung der DSGVO erleichtern soll.

Die Verbesserung der Datenqualität ist der zehnte Schritt. Wenn Sie mehr über die ersten neun Schritte erfahren möchten, werfen Sie einen Blick auf die Links in der Sidebar.

Datenqualität unter der DSGVO

Gemäß Artikel 16 der DSGVO sind Unternehmen dazu verpflichtet, unrichtige personenbezogene Daten unverzüglich zu berichtigen und unvollständige personenbezogene Daten umgehend zu vervollständigen. Governance-Teams müssen mithilfe entsprechender Kontrollen sicherstellen, dass betroffene Personen Qualitätsprobleme im Hinblick auf ihre personenbezogenen Daten zeitnah angehen können.

Auch der Datenabgleich spielt eine wesentliche Rolle, da Kunden- und Mitarbeiterdaten an verschiedenen Orten und Systemen innerhalb der Organisation fragmentiert vorliegen können. Die DSGVO sieht vor, dass diese Informationen in einer einheitlichen und vollständigen Übersicht zusammengeführt werden, die auf Anfrage den betroffenen Personen zur Verfügung gestellt werden kann.

Talend für die Datenqualität

Schlechte Daten kosten US-Unternehmen 3 Billionen $ pro Jahr. Sie können zu einem unzureichenden Verständnis der Kunden sowie zu Verstößen gegen DSGVO-Vorgaben führen und empfindliche Geldstrafen nach sich ziehen. Dies ist für die meisten Organisationen zweifellos ein großes Problem, um das sie sich kümmern müssen.

Im Folgenden finden Sie einen Überblick über einige Faktoren, die für eine schlechte Datenqualität sorgen, sowie die entsprechenden Talend-Tools, die Abhilfe schaffen:

  1. Informationssilos — In der heutigen Big-Data-Welt stammen die Informationen aus unterschiedlichen Quellen und Systemen. Talend Data Integration Platform trägt Daten aus unterschiedlichen Quellen in einer zentralen Plattform zusammen.
  2. Unterschiedliche Technologien — Weil Unternehmen unterschiedliche Technologien einsetzen, liegen Daten in verschiedenen Formaten vor. Talend Data Integration Platform ermöglicht eine einfache Integration unterschiedlicher Tools und Apps mit jeder beliebigen Technologie (z. B. Schreiben eines MapReduce- oder Spark-Jobs) und stellt Daten in einem einheitlichen Format bereit.
  3. Uneinheitliche Daten — Weil die Daten aus unterschiedlichen Quellen stammen, kann es zu Abweichungen kommen. Es könnte zum Beispiel sein, dass in den Marketing- und Vertriebssystemen unterschiedliche Mobilfunknummern ein und desselben Kunden verzeichnet sind. Mit Talend Data Quality und Talend Data Stewardship lassen sich diese Informationen in einem einheitlichen Stammdatensatz (einzige Version der Wahrheit) zusammenführen.

Integration mit dem Datenqualitätszyklus

Mit Talend Data Quality lassen sich Probleme in allen Phasen des Datenqualitätszyklus (Abbildung 1) beheben. Das Produkt bietet Lösungen für alle Szenarien: angefangen bei der Identifizierung von Problemen und der Standardisierung von Daten mithilfe von Bibliotheken über die Auflösung von Duplikaten und die Zusammenführung der Datensätze in einer einzigen Version der Wahrheit bis hin zur ständigen Überwachung der Datenqualität.

Abbildung 1: Datenqualitätszyklus.

Talend Data Quality generiert nativen Code, um Datenqualitätskontrollen und Datenanonymisierung an der richtigen Stelle (lokal innerhalb eines Hadoop-Clusters oder in der Cloud) und zur richtigen Zeit (auf gespeicherte Daten oder Streaming-Daten) anzuwenden. Das Produkt bietet auch ausgeklügelte Deduplizierungs- und Abgleichfunktionen, um Datensätze über verschiedene Systeme hinweg zusammenzuführen oder zu verbinden.

Abbildung 2: Talend Data Quality kann personenbezogene Daten automatisch mit neuen Datenquellen auf Basis von Mustern, Wörterbüchern oder Ontologien abgleichen und anschließend markierte Daten kennzeichnen oder Regeln darauf anwenden.

Manche Organisationen müssen Befugnisse von den Datenschutzbeauftragten auf die Data-Stewards oder Business-Anwender übertragen. Zum Beispiel ist ein Vertriebsingenieur möglicherweise am besten geeignet, um sicherzustellen, dass die Kontaktdaten seiner Accounts aktuell gehalten werden. Und um die Einrichtung eines Zustimmungsmechanismus innerhalb der Marketingdatenbank sollte sich idealerweise ein Kampagnenmanager kümmern.

Um sicherzugehen, dass jeder in der Organisation seine Daten regelkonform nutzt, müssen workflowbasierte Selfservice-Apps wie Talend Data Preparation und Talend Data Stewardship in den verschiedenen Abteilungen bereitgestellt werden. So profitieren diese von einer größeren Eigenständigkeit, ohne Daten irgendwelchen Risiken auszusetzen (siehe Abbildung 3).

Figure 3: Talend Data Stewardship allows the orchestration of stewardship workflows and the delegation of activities to potentially anyone in the organization.

Die nächsten Schritte zur Verbesserung der Datenqualität

Um die Vorgaben der DSGVO zu erfüllen, ist es wichtig, dass sich Organisationen um die Datenqualität kümmern. In einem komplexen Software-Ökosystem funktioniert dies am schnellsten und einheitlichsten mithilfe automatisierter Lösungen und Selfservice-Tools, die Daten sammeln, abgleichen und konsolidieren.

Der nächste Schritt in unserem umfassenden 16-stufigen Plan für die DSGVO-Compliance ist die Konsolidierung der Datenherkunft.

← Schritt 9  |  Schritt 11 →

Sind Sie bereit, mit Talend durchzustarten?