[Étape 2 du RGPD] L’importance de créer une taxonomie des données
Le Règlement général sur la protection des données (RGPD), introduit par l’Union européenne, est entré en vigueur le 25 mai 2018. Avec l’introduction du RGPD, la façon dont les organisations traitent les données à caractère personnel de leurs clients, employés et prospects sera étroitement surveillée. La non-conformité peut être sanctionnée par de lourdes amendes. Il est donc impératif pour les organisations de comprendre les données qu’elles collectent et de prendre des mesures pour les protéger.
Nous avons récemment mis en ligne un webinaire à la demande, Étapes pratiques pour la mise en conformité au RGPD, qui porte sur un plan global en 16 étapes de mise en œuvre d’un programme de gouvernance des données en vue d’assurer la conformité au RGPD.
Regardez la première étape du plan, « Comment développer des politiques, normes et contrôles. » La création d’une taxonomie des données est la seconde étape.
Qu’est-ce qu’une taxonomie des données ?
Une taxonomie des données est une classification des données en catégories et sous-catégories. Elle offre un point de vue unique sur les données d’une organisation et introduit des terminologies et sémantiques communes à l’ensemble des systèmes. La hiérarchisation d’un ensemble de métadonnées et leur catégorisation donnent une meilleure compréhension des relations entre les points de données.
Pour assurer la conformité au RGPD, l’équipe de gouvernance des données d’une organisation doit collaborer avec l’architecture des données de l’entreprise pour classer les données.
Par exemple, la taxonomie des données peut comporter des informations sur les employés comme catégorie de niveau 1. Ces informations peuvent ensuite être divisées en plusieurs catégories de niveau 2 (salaires et avantages, identité, contacts, informations sanitaires protégées, réseaux sociaux et performances des collaborateurs, p. ex.).
En quoi la taxonomie des données est-elle essentielle pour le RGPD ?
Le RGPD exige des organisations qu’elles protègent la confidentialité des données à caractère personnel, communiquent sur leur stockage et leur utilisation de ces données, et assument la responsabilité de la confidentialité et de la protection de ces données. La création d’une taxonomie des données devient cruciale dans ce contexte. Voyons ici quelques avantages liés à la création d’une taxonomie des données :
- Compréhension fondamentale des données — Avec l’entrée en vigueur du RGPD, il se peut qu’un grand nombre d’éléments de données existants ne soient pas conformes au règlement. Il faut donc résoudre ce problème. Une taxonomie contribue à la détection de ces problèmes de qualité des données en permettant de bien comprendre.
- Accès aux données — Le RGPD confère aux personnes concernées le droit d’accéder à leurs données en format électronique au besoin. La catégorisation des données contribue à accélérer la récupération des données, en étendant automatiquement la recherche d’un mot clé à d’autres termes qui y sont étroitement liés.
- Analyse du risque — Le classement des données aide à déterminer si ces données présentent un risque de non-conformité. Ce processus permet d’identifier les données qui relèvent de la catégorie des données ultra-sensibles. Conformément au RGPD, ces données doivent faire l’objet d’une anonymisation. L’analyse de la conformité peut ignorer les autres données, non sensibles, ce qui permet d’économiser du temps et de l’énergie.
- Réduction des données indésirables — Le RGPD recommande de minimiser les données pour collecter et stocker uniquement les données à caractère personnel qui sont nécessaires. Une taxonomie aide à éliminer les données ROT (redondantes, obsolètes, triviales) existantes, ce qui réduit le risque de stockage de données à caractère personnel non conformes.
Utiliser les outils Talend pour générer automatiquement une taxonomie
Dans Talend Metadata Manager, il est possible d’utiliser un glossaire professionnel pour définir un ensemble de termes et les relier à des catégories et sous-catégories, comme le montre la Figure 1. La constitution d’un glossaire métier peut être des plus simples : utilisez un modèle de données existant bien documenté, importez les termes et définitions d’autres sources (p. ex., CSV, Microsoft Excel) ou rédigez-les de façon interactive via l’interface utilisateur lors du classement des objets.
Une fois publié, ce glossaire est accessible via une interface de recherche à quiconque possède les autorisations nécessaires.
Figure 1. Glossaire métier Talend Metadata Manager
Étapes suivantes de création d’une taxonomie des données
La création d’une taxonomie n’est qu’un début. Suite à cette classification étendue, il est important d’assigner des propriétaires de données et de cartographier ces catégories de haut niveau jusqu’aux points de données à proprement parler, dans les différents systèmes informatiques. Il est alors plus facile d’exécuter des tâches de profilage et de nettoyage sur ces points de données, pour les rendre fiables et conformes au RGPD.
← Étape 1 | Étape 3 →
Plus d'articles connexes
- Tout comprendre au RGPD grâce au guide Talend
- Qu'est-ce que la minimisation des données ?
- Se préparer au RGPD
- [Étape 14 du RGPD] Comment contrôler le cycle de vie des informations
- [Étape 15 du RGPD] Comment établir des accords de partage des données
- [Étape 16 du RGPD] Comment assurer la conformité au RGPD avec les contrôles
- [Étape 13 du RGPD] Comment gérer l’End User Computing
- [Étape 11 du RGPD] Comment reconstituer le lignage des données pour le RGPD
- [Étape 9 du RGPD] Comment mener des évaluations du risque lié au prestataire
- [Étape 12 du RGPD] Comment contrôler les modèles analytiques
- [Étape 10 du RGPD] Comment améliorer la qualité des données
- [Étape 8 du RGPD] Les Analyses d’Impact relatives à la Protection des Données
- [Étape 7 du RGPD] Comment instaurer des normes de masquage des données
- [Étape 3 du RGPD] Comment confirmer les propriétaires des données
- [Étape 6 du RGPD] Comment définir des normes d’utilisation acceptable pour le RGPD
- [Étape 4 du RGPD] Comment identifier des ensembles de données critiques et des éléments de données critiques
- [Étape 1 du RGPD] Comment développer des politiques, normes et contrôles
- [Étape 5 du RGPD] Comment établir des normes de collecte des données