Le Règlement général sur la protection des données (RGPD), introduit par l’Union européenne, est entré en vigueur le 25 mai 2018. Avec l’introduction du RGPD, la façon dont les organisations traitent les données à caractère personnel de leurs clients, employés et prospects sera étroitement surveillée. La non-conformité peut être sanctionnée par de lourdes amendes. Il est donc impératif pour les organisations de comprendre les données qu’elles collectent et de prendre des mesures pour les protéger.

Nous avons récemment mis en ligne un webinaire à la demande, Étapes pratiques pour la mise en conformité au RGPD, qui porte sur un plan global en 16 étapes de mise en œuvre d’un programme de gouvernance des données en vue d’assurer la conformité au RGPD.

Regardez la première étape du plan, « Comment développer des politiques, normes et contrôles. » La création d’une taxonomie des données est la seconde étape.

Télécharger L’importance de créer une taxonomie des données [Étape 2 du RGPD] maintenant
En savoir plus

Qu’est-ce qu’une taxonomie des données ?

Une taxonomie des données est une classification des données en catégories et sous-catégories. Elle offre un point de vue unique sur les données d’une organisation et introduit des terminologies et sémantiques communes à l’ensemble des systèmes. La hiérarchisation d’un ensemble de métadonnées et leur catégorisation donnent une meilleure compréhension des relations entre les points de données.

Pour assurer la conformité au RGPD, l’équipe de gouvernance des données d’une organisation doit collaborer avec l’architecture des données de l’entreprise pour classer les données.

Par exemple, la taxonomie des données peut comporter des informations sur les employés comme catégorie de niveau 1. Ces informations peuvent ensuite être divisées en plusieurs catégories de niveau 2 (salaires et avantages, identité, contacts, informations sanitaires protégées, réseaux sociaux et performances des collaborateurs, p. ex.).

En quoi la taxonomie des données est-elle essentielle pour le RGPD ?

Le RGPD exige des organisations qu’elles protègent la confidentialité des données à caractère personnel, communiquent sur leur stockage et leur utilisation de ces données, et assument la responsabilité de la confidentialité et de la protection de ces données. La création d’une taxonomie des données devient cruciale dans ce contexte. Voyons ici quelques avantages liés à la création d’une taxonomie des données :

  • Compréhension fondamentale des données — Avec l’entrée en vigueur du RGPD, il se peut qu’un grand nombre d’éléments de données existants ne soient pas conformes au règlement. Il faut donc résoudre ce problème. Une taxonomie contribue à la détection de ces problèmes de qualité des données en permettant de bien comprendre la nature des données et leur lignage.
  • Accès aux données — Le RGPD confère aux personnes concernées le droit d’accéder à leurs données en format électronique au besoin. La catégorisation des données contribue à accélérer la récupération des données, en étendant automatiquement la recherche d’un mot clé à d’autres termes qui y sont étroitement liés.
  • Analyse du risque — Le classement des données aide à déterminer si ces données présentent un risque de non-conformité. Ce processus permet d’identifier les données qui relèvent de la catégorie des données ultra-sensibles. Conformément au RGPD, ces données doivent faire l’objet d’une anonymisation. L’analyse de la conformité peut ignorer les autres données, non sensibles, ce qui permet d’économiser du temps et de l’énergie.
  • Réduction des données indésirables — Le RGPD recommande de minimiser les données pour collecter et stocker uniquement les données à caractère personnel qui sont nécessaires. Une taxonomie aide à éliminer les données ROT (redondantes, obsolètes, triviales) existantes, ce qui réduit le risque de stockage de données à caractère personnel non conformes.

Télécharger A 16 Step Data Governance Plan for GDPR Compliance maintenant
En savoir plus

Utiliser les outils Talend pour générer automatiquement une taxonomie

Dans Talend Metadata Manager, il est possible d’utiliser un glossaire professionnel pour définir un ensemble de termes et les relier à des catégories et sous-catégories, comme le montre la Figure 1. La constitution d’un glossaire métier peut être des plus simples : utilisez un modèle de données existant bien documenté, importez les termes et définitions d’autres sources (p. ex., CSV, Microsoft Excel) ou rédigez-les de façon interactive via l’interface utilisateur lors du classement des objets.

Une fois publié, ce glossaire est accessible via une interface de recherche à quiconque possède les autorisations nécessaires.

taxonomie des données

Figure 1. Glossaire métier Talend Metadata Manager

Étapes suivantes de création d’une taxonomie des données

La création d’une taxonomie n’est qu’un début. Suite à cette classification étendue, il est important d’assigner des propriétaires de données et de cartographier ces catégories de haut niveau jusqu’aux points de données à proprement parler, dans les différents systèmes informatiques. Il est alors plus facile d’exécuter des tâches de profilage et de nettoyage sur ces points de données, pour les rendre fiables et conformes au RGPD.

Pour approfondir les étapes suivantes de création de mappages des données et de résolution des problèmes de qualité des données, regardez le webinaire à la demande. Ce webinaire présente le plan en 16 étapes qui aide les organisations à assurer la conformité au RGPD.