Qu’est-ce qu’une politique de gouvernance des données et comment la mettre en place ?

Dans le monde des entreprises actuel, rapide et hautement compétitif, la gouvernance des données est indispensable. Les organisations peuvent aujourd'hui collecter d'immenses quantités de données internes et externes, mais elles ont besoin d'une discipline pour augmenter la valeur apportée par ces données, gérer les risques et réduire les coûts.

Qu'est-ce que la gouvernance des données ?

La gouvernance des données est un ensemble de processus, rôles, règles, normes et métriques permettant d'assurer une utilisation efficace et efficiente des informations, dans le but d'aider les entreprises à atteindre leurs objectifs. Elle définit les procédures et les responsabilités garantissant la qualité et la sécurité des données au sein d'une entreprise ou d'une organisation. Elle définit également qui peut effectuer quelle action, sur quelles données, dans quelle situation et selon quelle méthode.

Une stratégie de gouvernance des données claire est fondamentale pour toute organisation traitant les big data, et explique comment la société peut bénéficier de procédures et de responsabilités communes et cohérentes. Les moteurs opérationnels déterminent quelles données doivent être soigneusement contrôlées dans votre stratégie de gouvernance des données ainsi que les bénéfices attendus. Cette stratégie sera la base de votre cadre de gouvernance des données.

Par exemple, si l'un des moteurs opérationnels de votre stratégie de gouvernance des données est d'assurer la confidentialité des données de santé, toutes les données relatives à des patients devront être gérées de manière sécurisée lors de leur traitement au sein de votre entreprise. Les exigences en matière de conservation (c'est-à-dire l'historique des changements apportés aux informations, avec leur date et leur auteur) seront définies pour assurer la conformité aux exigences réglementaires applicables, telles que le RGPD.

La gouvernance des données garantit que les rôles relatifs aux données sont clairement définis, et que les responsabilités sont comprises et acceptées par tous dans l'entreprise. Un cadre de gouvernance des données bien conçu couvre les rôles et responsabilités stratégiques, tactiques et opérationnels.

Ce que n'est pas la gouvernance des données

La gouvernance des données est souvent confondue avec d'autres termes et concepts relativement proches, dont la gestion des données et la gestion des données de référence (Master Data Management, ou MDM).

La gouvernance des données n'est pas la gestion des données

La gestion des données est la gestion de l'ensemble des besoins en données d'une organisation. La gouvernance des données est le composant principal de la gestion des données, celui qui relie les neuf autres disciplines, dont la qualité des données, la gestion des données de référence (MDM), la sécurité des données, les opérations de bases de données, la gestion des métadonnées et le data warehousing.

La gouvernance des données n'est pas la gestion des données de référence

La gestion des données de référence (MDM) se concentre sur l'identification des entités clés d'une entreprise, puis sur l'amélioration de la qualité de ces données. Elle aide à assurer l'exactitude et l'exhaustivité des informations sur des entités clés telles que les clients, fournisseurs, prestataires de soins, etc. Ces entités étant partagées par toute l'organisation, la gestion des données de référence vise à regrouper les vues partielles de ces entités dans une vue d'ensemble. Cette discipline va au-delà de la gouvernance des données.

Cependant, il ne peut y avoir de gestion des données de référence sans gouvernance correcte. Par exemple, un plan de gouvernance des données définit les principaux modèles de données (définition d'un client, d'un produit, etc.), les règles de conservation de données ainsi que les rôles et responsabilités pour l'écriture de données, l'agrégation de données et l'accès.

La gouvernance des données n'est pas data stewardship

La gouvernance des données permet d'assigner les responsabilités appropriées en matière de données à chaque personne. Le data stewardship permet, lui, de s'assurer que les données sont exactes, contrôlées, et faciles à découvrir et à traiter par les intervenants correspondants. La gouvernance des données intervient plutôt au niveau de la stratégie, des rôles, de l'organisation et des règles, alors que le data stewardship se focalise sur l'exécution et l'opérationnalisation.

Les arbitres de données gèrent les éléments de données et s'assurent que les données elles-mêmes sont conformes au plan de gouvernance des données, liées à d'autres éléments de données et maîtrisées en termes de qualité, de conformité et de sécurité.

Principaux avantages de la gouvernance des données

Une stratégie de gouvernance des données efficace offre de nombreux avantages à une organisation, notamment :

  • Une compréhension commune des données : la gouvernance des données offre une vue cohérente des données et une terminologie commune, tout en laissant aux unités opérationnelles la flexibilité dont elles ont besoin.
  • Une meilleure qualité des données : la gouvernance des données crée un plan assurant l'exactitude des données, leur exhaustivité et leur cohérence.
  • Une carte des données : la gouvernance des données offre une fonctionnalité avancée de compréhension de l'emplacement de toutes les données liées aux entités clés, facteur indispensable de l' intégration des données. Tout comme un GPS permet de représenter une zone géographique et de guider les utilisateurs, la gouvernance des données rend les éléments de données plus faciles à utiliser et à connecter avec des résultats commerciaux.
  • Une vue à 360 degrés de chaque client et des autres entités de l'entreprise : la gouvernance des données établit un cadre dans lequel l'organisation partage « une seule version de la vérité » et assure la cohérence nécessaire entre toutes les entités et activités de l'entreprise.
  • Une conformité à tous les niveaux : la gouvernance des données offre une plate-forme permettant de répondre aux exigences réglementaires, telles que le RGPD (Règlement général sur la protection des données) de l'Union européenne ou la loi HIPAA (Health Insurance Portability and Accountability Act) des États-Unis, et aux autres exigences du secteur, telles que les normes PCI DSS (Payment Card Industry Data Security Standards).
  • Une meilleure gestion des données : la gouvernance des données apporte une dimension humaine dans ce monde des données fortement automatisé. Elle établit des codes de conduite et des bonnes pratiques en matière de gestion des données, afin de répondre aux besoins et inquiétudes dans tous les domaines : données et technologies bien sûr, mais aussi sécurité, conformité et autres aspects juridiques.

Gouvernance des données dans le cloud

Puisque de plus en plus de sociétés et d'organisations prennent conscience des bénéfices que peut engendrer la migration de tout ou partie des stockages et traitements de données vers des stratégies d'intégration cloud et des solutions iPaaS, le besoin d'une gouvernance des données efficace augmente fortement.

Pour évoluer vers le cloud, il faut déléguer certaines tâches à des tiers, par exemple la gestion de l'infrastructure, le développement d'applications, la sécurité, etc. Le cloud implique également de virtualiser les ressources techniques, ce qui peut être problématique au regard de la souveraineté des données (certaines réglementations imposent par exemple que les données résident dans un lieu ou un pays précis). De plus, les stratégies privilégiant le cloud encouragent généralement la décentralisation, ce qui peut permettre à certaines branches de l'entreprise ou certains groupes de travail de créer leurs propres systèmes indépendants, et ainsi entraîner une dispersion des données non contrôlée.

La gouvernance permet de répondre à ces problématiques. Tout d'abord, un plan de gouvernance des données stratégique est indispensable pour toute migration de données vers le cloud. Que l'organisation choisisse un modèle hybride ou entièrement basé sur le cloud, le processus de migration des données sera toujours amélioré par un plan de gouvernance des données global, et la migration en elle-même sera plus efficace et plus sûre.

En outre, le déplacement des processus de traitement des données vers le cloud ajoute une couche de complexité en matière de sécurité et d'accès. Certes, les solutions de données sur site ont aussi besoin d'une stratégie de gouvernance des données solide, mais les responsables apprécient particulièrement la valeur de la gouvernance des données lorsque les données migrent vers le cloud.

Outils de gouvernance des données

Afin d'adopter la bonne approche de gouvernance pour votre organisation, optez pour des outils open source évolutifs, qui peuvent être intégrés rapidement et à faible coût avec votre environnement.

De plus, une plate-forme cloud permet une connexion rapide à des fonctionnalités robustes, faciles à utiliser et abordables. Les solutions cloud évitent également les frais supplémentaires liés aux serveurs sur site.

Lorsque vous comparez les outils de gouvernance des données, retenez ceux qui vous aideront à obtenir les avantages commerciaux que vous avez définis dans votre stratégie de gouvernance.

Ces outils doivent vous aider à :

  • Collecter et comprendre vos données, grâce à des outils et des fonctionnalités de découverte, de profilage et de comparaison. Par exemple, les outils performants peuvent automatiquement détecter une donnée personnelle, comme un numéro de sécurité sociale, dans un nouveau dataset et déclencher une alerte.
  • Améliorer la qualité des données avec la validation, le nettoyage et l'enrichissement des données.
  • Gérer vos données grâce aux processus ETL et ELT basés sur les métadonnées, et aux applications d'intégration de données, afin que les pipelines de données puissent être suivis avec un historique des données de bout en bout.
  • Contrôler vos données avec des outils de vérification et de surveillance actives.
  • Documenter vos données afin que des métadonnées puissent leur être ajoutées, améliorant ainsi la pertinence, la recherche, l'accès, les liaisons et la conformité.
  • Responsabiliser les personnes qui connaissent le mieux les données, en leur permettant de contribuer aux tâches de data stewardship avec des outils en libre-service.

Talend comprend parfaitement la gouvernance des données, et offre des outils cloud très utiles qui peuvent aider les organisations de toutes tailles à passer de données non gouvernées à une gouvernance des données active. Les outils Talend de qualité des données, de gestion des métadonnées et des données, et de data stewardship sont fiables et simples d'utilisation. Ils vous permettent de répondre à vos besoins de gouvernance des données rapidement et efficacement.

La gouvernance des données est une obligation

Les organisations disposent aujourd'hui d'une quantité de données incroyable sur les clients, les fournisseurs, les patients, les employés, etc. Si une organisation utilise correctement ces informations pour mieux comprendre son marché et son audience cible, elle accroît ses chances de succès. Cette gouvernance des données garantit également que les données sont fiables et bien documentées, que la recherche et l'accès à ces données sont faciles au sein de l'organisation, et que les données restent sécurisées, conformes et confidentielles.

Assurez-vous que votre organisation rentabilise au mieux ses investissements en matière de gouvernance des données et minimise les risques de violation des données. Lorsque vous êtes prêt à vous lancer, découvrez nos solutions de gouvernance des données.

Prêt à faire vos premiers pas avec Talend ?