Petite ou grande entreprise, vous savez combien il est facile d’accumuler des data et de se laisser déborder. Si bien qu’arrivé à un certain stade, vous ne parvenez plus à distinguer les informations utiles des données obsolètes. Si les données constituent des atouts considérables pour un business, une mauvaise gestion peut mener à des situations problématiques : insécurité, non-conformité, erreurs stratégiques…

Avec les Big Data, la qualité des données est donc devenue un enjeu majeur pour toute entreprise “data-driven”. C’est pour faire face à ce défi que les structures font aujourd'hui appel à des data stewards. Aussi nommée coordinateur des données, cette personne maîtrise l’ensemble des données collectées, stockées et utilisées par une entreprise. Alors, quelles sont les missions du data steward au quotidien ? En quoi peut-il vous aider dans vos futurs projets ?

Comprendre le rôle du data steward

Définition

L’explosion du nombre de données a entraîné de nouveaux challenges de taille pour toutes les entreprises. Afin de réussir à mieux gérer les enjeux qui en découlent, de nouveaux métiers ont fait récemment leur apparition au sein des organisations : data owner, data analyst, data scientist…

Parmi eux, on retrouve le data steward. Considéré comme le gardien de la donnée d’entreprise, celui-ci est chargé de la gestion et de la qualité des informations. Plus concrètement, le coordinateur des données rassemble et nettoie les données de votre data lake. On parle alors d'intendance des données (ou de “data stewardship”).

Si le poste nécessite des compétences techniques évidentes (data modeling, programmation, connaissances en data warehouse…), le data steward est amené à communiquer avec la majorité des services de l’entreprise. Il possède une réelle vision de l'environnement et une compréhension de la donnée et de sa valeur. Un bon relationnel et une bonne connaissance métier sont donc deux compétences primordiales pour occuper ce poste.

Notez également que, selon la taille de l’établissement, plusieurs data stewards peuvent se répartir la charge de travail.

Missions

L’objectif numéro un du data steward ? Faire de la donnée un actif utile au développement de l’entreprise, voire un avantage concurrentiel sur le long terme. Il s’agit de transformer la data en un outil sur lequel les collaborateurs peuvent s’appuyer à tout moment. Pour ce faire, il articule ses journées autour de différentes missions.

  • Il documente la donnée : le data steward centralise les connaissances autour des datasets. En tant que référent de la donnée, il doit être capable de fournir à l'utilisateur le plus de détails possibles (nom d’origine, taille, éventuelles modifications, source, niveau de confiance, statut…). Son travail gravite principalement autour des questions suivantes : où se trouve cette donnée ? En quoi est-elle importante pour l’entreprise et combien de temps doit-elle être conservée ?
  • Il maintient la disponibilité des données : l’accès aux informations est facilité afin d’aider les utilisateurs finaux à prendre des décisions éclairées au quotidien.
  • Il s’assure de la qualité des informations : data obsolètes, doublons, anomalies… Les entreprises estiment que 32% de leurs données sont inexactes. À l’aide de procédures et de contrôles internes réguliers, le data steward repère les données superflues et corrige les inexactitudes, avant même que les collaborateurs ne s’en rendent compte (dans le meilleur des cas).
  • ll fixe les conditions et limites d’utilisation des données : en fonction de son poste, un collaborateur est amené à manipuler des données plus ou moins sensibles. Afin de protéger ces informations, le data steward définit les accès de chacun. Il préserve ainsi la confidentialité et l’intégrité de la donnée face aux menaces internes et externes.
  • Il veille au respect des politiques et normes : l’intendant des données s’assure que l’usage des data au sein de l'organisation est en accord avec le cadre légal.

L’importance du data stewardship

En quoi l’intendance des données est-elle essentielle pour une entreprise ?

Dans la mesure où la donnée est devenue une ressource précieuse pour un business, une gestion optimale de celle-ci s’impose. Véritable chef d’orchestre de la donnée, le data steward possède une fonction clé au sein d’une société : il met à disposition des utilisateurs des bases de données 100% fiables et cohérentes. Il améliore la productivité en facilitant la prise de décision et diminue les coûts en corrigeant les données. Plus qu’un simple gestionnaire, il possède une vision globale de l'utilisation des données, ce qui lui permet de savoir comment utiliser ces dernières pour atteindre les objectifs stratégiques d’une entreprise.

Intendance des données et gouvernance des données : quel lien ?

Vous vous demandez peut-être quelle est la différence entre le data stewardship et la gouvernance des données. Après tout, ces concepts répondent tous deux au même objectif : valoriser la donnée pour aider la société à atteindre ses objectifs. Ils représentent cependant deux disciplines bien distinctes.

La gouvernance des données constitue une stratégie globale à l’échelle de l’entreprise. Elle détermine les différentes procédures relatives aux data et définit les rôles de chacun. Elle est absolument nécessaire à toute structure manipulant des Big Data, autant pour optimiser l’utilisation des données que pour demeurer conforme aux réglementations en vigueur.

Multiplicité des sources, intérêts divergents, important volume de données... La mise en place d’un plan de gouvernance peut se révéler complexe. Pour en faciliter l'implémentation, le data steward se met au service de la data gouvernance.

L'intendance des données possède un aspect beaucoup plus opérationnel. Elle s’assure que les data sont en adéquation avec le plan de gouvernance au niveau de la sécurité et de la qualité. Le data steward prend donc pleinement part à la réalisation d’un projet de gouvernance des données.

Mettre en place l’intendance des données

Les différents modèles d'intendance des données

Vous l’aurez compris : il est compliqué pour une structure de formaliser clairement le champ d’action du data steward et ses limites. Sachez qu’il existe en réalité presque autant de façons d’organiser l’intendance des données que d'entreprises. En effet, l’intendance des données peut revêtir différentes formes en fonction de la structure de l'entreprise, mais aussi de ses besoins. Néanmoins, on distingue plusieurs modèles efficaces qui peuvent être appliqués. Ces derniers comportent chacun des atouts et des points faibles.

  • L’intendance des données par domaine : les différents data stewards sont ici responsables d’un sujet bien précis au sein de la structure. Ils se répartissent ainsi leurs missions : l’un sera par exemple chargé de toutes les données relatives au produit, l’autre sera responsable de toutes les informations liées au client. Dans les grandes entreprises, un même sujet peut être couvert par plusieurs data stewards. Cette approche est particulièrement efficace dans les moyennes à grandes organisations, notamment lorsque différents services partagent les mêmes données.
  • L’intendance des données par projet : même si ce modèle s’applique souvent sur du court terme, il reste facile et rapide à mettre en place. Le rôle du data steward peut être personnalisé en fonction du projet pour une efficacité optimale. Le problème : l’intendance des données se termine au moment où le projet est finalisé.
  • L’intendance des données par fonction : le data steward est dans ce cas dédié à un seul service de l’entreprise (marketing, sales, logistique, service client…). Il se concentre uniquement sur les données générées par ce département. Le data steward dispose alors d'une connaissance pointue sur le contexte d’utilisation des données et sur les objectifs de l’équipe. Il évolue aux côtés des utilisateurs finaux, ce qui favorise une meilleure confiance de ceux-ci dans l’exploitation des données. Cependant, ce modèle cloisonne les data stewards qui travaillent dans des services différents, ce qui peut amener à créer des.
  • L’intendance des données par process : dans ce troisième modèle, le coordinateur des données est assigné à un processus en particulier (campagne de publicité, approvisionnement, recrutement…). L’intendance des données devient alors partie intégrante du processus. L’avantage ? Une fois l'intendance des données appliquée à un procédé, il devient alors plus facile de l'implémenter sur d’autres activités. Cependant, pour que ce modèle fonctionne, il est évidemment primordial d’avoir établi des procédures claires au préalable.
  • L’intendance des données par système : le data steward gère ici les données générées par un système opérationnel, peu importe sa nature. Outils de facturation, support CRM, logiciel de gestion des stocks… Ces systèmes étant souvent à l'origine d'erreurs dans les données, ce type de modèle permet d’introduire la notion d’intendance et d’en montrer les bénéfices. Le risque est que les utilisateurs associent le data steward à une fonction purement informatique, et non pas à un rôle métier.

Certaines entreprises choisissent de mixer plusieurs schémas afin de créer un modèle hybride parfaitement adapté à leur propre configuration et leur objectifs.

Les outils du data steward

Au quotidien, l'intendant des données est aidé dans sa pratique par différents outils. Ces derniers doivent vous proposer des options adaptées à votre niveau de maturité et vos besoins quant à l'intendance des données : suivi de projet, modification manuelle, gestion des nouvelles réglementations, organisation des workflows...

Vous souhaitez vous aussi repenser votre gestion de la donnée ? Talend a regroupé toutes ces fonctionnalités dans son application Talend Data Stewardship. Gagnez en temps et en efficacité: facile à utiliser, cette solution collaborative vous permet de consolider la gouvernance et l’intendance de vos données. Maximisez le potentiel de vos données, tout en restant conforme aux réglementations.

Prêt à faire vos premiers pas avec Talend ?