Cartographier la donnée : quoi, pourquoi, comment ?

Partager : 
cartographie des données - gouvernance des données

À mesure que les données sont massivement collectées par l’entreprise, elles doivent être exploitées – c’est-à-dire analysées, triées, segmentées, puis qualifiées. Mais parce qu’elles ne sont pas confinées dans une base fixe et immuable, à la manière d’un trophée dans une vitrine, ces données doivent nécessairement être rendues accessibles et utilisées par tous au sein de la structure, sans cloisonnement ni limitation techniques. C’est à cette problématique que répond la cartographie des données, dans le but d’établir une topographie commune à tous les collaborateurs.

Découvrez ce que DataGalaxy peut faire pour vous !

Qu’est-ce que la cartographie des données ?

En substance, la cartographie des données est un processus permettant de recenser, puis de visualiser, les points d’entrée et de traitement de la data. Cette forme de topographie est commune aux différents systèmes d’information de l’entreprise, ce qui donne l’opportunité à tous les collaborateurs de s’en saisir – et de parler le même langage « data », aussi bien chez les Data Scientists et les responsables informatiques qu’au sein des services métiers, moins experts en la matière.

Cette carte est dessinée à l’aide de trois grands « ustensiles » :

  • L’outil sémantique, consistant à recenser dans un glossaire métier les métadonnées des données et des objets métier propres à l’entreprise, afin d’optimiser la compréhension et le contexte de la data.
  • Les modèles de données, apportant des indications précises sur la façon dont la data est modélisée et stockée dans les différents systèmes de stockage (structurées, semi structurées ou non structurées). Un autre outil lui est consubstantiel : le dictionnaire des données techniques.
  • L’outil de design des traitements des flux de données, apportant des informations sur les méthodes de transformation, de manipulation et de traitement de la data au travers des différents SI de l’entreprise.

À ces trois outils, il faut ajouter la formalisation du format de mise à disposition, d’accès et de conditions d’utilisation des données, pour que le partage de la cartographie ne se heurte pas aux obstacles relatifs à la confidentialité et à l’intégrité de la compréhension des données.

Pourquoi ce processus est-il capital ?

Obtenir une vision à 360° de la masse des données en circulation dans une entreprise : telle est la solution offerte par le processus de cartographie de la donnée. Le but étant de l’universaliser (à l’échelle de la structure, du moins), c’est-à-dire de la rendre totalement accessible et compréhensible à l’ensemble des collaborateurs, afin que chacun soit à même d’identifier la provenance d’une donnée, de mesurer son mode de calcul, de repérer d’éventuelles redondances, etc.

Imaginez un instant : vous souhaitez trouver l’adresse de facturation d’un client. Non seulement les sources de cette information peuvent être multiples, mais sa définition même peut différer au gré des services dont elle provient. La compréhension même de la notion « d’adresse » peut varier du tout au tout en fonction des glossaires de l’entreprise, et l’impossibilité de suivre un historique des mises à jour contribuera à vous perdre dans un inextricable réseau de bases de données – sans assurance de pouvoir mettre la main sur ce que vous cherchez.

Cartographier les données permet donc de tisser des liens entre la vision technique (stockage et transformation de la data dans les applications des SI) et la vision métier (l’utilisation qui en est faite au sein des différents services). Ce processus vise à faire tomber les silos historiques, à décloisonner les services – bref, à édifier un espace commun dans lequel tous les collaborateurs parlent le même langage, afin de donner à chacun les outils d’une meilleure gouvernance opérationnelle de la donnée.

Comment tirer le meilleur parti de la cartographie des données ?

Une bonne cartographie passe par un processus pédagogique : il s’agit de transformer une structuration historiquement en silos (des cloisons techniques séparent chaque service, limitant la circulation aisée des informations et des usages au sein de l’entreprise) en un savoir collectif vivant, évolutif, modelé par les collaborateurs eux-mêmes, au gré de l’expérience.

Ce processus ne peut pas être limité à une approche basiquement top-down, qui condamnerait toute cartographie à l’obsolescence dès son lancement. Il ne peut se dérouler que de manière itérative, en faisant se succéder les projets et les initiatives les uns après les autres, au cœur d’une démarche globale d’intégration aux tâches quotidiennes. Par exemple, chacun peut participer à son niveau à la cartographie des données granulaires métiers ; et ce n’est que dans un second temps qu’il sera possible de créer des passerelles entre les initiatives personnelles, afin d’élargir le périmètre et de produire des données agrégées, en fonction de caractéristiques communes. Une approche résolument bottom-up.

À terme, l’ambition est d’obtenir une cartographie englobant tous les services et toutes les applications des SI, offrant une vision à 360° de la donnée en circulation dans la structure. Et permettant à chacun d’en tirer le meilleur parti.

Demandez votre démo personnalisée

Qu’est-ce que la cartographie des données ?

Partager :