Les 4 facettes d’un catalogue de données

Partager : 
Catalogue-donnes-2

Le catalogue de données ou Data Catalog devient l’outil indispensable pour réussir sa transformation numérique. Réponses aux questions que vous vous posez peut être encore concernant cet outil.

Les 4 côtés du catalogue de données

Le travail de recensement et le partage des connaissances des données est un sujet sur lequel on trouve assez peu de littérature. L’objectif de cet article est d’expliquer quels sont les domaines de connaissances à couvrir pour disposer d’une compréhension exhaustive des données, éviter l’écueil du DataSwamp et démarrer avec de solides fondations pour entamer une démarche de DataGouvernance.

Le sens des données – Glossaire

C’est le coeur de l’outil : il n’y a pas de valorisation possible si le sens des données n’est pas connu. Attention à ne pas voir le glossaire comme un simple dictionnaire avec le nom et la définition de la donnée : le glossaire doit traiter d’informations comme les rôles et responsabilités associés à cette donnée, son cycle de vie, ses contraintes réglementaires…

L’emplacement des données

Parmi les informations de stockage à proposer, nous retrouvons la localisation physique de la donnée, la structure de cette source de donnée (comment croiser cette donnée avec d’autres,…) ainsi que des informations locales (donnée cryptée/anonymisée, qualité, …).

Catalogue-donnes-citation-2

La dynamique des données

Les données circulent dans l’entreprise et de plus en plus rapidement. Cette facette du catalogue de données permet d’assurer une traçabilité des flux de données en restant agnostique à la technologie employée pour manipuler ces données.

Les usages des données

Il s’agit ici de recenser les accès aux données par les utilisateurs : qu’il s’agisse de rapports ou tableaux de bord, de site web, d’algorithmes ou d’écran logiciels, ces usages font partie de la chaîne de valeur de la données et se doivent d’être documentés.

Attention ! Il s’agit bien de facettes du DataCatalog dont on rappelle qu’il s’agit d’un référentiel centralisé. Cela signifie que la gestion de ces 4 facettes est inutiles s’il ne s’accompagne pas de la gestion des liens entre toutes les informations ! Par exemple, connaître la définition du score client est dérisoire, si l’on ne sait pas où trouver l’information, comment elle a été calculé dans tel ou tel système ou encore dans quel tableau de bord elle est utilisée.

Partager :