Data Catalog : FAQ en 7 questions/réponses

Juin 24, 2020 | Catalogue de données, Data Gouvernance

Pour les entreprises d’aujourd’hui, mettre en place une gouvernance des données efficace et accessible à tous est indispensable. Le Data Catalog collaboratif est l’outil parfait pour mutualiser les efforts de chacun dans la définition d’un patrimoine data commun. Pour en savoir plus, découvrez notre FAQ sur le Data Catalog !

FAQ Data Catalog : 7 questions à se poser…

#1 Qu’est-ce qu’un Data Catalog ?

Un Data Catalog – ou catalogue de données – est un outil où sont regroupées les métadonnées du patrimoine de données stockées dans l’entreprise.

Ces métadonnées sont primordiales pour comprendre le contexte de la data. Différentes informations sont accessibles dans cet emplacement centralisé :

  • la structure,
  • la qualité,
  • la définition,
  • et l’utilisation des données.

Avec une quantité de données toujours plus importante, les entreprises doivent s’adapter et employer de nouveaux outils. Le Data Catalog devient indispensable pour contrôler et utiliser efficacement toutes ces données.

#2 À quoi sert-il ?

L’objectif principal du Data Catalog est de rendre accessibles et compréhensibles, à tous les utilisateurs, les sources de données en self-service. Avec cet accès aux métadonnées et leur compréhension, le nombre de silos de données au sein de l’environnement data diminue fortement : le patrimoine de data de l’entreprise est homogène, accessible à tous et évite les doublons inter-services.

Le Data Catalog permet aussi aux équipes data d’accélérer l’analyse des données et la rendre plus précise.

#3 Qui utilise le Data Catalog ?

Le Data Catalog est un outil conçu pour tous les utilisateurs de la donnée dans l’entreprise – les Data Bakers. Il existe différents types d’utilisateurs du Data Catalog :

  • les Data Governor,
  • les Data Manager,
  • les Data Craftsman,
  • et les Data Consumer.

Le catalogue de données permet à ses utilisateurs de découvrir et utiliser les sources de données, mais surtout de les comprendre pour avancer sur leurs projets et prendre de meilleures décisions.

fonctionnalités essentielles du catalogue de données

#4 Quelles sont les fonctionnalités essentielles du catalogue de données ?

Il existe plusieurs types de Data Catalog et chacun possède ses propres capacités. Cependant, certaines fonctionnalités sont essentielles :

  • Un bon Data Catalog doit pouvoir importer automatiquement les métadonnées des différentes sources de données. Sans cette possibilité, tout doit être fait manuellement, ce qui peut vite devenir un travail long et fastidieux.

Un catalogue des données capable de scanner et de charger automatiquement les métadonnées provenant de centaines de sources de données différentes est un atout précieux.

  • Un bon Data Catalog doit être collaboratif et permettre aux utilisateurs d’échanger autour de la connaissance des données. Il doit proposer l’ajout de commentaires, d’informations, de droits d’accès, un centre de notifications, des étiquettes, etc.
  • Enfin, un bon Data Catalog doit absolument proposer un moteur de recherche accessible et surtout très performant. C’est notamment à partir de cette dernière fonctionnalité que la plupart des utilisateurs vont utiliser le catalogue des données, afin de comprendre une donnée.

#5 Quels sont les objectifs d’un Data Catalog ?

Mettre en place une gouvernance des données agile

Le catalogue des données est l’outil idéal pour commencer à cartographier et mettre en lumière le cycle de vie des données. Les DataBakers vont savoir où se trouvent leurs données, qui les utilisent, comment elles sont utilisées et pour quel objectif.

Assurer une documentation des données en temps réel

Le Data Catalog permet de mettre en place un répertoire de métadonnées, techniques, mais aussi business. Ces informations stockées sont accessibles facilement et à tous les collaborateurs de l’entreprise. De ce fait, la collaboration autour des données dans les différents projets est facilitée et accélérée.

Donner un contexte pour rendre la donnée intelligente

Avec l’accessibilité au contexte de toutes les métadonnées, des usages et traitements des données qui sont connus et documentés, plus de place à l’erreur : la donnée est de plus en plus accessible, de plus en plus vite. Ainsi, la productivité est optimisée pour accompagner les projets et l’innovation est accrue.

#6 Quels cas d’usage pour un Data Catalog ?

Dans une démarche de mise en place de gouvernance des données, le catalogue des données peut être utilisé pour différents cas d’usage. Il permet notamment de :

  • mieux organiser ses données,
  • améliorer l’accès aux informations pour les utilisateurs,
  • identifier les responsables d’une donnée et gérer les droits d’accès,
  • qualifier la qualité d’une donnée,
  • démarrer sa mise en conformité RGPD.

#7 Quelles sont les qualités d’un Data Catalog ?

Le Data Catalog donne accès à l’information, il permet donc une démocratisation de la connaissance data en entreprise. C’est un outil massivement collaboratif qui permet un partage du patrimoine data.

Les trois qualités d’un Data Catalog :

  • il est inclusif : il est impensable de limiter l’accès à l’information à une seule population d’utilisateurs sans raison valable. Un accès contrôlé doit être expliqué et compris par tous les utilisateurs du catalogue des données.
  • c’est un référentiel bidirectionnel : l’interactivité est bien souvent beaucoup plus performante que la simple diffusion. Voilà pourquoi le catalogue des données doit être un Data Catalog collaboratif.
Tous les utilisateurs doivent pouvoir faire des retours, préciser des informations, notifier les responsables, poser des questions, etc.

  • c’est un facilitateur : il doit permettre d’accélérer le recensement des données et faciliter la navigation dans le patrimoine data. Un moteur de recherche performant est évidemment un avantage certain.

Vous souhaitez gérer efficacement la gouvernance de vos données d’entreprise avec un Data Catalog collaboratif ? Découvrez le DataCatalog 360° et gagnez du temps dans vos recherches d’informations !