FAQ : le Data Catalog en 7 questions/réponses

by | Jun 24, 2020 | Catalogue de données, Data Gouvernance, Métadonnées

Le Data Catalog est l’outil parfait pour démarrer la mise en place d’une gouvernance des données efficace. Cette solution data est idéale pour rendre accessible à tous les collaborateurs les métadonnées de l’entreprise. 

Un Data Catalog collaboratif est primordial afin de mutualiser les efforts de chacun dans la définition des données. Tout le monde collabore autour d’un patrimoine data commun. Avec notre FAQ sur le Data Catalog, vous aurez une bonne connaissance de cet outil data.

webinar-2-datagalaxy
Jeudi 2 juillet 2020  |  11H 

FAQ sur le Data Catalog 

📖 Qu’est-ce qu’un Data Catalog ?

Un Data Catalog ou catalogue de données, est un emplacement où sont centralisées et regroupées les métadonnées des données stockées dans l’entreprise. 

Ces métadonnées sont primordiales pour comprendre le contexte de la données : structure, qualité, définition et utilisation des données sont accessibles depuis un emplacement centralisé.

Avec une quantité de données toujours plus importante, les entreprises sont obligées de s’adapter et utiliser de nouveaux outils. Le Data Catalog devient l’outil indispensable pour contrôler et mieux utiliser toutes ces données. 

🎯 À quoi sert le Data Catalog ?

L’objectif principal du Data Catalog est de rendre accessible à tous les utilisateurs les sources de données en self-service et de les comprendre.

Avec cette accès aux métadonnées et leurs compréhension, le nombre de silos de données au sein de l’environnement data diminue fortement. 

Le Data Catalog permet aussi aux équipes data d’accélérer l’analyse des données et la rendre plus précise.

Vous voulez découvrir notre Data Catalog ?

moteur-recherche-datacatalog-360

👥 Qui utilisent le Data Catalog ?

Le Data Catalog est utilisé par tous les Data Bakers, les utilisateurs de la donnée au quotidien. Que ce soit les Data Governor, les Data Manger, les Data Craftsman ou les Data Consumer, les profils utilisant le Data Catalog sont divers et variés. 

Ce catalogue des données permet à ses utilisateurs de découvrir et utiliser les sources de données, mais surtout de les comprendre pour avancer sur leurs projets. 

 

🛠️ Quelles sont les fonctionnalités essentielles d’un Data Catalog ?

Il existe plusieurs types de Data Catalog. Ils n’ont pas tous les mêmes fonctionnalités. Il est toutefois important que celui que vous choisirez propose celles-ci. 

Un bon Data Catalog devrait avoir la possibilité d’importer automatiquement les métadonnées des différentes sources de données. Sans cette possibilité, tout devra être fait manuellement, un travail long et fastidieux. 

Le catalogue des données qui pourra scanner et charger automatiquement les métadonnées provenant des centaines de sources de données différentes sera un atout certain. 

Un bon Data Catalog devrait contenir une couche collaborative afin de permettre aux utilisateurs de collaborer autour de la connaissance des données. Il proposera l’ajout de commentaires, d’informations, de droits d’accès, un centre de notifications, des étiquettes, etc.

Enfin, un bon Data Catalog devra absolument proposer un moteur de recherche accessible et surtout très performant. 

C’est notamment à partir de cette fonctionnalité que la plupart des utilisateurs vont utiliser le catalogue des données, afin de comprendre une donnée

 

Vous voulez tout savoir des DataBakers ?

livre-blanc-databakers

🚀 Quels sont les objectifs du Data Catalog ?

Les objectifs d’un Data Catalog sont multiples, notamment : 

  • La mise en place d’une gouvernance des données agile

Le catalogue des données est l’outil idéal pour commencer à cartographier et mettre en lumière le cycle de vie des données. Les DataBakers vont savoir où se trouvent leurs données, qui les utilisent, comment elles sont utilisées et pour quel objectif. 

La connaissance data est accessible à tous. 

  • Assurer une documentation des données en temps réel

Le Data Catalog permet de mettre en place un répertoire de métadonnées, techniques, mais aussi business. Ces informations stockées sont accessibles facilement pour accélérer la collaboration autour des données dans les différents projets. 

  • Donner un contexte rendre la donnée intelligente

Avec l’accessibilité au contexte de toutes les métadonnées, des usages et traitements des données qui sont connus et documentés, plus de place à l’erreur. 

La productivité est optimisée pour accompagner les projets et l’innovation accrue. 

La données est de plus en plus accessible, de plus en plus vite.

 

🧩 Quels cas d’usage pour un Data Catalog ?

Le Data Catalog peut être utile et utilisé pour différents cas d’usage. 

Dans une démarche de mise en place de gouvernance des données, le catalogue des données peut permettre de : 

  • Mieux organiser ses données
  • Améliorer l’accès aux informations pour les utilisateurs des données
  • Identifier les responsables d’une donnée et gérer les droits d’accès
  • Qualifier la qualité d’une donnée
  • Démarrer sa mise en conformité RGPD

 

💎 Quelles sont les qualités d’un Data Catalog ?

Le Data Catalog donne accès à l’information, il permet donc une démocratisation de la connaissance data de l’entreprise. C’est un outil massivement collaboratif, permettant un partage du patrimoine data. 

La première qualité attendue est donc l’inclusion. Il est impensable de limiter l’accès à l’information à une seule population d’utilisateurs sans raisons vraiment valables. Un accès contrôlé doit être expliqué et compris par tous les utilisateurs du catalogue des données. 

La deuxième qualité est que le Data Catalog doit être un référentiel bidirectionnel, car l’interactivité est bien souvent beaucoup plus performante que la simple diffusion. Voilà pourquoi le catalogue des données doit être un Data Catalog collaboratif

Tous les utilisateurs doivent pouvoir faire des retours, préciser des informations, notifier les responsables, poser des questions etc. 

Et la dernière qualité est que le Data Catalog doit être un facilitateur, donc permettre d’accélérer le recensement des données et faciliter la navigation dans le patrimoine data. 

Un moteur de recherche performant est évidemment un avantage certain.