Rien de plus important pour une entreprise data-driven qu’un Data Catalog. Pourquoi ? Indispensable pour les « métiers de la data », qui travaillent avec la donnée au quotidien, cet outil permet de collecter, d’organiser et d’uniformiser toutes les données d’une entreprise.
DataBakers : les métiers de la data
L’expression « DataBakers » désigne les métiers qui utilisent la donnée. Les entreprises s’appuient sur les besoins des DataBakers pour construire toute leur infrastructure technique, leur langage et leurs process autour de leurs bases de données.
Avant de se lancer dans des optimisations techniques des données, il faut s’assurer que tous les collaborateurs partagent le même langage. S’ils n’arrivent pas à se comprendre, il sera difficile d’uniformiser l’utilisation de la data pour l’ensemble de l’entreprise.
➡️ C’est le rôle d’un Data Catalog.
Il s’agit d’un outil qui décrit la data et permet d’avoir une vue globale de toutes les données utilisées par les différents métiers de l’entreprise. Il sert également d’interface pour organiser les données et les rendre accessibles et intelligibles à tous les DataBakers :
- les techniciens de la donnée (IT, Data Analyst, etc.) ;
- les architectes et gouverneurs ;
- les utilisateurs métiers et business (DataProsumers).
Une telle organisation data-centric ne s’invente pas, elle se construit ! Une entreprise qui souhaite adopter une culture data doit s’entourer d’experts, mais aussi des bons outils, à commencer par le Data Catalog.
Trois métiers qui utilisent le Data Catalog
#1 Chief Data Officer
Le Chief Data Officer, ou CDO, est responsable de la stratégie des données de l’entreprise. C’est le chef d’orchestre de la culture data : c’est lui qui dirige l’optimisation des données collectées et s’occupe de leur organisation. Internes ou externes, toutes les données sont sous sa responsabilité. Le CDO, dont le métier est 100 % orienté business et stratégie, travaille en collaboration avec le Directeur des Systèmes d’Information (DSI). Il pilote le déploiement du Data Catalog.
Le Chief Data Officer a besoin du Data Catalog pour :
- mettre en œuvre la stratégie de gouvernance des données ;
- créer un langage commun autour de la donnée de l’entreprise ;
- définir les règles et le glossaire, en accord avec les référents métiers ;
- coordonner les besoins de toutes les parties prenantes.
#2 Responsable Business Intelligence
Bien qu’orienté business, le Responsable Business Intelligence a un rôle plus technique et opérationnel que le CDO. Il est responsable de l’analyse des données, de la gestion des projets informatiques de l’entreprise, mais aussi de la collecte et de la restitution des données.
Le Responsable Business Intelligence a besoin du Data Catalog pour :
- disposer d’une donnée fiable à analyser pour prendre de bonnes décisions business ;
- vérifier la source de la donnée ;
- voir les modifications et les analyses apportées par les référents métiers.
#3 Data Scientist
Responsable de la gestion et de l’analyse des données, le Data Scientist a pour rôle de trouver des solutions pour les utilisateurs finaux de la donnée. Il conçoit et éprouve donc des algorithmes qui lui permettent d’étudier la data sous tous les angles. Il teste différentes solutions techniques avant de les présenter aux autres DataBakers.
Le Data Scientist a besoin du Data Catalog pour :
- connaître la source d’une donnée avant de l’analyser ;
- vérifier la fiabilité des données utilisées ;
- retracer les origines et l’historique de la data ;
- communiquer avec les utilisateurs de la donnée et créer des indicateurs utiles pour les métiers et le business.
Et les autres métiers de la data ?
Il existe beaucoup d’autres fonctions et métiers de la data qui ont besoin du Data Catalog.
- Le Data Steward est garant de l’application opérationnelle de la donnée de l’entreprise : définition de la donnée, du niveau de qualité, des traitements applicables…
- Le Data Architect, ou Data Manager, sert d’interface entre le business et l’IT. Son rôle est de modéliser les données ainsi que l’architecture des traitements et de gérer les modes de mise à disposition des données.
- Le Data Protection Officer est le garde-fou de la donnée. Il vérifie que l’exploitation des données (publiques et personnelles) et les traitements appliqués sont conformes à la loi.
Indispensable pour tous les DataBakers, les Data Prosumers et les métiers en charge de la gouvernance des données, le Data Catalog facilite la communication entre les collaborateurs d’une entreprise et garantit l’homogénéité des processus autour de la donnée. Il permet de prendre de meilleures décisions en s’appuyant sur des données fiables et contextualisées : un véritable atout business !