La Data Quality est un enjeu business primordial pour les entreprises. Il paraît donc logique d’en laisser la gestion aux équipes qui récoltent ou utilisent quotidiennement la data. Pourtant, il existe une solution plus efficace pour assurer la qualité des données : la Data Governance. On fait le point !
Data Governance : la solution pour une meilleure Data Quality
Les enjeux de la Data Quality
La Data Quality permet aux équipes métiers (produit, marketing, finance, RH…) de travailler avec des données régulièrement actualisées et simplifiées pour mener à bien leurs projets et les encourager à innover.
Pour qu’une donnée soit de qualité, elle doit impérativement être conforme aux réglementations de protection des données (RGPD, etc.) en vigueur. Les responsables de la data doivent ainsi être en mesure de retrouver les données d’un client, ainsi que les doublons, et être en mesure de les supprimer.
Mais si la Data Quality semble être une évidence… Elle ne l’est pas pour autant !
- Un important volume de données est souvent difficile à gérer et à surveiller.
- Une information peut facilement devenir obsolète si elle n’est pas mise à jour dans toutes les bases de données.
- Si l’entreprise ne nomme aucun responsable de la data, les bases de données ne sont pas nettoyées et les informations erronées s’accumulent (numéro de téléphone, adresse email…).
La fonction de la Data Governance
La Data Governance aide à mettre en place un système de mesure de la qualité des données grâce à des indicateurs de qualité performants. Ces derniers répertorient et signalent toutes les données erronées présentes dans la base, et permettent la mise en place d’actions correctives.
La gouvernance des données demande que tous les métiers de l’entreprise se responsabilisent. Ils doivent édicter des règles de gestion des données et définir le responsable métier et les missions à réaliser pour maintenir la Data Quality.
Le petit + ? La Data Governance installe une véritable dynamique de qualité sur le long terme pour votre entreprise.
Les 6 indicateurs de Data Quality
- Exactitude. L’information indiquée par la donnée est correcte, vérifiée et vérifiable (comme un numéro de facture, une adresse de contact…).
- Complétude. La donnée est complète, il ne manque aucune information (comme l’adresse d’un fournisseur qui inclut bien le code postal et le pays).
- Conformité aux règles de gestion métier. La donnée possède le bon format, est stockée à l’emplacement prévu…
- Intégrité. La cohérence avec les données satellites est assurée.
- Unicité. Les données des clients ne sont pas dupliquées.
- Disponibilité. La donnée est accessible dans les délais autorisés.
Data Governance : améliorer la Data Quality en 3 points clés
L’implication des équipes dans la définition des règles de qualité des données
La gestion de la Data Quality se fait via les règles de qualité des données. On y trouve, par exemple, les informations relatives au format d’une adresse mail. Toutes ces règles doivent être établies par les responsables métiers eux-mêmes : ils savent reconnaître les informations indispensables, les bons formats…
L’implication immédiate des métiers dans la rédaction des règles de qualité des données permet une appropriation directe et un suivi plus efficace. Si ces règles sont édictées par les responsables de la gouvernance des données, elles ne représenteront probablement pas les réalités du terrain, et les métiers risquent de ne pas en tenir compte.
La prise en compte du facteur humain
Il est parfois difficile de déterminer objectivement si les données collectées sont qualitatives, surtout si vous n’utilisez que des facteurs traditionnels. Ne négligez pas l’humain ! Un collaborateur expérimenté, habitué à utiliser certaines entrées de données, sera plus habilité à vous dire s’il en est satisfait ou non.
Pour retranscrire ces facteurs de ressenti, vous pouvez utiliser des indicateurs de confiance. Ils vous garantissent une meilleure représentation des données utilisées au sein des équipes et expliquent pourquoi dans le cas contraire elles sont négligées.
La mise en place du machine learning
Après avoir défini les règles à respecter, vous pouvez les coupler avec du machine learning. Vous obtiendrez ainsi des recommandations sur les actions correctives à mettre en place pour résoudre les problèmes de qualité des données.
N’oubliez pas de récolter les avis de vos collaborateurs ! Les experts d’un département peuvent aussi attribuer un score de confiance aux données utilisées. L’algorithme chargé d’évaluer la Data Quality considère les résultats et vérifie la qualité des données selon les règles mises en place. Mais pas seulement : l’outil prend en compte l’utilisation de la donnée par les différents métiers.