Le Glossaire Data Vol.II : pour tout savoir du lexique data

by | Jul 3, 2018 | Glossaire Data

Voici le volume II du Glossaire Data, avec des nouveaux termes liés au monde du Big Data. Que ce soit avec de nouveaux métiers Data comme le Chief Data Officer ou le Data Scientist, des techniques innovantes comme le machine learning ou de nouveaux terrains d’expérimentations avec l’IoT (Internet of Things), le Big Data apporte son lots d’évolutions.

Voici ci-dessous les 10 nouveaux termes expliqués simplement pour tout comprendre de la transformation numérique liée au Big Data.

Data Cleansing : ce terme signifie “nettoyage des données”. Cette étape consiste à supprimer des données incohérentes, corriger des erreurs comme des doublons ou des données mal saisies.

Machine Learning : grâce à l’intelligence artificielle, le Machine Learning (apprentissage automatique) se traduit par un apprentissage spécifique d’algorithmes qui se développent grâce à des données. Ce développement est automatique.

OpenData : la “donnée ouverte” est une donnée numérique dont l’accès et l’utilisation sont en libre accès aux usagers. Cette donnée peut soit venir de sources publiques ou privées, que ce soit par une collectivité, un service publique ou une entreprise.

Qualité des données : afin de ne pas se reposer sur des données erronées, il est nécessaire de s’appuyer sur des données fiables. Voilà pourquoi la mise en place d’une stratégie de gouvernance des données est conseillée.

Chief Data Officer : le CDO assure un contrôle globale de la gouvernance des données. Il est garant de la qualité des données collectées et de la conformité des métadonnées.

Data Center : le centre de données est une plateforme permettant le stockage et la sécurisation de traitements relatifs aux données. La plupart du temps, ces Data Center sont mis en place par des prestataires externes spécialisés en gestion des données.

Dark Data : ces “données sombres” correspondent à toutes les données recueillies par les entreprises mais qui ne sont pas utilisées par la suite dans un but précis. Ces dernières ne seront sûrement jamais analysées.

IoT : ce terme désigne “l’internet des objets”. De plus en plus d’objets peuvent se connecter les uns aux autres (véhicules connectés, montres connectées, meubles connectés,etc.), formant un réseau de connexion, l’internet des objets.

3V : Les trois “v” représentent Volume, Vitesse et Variété, les trois critères d’une plateforme Big Data.

Data Scientist : ce statisticien expert est capable de manipuler des outils spécifiques du Big Data pour comprendre des enjeux business et de les analyser. Le Data Scientist peut ainsi faire le lien entre les aspects techniques et les besoins métiers.