B-DatScientist-quel-rôle

Qu’est-ce qu’un Data Scientist ?

Le Data Scientist est l’extracteur de connaissance à partir d’un grand volume de données. Son rôle est de produire des algorithmes sur les données pour anticiper leur comportement, recommander des actions, et catégoriser les données.

Fiche pratique :
avez-vous besoin d'un Data Catalog ?

Fiche_pratique_data_catalog_ressource

Il chasse dans la vaste étendue des données générées et/ou importées par une entreprise les informations pertinentes à l’analyse et la prise de décision (Business Intelligence). Avec la gestion des données produites et stockées, il les analyse afin d’exploiter leur plein potentiel et créer de valeur avec les données. 

Livre-blanc-data-usescases-couv

Nos suggestions pour
bien commencer vos usecases Data !

Le Data Scientist doit avoir des notions en calculs statistiques, des connaissances qui vont lui permettre de développer la bonne approche d’analyse des données dans un contexte précis. Ce DataBaker doit aussi maîtriser des outils analytiques, comme SAS ou R. 

Pour devenir Data Scientist, il faut savoir gérer des données non structurées.

Ces données en énormes quantités qui arrivent des réseaux sociaux, de flux vidéo ou audio, des applications, etc. doivent être maîtrisées pour espérer en tirer de la valeur. Enfin, ce scientifique des données doit pouvoir traiter des données imparfaites, incohérentes, avec des valeurs manquantes ou des formats incohérents. C’est notamment le cas dans une structure qui n’est pas habituée à l’analyse des données.

Pourquoi le Data Scientist est-il important ?

Les données sont devenues trop nombreuses et complexes pour que leur étude soit confiée aux équipes SI. Extraire des informations cruciales et pertinentes depuis des données brutes (structurées ET déstructurées) est une tâche qui requiert une analyse approfondie et une agilité d’esprit: celle d’un Data Scientist.

C’est le chercheur d’or de la Data, qui s’aventure dans le nouveau Far West: celui du Big Data. Le Data Scientist est indispensable, tout secteur confondu, si il y a besoin de:

  • Résoudre des problèmes induisant une large quantité de données.
  • Valoriser des données pour toutes les fonctions de l’entreprise.
  • Prendre des décisions basées sur des données de confiance (BI).

Quels sont les bénéfices à attendre du Data Scientist ?

Il crée et applique des algorithmes pour jouer avec les données et fournir aux équipes métiers des atouts, qu’il s’agisse de compte rendu, d’analyses en temps réel, comme d’analyses prédictives.

Le Data Scientist utilise les données existantes mais toute sa valeur ajoutée s’exerce lorsqu’il crée des données pertinentes nouvelles en recoupant les données existantes.

Ainsi, il est en position d’insuffler la transformation digitale d’une entreprise.
Un Data Scientist est une vrai contribution à votre processus de décision (business intelligence), et il est facteur d’agilité, à condition que le business embrasse le changement induit, et choisisse cette agilité.

R-DatScientist-quel-rôle

Quelles sont les compétences à avoir pour devenir un Data Scientist ?

Les compétences requises pour un Data Scientist sont aussi nombreuses que techniques et spécifiques. Avec l’arrivée du Big Data, le Data Scientist est un profil hybride, qui combine l’ensemble des savoirs-faire de la data et se bonifie avec l’expérience, en gagnant une vision business plus pertinente.

Ce professionnel de la data doit posséder des compétences techniques, mais aussi de fortes compétences humaines ou soft skills. Il est important d’être suffisamment curieux pour aller déceler toutes les données importantes et ayant de la valeur, exploitables et perdues pour la plupart dans un important volume de data.

Un esprit critique, l’envie de recherche et la volonté de comprendre l’origine des problèmes sont des compétences qui peuvent faire qu’un Data Scientist deviendra indispensable.

Enfin, le Data Scientist ne pourra pas faire grand chose seul. Il est nécessaire qu’il puisse communiquer avec toutes les équipes qui manipulent les données. Il doit échanger avec elles, pour comprendre leurs attentes, leurs problématiques et leurs objectifs. In fine, pour répondre à leurs attentes en terme d’analyse de la donnée.

Il doit en effet comprendre et connaître les enjeux économiques de l’organisation pour fournir des prédictions pertinentes. Le Data Scientist peut ainsi faire le lien entre les aspects techniques et les besoins métiers et ainsi:

  • Résoudre des problèmes métiers (réel) à l’aide des données.
  • Communiquer avec les équipes concernées, techniques ET fonctionnelles, afin de mieux comprendre les problèmes, et ainsi mieux transmettre des solutions.
  • Vulgariser, et évangéliser la culture du “data-driven business”.

Découvrez ce que DataGalaxy peut apporter au Data Scientist