Les mystérieuses dark data en entreprise

Partager : 
Les dark data en entreprise

Vous savez déjà tout du Big Data, cette source infinie de données à analyser pour optimiser vos décisions ? Vous êtes déjà adepte des logiciels de business intelligence et pensez être incollable sur le sujet ? Détrompez-vous, il existe tout un univers dont vous ignorez l’existence, celui des dark data ! Mais que sont-elles au juste, ces données, et où se cachent-elles ?

Définition des dark data

Dark data” est un terme créé par l’entreprise Gartner pour décrire ces informations collectées et archivées qui ne sont pas ou très peu utilisées par les entreprises qui les recueillent. Cela englobe des données de géolocalisation, des diagnostics de l’IoT (Internet des Objets), des rapports d’analyse, des sondages ou encore des données RH. Or, ces données constituent une partie non négligeable des systèmes de données, puisqu’elles représentent environ 80 % des informations commerciales détenues à ce jour (étude IBM) et ce taux est voué à croître continuellement ! En effet, d’ici 2020, jusqu’à 93 % des données totales pourraient être considérées comme des dark data. L’accumulation frénétique des données, enclenchée par l’avènement du Big Data, amène son lot de complications.

Les dark data, l’angle mort des entreprises

Faut-il s’inquiéter du manque de traitement des dark data ? Dans de nombreux cas, la réponse est oui. En effet, les dark data ne sont pas problématiques en soi mais peuvent potentiellement le devenir pour nombre de PME.

Tout d’abord, même si elles ne sont pas utilisées, ces dark data restent soumises aux lois et régulations relatives aux données des entreprises. Dans l’Union européenne, par exemple, le Règlement général sur la protection données (RGPD) précise que toute entreprise est juridiquement responsable des informations personnelles de ses employés, quand bien même cette entreprise ne serait pas au courant de leur existence. Or, nul n’est censé ignorer la loi, et les dark data n’échappent pas à la maxime : aussi, il faut s’assurer de leur légalité. La cybersécurité est très importante en 2019, notamment en ce qui concerne les objets connectés, qui génèrent de très nombreuses dark data !

En outre, puisqu’elles ne sont pas utilisées, elles sont bien souvent stockées dans des serveurs et dossiers moins bien protégés que les données considérées “sensibles” par l’entreprise. Les dark data sont ainsi également sujettes aux failles de sécurité et des hackers pourraient très bien choisir d’en faire leur cible. Il est donc impératif de prendre connaissance des dark data dont vous disposez en tant qu’entreprise et de s’assurer qu’elles ne tombent pas entre de mauvaises mains.

D’autre part, ne pas exploiter ses dark data est un danger d’un point de vue purement concurrentiel ! Imaginez que votre principal concurrent réussisse à exploiter une manne de données dont vous ignorez jusqu’à l’existence : celui-ci serait en mesure de vous devancer grâce à ces nouvelles sources d’informations. La révolution Big Data a mis en lumière la primordialité des données dans le monde de l’entreprise, puisqu’elles apportent des connaissances décisives sur les tendances, les envies des consommateurs et de nombreux autres facteurs. Vous n’oseriez pas conduire sans rétroviseurs, alors pourquoi vous mettre des œillères et ignorer des données vitales pour votre entreprise ? 

Que faire de ces dark data ?

Pour faire court, il est impossible d’éliminer complètement les dark data. Certaines données ne seront tout simplement pas utilisables par votre entreprise, ou du moins pas dans l’immédiat. Ces données, bien souvent non linéaires (e-mails, documents, publications sur les réseaux sociaux, images ou encore vidéos) peuvent se dissimuler facilement dans votre système et ses zones d’ombres. S’il est nécessaire que vous protégiez ces données malgré tout, il faut aussi que vous puissiez dans l’absolu les utiliser.

De nombreuses PME ont très vite mis de côté les dark data, jugeant qu’elles n’étaient pas si importantes. Pourtant, s’y intéresser aurait un fort impact sur les flux de travail et pourrait bien révolutionner la manière de travailler. Or, nous avons tous une certaine aversion plus ou moins prononcée au changement, qui nous pousse à ne pas sortir de notre zone de confort. C’est pourquoi il paraît parfois plus simple de ne pas faire cas de ces données. Il peut également être difficile de convaincre ses collègues de l’importance des dark data quand ceux-ci n’en connaissent pas l’existence. Il est cependant nécessaire de les en convaincre. Les dark data peuvent atteindre une masse critique qui pourrait devenir néfaste pour votre entreprise, tant au niveau des failles de sécurité qu’en coûts de stockage.

Comment gérer concrètement vos dark data ? 

La première chose à faire pour empêcher de crouler sous les dark data est de les identifier. Cela commence par leur localisation : où sont-elles stockées ? Bien souvent, elles sont éparpillées sur tous vos serveurs et il s’agit de les regrouper et de les labelliser pour qu’elles soient aisément accessibles. Pour ce faire, il vous faut des outils d’analyse et d’informatique décisionnelle (ou business intelligence) qui automatisent une partie de ces procédés et permettent de les appliquer de façon systématique. Ces logiciels proposent des fonctionnalités de visualisation et d’exploitation des données, de reporting ainsi qu’une certaine optimisation du stockage. Ils trouveront d’eux-mêmes les données qui se sont cachées dans vos serveurs et leur accorderont la visibilité nécessaire. Toutefois, ces outils ne font pas tout. Vous aurez des décisions à prendre vous-même concernant l’utilisation de ces données mises au jour.

Il faut bien comprendre que l’archivage des données “au cas où elles pourraient servir plus tard” n’est tout simplement plus viable à l’heure actuelle. La quantité de données accumulées à chaque instant (chaque personne en génère 1,7 mégaoctets par minute) rend l’archivage systématique impossible. Une étude d’IBM a montré que 90 % des données mondiales actuelles ont été créées au cours des deux dernières années ! Au vu de la croissance de cette masse d’informations, il est impératif de déterminer quelles données sont utilisables et sur quelle durée afin de ne pas encombrer les serveurs des entreprises. Il faut aussi pouvoir les traiter correctement : pour ce faire, il faut les étiqueter, les suivre et les localiser de la façon la plus simple et la plus logique possible. En les traitant correctement, vous en en tirerez tous les bénéfices. 

Que gagne-t-on à exploiter les dark data ? 

Les risques liés aux dark data sont certes nombreux, mais les opportunités ne sont pas non plus en reste. En exploitant vos dark data, vous bénéficiez d’un avantage concurrentiel certain, et explorez de nouveaux pans de votre entreprise. Par exemple, les données liées à l’utilisation de vos réseaux peuvent être extrêmement intéressantes pour découvrir les failles de sécurité de celui-ci, afin d’en identifier les points faibles et d’y pallier. Ceci vous permettra d’optimiser l’utilisation de vos ressources. Bien souvent, les entreprises n’utilisent pas suffisamment les données associées à leurs clients et aux échanges qu’elles ont eues avec eux car ces informations sont dispersées. Si vous parvenez à les structurer, vous pourrez mettre en place de meilleures stratégies et procédés. 

Les PME ont la chance de pouvoir se transformer plus facilement que les très grandes entreprises, mais ce n’est une force que pour celles qui acceptent le changement. Alors, soyez parmi les premiers à rejoindre le côté obscur de la data pour en faire votre “Force” ! 

À propos de Caroline Rousseau :

Rédactrice pour la France pour GetApp, marketplace et comparateur de logiciels métiers qui fournit des avis clients. Tout d’abord graphiste, puis testeuse et traductrice de jeux vidéo, elle se consacre désormais à la rédaction d’articles traitant des nouvelles technologies.

Partager :