Sélectionner une page

DataLab Groupe

Le DataLab Groupe de Crédit Agricole utilise DataGalaxy pour standardiser, organiser et structurer la documentation des données de ses projets d’IA et data à destination de l’ensemble du groupe Crédit Agricole.

Je recommanderais DataGalaxy pour trois raisons principales. La simplicité d’utilisation, l’adaptabilité à différents cas d’usage et les équipes de support efficaces et disponibles.

Matthieu Capron
Data and AI Project Manager

DNDi Case Study

présentation

DataLab Groupe

Groupe bancaire proposant des services financiers aux entreprises, institutionnels et particuliers, le groupe Crédit Agricole possède le plus grand réseau de banques coopératives et mutualistes au monde. Il emploie 145 000 collaborateurs au service de 53 millions de clients à l’échelle internationale.

Créé en 2016 et employant 50 personnes, le DataLab Groupe de Crédit Agricole a pour mission de développer des solutions industrielles d’intelligence artificielle destinées à l’interne, d’accompagner les entités du groupe dans la création de solutions Data & IA et d’acculturer le groupe Crédit Agricole à ces technologies en phase d’évolution accélérée

Infos clés :

  • Le DataLab Groupe de Crédit Agricole avait besoin d’un outil pour cataloguer et documenter efficacement toutes les données utilisées : confiées par les entités du groupe Crédit Agricole ou bien Open Data
  • Le DataLab Groupe utilise DataGalaxy pour documenter les données associées à l’ensemble de ses cas d’usage regroupés dans trois familles principales : IA analytique, IA documentaire et IA textuelle.

Industrie : Banque et finance

Siège: France

Effectifs : 50 employées

Pascal Carpentier DNDI

Nous avions trois critères principaux dans le choix de l’outil. Le premier, c’était de pouvoir répondre à l’ensemble de nos cas d’usage. Nous traitons à la fois des données classiques que nous allons retrouver dans des bases de données, mais également du texte et des documents. L’outil DataGalaxy permettait cette flexibilité.

Matthieu Capron
Data and AI Project Manager

Contexte du projet et enjeux stratégiques

À l’origine, l’objectif du DataLab Groupe était d’explorer le potentiel de la data et de l’IA pour les métiers du Crédit Agricole et de mener des tests pour en évaluer la faisabilité. Tout en conservant son ADN recherche et développement, afin de mieux convaincre de la pertinence de la Data et de l’IA, depuis 2018 plusieurs transformations ont été menées afin de devenir un pôle de référence en création de solutions internes data et IA innovantes, nativement industrielles, dignes de confiance et responsables.

Les méthodes de travail ont donc évolué, pour se placer dans une démarche globale « IA de confiance et responsable », éprouvée sur de nombreux projets menés en lien avec les entités du Groupe Crédit Agricole. Ces travaux ont été concrétisés début 2022 par la certification et la labellisation des processus de construction, déploiement et maintien en condition opérationnelle de ses solutions.

Le DataLab Groupe traite une variété de cas d’utilisation de l’IA basés sur différents types de données, y compris :

  • IA analytique : utilisation de données structurées ou semi-structurées pour anticiper les difficultés des clients, leur proposer des offres pertinentes ou détecter des tentatives de fraude ou des cyberattaques.
  • IA documentaire : utilisation de données non structurées pour faciliter la reconnaissance et le contrôle des documents utilisés dans tous les processus bancaires.
  • IA textuelle : exploitation de données non structurées pour classer des courriels, extraire des intentions de rapports, reconnaître des émotions dans un texte, etc.

Tous les systèmes d’IA sont basés sur des données, et la maîtrise des systèmes d’IA nécessite au préalable la maîtrise des données.

Démarche d’implémentation du Data Catalog

Le DataLab Groupe avait besoin d’un outil pour centraliser les données de tous les projets sur lesquels il travaillait, notamment les différentes sources de données provenant des différentes entités du Groupe ou de l’Open Data, les liens entre elles, les transformations appliquées, et les liens avec les cas d’usage développés.

Le DataLab Groupe avait quelques critères principaux dans le choix d’un catalogue de données pour répondre à ses besoins : pouvoir répondre à tous les cas d’utilisation, traiter les données structurées (données bancaires présentes en base de données), semi-structurées (logs de navigation), mais également des données non structurées (documents et textes). Ils ont choisi DataGalaxy car l’outil permettait cette flexibilité.

Le DataLab Groupe a commencé à travailler sur son catalogue de données par une phase pilote impliquant la documentation de trois projets sur ses principales familles de cas d’usage : L’IA analytique, l’IA documentaire, et l’IA pour extraire des informations à partir d’un texte. 

Ensuite, pour chacun de ces types de cas d’usage, des modèles ont été définis en structurant les éléments du dictionnaire et les traitements dans DataGalaxy afin de répondre aux spécificités de chacun de ces types de cas d’usage. L’application de ces modèles permet aujourd’hui de gagner en homogénéité, et en efficacité.

Utilisation et solutions apportées par DataGalaxy

Création de l’Open Data Mart,

qui propose des données ouvertes récupérées, retravaillées et mises à disposition de l’ensemble du DataLab Groupe pour l’ensemble de leurs projets.

Une documentation et une communication internes

pour l’utilisation et le partage des données ouvertes.

Une source unique de vérité

pour tous les projets de données futurs, y compris ceux qui impliquent l’IA et une immense documentation.

Les + de DataGalaxy selon DataLab Groupe

  • Une solution complète et simple d’utilisation pour organiser toutes les données exploitées par le DataLab Groupe dans ses différents projets.
  • Les équipes de DataGalaxy qui sont très réactives, toujours disponibles avec une solution pour chaque question qui se posait.

Yulia Koloskova
Infolinguiste et Lead Chapter Data

« Nous sommes dans la phase de la généralisation de l’outil à l’ensemble de nos projets au DataLab Groupe. Nous menons beaucoup de projets IA qui suivent méthode, projet labellisé et certifiés, qui inclut désormais la documentation des projets dans l’outil DataGalaxy. »

Et maintenant, à vous de jouer !

Loading...