Enrichissement de Base de Données

Nous collectons et agrégeons des informations de manière automatique sur le web afin d’enrichir et d’améliorer la qualité de bases de données métier.

Introduction

Le web regorge de données sur les entreprises : articles rédigés sur des sites spécialisés, réseaux sociaux, annuaires d’entreprises, sites vitrines présentant des entreprises etc. Ajoutez à ça la récente ouverture de la base de données SIRENE par l’INSEE et le programme d’open data d’Infogreffe, il n’a jamais été aussi simple d’identifier et d’agréger des données sur les entreprises (innovantes).

Cependant, la collecte et le traitement de données est un processus complexe et requiert une certaine expertise : c’est dans ce cadre que notre client – une startup opérant sur le marché de l’open innovation – à fait appel à notre savoir-faire.

Notre client disposant déjà d’une base de données (relativement peu qualifiée et sur un faible volume), l’objectif du projet est de collecter de manière récurrente – à minima toutes les semaines – des données sur des entreprises innovantes afin d’enrichir sa base de données métier en interne.

Objectif

Obtenir un flux constant de données sur des entreprises innovantes.

Client

Startup – Plateforme d’Open Innovation

Résultat

Des données entreprises collectées quotidiennement sur une dizaine d’annuaires.

Une approche méthodique

La première étape de notre travail consiste à comprendre la proposition de valeur de l’entreprise et son mode de fonctionnement, afin de servir au mieux ses problématiques d’extraction et d’enrichissement de base de données.

La seconde étape de notre travail consiste à faire un état des lieux de l’existant afin de se projeter :

  • Quel est le volume actuel et le volume désiré
  • Déterminer le modèle de données existant et quel modèle désiré
  • Quel est le niveau de qualité minimum à mettre en place sur les fiches entreprises
  • Comment fonctionne l’intégration des données en interne
Checklist
Data Selection

Sélection et agrégation des sources

Chaque source de données n’est pas égale en termes de qualité. Certains sites web proposent une meilleure description qu’un autre, des informations peuvent manquées sur l’un etc. Il s’agit donc de travailler en profondeur la sélection des sources afin de choisir comment agréger les données.

Nous analysons tous les sites un-à-un puis émettons une recommandation en fonction de l’état des lieux réalisé précédemment. Notre but est de co-construire tout le processus – de la collecte à l’agrégation des données – afin de vous assurer une qualité des données irréprochables.

L'enrichissement de base de données comme levier d'innovation

Pour notre client, il était essentiel de renforcer sa base de données afin de mieux « sourcer » et « screener » les entreprises.

En effet, l’open innovation consiste à :

  • Effectuer une veille constante sur l’innovation afin de renforcer les démarches d’agilité et d’innovation dans les entreprises
  • Mettre en relation des entreprises innovantes et des ETIs / Grand comptes
Grâce à ce projet d’enrichissement de base de données, le client a vu sa base de données doubler en qualité ET en volume.
Data Enrichment

Commencez dès demain votre projet d'enrichissement de données.