Connexion

Connexion à votre compte

Identifiant
Mot de passe
Maintenir la connexion active sur ce site

Toutes nos références

Retour d'expérience d'un projet Big Data

Contexte

Traditionnellement, la publicité en ligne se base sur l’optimisation du taux de click sans prendre en compte la pertinence du client. Contrairement à cette approche classique, notre partenaire a fondé sa stratégie sur l’optimisation de la valeur client afin de concentrer ses efforts sur leur pertinence. Son modèle se base sur une analyse fine de la valeur client afin de proposer les produits les plus adaptés. La problématique rencontrée était d’analyser un très grand volume de dossiers et historiques clientèles et de les croiser avec les données publicitaires. 

 

Une approche itérative : de la découverte à l’industrialisation

Nous avons donc déployé une architecture capable de gérer et d’analyser cette masse de données. Pour cela, la plate-forme Hadoop nous a paru une évidence de par sa capacité à gérer de larges volumes de données et sa facilité de passage à l´échelle. Nous avons pu stocker indifféremment des teraoctets de données relatives à la publicité ainsi que des milliers de dossiers clients. Une fois stockées, ces données furent nettoyées et organisées. 

La première étape fut l’importation des données dans un environnement Hadoop. Ces données, une fois importées, furent alors nettoyées et normalisées. Dans tout projet Big data, le processus de data cleaning est l’une des plus importante et longue. Celle-ci est néanmoins vitale et nécessite de nombreuses itérations.

Suite à ce processus, nous avons croisé les données de publicité et les données client. Grâce à des modèles mathématiques, nous avons pu identifier les différents profils de clients et d’en discerner leur valeur. Dans un second temps, nous avons restitué les résultats de ces analyses sous forme de dataviz au sein de Tableau Software.

Suite à ce premier travail de valorisation client effectué, nous avons mis en place un flux de traitement permettant l’amélioration continue du ciblage publicitaire.

 

Bénéfices

Grâce à l’association de ces technologies innovantes (Hadoop, Tableau, etc.) et du Machine Learning, nous avons mis en place un système auto-adaptatif permettant à notre client de sélectionner des prospects pertinents et à ainsi optimiser son taux de transformation de publicité.

L’architecture Hadoop permet d’être agile et d’avoir une approche itérative en utilisant les nombreux moteurs de traitement en fonction de la situation. Le fait que les données soient centralisées apporte également beaucoup à cette flexibilité.

 

Solution technique

  • Distribution Cloudera (Environnement Hadoop)
  • Hadoop (plate-forme de stockage et traitement de BigData)
  • Flume (Intégration des logs)
  • Oozie (Ordonnancement des tâches récurrentes)
  • Hive (Moteur SQL de traitements des données)
  • Impala (Moteur SQL à faible latence pour l’analyse des données)
  • Tableau Software (Présentation des résultats)