Connexion

Connexion à votre compte

Identifiant
Mot de passe
Maintenir la connexion active sur ce site

Blog

Hadoop un nouveau paradigme, donc de nouvelles pratiques



Paul WESTERMAN dans « Data Warehousing Using the WalMart Model », paru en 2001, indiquait déjà qu'il fallait responsabiliser les utilisateurs, leur laisser la main pour lancer leurs requêtes, et leur offrir les outils qui leur permettraient aussi de les stopper.
J'ai retrouvé les idées développées par Paul WESTERMAN parmi les présentations du Hadoop Summit de cette annéei. Waltmart, toujours, procède de la même manière sur son cluster Hadoop. Les utilisateurs disposent de client SQL pour interroger leur grand volume de données via Hive. En plus, via le bouche à oreille le cluster initial de Waltmart a progressé de 2000% - Ok ! Ils ont dû commencé petit ! - et continue à croître parce que de nouveaux cas d'utilisation émergent chaque jour.
Même en France, j'ai eu vent que l'on donne à l'utilisateur les outils pour l'aider à analyser par lui même ses BigData.
Ces expériences montrent à quel point les utilisateurs peuvent reprendre le pouvoir sur les services informatiques qui tardent souvent à leur délivrer les demandes d'amélioration sur les datamarts. Sans compter que nos bases de données traditionnelles dès lors qu'elles sont un peu grosses travaillent moins vite pour appliquer des modifications de schéma.

Il n'est plus question de s'interroger sur le fait d'utiliser les technologies telle que Hadoop, mais comment est-ce qu'il faut les exploiter ? Quelle est la meilleure manière de tirer partie au mieux des BigData ?
Je reprends ici les idées de Mathias Herberts (@herberts) qui me rappelle que nous avons changé de paradigme, et qu'il serait temps de le considérer et de transformer notre approche si l'on souhaite bien exploiter les BigData. Et il rajoute « tu ne peux pas interroger 10 ans de données comme si tu en avais que 3 mois ! Tu ne peux pas avoir les mêmes questions ! ».

Si maintenant encore on considère une solution de visualisation telle que Tableau Software, largement présente parmi les différentes présentations, il faut se rendre à l'évidence que nous changeons d'époque. Tableau propose aux utilisateurs une exploration de leur données complètement nouvelle. A partir de données de qualité, l'utilisateur creuse, analyse, cherche les éléments perturbateurs, lève les alertes et peut finalement créer les tableaux de bords qui vont bien, les diffusent via Tableau Server. Voilà une nouvelle manière d'imaginer la BI.

Hadoop par sa capacité de stockage et de traitement transforme l'accès à l'information, il fait tomber les cloisons entre les départements de l'entreprise. Hadoop apporte vraiment de nouvelle capacité d'analyse au sein de l'entreprise qu'il convient de exploiter intelligement.

Il faut rester simple et transformer la vision analytique traditionnelle des utilisateurs.

Si vous n'êtes pas encore convaincu par Hadoop je vous invite à regarder cette propagande :
Tags: hadoop

Rechercher sur le blog