Connexion

Connexion à votre compte

Identifiant
Mot de passe
Maintenir la connexion active sur ce site

Blog

Hadoop Summit 2014 ça démarre fort

 

Le Hadoop Summit démarre très fort car, pour cette 7ième édition, pas loin de 3 000 participants sont attendus. Le centre de congrès de San José, 10 ème ville la plus importante des États-Unis et la capitale de la Silicon Valley, est bien plus largement occupé en terme de surface qu'il ne l'a été en 2012. Tout comme le nombre d'inscrits, celui des sponsors a largement progressé. L'intérêt pour Hadoop, par conséquent les big data, est devenu en très peu d'années un sujet majeur. D'ici à 2020 le marché devrait avoisiner 50 milliards de dollars dont 15 pour la seule technologie Hadoop.

hadoopsummit-2014 jour1


Être dans la baie de San Francisco, avoir traversé la Silicon Valley, revêt toujours un sentiment particulier quant à l'impression d'être au cœur du monde de l'innovation numérique. Cette ambiance est d'autant plus renforcée quant on voit la quantité de personnes qui assistaient aux meetups en amont du Hadoop Summit. Il y en avait plusieurs avec quelque 250 inscrits pour chacun. Le sujet intéresse ! Ça c'est sûr.

Hier encore Concurrent, « the Cascading company » - Cascading un des langage au dessus d'Hadoop – a annoncé la levée de 10 millions de dollars. C'est pas mal non. Il s'agit de poursuivre leur développement pour encore mieux supporter Cascading.

IBM sponsorisait un des meetups, « SQL on Hadoop » avec pour premier but de montrer en quoi Big SQL correspond à l'une des meilleures technologies SQL au dessus d'Hadoop. Il est vrai que IBM a une longue vie d'éditeur de base de données avec DB2, Netenza. Il est alors simple de penser qu'il exploite toute cette expérience pour la traduire dans cette nouvelle offre poussée via Big Insight, leur distribution Hadoop. Intéressant : un participant a demandé s'il se faisait concurrent à eux même, rappelant au passage que Netenza est l'offre de base de données massivement distribuée d'IBM pour le data warehouse. Bien entendu toutes ces briques ne s'opposent pas car elles répondent bien à des problématiques distinctes. Big SQL, comme toutes les autres solutions de ce marché telles que Hive, PrestoDB, Shark, Spark SQL, Drill, Hawq, Impala, Hadapt sont complémentaires au data warehouse.

Le coût de possession d'un data warehouse s'optimise aisément aujourd'hui grâce à Hadoop qui peut stocker votre zone de préparation des donnés (staging), et peut aussi accueillir la couche d'historisation. On tire ainsi pleinement partie de son data warehouse pour accéder aux données identifiées comme cruciales et utiles à la prise de décision.

Un autre révélateur de l'importance d'Hadoop est la présence du leader mondial de la base de données : Oracle.

Une très belle chose de cet Hadoop Summit demeure la place octroyée à la communauté. De nombreuses initiatives de la communauté open source font l'objet de présentation, une manière de faire connaître les solutions qu'elle apporte puisque les grands acteurs ne peuvent de toute façon pas tout anticiper. D'autant plus que Hadoop reste une technologie open source, avec ainsi une feuille de route discutée au fil des releases au sein de la communauté elle même. Les corrections des bugs et l'ajout de nouvelles fonctionnalités sont justement débattus lors de pareil événement. Plusieurs sessions abordent des thèmes dédiés aux commiters (développeurs experts dont le code est repris). Toute l'après midi de la dernière journée a été réservée pour définir les feuilles de route des différents projets qui composent l'écosystème d'Hadoop.

Altic est ravi de pouvoir participer à un tel événement et aider ses clients à évoluer dès à présent grâce à cet écosystème.

Nous allons vivre cette première journée avec une importante attente de toutes les nouveautés qui pourraient être annoncées.

Rechercher sur le blog