Connexion

Connexion à votre compte

Identifiant
Mot de passe
Maintenir la connexion active sur ce site

Blog

Hadoop Summit 2014 ça démarre fort

Le Hadoop Summit démarre très fort car, pour cette 7ième édition, pas loin de 3 000 participants sont attendus. Le centre de congrès de San José, 10 ème ville la plus importante des États-Unis et la capitale de la Silicon Valley, est bien plus largement occupé en terme de surface qu'il ne l'a été en 2012. Tout comme le nombre d'inscrits, celui des sponsors a largement progressé. L'intérêt pour Hadoop, par conséquent les big data, est devenu en très peu d'années un sujet majeur. D'ici à 2020 le marché devrait avoisiner 50 milliards de dollars dont 15 pour la seule technologie Hadoop.

 

Lire la suite...

Altic en direct du Hadoop Summit 2014 de San José (Californie)

Hortonworks, notre partenaire et l'un de ses principaux investisseurs, Yahoo!, continuent à promouvoir Hadoop via le Hadoop Summit, une manifestation qui a lieu maintenant deux fois par an : à Amsterdam et à San José. Nous étions à Amsterdam ! Nous revenons à San José.

Lire la suite...

Hadoop, Big Data, tout ce que vous auriez manqué

Chez Altic grâce à notre veille nous avons constitué une belle bibliothèque de liens. Elle s'enrichit aussi des contributions de partenaires qui aiment eux aussi partager des nouvelles fraîches qui ont un certain impact sur la vision que nous aurions d'une solution, d'une technologie. Ici nous voulons échanger avec vous quelques liens autour d'Hadoop. Il s'est passé tellement de choses récemment que nous estimons intéressant de les rappeler.


1. Presto, une couche SQL « interactif » pour Hadoop signé Facebook
 
Facebook est à l'initiative de Hive, la couche SQL pour Hadoop. Mais Hive, largement utilisé chez eux n'est pas très interactif, alors Presto vient corriger ça. Et bien entendu le gros contributeur open source qu'est Facebook n'a pas tarder à l'ouvrir... Il paraît même qu'ils sont allés voir les leaders des distributions Hadoop pour leur proposer le projet...

http://gigaom.com/2013/11/06/facebook-open-sources-its-sql-on-hadoop-engine-and-the-web-rejoices/
 
2. Hadoop Yarn 
 
Il est certain que vous avez entendu parler d'Hadoop 2 ! Et bien tout ça c'est grâce à YARN ! ....

 

Lire la suite...

Talend Big Data, Hadoop et Elasticsearch

Nombreux d'entre vous recherchent une architecture Big Data tant le nombre d'acteurs et d'offres continue à s'etoffer. Ainsi l'objectif de l'exercice décrit dans cet article est de tester le bon fonctionnement d'un ensemble d'outils appartenant au domaine Big Data.

Pour cela, nous avons choisi de nous intéresser à l'intégration du moteur de recherche Elasticsearch à Hadoop et d'utiliser Talend Big Data pour orchestrer le tout. Avec un tel ensemble il s'agit d'exploiter la puissance d'un moteur de recherche tel qu'Elasticsearch au sein d'une grille Hadoop qui conserve encore l'image d'un système peu interactif. Ce qui au passage est de moins en moins vrai avec le nouveau gestionnaire de ressource YARN.

Pour être en mesure de réaliser ces tests, nous avons donc utilisé le Studio Talend Big Data, la Sandbox d'Hortonworks et la librairie elasticsearch-hadoop (réalisée par les équipes d'ElasticSearch).

On verra à la fin de cet article que ces tests ont permis de faire ressortir un exemple d'architecture Big Data dans laquelle on réussit à trouver une interface de requêtage classique de type batch (avec Pig, Hive...) mais également une autre interface plus rapide et plus transverse à travers l'utilisation Elasticsearch.

Lire la suite...

Elasticsearch, Kibana3 : une nouvelle approche de la BI

Dans la continuité de l'article «La New BI, les moteurs de recherche pour repenser le décisionnel», nous avons pensé qu'il était intéressant d'étayer notre propos avec un exemple parlant et ainsi montrer l'intérêt des moteurs de recherche dans le cadre de projet de business intelligence.

Vous n'avez sans doute pas raté qu'un moteur de recherche open source n'arrêtait plus de faire parler de lui. Il s'agit d'Elasticsearch, créé par Shay Banon et basé sur Lucene.

Elasticsearch est sans commune mesure une des solutions qui s'engage vers un bel avenir tant sa richesse fonctionnelle, sa qualité technique, sa communauté bouillonnent pour offrir un moteur de recherche performant et tellement simple à mettre en oeuvre.

 

Lire la suite...

Rechercher sur le blog